Обзор машинного обучения:

Контент основан на курсе nptel "Машинное обучение для инженерных и научных приложений".

Https://www.linkedin.com/in/arun-singh-0068b1157/

Что такое машинное обучение?

Программы, которые работают все лучше и лучше по мере поступления все большего и большего количества данных.

Формально. Считается, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности P, если ее производительность при выполнении задач в T, измеренная с помощью P, улучшается с опытом E.

Пример: Предположим, что задача T состоит в том, чтобы распознать, что полученное электронное письмо является спамом или нет, и опыт E помечен метками, указывающими, что данное электронное письмо является спамом или нет, а производительность P - сколько или какая часть писем помечены как правильные из тестовых данных. установленный. Здесь E - это просто помеченные данные, и чем больше данных, тем выше точность или производительность модели (как правило).

Парадигма машинного обучения

Традиционный подход / классический подход

В классическом подходе правила предопределены и применяются к данным, а ответы предсказываются в соответствии с этими предопределенными правилами.

Современный подход

В ML модель пресыщена данными и помеченными данными (ответами), а вывод - это функция или правила, которые сопоставляют эти ответы с необработанными данными.

Когда полезно ML?

Не используйте, если правила очень четкие и краткие.

Когда правила трудно извлечь (например, эксперты не могут объяснить свой опыт).
Когда правила не могут быть построены (или когда человеческий опыт не существует)
Пример: навигация на Марсе
Решение необходимо адаптировать к конкретным случаям
Пример: биометрические данные пользователя, индивидуальные методы лечения пациентов.

Фундаментальный «трюк» в большинстве машинного обучения

Все проблемы - это данные, а все решения - это функции / карты.
Преобразуйте эти данные в числа.
Определение подходящих входов и выходов для задачи машинного обучения является важной частью процесса.
Часто «учебной задачей» является изучение отображения от входа к выходу.

Семь шагов в машинном обучении

Сбор данных
Часть проблемы - решить, что означают «данные».
Подготовка данных
Обеспечение отсутствия предвзятости.
Выбор модели / алгоритма
Угадайте форму функции гипотезы h (x; w).
Обучение
Использование данных для определения параметров модели. (Параметры - это константы, которые являются частью функции гипотезы, например, y = mx + c, где m и c - параметры.
Оценка
Насколько хорошо модель работала?
Настройка гиперпараметров
Для дальнейшего улучшения модели. например эпоха (кол-во итераций)… ..
Прогнозирование, а затем развертывание