Контент основан на курсе nptel "Машинное обучение для инженерных и научных приложений".
Https://www.linkedin.com/in/arun-singh-0068b1157/
Что такое машинное обучение?
Программы, которые работают все лучше и лучше по мере поступления все большего и большего количества данных.
Формально. Считается, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности P, если ее производительность при выполнении задач в T, измеренная с помощью P, улучшается с опытом E.
Пример: Предположим, что задача T состоит в том, чтобы распознать, что полученное электронное письмо является спамом или нет, и опыт E помечен метками, указывающими, что данное электронное письмо является спамом или нет, а производительность P - сколько или какая часть писем помечены как правильные из тестовых данных. установленный. Здесь E - это просто помеченные данные, и чем больше данных, тем выше точность или производительность модели (как правило).
Парадигма машинного обучения
Традиционный подход / классический подход
В классическом подходе правила предопределены и применяются к данным, а ответы предсказываются в соответствии с этими предопределенными правилами.
Современный подход
В ML модель пресыщена данными и помеченными данными (ответами), а вывод - это функция или правила, которые сопоставляют эти ответы с необработанными данными.
Когда полезно ML?
Не используйте, если правила очень четкие и краткие.
- Когда правила трудно извлечь (например, эксперты не могут объяснить свой опыт).
- Когда правила не могут быть построены (или когда человеческий опыт не существует)
Пример: навигация на Марсе - Решение необходимо адаптировать к конкретным случаям
Пример: биометрические данные пользователя, индивидуальные методы лечения пациентов.
Фундаментальный «трюк» в большинстве машинного обучения
- Все проблемы - это данные, а все решения - это функции / карты.
- Преобразуйте эти данные в числа.
- Определение подходящих входов и выходов для задачи машинного обучения является важной частью процесса.
- Часто «учебной задачей» является изучение отображения от входа к выходу.
Семь шагов в машинном обучении
- Сбор данных
Часть проблемы - решить, что означают «данные». - Подготовка данных
Обеспечение отсутствия предвзятости. - Выбор модели / алгоритма
Угадайте форму функции гипотезы h (x; w). - Обучение
Использование данных для определения параметров модели. (Параметры - это константы, которые являются частью функции гипотезы, например, y = mx + c, где m и c - параметры. - Оценка
Насколько хорошо модель работала? - Настройка гиперпараметров
Для дальнейшего улучшения модели. например эпоха (кол-во итераций)… .. - Прогнозирование, а затем развертывание