Контент основан на курсе nptel "Машинное обучение для инженерных и научных приложений".

Https://www.linkedin.com/in/arun-singh-0068b1157/

Что такое машинное обучение?

Программы, которые работают все лучше и лучше по мере поступления все большего и большего количества данных.

Формально. Считается, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности P, если ее производительность при выполнении задач в T, измеренная с помощью P, улучшается с опытом E.

Пример: Предположим, что задача T состоит в том, чтобы распознать, что полученное электронное письмо является спамом или нет, и опыт E помечен метками, указывающими, что данное электронное письмо является спамом или нет, а производительность P - сколько или какая часть писем помечены как правильные из тестовых данных. установленный. Здесь E - это просто помеченные данные, и чем больше данных, тем выше точность или производительность модели (как правило).

Парадигма машинного обучения

Традиционный подход / классический подход

В классическом подходе правила предопределены и применяются к данным, а ответы предсказываются в соответствии с этими предопределенными правилами.

Современный подход

В ML модель пресыщена данными и помеченными данными (ответами), а вывод - это функция или правила, которые сопоставляют эти ответы с необработанными данными.

Когда полезно ML?

Не используйте, если правила очень четкие и краткие.

  1. Когда правила трудно извлечь (например, эксперты не могут объяснить свой опыт).
  2. Когда правила не могут быть построены (или когда человеческий опыт не существует)
    Пример: навигация на Марсе
  3. Решение необходимо адаптировать к конкретным случаям
    Пример: биометрические данные пользователя, индивидуальные методы лечения пациентов.

Фундаментальный «трюк» в большинстве машинного обучения

  1. Все проблемы - это данные, а все решения - это функции / карты.
  2. Преобразуйте эти данные в числа.
  3. Определение подходящих входов и выходов для задачи машинного обучения является важной частью процесса.
  4. Часто «учебной задачей» является изучение отображения от входа к выходу.

Семь шагов в машинном обучении

  1. Сбор данных
    Часть проблемы - решить, что означают «данные».
  2. Подготовка данных
    Обеспечение отсутствия предвзятости.
  3. Выбор модели / алгоритма
    Угадайте форму функции гипотезы h (x; w).
  4. Обучение
    Использование данных для определения параметров модели. (Параметры - это константы, которые являются частью функции гипотезы, например, y = mx + c, где m и c - параметры.
  5. Оценка
    Насколько хорошо модель работала?
  6. Настройка гиперпараметров
    Для дальнейшего улучшения модели. например эпоха (кол-во итераций)… ..
  7. Прогнозирование, а затем развертывание