Введение

  • Регрессия — это процесс прогнозирования непрерывного значения с использованием заданных переменных.
  • Переменные обычно бывают двух типов: независимые переменные и зависимые переменные.
  • Зависимая переменная — это переменная, которую мы пытаемся предсказать, также называемая целевым массивом (y).
  • Независимые переменные — это переменные, которые содержат значение характеристик данных. Обозначается как Характеристики (X).
  • Таким образом, регрессионная модель связывает y с x.

Типы регрессионных моделей

  • В машинном обучении есть в основном 2 типа регрессионных моделей.

Простая регрессия:-

  • Он используется, когда одна независимая переменная используется для прогнозирования одной зависимой переменной.
  • Пример: простой алгоритм линейной регрессии

Множественная регрессия:-

  • Он используется, когда для предсказания одной зависимой переменной используется много (более 1) независимых переменных.
  • Пример: алгоритм множественной линейной регрессии

Алгоритм простой линейной регрессии

  • Линейная регрессия — это аппроксимация линейной модели, используемой для описания взаимосвязи между двумя или более переменными.
  • Как обсуждалось выше, когда только одна переменная используется для прогнозирования другой переменной с использованием линейной модели, такая модель регрессии называется простой линейной регрессией.

  • Мы должны вычислить значения наклона и точки пересечения, чтобы найти линию, наиболее подходящую для «подгонки» данных, потому что линейная регрессия оценивает коэффициенты линии.
  • Мы должны настроить параметры (наклон и пересечение), чтобы выровнять линию наилучшего соответствия в модели.
  • Остаточная ошибка: расстояние от точки данных до подобранной линии регрессии.

  • Среднее значение всех остаточных ошибок показывает нам, насколько плохо подобраны точки данных. Математически это можно показать уравнением среднеквадратичной ошибки (MSE).

  • Итак, цель состоит в том, чтобы найти линию, где MSE наименьшая, а для ее минимизации нам нужно найти наилучшие параметры (наилучшее значение наклона и точки пересечения).

Чтобы найти наилучшие параметры или минимизировать уравнение MSE, мы используем обычный метод наименьших квадратов. Эта тема будет раскрыта в следующем блоге.