Введение
- Регрессия — это процесс прогнозирования непрерывного значения с использованием заданных переменных.
- Переменные обычно бывают двух типов: независимые переменные и зависимые переменные.
- Зависимая переменная — это переменная, которую мы пытаемся предсказать, также называемая целевым массивом (y).
- Независимые переменные — это переменные, которые содержат значение характеристик данных. Обозначается как Характеристики (X).
- Таким образом, регрессионная модель связывает y с x.
Типы регрессионных моделей
- В машинном обучении есть в основном 2 типа регрессионных моделей.
Простая регрессия:-
- Он используется, когда одна независимая переменная используется для прогнозирования одной зависимой переменной.
- Пример: простой алгоритм линейной регрессии
Множественная регрессия:-
- Он используется, когда для предсказания одной зависимой переменной используется много (более 1) независимых переменных.
- Пример: алгоритм множественной линейной регрессии
Алгоритм простой линейной регрессии
- Линейная регрессия — это аппроксимация линейной модели, используемой для описания взаимосвязи между двумя или более переменными.
- Как обсуждалось выше, когда только одна переменная используется для прогнозирования другой переменной с использованием линейной модели, такая модель регрессии называется простой линейной регрессией.
- Мы должны вычислить значения наклона и точки пересечения, чтобы найти линию, наиболее подходящую для «подгонки» данных, потому что линейная регрессия оценивает коэффициенты линии.
- Мы должны настроить параметры (наклон и пересечение), чтобы выровнять линию наилучшего соответствия в модели.
- Остаточная ошибка: расстояние от точки данных до подобранной линии регрессии.
- Среднее значение всех остаточных ошибок показывает нам, насколько плохо подобраны точки данных. Математически это можно показать уравнением среднеквадратичной ошибки (MSE).
- Итак, цель состоит в том, чтобы найти линию, где MSE наименьшая, а для ее минимизации нам нужно найти наилучшие параметры (наилучшее значение наклона и точки пересечения).
Чтобы найти наилучшие параметры или минимизировать уравнение MSE, мы используем обычный метод наименьших квадратов. Эта тема будет раскрыта в следующем блоге.