Я хочу сравнить две вложенные линейные модели, назовем их m01 и m02, где m01 — сокращенная модель, а m02 — полная модель. Я хочу провести простой F-тест, чтобы увидеть, добавляет ли полная модель значительную полезность по сравнению с сокращенной моделью.
В R это очень просто. Например:
mtcars <- read.csv("https://raw.githubusercontent.com/focods/WonderfulML/master/data/mtcars.csv")
m01 <- lm(mpg ~ am + wt, mtcars)
m02 <- lm(mpg ~ am + am:wt, mtcars)
anova(m01, m02)
Дает мне следующий вывод:
Это говорит мне о том, что добавление термина взаимодействия am: wt значительно улучшает модель. Есть ли способ сделать что-то подобное в Python/sklearn/statsmodels?
Изменить: я просмотрел этот вопрос перед публикацией этого и не могу понять, чем они совпадают. Другой вопрос заключается в выполнении F-теста на двух векторах. Этот вопрос касается сравнения двух вложенных линейных моделей.
Я думаю, это то, что мне нужно:
но не уверен, что именно передать эту функцию. Если бы кто-нибудь мог предоставить или указать пример, это было бы чрезвычайно полезно.