ฉันต้องการเปรียบเทียบโมเดลเชิงเส้นสองแบบที่ซ้อนกัน เรียกว่า m01 และ m02 โดยที่ m01 เป็นโมเดลรีดิวซ์ และ m02 เป็นโมเดลเต็ม ฉันต้องการทำการทดสอบ F แบบง่ายๆ เพื่อดูว่ารุ่นเต็มเพิ่มประโยชน์ใช้สอยที่สำคัญมากกว่ารุ่นที่ลดลงหรือไม่
นี่เป็นเรื่องง่ายมากใน R ตัวอย่างเช่น:
mtcars <- read.csv("https://raw.githubusercontent.com/focods/WonderfulML/master/data/mtcars.csv")
m01 <- lm(mpg ~ am + wt, mtcars)
m02 <- lm(mpg ~ am + am:wt, mtcars)
anova(m01, m02)
ให้ผลลัพธ์ต่อไปนี้แก่ฉัน:
ซึ่งบอกฉันว่าการเพิ่มคำโต้ตอบ am: wt ช่วยปรับปรุงโมเดลได้อย่างมาก มีวิธีทำสิ่งที่คล้ายกันใน Python/sklearn/statsmodels หรือไม่
แก้ไข: ฉันดูที่ คำถามนี้ ก่อนที่จะโพสต์คำถามนี้ และไม่สามารถเข้าใจได้ว่าเหมือนกันอย่างไร คำถามอีกข้อคือทำการทดสอบ F กับเวกเตอร์สองตัว คำถามนี้เกี่ยวกับการเปรียบเทียบโมเดลเชิงเส้นที่ซ้อนกัน 2 ตัว
ฉันคิดว่านี่คือสิ่งที่ฉันต้องการ:
แต่ไม่แน่ใจว่าจะผ่านฟังก์ชันนี้ไปอย่างไร หากใครสามารถยกตัวอย่างหรือยกตัวอย่างได้จะเป็นประโยชน์อย่างยิ่ง