ฉันจะสร้างแบบจำลองเพื่อระบุความผิดปกติในชุดข้อมูลของฉัน ฉันค้นคว้ามามากมายและพบว่าป่าโดดเดี่ยวเป็นป่าที่ดีที่สุด ในชุดข้อมูลของฉัน ฉันไม่มีป้ายกำกับใดๆ (ซึ่งหมายความว่าชุดข้อมูลจะมีเฉพาะตัวแปรอธิบายเท่านั้น) แต่ฉันไม่มีความคิดที่จะตั้งค่าพารามิเตอร์การปนเปื้อนในฟอเรสต์การแยก (บทความส่วนใหญ่ที่อธิบายมีตัวแปรเอาท์พุตอยู่แล้ว [ติดป้ายกำกับว่าเป็นความผิดปกติ] โดยใช้พวกมันคำนวณอัตราส่วนค่าผิดปกติแล้วตั้งค่าเป็น ค่าการปนเปื้อน แข็งแกร่ง>)
จำเป็นต้องตั้งค่ามั้ย.. ค่าเริ่มต้นสำหรับการปนเปื้อนคือ 0.1 ไม่เป็นไรหรอกที่จะเพิกเฉยต่อมัน? ถ้าฉันไม่ให้คุณค่ากับมัน มันจะส่งผลต่อผลลัพธ์ของโมเดลหรือไม่
model = IsolationForest(contamination=0.1, n_estimators=1000)