Saya akan membuat model untuk mengidentifikasi anomali dalam kumpulan data saya. Saya banyak meneliti dan menemukan bahwa hutan isolasi adalah yang terbaik. Di dataset saya, saya tidak memiliki label apa pun (artinya dataset hanya berisi variabel penjelas). Tapi saya tidak punya ide untuk mengatur parameter kontaminasi di hutan isolasi (Sebagian besar artikel yang menjelaskan sudah memiliki variabel keluaran [diberi label sebagai anomali], dengan menggunakannya mereka menghitung rasio outlier dan kemudian menetapkannya sebagai nilai kontaminasi kuat>).
Apakah wajib untuk mengaturnya?. Nilai default untuk kontaminasi adalah 0,1. Bolehkah mengabaikannya? jika saya tidak memberikan nilai, apakah hal tersebut memengaruhi hasil model?
model = IsolationForest(contamination=0.1, n_estimators=1000)