Я собираюсь построить модель для выявления аномалий в моем наборе данных. Я много исследовал и выяснил, что изоляционный лес лучше всего подходит для этого. В моем наборе данных у меня нет меток (это означает, что набор данных содержит только объясняющие переменные). Но я понятия не имею, как установить параметр загрязнения в изолированном лесу (в большинстве статей, которые объясняют, уже есть выходная переменная [помеченная как аномалия], с помощью которой они вычисляют коэффициент выбросов, а затем устанавливают его как значение загрязнения сильный>).
Обязательно ли его устанавливать ?. Значение по умолчанию для загрязнения - 0,1. Можно ли игнорировать это? если я не придал этому значения, повлияет ли это на результаты модели?
model = IsolationForest(contamination=0.1, n_estimators=1000)