Публикации по тегам data-mining

Публикации по теме 'data-mining'

Краткая заметка о наивном байесовском классификаторе

Основная характеристика наивного байесовского классификатора заключается в том, что он предполагает условную независимость. Алгоритм наивной байесовской классификации является вероятностным классификатором. Он основан на вероятностных моделях, которые включают сильные независимые предположения. Эти независимые предположения часто не влияют на реальность, поэтому это называется наивным. Наивного байесовца можно обучать в контролируемой учебной среде. Принцип: Здесь каждая пара..

Применение метода передискретизации синтетического меньшинства (SMOTe) для несбалансированных наборов данных

"Сбор данных" Применение метода передискретизации синтетического меньшинства (SMOTe) для несбалансированных наборов данных В Data Science несбалансированные наборы данных не удивляют. Если наборы данных, предназначенные для задач классификации, таких как анализ настроений, медицинская визуализация или другие проблемы, связанные с дискретной прогнозной аналитикой (например, прогнозирование задержки полета), имеют неодинаковое количество экземпляров (образцов или точек данных) для..

Вопросы по теме 'data-mining'

как формировать правила с частыми наборами элементов с помощью mahout

Я изучаю fpgrowth в mahout, я нахожу функцию создания частых наборов элементов, но как сформировать правила с частыми наборами элементов с помощью mahout? это еще не реализовано в mahout?

1817 просмотров

data-mining mahout

08.11.2023

Метод классификации текста для этого сценария

Я совершенно новичок в алгоритмах машинного обучения, и у меня есть быстрый вопрос относительно классификации набора данных. В настоящее время существуют обучающие данные, состоящие из двух столбцов «Сообщение» и «Идентификатор». Сообщение —...

78 просмотров

machine-learning cluster-analysis classification data-mining

03.12.2023

Использование LabelEncoder sklearn в столбце фрейма данных

Если у меня есть фрейм данных, скажем, df, и если df["levels"] = pd.Series(["low", "low", "med", "low", "med", "high"]) Есть ли способ изменить это на: df["levels"] = pd.Series([0,0,1,0,1,2]) Я пробовал использовать...

1192 просмотров

python pandas scikit-learn data-mining

03.12.2023

как исключить очень близкие точки в области, чтобы отфильтровать точки интереса?

Я работаю над точками интереса и ищу способ отфильтровать очень близкие точки, чтобы избежать избыточности и облегчить описание, у кого-то есть идея? спасибо

29 просмотров

computer-vision image-processing data-mining

23.12.2023