как формировать правила с частыми наборами элементов с помощью mahout

Я изучаю fpgrowth в mahout, я нахожу функцию создания частых наборов элементов, но как сформировать правила с частыми наборами элементов с помощью mahout? это еще не реализовано в mahout?


person whiletrue    schedule 17.07.2012    source источник


Ответы (2)


Вычисление правил из частых шаблонов довольно просто и, вероятно, не дает много преимуществ от параллелизма и распределенности. В конце концов, ожидается, что вы получите гораздо меньше частых шаблонов из ваших данных.

Так что это может быть намного быстрее сделать вне Mahout, в зависимости от количества частых шаблонов, которые у вас есть.

person Has QUIT--Anony-Mousse    schedule 17.07.2012

Mahout не специализируется на анализе шаблонов.

Вы можете проверить программное обеспечение SPMF: http://www.philippe-fournier-viger.com/spmf/index.php (я автор).

Он имеет исходный код Java для более чем 45 алгоритмов, связанных с частым анализом наборов элементов и правил ассоциации.

Он включает алгоритмы для некоторых классических алгоритмов, таких как FPGrowth. Но он также предлагает несколько специализированных алгоритмов, которые вы не найдете в других инструментах интеллектуального анализа данных, таких как добыча редких наборов элементов, стираемых наборов элементов, наборов элементов с высокой полезностью, наборов элементов из сомнительных данных и т. д. и т. д.

Например, существует множество различных типов правил ассоциации, которые вы можете попробовать помимо «классических» правил ассоциации, таких как закрытые правила ассоциации, информативные и общие базовые правила ассоциации, последовательные правила и т. д. и т. д.

Он находится под лицензией GPL и имеет простой графический интерфейс для некоторых из самых популярных алгоритмов, и если у вас есть какие-либо вопросы, вы можете задать их на форуме, и я постараюсь ответить вам.

person Phil    schedule 18.07.2012
comment
В mahout есть только то, что они называют Parallel FP-Growth для поиска наборов предметов. Не существует алгоритмов для генерации правил ассоциации после того, как наборы элементов будут найдены. Если вы хотите найти правила с помощью Mahout, вам нужно будет реализовать их самостоятельно. Кроме того, обратите внимание, что то, что они называют Parallel FPGrowth, немного отличается от оригинального FPGrowth. Версия в Mahout добывает наборы элементов из топ-к, а не наборы элементов с порогом minsup. - person Phil; 31.07.2012