Публикации по теме 'clustering'


Шпаргалка по алгоритмам кластеризации
Алгоритмы кластеризации являются одним из самых популярных алгоритмов, используемых специалистами по машинному обучению во всем мире для решения задач классификации. Наиболее популярным среди всех алгоритмов кластеризации является кластеризация K-средних, но в этой истории мы увидим, как он работает, какие есть другие доступные варианты, когда какие использовать, чем они все отличаются и многое другое. К-средние Это требует от нас знать, каково возможное количество кластеров,..

Прогнозирование популярности песни
Понимание бизнеса Многие артисты, продюсеры и звукозаписывающие компании в музыкальной индустрии стремятся создать хит, но каков идеальный баланс танцевальности, энергии, темпа, продолжительности и других факторов, которые могут обеспечить популярность? По данным Business Insider, артисты обычно зарабатывают от 0,003 до 0,005 долларов за стрим, то есть требуется около 250 стримов, чтобы заработать всего 1 доллар. Эти деньги поступают от абонентской платы Spotify и дохода,..

Иерархическая кластеризация
Иерархическая кластеризация группирует (агломеративный или также называемый восходящим подходом) или делит (разделительный или также называемый нисходящим подходом) кластеры на основе показателей расстояния. В агломеративной кластеризации каждая точка данных сначала действует как кластер, а затем группирует кластеры один за другим. Разделительный — это противоположность агломеративному, он начинается со всех точек в один кластер и разделяет их для создания большего количества кластеров...

Сегментация клиентов - Часть I
Сегментация онлайн-покупателей по описанию позиции Введение Сегментация клиентов - одно из наиболее распространенных применений анализа данных / науки о данных. В этой серии двух публикаций мы увидим пример сегментации клиентов. Мы собираемся использовать набор данных Online Retail II , который содержит транзакции онлайн-розничной торговли в Великобритании с 1/12/2009 по 09/12/2011. Набор данных содержит 1.067.371 строки о покупках 5.943 клиентов. Как мы видим, набор данных..

Кластеризация пополам K-средних
Разделение k-средних значений пополам - это гибридный подход между разделенной иерархической кластеризацией (кластеризация сверху вниз) и кластеризацией K-средних. Вместо разделения набора данных на K кластеров на каждой итерации, алгоритм деления пополам k-средних разбивает один кластер на два подкластера на каждом шаге деления пополам (с использованием k-средних) до тех пор, пока не будут получены k кластеров. Разделительная иерархическая кластеризация Разделительная..