Есть ли какой-либо метод кластеризации подпространств для работы с числовыми атрибутами?

Я пытаюсь применить какой-то метод кластеризации к своим наборам данных (с числовыми размерами). Но я убежден, что функции имеют разный вес для разных кластеров. Я читал, что существует подход, называемый мягкой кластеризацией подпространств, который пытается идентифицировать кластеры и веса функций для каждого кластера одновременно. Однако найденные мной алгоритмы применимы только к категориальным данным.

Я пытаюсь определить алгоритм мягкой кластеризации подпространств для числовых. Знаете ли вы, есть ли они, или как я могу адаптировать методы, изначально разработанные для работы с категориальными данными, для работы с числовыми данными (я думаю, что необходимо предложить какой-то способ измерения релевантности каждой числовой характеристики в каждом кластере)?


comment
SUBCLU, DBSCAN, SUBSCALE?   -  person Tiago Martins Peres 李大仁    schedule 03.02.2018


Ответы (1)


Да, существуют десятки алгоритмов кластеризации подпространств.

Вам нужно будет провести надлежащее исследование литературы, это слишком широко, чтобы охватить QA, например переполнение стека. Поищите (неожиданно) «кластеризацию подпространств», но также включите, например, «бикластеризацию».

person Has QUIT--Anony-Mousse    schedule 03.02.2018
comment
Но бикластеризация - это своего рода ЖЕСТКАЯ кластеризация подпространств. Я ищу SOFT подпространственную кластеризацию для числовых данных. - person Paulo; 03.02.2018
comment
Я почти уверен, что из этой дюжины некоторые из них мягкие, или их можно тривиально превратить в мягкую кластеризацию. И почти все они будут числовыми данными. - person Has QUIT--Anony-Mousse; 04.02.2018