Алгоритм кластеризации для получения кластеров одинакового размера

Я пытаюсь сформировать кластеры вокруг медоидов, используя алгоритм PAM в R. Можно ли как-то исправить размер кластера для PAM (несколько перебором размера кластера)? Существуют ли какие-либо другие алгоритмы кластеризации, которые обеспечат кластеры одинакового размера для медоидов?

Спасибо заранее за вашу помощь.


person Lawrence    schedule 03.06.2016    source источник
comment
Дублировать в: stats.stackexchange.com/questions/8744/   -  person Has QUIT--Anony-Mousse    schedule 03.06.2016
comment
Особый случай дублирования: Оптимальная группировка/кластеризация элементов в группы минимального размера   -  person Has QUIT--Anony-Mousse    schedule 04.06.2016
comment
Привет @Lawrence, ты получил ответ на эту проблему? Я ищу реализацию R такого алгоритма, но не смог найти. Благодарность   -  person agenis    schedule 26.09.2017


Ответы (1)


Вы можете изменить алгоритм кластеризации в соответствии со своими потребностями.

Вы можете следовать этому учебнику по K-средним одинакового размера или просто используйте этот алгоритм из пакета/модуля tutorial в ELKI (соберите последнюю версию с GitHub, потому что я только что исправил там ошибку — это будет включено в ELKI 0.7.2).

По сути, этот алгоритм выполняет оптимизацию методом наименьших квадратов в стиле k-средних, но все кластеры должны иметь одинаковый размер (если N/k не является целым числом, размеры кластеров могут отличаться на 1).

Если вы перейдете к учебнику выше и прокрутите вниз, вы увидите примеры результатов.

person Erich Schubert    schedule 06.06.2016
comment
Спасибо за ваш ответ. К сожалению, я работаю с матрицей различий (у меня нет координат, чтобы использовать kmeans). Мои данные находятся в объектах формы, а вес атрибутов для каждой пары. Вот почему я использую PAM. Однако я разработал свой собственный алгоритм кластеризации, соответствующий моей проблеме. Выложу, когда закончу кодить. Еще раз спасибо ! - person Lawrence; 09.06.2016
comment
Вы можете по существу следовать руководству, но работать с KMedoidsEM вместо KMeans. Это похоже на k-means, но использует медоид, как PAM. С указанными выше изменениями вы получите k-medoids, который гарантирует, что кластеры имеют одинаковый размер. - person Erich Schubert; 09.06.2016