содержит ли k-means кластеризатор apache commons math метод средних?

Я должен получить средства кластеризации k-средних. в настоящее время я использую математическую библиотеку apache commons, которая реализует алгоритм кластеризации k-means plus plus. кто-нибудь знает, есть ли простой способ получить средства после кластеризации с помощью этой библиотеки или мне нужно реализовать это самому?
если нет, можете ли вы объяснить мне, как это рассчитать, или привести пример кода?


person chef    schedule 10.04.2014    source источник


Ответы (2)


Выходные данные алгоритма кластеризации должны как минимум содержать назначения кластеров, т. е. к какому кластеру принадлежит каждая точка. Если у вас есть это, то кластерные центры k-средних просто задаются средним значением точек, принадлежащих каждому кластеру.

person user2566092    schedule 10.04.2014
comment
хорошо, и если точка состоит из нескольких измерений, среднее значение рассчитывается для каждого кластера следующим образом: получить все точки кластера -> суммировать все значения в столбце (измерении) вверх -> разделить на количество точек? - person chef; 11.04.2014
comment
А именно, каждое измерение в среднем векторе представляет собой среднее значение значений в этом измерении для всех точек кластера, т. е. сумму всех значений точек в этом измерении для точек, принадлежащих кластеру, деленную на общее количество точек в кластер. - person user2566092; 11.04.2014

KMeansPlusPlusClusterer (пакет org.apache.commons.math3.ml.clustering, версия 3.2+) возвращает список объектов CentroidCluster. Из CentroidCluster вы можете получить центр кластера (= среднее значение точек кластера), вызвав метод getCenter().

person T. Neidhart    schedule 27.06.2014