Я должен получить средства кластеризации k-средних. в настоящее время я использую математическую библиотеку apache commons, которая реализует алгоритм кластеризации k-means plus plus. кто-нибудь знает, есть ли простой способ получить средства после кластеризации с помощью этой библиотеки или мне нужно реализовать это самому?
если нет, можете ли вы объяснить мне, как это рассчитать, или привести пример кода?
содержит ли k-means кластеризатор apache commons math метод средних?
Ответы (2)
Выходные данные алгоритма кластеризации должны как минимум содержать назначения кластеров, т. е. к какому кластеру принадлежит каждая точка. Если у вас есть это, то кластерные центры k-средних просто задаются средним значением точек, принадлежащих каждому кластеру.
person
user2566092
schedule
10.04.2014
хорошо, и если точка состоит из нескольких измерений, среднее значение рассчитывается для каждого кластера следующим образом: получить все точки кластера -> суммировать все значения в столбце (измерении) вверх -> разделить на количество точек?
- person chef; 11.04.2014
А именно, каждое измерение в среднем векторе представляет собой среднее значение значений в этом измерении для всех точек кластера, т. е. сумму всех значений точек в этом измерении для точек, принадлежащих кластеру, деленную на общее количество точек в кластер.
- person user2566092; 11.04.2014
KMeansPlusPlusClusterer (пакет org.apache.commons.math3.ml.clustering, версия 3.2+) возвращает список объектов CentroidCluster. Из CentroidCluster вы можете получить центр кластера (= среднее значение точек кластера), вызвав метод getCenter().
person
T. Neidhart
schedule
27.06.2014