Типичный экземпляр кластера - иерархическая кластеризация

Я использую метод агломеративного иерархического кластера для кластеризации набора данных. Набор данных, который я использую для кластеризации, - это траектории. Я использую специальную функцию расстояния, чтобы оценить расстояние между траекториями. Код Matlab следующий: Z = linkage (ID, 'single', '@ my_distfun');

После кластеризации данных; Хотелось бы найти представительный экземпляр (или траекторию).

Как я могу найти репрезентативный экземпляр (траекторию) каждого кластера?


person Omar14    schedule 16.11.2015    source источник


Ответы (1)


Иерархическая кластеризация не предполагает репрезентативных экземпляров.

Вам придется самому определиться с определением.

Например, вы можете использовать элемент с наименьшим средним расстоянием до всех остальных. Или тот, у которого наименьшее среднее расстояние в квадрате, или ... многие другие варианты.

«Представитель» - термин субъективный.

person Has QUIT--Anony-Mousse    schedule 16.11.2015
comment
Спасибо, Анони. Я планировал использовать экземпляр «Представитель» для вычисления критерия суммы квадратов ошибок для оценки кластеризации. Предлагаете ли вы какие-либо другие критерии оценки внутренней кластеризации для оценки полученных кластеров? - person Omar14; 17.11.2015
comment
Ни один из этих критериев никогда не работал у меня. Ручная оценка - единственное, что работает. - person Has QUIT--Anony-Mousse; 17.11.2015