Алгоритм агломерационной кластеризации, который сохраняет порядок точек данных?

Мне нужна реализация иерархической кластеризации (желательно в Matlab), которая сохраняет порядок моих точек данных. Например, я не хочу, чтобы он выводил что-то вроде этого

(((1, 5), (2, 3)), 4)

Я почти уверен, что для этого есть лучший термин. Мне просто нужно, чтобы кластеры находились рядом друг с другом в том же порядке, что и ввод.


person Mohammad Moghimi    schedule 13.06.2013    source источник
comment
Вы сами пробовали реализовать? Это не особенно сложно, и я не думаю, что это согласуется с интуицией кластерного анализа.   -  person Has QUIT--Anony-Mousse    schedule 14.06.2013
comment
Ok. Допустим, у меня есть видео, и мне нравится сегментировать видео по времени на основе различий между кадрами. Тогда я не хочу группировать несмежные сегменты.   -  person Mohammad Moghimi    schedule 14.06.2013


Ответы (1)


То, что вы пытаетесь сделать, это больше не использовать кластерный анализ. Это похоже, но не кластеризация.

Вы пытаетесь сегментировать свои данные, т. е. у вас есть заданная последовательность, и вы ищете хорошие точки для ее разделения.

При обычном подходе к кластерному анализу у вас есть множество отдельных элементов, и вы хотите собрать их, чтобы агрегировать соседние объекты; таким образом, чтобы они могли быть или не быть смежными.

На самом деле, вместо того, чтобы пытаться взломать алгоритм кластеризации для достижения ваших целей, имеет смысл тонны начать с исходной точки и, возможно, просто «повторно использовать» некоторые идеи, которые ранее использовались в кластеризация.

Причина не только техническая, но и вопрос интуиции.

person Has QUIT--Anony-Mousse    schedule 14.06.2013
comment
Спасибо @Anony-Mousse. Я просто проверял, существует ли такая реализация. Не создавать колеса с нуля. - person Mohammad Moghimi; 15.06.2013
comment
Однако вы можете использовать Generalized DBSCAN. В обобщенной версии вы можете указать предопределенный порядок в качестве соседей, а затем, например. используйте низкую дисперсию в качестве предиката основной точки. - person Has QUIT--Anony-Mousse; 15.06.2013