Метрики подобия

Я пытаюсь исследовать различные показатели и нашел много показателей сходства: евклидово расстояние, динамическое искажение времени, расстояние редактирования с реальным штрафом DISSIM, модель взвешенного выравнивания последовательности, расстояние пространственной сборки.

Однако у меня возник вопрос: есть ли какая-либо другая метрика, которая дает сходство во временном ряду. Я ищу что-то, что не только вычисляет показатель сходства между функциями, но и упорядочивает их в виде временных рядов (в порядке получения функций)?

Например: если у нас есть функции F1, F2, F3, F4, F5, F6,7, F8 и из них, если функции F1 F2 F4 F6 F8 похожи

Есть алгоритм, который дает на выходе F1 F2 F4 F6 F8 похожие в таком порядке:. т.е. есть ли алгоритм, который дает результат последовательно (с точки зрения времени)

Благодарю вас!


person user2359877    schedule 01.03.2017    source источник
comment
Можете уточнить свой вопрос? Вы ищете алгоритм, который будет упорядочивать функции, исходя из которых они наиболее похожи, или алгоритм, который учитывает время просмотра функции при расчете сходства?   -  person Matthew Pope    schedule 02.03.2017
comment
Ищу 2 вариант. Алгоритм должен группировать функции в зависимости от времени их получения. Например, если он получает функции F1-F10, он должен сказать, что функции 1, функции 2, функции 4, функции 6 аналогичны в порядке, в котором алгоритм получил функции.   -  person user2359877    schedule 02.03.2017
comment
Можете ли вы предоставить больше контекста? Представлены ли функции булевыми, скалярными или каким-либо другим типом значений? Вы проводите различие между еще не замеченным и определенно не имеющим функции?   -  person Matthew Pope    schedule 02.03.2017


Ответы (1)


Вопрос сбивает с толку. Но чего это стоит...

Динамическая деформация времени НЕ является показателем. Пространственное расстояние сборки не является метрикой.

Вы должны прочитать http://www.cs.unm.edu/~mueen/DTW.pdf

Если вы выполняете сравнения сходства временных рядов, то я на 99% уверен, что вам следует использовать DTW. Источник, я проверил больше показателей расстояния на большем количестве наборов данных, чем весь остальной мир вместе взятый. http://www.cs.ucr.edu/~eamonn/time_series_data/

person eamonn    schedule 03.03.2017