Я кластеризовал некоторые данные с помощью Spark и теперь хочу получить оценку сходства между конкретной интересующей меня записью и другими элементами в том же кластере, в котором находится моя запись. Существуют ли какие-либо алгоритмы или методы Spark для этого?
Я читал о функции ColumnSimilarities() для RowMatrix, но меня не интересует сходство «все против всех», а только очень конкретное по сравнению с набором других векторов.