Я последовал примеру на странице документации Spark, чтобы использовать word2vec, link а>. Это сработало, но я не совсем понял, что он пытается вычислить.
Являются ли выходные векторы представлением выходных строк?
Если да, я попытался вычислить косинусное сходство между ними, но получил отрицательные значения, потому что векторы не положительны.
Может ли Spark word2vec создавать только положительные векторы?
Как вычислить сходство между списком строк с помощью Spark word2vec?