Я использую инструмент ParagraphVector в рамках DeepLearning4j. Я тренирую модель на наборе текстовых документов, а затем вычисляю сходство между этими документами.
Теперь, как сказано на справочной странице (http://deeplearning4j.org/word2vec), показатель, используемый инструментом для вычисления сходства используется косинусное сходство, которое должно быть включено между 0 и 1. Однако для некоторых пар документов я получаю отрицательные оценки.
Кто-нибудь может сказать, почему это так?
Заранее спасибо.