Я использую Gensim's Doc2vec для обучения модели, и я использую infer_vector, чтобы вывести вектор нового документа для сравнения документа подобия модели. Однако повторное использование одного и того же документа может привести к очень разным результатам. Таким образом невозможно точно оценить похожие документы.
Поисковая сеть упоминает, что infer_vector имеет случайные характеристики, поэтому каждый раз, когда создается новый текстовый вектор, он будет другим.
Есть ли способ решить эту проблему проблема?
model_dm =pickle.load(model_pickle)
inferred_vector_dm = model_dm.infer_vector(i)
simsinput =model_dm.docvecs.most_similar([inferred_vector_dm],topn=10)