В настоящее время я использую gensim, чтобы воспроизвести результат примера, предоставленного Google. здесь
Проблема в том, что проверка точности gensim не совпадает с результатами Google.
Например, точность определения стран-столиц в Google составляет 82,02%, лучший результат генерации различных наборов параметров - 64,4%. Здесь большой пробел.
Вот фрагмент кода поезда word2vec и точности с помощью gensim
sentences = word2vec.Text8Corpus('./text8')
model = word2vec.Word2Vec(sentences, size=200, workers=12, min_count=5, sg=0, window=8, iter=15, sample=1e-4, negative=25)
model.accuracy("./questions-words.txt")[enter image description here][2]
Фрагмент кода демонстрации Google без изменений каких-либо параметров
./demo-word-accuracy.sh
Кто-нибудь может помочь в этом?