Где результат встраивания слов после запуска word2vec.py в TensorFlow?

Я запустил файл «word2vec.py» в папке «/tensorflow/models/embedding/». Но я не могу найти результат встраивания слов в выходную папку, и там только файлы моделей и какие-то неизвестные файлы, такие как этот:

файлы результатов word2vec


person Jey Zhang    schedule 21.03.2016    source источник


Ответы (1)


Так как из статьи Миколова видно, что вывод вложений всех слов не получается в финальном слое. Вместо этого они отсекают последний слой и берут веса скрытого слоя, который имеет размерность: [vocab_size x embd_dim], т. е. каждая строка представляет собой вектор слова (размерность: embd_dim) соответствующего слова.

Обратитесь к этому для лучшего понимания: http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/

Итак, в реализации тензорного потока tf.embedding_lookup имеет вложения всех слов. Он упоминается в строке 26 файла word2vec.py в /tensorflow/models/embedding/.

24 The key ops used are:
25 * placeholder for feeding in tensors for each example.
26 * embedding_lookup for fetching rows from the embedding matrix.
27 * sigmoid_cross_entropy_with_logits to calculate the loss.
28 * GradientDescentOptimizer for optimizing the loss.
29 * skipgram custom op that does input processing.
person Vijay Prakash Dwivedi    schedule 03.07.2017