Я читаю необработанную статью word2vec: http://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf
Согласно приведенному ниже уравнению, каждое слово имеет два вектора, один из которых используется для прогнозирования слова контекста в качестве центрального слова, а другой используется в качестве слова контекста. Для первого мы можем обновлять его с помощью градиентного спуска на каждой итерации. Но как обновить последнюю? И какой вектор является конечным вектором в окончательной модели?