Я пытаюсь построить систему извлечения отношений для взаимодействий между лекарствами с помощью CNN, и мне нужно сделать вложения для слов в моих предложениях. План состоит в том, чтобы представить каждое слово в предложениях в виде комбинации трех встраиваний: (w2v, dist1, dist2), где w2v - это предварительно обученное вложение word2vec, а dist1 и dist2 - относительные расстояния между каждым словом в предложении и двумя наркотиками, которые возможно связаны.
Я не понимаю, как я должен подходить к вопросу заполнения, чтобы каждое предложение было одинаковой длины. Должен ли я дополнить токенизированные предложения некоторой серией строк (какой строкой?), Чтобы уравнять их длину перед любым встраиванием?