встраивание позиций слов в керас

Я пытаюсь построить систему извлечения отношений для взаимодействий между лекарствами с помощью CNN, и мне нужно сделать вложения для слов в моих предложениях. План состоит в том, чтобы представить каждое слово в предложениях в виде комбинации трех встраиваний: (w2v, dist1, dist2), где w2v - это предварительно обученное вложение word2vec, а dist1 и dist2 - относительные расстояния между каждым словом в предложении и двумя наркотиками, которые возможно связаны.

Я не понимаю, как я должен подходить к вопросу заполнения, чтобы каждое предложение было одинаковой длины. Должен ли я дополнить токенизированные предложения некоторой серией строк (какой строкой?), Чтобы уравнять их длину перед любым встраиванием?


person seanysull    schedule 03.05.2018    source источник


Ответы (1)


Вы можете вычислить максимальное расстояние между упоминаниями сущностей, связанными отношением, и выбрать входную ширину, превышающую это расстояние. Это гарантирует, что каждый ввод (упоминание отношения) будет иметь одинаковую длину, путем обрезки более длинных предложений и дополнения более коротких предложений специальным токеном.

person Mayur Bhangale    schedule 03.05.2018