встраивание позиций слов в керас

Я пытаюсь построить систему извлечения отношений для взаимодействий между лекарствами с помощью CNN, и мне нужно сделать вложения для слов в моих предложениях. План состоит в том, чтобы представить каждое слово в предложениях в виде комбинации трех встраиваний: (w2v, dist1, dist2), где w2v - это предварительно обученное вложение word2vec, а dist1 и dist2 - относительные расстояния между каждым словом в предложении и двумя наркотиками, которые возможно связаны.

Я не понимаю, как я должен подходить к вопросу заполнения, чтобы каждое предложение было одинаковой длины. Должен ли я дополнить токенизированные предложения некоторой серией строк (какой строкой?), Чтобы уравнять их длину перед любым встраиванием?

seanysull 03.05.2018 источник

Ответы (1)

arrow_upward
0
arrow_downward

Вы можете вычислить максимальное расстояние между упоминаниями сущностей, связанными отношением, и выбрать входную ширину, превышающую это расстояние. Это гарантирует, что каждый ввод (упоминание отношения) будет иметь одинаковую длину, путем обрезки более длинных предложений и дополнения более коротких предложений специальным токеном.

Mayur Bhangale 03.05.2018

встраивание позиций слов в керас

Ответы (1)

Похожие вопросы