Я тренирую пользовательскую модель в Spacy для извлечения пользовательских объектов, но, хотя мне нужно предоставить входные данные поезда, которые состоят из моих объектов вместе с местоположениями индекса, я хотел понять, есть ли более быстрый способ присвоить значение индекса для ключевых слов, которые я я ищу в конкретном предложении в моих данных обучения.
Пример моих тренировочных данных:
TRAIN_DATA = [
('Behaviour Skills include Communication, Conflict Resolution, Work Life Balance,
{'entities': [(25, 37, 'BS'),(40, ,60, 'BS'),(62, 79, 'BS')]
})
]
Теперь, чтобы передать положение индекса для определенных ключевых слов в моих обучающих данных, я в настоящее время подсчитываю его вручную, чтобы определить местоположение моего ключевого слова.
Например: в случае первой строки, где я говорю, что навыки поведения включают в себя общение и т. д., я вручную вычисляю расположение индекса для слова общение, которое равно 25,37.
Я уверен, что должен быть другой способ определить местоположение этих индексов какими-то другими методами, а не подсчитывать их вручную. Любые идеи, как я могу достичь этого?
str.find()
? - person krisograbek   schedule 18.02.2021