Я искал решение этой проблемы в течение нескольких недель, у меня есть несколько документов (около 95), которые я пытаюсь классифицировать с помощью GATE. Я поместил их в один корпус, который я назвал training_corpus, однако после того, как ANNIE прокомментировала корпус, мне нужно вернуться в каждый файл, выбрать все токены в документе и создать аннотацию под названием Mention с типом функции и значением класса. для документа. Например:
type Start End id Features
Упоминание 0 70000 2588 {type=neg}
Есть ли способ автоматически сделать это с JAPE? По сути, я хочу выбрать все токены и создать новую аннотацию с функцией (тип = класс). Кроме того, класс добавляется к документу. Поскольку документов много, может ли JAPE извлечь класс из имени документа и установить для него значение функции «Упоминания». Пример имени документа — neg_data1.txt, поэтому аннотация будет Mention.type = neg?
Любая помощь будет оценена. Спасибо