Apache OpenNLP, как обучить или сделать новую модель?

Например, en name finder не находит некоторые имена, а я хочу добавить новые данные в существующую модель данных. Я нашел этот ответ нажмите здесь, но я не понимаю

что такое en-ner-person.train? это клон en-ner-person.bin?

Мы должны загрузить существующую модель и добавить новые данные из файла? Какой тип информации должен содержать txt file?


person Armen Arzumanyan    schedule 08.09.2014    source источник


Ответы (2)


en-ner-person.train — файл обучения, а en-ner-person.bin — модель.

Файл обучения состоит из обучающих данных, с помощью которых вы обучаете свою модель.

текстовый файл должен содержать тренировочные данные, которые вы хотите добавить, в правильном формате. Взгляните на это, в котором объясняется, как обучать модель.

person iamgr007    schedule 11.10.2016

Вы можете проверить эту ссылку, он использует википедию, чтобы иметь корпус (набор документов) для обучения вашей модели.

person salmuz    schedule 08.09.2014
comment
ссылка недействительна - person Abhishek Sengupta; 20.02.2020