Я пробую OpenNLP для албанского языка. Для этого я использую OPenNLP и пытаюсь построить модели для распознавания лиц, местоположений и организаций на албанском языке. Я сам создаю корпус, но мне нужен эксперт по Открытому НЛП, чтобы подтвердить мои сомнения ниже: 1- Должен ли я построить отдельный корпус для каждой модели, например для нер-персоны построить корпус, где присутствуют только теги? 2- Можно ли пометить человека, местоположение и организацию в одном корпусе и использовать его для обучения единой модели, способной извлекать все три типа сущностей? 3- есть ли ресурс, где я могу найти больше информации об алгоритме, используемом в модуле поиска имен OpenNLP?
Спасибо за ответ, мне очень нужна ваша поддержка моей диссертации