Создание обучающего набора данных для распознавания именованных сущностей для должностей

Я хочу узнавать названия должностей по текстам. Как я могу создать больший набор обучающих данных, расширив свой небольшой набор обучающих данных? Существуют ли готовые пакеты или открытые проекты для расширенного обучающего набора?


person Jane    schedule 07.10.2014    source источник


Ответы (2)


Существует открытый набор из ~ 44 000 названий должностей и соответствующих им стандартных кодов должностей, опубликованных как часть O * Net (Программа данных о профессиях Министерства труда США). Вы можете скачать файл здесь:

https://www.onetcenter.org/database.html#occ

person neilb    schedule 07.10.2014

Для такого рода запросов вы можете отправить электронное письмо в список рассылки корпорации:

http://www.hit.uib.no/corpora/welcome.html

person eldams    schedule 08.10.2014