Я хочу узнавать названия должностей по текстам. Как я могу создать больший набор обучающих данных, расширив свой небольшой набор обучающих данных? Существуют ли готовые пакеты или открытые проекты для расширенного обучающего набора?
Создание обучающего набора данных для распознавания именованных сущностей для должностей
Ответы (2)
Существует открытый набор из ~ 44 000 названий должностей и соответствующих им стандартных кодов должностей, опубликованных как часть O * Net (Программа данных о профессиях Министерства труда США). Вы можете скачать файл здесь:
https://www.onetcenter.org/database.html#occ
person
neilb
schedule
07.10.2014
Для такого рода запросов вы можете отправить электронное письмо в список рассылки корпорации:
http://www.hit.uib.no/corpora/welcome.html
person
eldams
schedule
08.10.2014