Найдите семантически похожее слово для обработки естественного языка

Я работаю над проектом обработки естественного языка на Java. У меня есть требование, в котором я хочу идентифицировать слова, принадлежащие к аналогичным семантическим группам. например : если встречаются такие слова, как study, university, graduate, attend, я хочу, чтобы они были отнесены к категории связанных с образованием. Если встречаются такие слова, как golfer, batsman, athlete, все должно быть отнесено к родителю, например, к спортсмену. Могу ли я выполнить эту задачу без использования тренировочного подхода? Есть ли какие-то пошлины, такие как WordNet, которые можно использовать напрямую? Приветствуется любой указатель! Спасибо, ура !! :-)


person Dee    schedule 10.04.2015    source источник


Ответы (1)


Да, вы можете использовать WordNet. Например, вы можете искать среди гиперонимов текущего слова (например, study) по слову вашей категории (например, education или sport). Существуют JAWS, JWNL и другие библиотеки, см. связанный вопрос.

В качестве альтернативы вы можете вычислить сходство между словами-кандидатами и словами категории - например, с помощью ws4j или Аналогично.

person Nikita Astrakhantsev    schedule 10.04.2015
comment
Гиперонимы WordNet действительно дают сходство между нужными мне словами. Я постараюсь прочитать текст, чтобы установить связь между каждым словом. Спасибо! Ваше здоровье! - person Dee; 11.04.2015
comment
Я пытался найти способ сделать это с помощью WordNet, но я действительно не мог найти способ обойтись. Я пробовал использовать code.google.com/p/ws4j, но это не дает последовательного Результаты. Пожалуйста, помогите мне! - person Dee; 15.04.2015
comment
Я думаю, вам следует создать новый вопрос (более конкретный, чем этот) и описать в нем свои шаги, фактические результаты и ожидаемые результаты. В настоящее время у меня недостаточно информации, чтобы понять, в чем ваша проблема. - person Nikita Astrakhantsev; 15.04.2015