Я работаю над проектом обработки естественного языка на Java. У меня есть требование, в котором я хочу идентифицировать слова, принадлежащие к аналогичным семантическим группам. например : если встречаются такие слова, как study
, university
, graduate
, attend
, я хочу, чтобы они были отнесены к категории связанных с образованием. Если встречаются такие слова, как golfer
, batsman
, athlete
, все должно быть отнесено к родителю, например, к спортсмену. Могу ли я выполнить эту задачу без использования тренировочного подхода? Есть ли какие-то пошлины, такие как WordNet, которые можно использовать напрямую? Приветствуется любой указатель! Спасибо, ура !! :-)
Найдите семантически похожее слово для обработки естественного языка
Ответы (1)
Да, вы можете использовать WordNet. Например, вы можете искать среди гиперонимов текущего слова (например, study
) по слову вашей категории (например, education
или sport
). Существуют JAWS, JWNL и другие библиотеки, см. связанный вопрос.
В качестве альтернативы вы можете вычислить сходство между словами-кандидатами и словами категории - например, с помощью ws4j или Аналогично.
person
Nikita Astrakhantsev
schedule
10.04.2015
Гиперонимы WordNet действительно дают сходство между нужными мне словами. Я постараюсь прочитать текст, чтобы установить связь между каждым словом. Спасибо! Ваше здоровье!
- person Dee; 11.04.2015
Я пытался найти способ сделать это с помощью WordNet, но я действительно не мог найти способ обойтись. Я пробовал использовать code.google.com/p/ws4j, но это не дает последовательного Результаты. Пожалуйста, помогите мне!
- person Dee; 15.04.2015
Я думаю, вам следует создать новый вопрос (более конкретный, чем этот) и описать в нем свои шаги, фактические результаты и ожидаемые результаты. В настоящее время у меня недостаточно информации, чтобы понять, в чем ваша проблема.
- person Nikita Astrakhantsev; 15.04.2015