Лексиконный словарь для слов-синонимов

Существует несколько словарей, доступных для обработки естественного языка. Например, словари положительных и отрицательных слов и т. д.

Есть ли доступный словарь, содержащий список синонимов для всех словарных слов?

лайк за nice

synonyms: enjoyable, pleasant, pleasurable, agreeable, delightful, satisfying, gratifying, acceptable, to one's liking, entertaining, amusing, diverting, marvellous, good; 

person Programming_crazy    schedule 17.05.2014    source источник


Ответы (2)


Хотя WordNet — хороший ресурс для поиска синонимов, следует учитывать его ограничения, вот пример с API Python в библиотеке NLTK:

Во-первых, слова имеют несколько значений (то есть смыслов):

>>> from nltk.corpus import wordnet as wn
>>> wn.synsets('nice')
[Synset('nice.n.01'), Synset('nice.a.01'), Synset('decent.s.01'), Synset('nice.s.03'), Synset('dainty.s.04'), Synset('courteous.s.01')]

И чтобы получить доступ к правильному смыслу слова, вам нужно знать правильный смысл слова в данном контексте.

>>> wn.synset('nice.a.01').definition()
u'pleasant or pleasing or agreeable in nature or appearance'

Вы можете попробовать программное обеспечение для устранения неоднозначности Word Sense, но оно не идеально (см. #8808962">Кто-нибудь знает хорошее программное обеспечение для устранения неоднозначности Word Sense?). Даже если вы знаете значение этого слова, число записей в wordnet ограничено. Вы не можете ожидать многого:

>>> wn.synset('nice.a.01').lemma_names()
[u'nice']
>>> wn.synset('nice.a.01').similar_tos()
[Synset('good.s.06'), Synset('pleasant.s.02')]
>>> [i.lemma_names() for i in wn.synset('nice.a.01').similar_tos()]
[[u'good'], [u'pleasant']]
person alvas    schedule 17.05.2014
comment
благодаря. Я хочу: для любого заданного слова/фразы мне нужен его синоним слова/фразы в моем приложении. Я работаю в PHP. Любая дополнительная ссылка? - person Programming_crazy; 18.05.2014
comment
вы можете попробовать просканировать thesaurus.com, но будьте осторожны с юридическими последствиями, если вы попытаетесь сохранить локальную копию их данных = ) - person alvas; 18.05.2014
comment
Нет, это не хорошее решение. Я хочу любую автономную базу данных. как файл текстового словаря - person Programming_crazy; 18.05.2014
comment
так что я думаю, вы должны заплатить за один или построить его =( - person alvas; 18.05.2014
comment
Знаете ли вы о wordnet (или другом) API, который дает синоним слов в автономном режиме? возможно для использования в php - person Programming_crazy; 22.05.2014
comment
@programming_crazy, три из них — это php API для wordnet: foxsurfer.com/wordnet - person alvas; 22.05.2014
comment
я работал над разработкой инструментов с wordnets (английский и не английский), и автоматическое получение синонимов — непростая задача. Это либо включает в себя много машинного обучения, либо ручное создание словаря. Последний стоит дорого, а первый дает шумный выход. Ооооо, это все еще считается сложной задачей в НЛП. попробуйте поискать в гугле paraphrase NLP - person alvas; 22.05.2014

«WordNet® — это большая лексическая база данных английского языка. Существительные, глаголы, прилагательные и наречия сгруппированы в наборы когнитивных синонимов (синсетов), каждый из которых выражает отдельное понятие»: http://wordnet.princeton.edu/

person Daniel Naber    schedule 17.05.2014
comment
благодаря. Я хочу: для любого заданного слова/фразы мне нужен его синоним слова/фразы в моем приложении. Я работаю в PHP. Любая дополнительная ссылка? - person Programming_crazy; 18.05.2014