База данных частотности слов со смыслами

Я ищу загружаемую базу данных частот / вероятностей слов, включая их значения. В идеале, если бы он был отображен с помощью WordNet.

В списке некоторые слова будут перечислены несколько раз, если они имеют несколько значений, например частота для слова «берег» как учреждения будет больше, чем «берег» реки.

Также были бы полезны другие наборы данных, показывающие частоты по словам / частям речи.

Спасибо, что прочитали это.


person piernik    schedule 28.04.2020    source источник


Ответы (1)


Частоты N грамм доступны в данных Google Ngram. Хотя это не дает ответа на словесную или «чувственную» часть вопроса, это хорошее начало.

Используйте этот пакет для экспериментов с тем же

person SidharthMacherla    schedule 29.04.2020