Я хочу построить языковую модель, в которой я хочу оценить вероятности ngram. Итак, мой вопрос: каковы наилучшие корпуса и инструменты, которые мы могли бы использовать для оценки вероятностей ngram?
Благодарность
Я хочу построить языковую модель, в которой я хочу оценить вероятности ngram. Итак, мой вопрос: каковы наилучшие корпуса и инструменты, которые мы могли бы использовать для оценки вероятностей ngram?
Благодарность
Вы видели это? : вы можете использовать его без повторного вычисления с нуля: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
Для упрощения загрузки см. это: https://pypi.python.org/pypi/google-ngram-downloader/