Как я могу указать NLTK обрабатывать текст на определенном языке?
Время от времени я пишу специализированную процедуру NLP для тегирования POS, токенизации и т. д. в текстовом домене, отличном от английского (но все еще индуистско-европейского).
Этот вопрос, похоже, касается только разных корпусов, а не изменения кода/настроек: Тегирование POS на немецком языке
В качестве альтернативы, существуют ли какие-либо специализированные модули НЛП для иврита/испанского/польского языков для python?