Поддерживает ли CMU sphinx4 распознавание неанглийской речи?

Я знаю, что sphinx 3 (теперь он называется Pocketsphinx) поддерживает распознавание речи не на английском языке, например, на немецком, испанском и китайском. Но поддерживает ли sphinx 4 и эти языки?

Для распознавания речи необходимы три файла: файл акустической модели, файл языковой модели и файл словаря. Но sphinx 4 может читать только файл в кодировке ASCII, в то время как некоторые неанглоязычные словари и языковые модели кодируются UTF-8.

Кажется, что CMU sphinx 4 по умолчанию может поддерживать только язык с кодировкой ASCII. Это правда?

Любая помощь будет оценена!!!


person Bily    schedule 13.11.2013    source источник


Ответы (1)


Кажется, что CMU sphinx 4 по умолчанию может поддерживать только язык с кодировкой ASCII. Это правда?

sphinx4 поддерживает файлы в кодировке utf-8. Чтобы убедиться, что java использует utf-8 для ввода-вывода, вы можете добавить параметр в командную строку java (или в JVM в вашей среде IDE):

   -Dfile.encoding=utf-8
person Nikolay Shmyrev    schedule 13.11.2013