CMU Sphinx4: распознавание да/нет на испанском языке

Мы пытаемся заставить CMU Sphinx4 распознавать только слова yes и no на испанском языке (si и no). Мы внедрили Sphinx4 с испанской моделью es_cont_2000 от voxforge. Мы создали языковую модель (прикреплена ниже), и при распознавании слова «Нет» имеем почти 100% точность. Однако при распознавании «Si» (Да) это всего около 50%.

Есть ли у кого-нибудь предложения о том, как повысить точность для такого сокращенного набора слов, помимо адаптации языковой модели (http://cmusphinx.sourceforge.net/wiki/tutorialadapt)?

Есть ли лучшие языковые модели для латиноамериканского испанского или других способов?

This is an ARPA-format language model file, generated by CMU Sphinx
\data\
ngram 1=4
ngram 2=4
ngram 3=4

\1-grams:
-0.7782 </s> -0.1761
-0.3010 <s> -0.5228
-0.7782 no -0.3978
-0.7782 si 0.0000

\2-grams:
-0.1761 </s> <s> -0.0791
-0.3978 <s> no 0.1761
-0.3978 <s> si -0.2217
-0.1761 no </s> 0.1761

\3-grams:
-0.3010 </s> <s> si 
-0.3010 <s> no </s> 
-0.3010 <s> si </s> 
-0.3010 no </s> <s> 

\end\

person jblaya    schedule 14.07.2014    source источник
comment
Чтобы получить помощь по точности, стоит предоставить полный набор данных для воспроизведения ваших проблем (аудиозапись, точная настройка декодера и т. д.).   -  person Nikolay Shmyrev    schedule 15.07.2014
comment
Спасибо Николай, я включил аудио и другие переменные в этот файл dropbox. com/s/lzzcamoduc7uir3/sphinx.tar.gz Если есть лучший способ или вам нужно что-то еще, дайте мне знать.   -  person jblaya    schedule 16.07.2014


Ответы (1)


Вы можете использовать следующую командную строку:

for f in *.wav ; do echo $f; pocketsphinx_continuous -infile $f -hmm es_cont_2000 -jsgf es.jsgf -dict es.dic -lw 1.0 -logfn /dev/null; done

Следующий эс.дик

si S I
no N O

Следующая грамматика jsgf:

#JSGF V1.0;
grammar sino;
public <sino> = si | no;

Результат будет:

no_andrea_converted.wav
000000000: no
no_dani_converted.wav
000000000: no
no_IM_converted.wav
000000000: no
si_andrea_converted.wav
000000000: si
si_dani_converted.wav
000000000: si
si_IM_converted.wav
000000000: si

Вам необходимо использовать последние версии pocketsphinx и sphinxbase из http://github.com/cmusphinx. -lw 1.0 параметр важен.

person Nikolay Shmyrev    schedule 16.07.2014
comment
Николай, спасибо, а зачем ты поставил pocketsphinx_continuous в первую строчку? Должен ли это быть sphinx, поскольку мы используем Sphinx4? Насколько я понимаю, вы используете либо pocketsphinx, либо sphinx4. - person jblaya; 17.07.2014