Я знаю, как применить скрытую марковскую модель (HMM), когда у меня есть изолированная фонема. Мне просто нужно было бы создать несколько моделей HMM (по крайней мере, с 3 состояниями на модель), по одной для каждой фонемы, вычислить прямой алгоритм для всех из них и посмотреть, какое из них имеет наибольшую вероятность.
Но теперь у меня есть непрерывная база данных речи, фонемы помечены в каждом кадре (TIMIT). Как мне обучить HMM, чтобы он мог распознавать фонемы в непрерывной речи?