Как сравнить формы волны двух саундтреков с помощью .net?

Я пытаюсь написать программу, которая могла бы проверять произношение пользователя.

Эта программа будет воспроизводить звук волны, произнести английское предложение, и пользователь попытается произнести его и записать свой голос, а программа проверит сходство этих форм волны и оценит произношение пользователя.

Вопрос в том, можно ли написать эту программу, используя .net? И если да, то какие библиотеки я могу использовать? Любое руководство для начала?


person mesut    schedule 18.07.2013    source источник


Ответы (2)


Программы распознавания музыки обычно представляют звук в спектральной области (как для захвата высоты тона).

Из некоторого спектрального представления может использоваться мера расстояния (евклидова или другая).

Для речи необходимо измерение времени.

В пространственной области меры деформации, учитывающие временные деформации (медленные или быстрые), также кажутся хорошим выбором.

Алгоритмы сопоставления шаблонов могут быть хорошими кандидатами, как и алгоритмы OCR, но теперь вы будете иметь дело со звуковой волной.

Обычным рассмотрением алгоритмов звуковых волн являются скользящие окна или сегментация.

person user2293601    schedule 18.07.2013

месут!

Предполагая, что вы используете C#.NET, у меня может быть для вас ответ. Простой поиск в Google привел меня к этому видео на YouTube, в котором показано, как «строить графики аудиосигналов»: http://www.youtube.com/watch?v=ZnFoVuOVrUQ

Удачи, а остальное зависит от вас!

person ChristonianCoder    schedule 18.07.2013