Кепстральные коэффициенты частоты Mel (MFCC) в C/C++

Есть ли реализация MFCC на C/C++? Любые исходники или библиотеки?

Я уже нашел http://code.google.com/p/libmfcc/, который кажутся хорошими.


person Ali    schedule 29.10.2012    source источник


Ответы (2)


Резюме 2016 года:

  • libmfcc простой, лицензия MIT, не поддерживается с 2010 года.
  • YAAFE предоставляет MFCC и другие функции, LGPLv3, не поддерживаемые с 2011 года.
  • Kaldi — это излишество, но его можно использовать только для MFCC. Лицензия Apache версии 2.0 и по-прежнему поддерживается.
  • PocketSphinx – это набор инструментов CMU для распознавания речи, лицензия CMU (стиль BSD) и еще поддерживается.
  • SPTK – это исследовательский инструментарий из Японии, измененная лицензия BSD, который по-прежнему поддерживается.
  • OpenSMILE имеет две лицензии: (1) гибкую для исследовательских и личных целей и (2) коммерческую. один.

Обратите внимание, я упоминаю PocketSphinx вместо Sphinx, так как последний написан на Java.

person Eric Platon    schedule 15.08.2016

Вы можете использовать внешний интерфейс из набора инструментов распознавания речи с открытым исходным кодом, такого как Kaldi или Сфинкс.

person Paul Dixon    schedule 30.10.2012