Самый быстрый метод извлечения MFCC на Linux-машине

Каков самый быстрый способ извлечения mfcc из аудиофайлов в Linux (в моем случае Raspberry Pi). Я пробовал sphinx3, но он был медленным для больших файлов (на Raspberry Pi). SFS (система хранения речи) работала довольно быстро на Windows, но я не мог установить ее на Linux. Пожалуйста, предложите какой-нибудь способ.


person Ironclad    schedule 19.12.2013    source источник


Ответы (2)


У sphinx-train есть приложение для этого. Я думаю, что это работает достаточно усердно, я использовал его на старом P4, и это не заняло много времени. Но у меня не было столько данных.

Вы можете использовать HCopy from HTK, хотя я не пробовал.

Если вы программист, рассмотрите возможность профилирования экстрактора sphinx-train и его оптимизации. Не забудьте сообщить авторам, если у вас получится.

Последнее замечание: процесс требует времени. Этого нельзя избежать. Попробуйте настроить автоматические сценарии и оставить извлечение на ночь. Часто это лучший способ приблизиться к нему.

person Dariusz    schedule 20.12.2013

Попробуйте скомпилировать sphinx-train или HTK с помощью хорошего оптимизирующего компилятора и установить правильные параметры набора инструкций. См., например, raspberrypi.stackexchange.com/questions/2046/what-cpu-flags-are-suitable-for-gcc-on-raspberry-pi Похоже, вам нужно использовать правильный дистрибутив Linux даже для поддержки FPU (очень важный!)

Они не используют что-то вроде fftw или ручной сборки, но их реализации БПФ и т. д. эффективны.

person Aleksandr Dubinsky    schedule 25.12.2013