Каков самый быстрый способ извлечения mfcc из аудиофайлов в Linux (в моем случае Raspberry Pi). Я пробовал sphinx3, но он был медленным для больших файлов (на Raspberry Pi). SFS (система хранения речи) работала довольно быстро на Windows, но я не мог установить ее на Linux. Пожалуйста, предложите какой-нибудь способ.
Самый быстрый метод извлечения MFCC на Linux-машине
Ответы (2)
У sphinx-train
есть приложение для этого. Я думаю, что это работает достаточно усердно, я использовал его на старом P4, и это не заняло много времени. Но у меня не было столько данных.
Вы можете использовать HCopy from HTK, хотя я не пробовал.
Если вы программист, рассмотрите возможность профилирования экстрактора sphinx-train
и его оптимизации. Не забудьте сообщить авторам, если у вас получится.
Последнее замечание: процесс требует времени. Этого нельзя избежать. Попробуйте настроить автоматические сценарии и оставить извлечение на ночь. Часто это лучший способ приблизиться к нему.
Попробуйте скомпилировать sphinx-train или HTK с помощью хорошего оптимизирующего компилятора и установить правильные параметры набора инструкций. См., например, raspberrypi.stackexchange.com/questions/2046/what-cpu-flags-are-suitable-for-gcc-on-raspberry-pi Похоже, вам нужно использовать правильный дистрибутив Linux даже для поддержки FPU (очень важный!)
Они не используют что-то вроде fftw или ручной сборки, но их реализации БПФ и т. д. эффективны.