У меня есть группа связанных вопросов, касающихся FFTW и анализа звука в Linux.
- Какая самая простая в использовании и наиболее полная аудио библиотека в Linux / Ubuntu, которая позволит мне декодировать любой из множества аудиоформатов (MP3 и т. Д.) И получить буфер необработанных 16-битных значений PCM?
gstreamer
? - Я намерен взять этот необработанный буфер и передать его в FFTW для получения данных частотной области (без сложной информации или информации о фазе). Думаю, мне следует использовать один из их методов "r2r", возможно, DHT. Это правильно?
- Кажется, что ось выходной частоты FFTW дискретизируется с линейными приращениями, основанными на длине буфера. Кроме того, кажется, что я не могу изменить эту дискретизацию в FFTW, поэтому я должен сделать это после DHT. Вместо линейной оси частот мне нужна экспоненциальная ось, которая следует за
2^(i/12)
. Думаю, мне придется взять вывод DHT и прогнать его через какую-нибудь настраиваемую функцию сглаживания. Есть ли библиотека Linux для такого сглаживания? Если нет, будет ли работать базовая функция сглаживания на основе косинусов?
Спасибо.