Я пытаюсь создать систему идентификации говорящего на Android. В настоящее время я использую libxtract для вычисления вектора MFCC из кадров и libsvm для классификации.
Есть ли у вас какие-либо идеи, как использовать libxtract или другую небольшую библиотеку C, C++, которую я могу скомпилировать под NDK, для обнаружения голоса (VAD Voice Activity Detection) в кадрах?