Моя цель - классифицировать неречевой сигнал, для которого я использую mfcc и dtw в java. Однако я застрял посередине. Буду признателен за любую помощь. Я оценил 13 значений mfcc для каждого кадра, однако некоторые значения отрицательны, я не понимаю, правильный или неправильный процесс, которому я следую. В настоящее время я использую код, предоставленный JAudio. Я также пробовал другой код, они тоже дают отрицательные значения.
Во-вторых, я получаю 13 коэффициентов для каждого кадра, учитывая 157 кадров для определенной длины выборки, я получаю 157 наборов по 13 mfcc. Мне сложно использовать все коэффициенты в DTW, потому что dtw дает только самое близкое расстояние между двумя сигналами времени. У меня есть код DTW для сравнения двух сигналов времени. Я не уверен, как использовать все значения mfccs сигнала в качестве функций.
Есть ли какой-то важный этап классификации, который мне не хватает? Пожалуйста помогите.