Вопросы по теме 'mfcc'

Методы определения акустического сходства (но не дактилоскопии)
Я ищу методы, которые работают на практике для определения некоторого акустического сходства между разными песнями. Большинство методов, которые я видел до сих пор (MFCC и т. Д.), Похоже, на самом деле нацелены только на поиск идентичных...
1294 просмотров
schedule 09.05.2023

звуковая классификация с использованием mfcc и динамического преобразования времени (dtw)
Моя цель - классифицировать неречевой сигнал, для которого я использую mfcc и dtw в java. Однако я застрял посередине. Буду признателен за любую помощь. Я оценил 13 значений mfcc для каждого кадра, однако некоторые значения отрицательны, я не...
2740 просмотров
schedule 05.06.2024

Кепстральные коэффициенты частоты Mel (MFCC) в C/C++
Есть ли реализация MFCC на C/C++? Любые исходники или библиотеки? Я уже нашел http://code.google.com/p/libmfcc/ , который кажутся хорошими.
9641 просмотров
schedule 01.01.2023

Используйте libxtract или другую небольшую библиотеку C, C++ для функциональности VAD.
Я пытаюсь создать систему идентификации говорящего на Android. В настоящее время я использую libxtract для вычисления вектора MFCC из кадров и libsvm для классификации. Есть ли у вас какие-либо идеи, как использовать libxtract или другую небольшую...
2574 просмотров
schedule 29.04.2022

Предакцент в обработке речи с помощью андроида
Я работаю над приложением, в котором мне нужно реализовать кепстральные коэффициенты Mel Frequency (MFCC) для распознавания речи. Первым шагом в MFCC является применение Pre-Emphasis. Pre-Emphasis увеличит энергию сигнала на более высокой...
4985 просмотров

Самый быстрый метод извлечения MFCC на Linux-машине
Каков самый быстрый способ извлечения mfcc из аудиофайлов в Linux (в моем случае Raspberry Pi). Я пробовал sphinx3, но он был медленным для больших файлов (на Raspberry Pi). SFS (система хранения речи) работала довольно быстро на Windows, но я не...
640 просмотров

Обнаружение высоты тона кепстра
Я хочу получить значения высоты тона, используя функции MFCC в Matlab, используя функцию из этой ссылки : [F0, T, C] = spPitchTrackCepstrum(y, 20000, 25.6, 10, 'hamming', 0); Но все числа положительные (без неозвученных значений)....
947 просмотров
schedule 04.06.2022

Может ли результирующая матрица извлечения признаков MFCC иметь отрицательное значение?
Я использую MFCC для извлечения функции для реализации распознавателя речи. Я застрял в реализации HMM. Я использую Kevin Murphy Toolbox для HMM. Моя результирующая матрица MFCC содержит отрицательные значения, может быть, это тот случай, когда я...
2561 просмотров
schedule 13.11.2022

Библиотека для расчета векторов mfcc
привет, я пишу небольшое приложение для Android, библиотека, необходимая для расчета векторов mfcc. Нет такой библиотеки? желательно, чтобы на вход он принимал байтовый массив, а взамен получал уже стандартные 13 векторов. просто все библиотеки...
1128 просмотров
schedule 13.11.2022

Как обучить алгоритм машинного обучения с использованием векторов коэффициентов MFCC?
В своем проекте последнего года я пытаюсь идентифицировать звуки собаки / лая / птицы в реальном времени (путем записи звуковых клипов). Я использую MFCC в качестве звуковых функций. Первоначально я извлек всего 12 векторов MFCC из звукового клипа с...
2153 просмотров

Средняя нормализация MFCC
Связано с: требуются ли функции MFCC для распознавания речи Можно ли нормализацию среднего свести к простому вычитанию среднего из всех (n, 13) MFCC и использовать ее для обучения данных? np.subtract(mfcc_feat,np.mean(mfcc_feat))
2454 просмотров
schedule 12.06.2022

Ошибка при импорте scikits.talkbox
Я хочу использовать scikits.talkbox, но получаю следующую ошибку при импорте scikits.talkbox. Трассировка (последний последний вызов): файл «/home/seref/Desktop/machine Learning code/MFCC/main.py», строка 3, из scikits.talkbox.features.mfcc...
2752 просмотров

Как построить MFCC в Python?
Я просто новичок в обработке сигналов. Вот мой код для извлечения функции MFCC из аудиофайла (.WAV): from python_speech_features import mfcc import scipy.io.wavfile as wav (rate,sig) = wav.read("AudioFile.wav") mfcc_feat = mfcc(sig,rate)...
14869 просмотров

Python-реализация алгоритма MFCC
У меня есть база данных, которая содержит потоковое видео. Я хочу рассчитать функции LBP из изображений и аудио MFCC, и для каждого кадра в видео у меня есть аннотация. В аннотацию встроены видеокадры и время видео. Таким образом, я хочу...
1739 просмотров
schedule 25.07.2023

ValueError: не удалось передать входной массив из формы (20,590) в форму (20)
Я пытаюсь извлечь функции из файлов .wav, используя MFCC звуковых файлов. Я получаю сообщение об ошибке, когда пытаюсь преобразовать свой список MFCC в массив numpy. Я совершенно уверен, что эта ошибка возникает, потому что список содержит значения...
1469 просмотров

Почему библиотеки извлечения MFCC возвращают разные значения?
Я извлекаю функции MFCC, используя две разные библиотеки: Библиотека python_speech_features Библиотека BOB Однако выход двух различен, и даже формы не одинаковы. Это нормально? или есть параметр, который мне не хватает?...
1339 просмотров
schedule 01.08.2023

Как я могу выбрать 20 значений из MFCC?
Я пользователь Mathematica 11.3. Чтобы сделать классификатор для распознавания музыкальных инструментов, мне нужны значения MFCC из набора музыкальных данных. Я получил данные от IRMAS. Продолжительность музыки варьируется от 5 до 20 секунд. Как...
51 просмотров
schedule 09.08.2022

Создание волновых данных из данных БПФ?
Как вы могли заметить, я действительно новичок в python и обработке звука. Я (надеюсь) извлек данные БПФ из волнового файла, используя python и функции logfbank и mfcc. (Кажется, logfbank дает наиболее многообещающие данные, вывод mfcc выглядел для...
1130 просмотров

Первая производная коэффициентов MFCC в Matlab
Я извлек функции мелкого частотного кепстрального коэффициента (MFCC) (в Matlab) для некоторой классификации речи. В настоящее время я думаю о добавлении первой и второй производных функций коэффициента MFCC. Как мы можем получить первую и вторую...
184 просмотров

MFCC Python: совершенно другой результат от librosa vs python_speech_features vs tensorflow.signal
Я пытаюсь извлечь функции MFCC из аудио (файл .wav), и я пробовал python_speech_features и librosa , но они дают совершенно разные результаты: audio, sr = librosa.load(file, sr=None) # librosa hop_length = int(sr/100) n_fft = int(sr/40)...
6989 просмотров
schedule 27.04.2023