Я хочу записать в журнал события, соответствующие определенному звуку, например, хлопку дверцы машины или, возможно, тосту, из которого извлекается тост.
Система должна быть более сложной, чем «детектор громкого шума»; он должен уметь отличать этот конкретный звук от других громких шумов.
Идентификация не обязательно должна иметь нулевую задержку, но процессор должен поддерживать непрерывный поток входящих данных с микрофона, который всегда включен.
- Существенно ли отличается эта задача от распознавания речи, или я могу использовать библиотеки / инструменты распознавания речи для идентификации этих неречевых звуков?
- Учитывая требование, что мне нужно сопоставить только один звук (в отличие от сопоставления среди библиотеки звуков), могу ли я сделать какие-либо специальные оптимизации?
Этот ответ указывает на то, что соответствующий фильтр было бы уместно, но я не знаю деталей. Я не верю, что простая взаимная корреляция данных звуковой волны между образцом целевого звука и потоком микрофона будет эффективной из-за вариаций целевого звука.
Мой вопрос также похож на this, который получил мало внимание.