Измерение качества звука и привлекательности/эстетики

Есть ли способ измерить качество и привлекательность/эстетичность аудиоклипа? Качество количественно определяет, насколько хорош звук, т. е. чем ниже уровень шума, тем лучше качество. Принимая во внимание, что привлекательность / эстетика измеряет, насколько звук привлекателен для человека. Существует некоторая работа по оценке качества изображения и эстетической оценки, например NIMA., но не для звука/аудио. Любой метод или ссылки будут полезны.


person Saikat    schedule 16.11.2019    source источник
comment
привлекательность обязательно связана с текущими вибрациями человека, поэтому любая метрика данного клипа может быть измерена только после оценки человека ... если бы это было возможно, результирующая метрика была бы действительна только для момента времени этого слушает и дико недействителен в другое время и во все времена для других людей   -  person Scott Stensland    schedule 17.11.2019


Ответы (1)


Измерения качества звука или эстетики выполняются как с машинным обучением, так и без него. Однако большая часть работы сосредоточена на воспроизведении речи, а тем более на общем звуке.

Можно проводить тесты на прослушивание, когда группа экспертов слушает звук и дает свои оценки, чтобы установить средний балл мнений (MOS). Для их проведения существует несколько стандартов, например MUSHRA. Такие субъективные оценки составляют основу разработки «объективных показателей», которые представляют собой алгоритмические способы оценки качества звука. Некоторыми ранними примерами являются PESQ для качества речи (стандарт ITU с 2001 г.) и PEAQ для качества звука (стандарт ITU с 1998 г.). К более продвинутым относятся POLQA (стандарт ITU с 2011 г.) и ViSQOLAudio (предложено в ходе исследования).

В нескольких работах последних лет было показано, что такие метрики можно изучать с помощью глубоких нейронных сетей. Что касается качества речи, в одной недавней статье (2019 г.) содержится Навязчивая и ненавязчивая перцептивная оценка качества речи с использованием сверточной нейронной сети.

Единственная научная оценка, которую я нашел для общего качества звука или качества музыки, — это Расстояние звука по Фреше.

person Jon Nordby    schedule 02.01.2020