Google Speech API: распознает речь из файла OGG

Я использую Google Speech API для распознавания вьетнамской речи в аудиофайле .OGG с помощью Python. Но результатов это не дает.


person Ngọc Thạch    schedule 01.08.2017    source источник


Ответы (2)


По крайней мере, в английской версии Google Speech API вам необходимо использовать входной файл FLAC или входной файл Linear 16 (не аудиоформат OGG).

Дополнительную информацию см. На этой странице устранения неполадок: https://cloud.google.com/speech-to-text/docs/troubleshooting

person andersan    schedule 16.09.2019

Попробуйте использовать эту конфигурацию, для меня работает с использованием nodejs

const config = {
  encoding: 'OGG_OPUS',
  sampleRateHertz: 16000,
  languageCode: 'YOUR_LAUNGAGE CODE'
}

Я работаю с аудиофайлом телеграммы, который является OGA

person user2403337    schedule 10.03.2021