Я использую Google Speech API для распознавания вьетнамской речи в аудиофайле .OGG с помощью Python. Но результатов это не дает.
Google Speech API: распознает речь из файла OGG
Ответы (2)
По крайней мере, в английской версии Google Speech API вам необходимо использовать входной файл FLAC или входной файл Linear 16 (не аудиоформат OGG).
Дополнительную информацию см. На этой странице устранения неполадок: https://cloud.google.com/speech-to-text/docs/troubleshooting
person
andersan
schedule
16.09.2019
Попробуйте использовать эту конфигурацию, для меня работает с использованием nodejs
const config = {
encoding: 'OGG_OPUS',
sampleRateHertz: 16000,
languageCode: 'YOUR_LAUNGAGE CODE'
}
Я работаю с аудиофайлом телеграммы, который является OGA
person
user2403337
schedule
10.03.2021