Вопросы по теме 'google-speech-api'

Google Speech API не возвращается после подключения
Я пытаюсь разработать приложение для преобразования речи в текст. В качестве теста я провел следующее с этими результатами: wget -U "Mozilla/5.0" --post-file /home/pi/good-morning-google.flac --header "Тип контента: audio/x-flac; rate=44100" -O -...
69 просмотров
schedule 29.12.2022

Конвертировать mp3 в flac файлы
Я пытаюсь найти способ легко конвертировать mp3 в файлы flac, используя ruby ​​(предпочтительно) на стороне сервера. У меня есть куча аудио, которые я хотел бы транскрибировать с помощью Google Voice API, но он принимает только flac. (между прочим)....
1421 просмотров

Файл с кодировкой POST base64 в API речи Google с использованием perl
У меня возникают трудности с кодированием аудиофайла FLAC в base64 при публикации строки json в API речи Google. Я заметил несколько \n в ответе от Google, не уверен, что base64 недостаточно хорош, или, возможно, я не полностью понимаю, как создавать...
1302 просмотров
schedule 04.10.2022

Google Cloud Streaming Speech API
Мне нужно распознавание речи в реальном времени через Google Cloud Speech API. Однако он все еще находится в бета-версии, и в Интернете не так много полезных вещей. https://cloud.google.com/speech/docs/samples есть несколько образцов доступен...
2084 просмотров
schedule 10.07.2023

Как работает ограничение ключа API Google Cloud Platform для приложений iOS?
В соответствии с: https://cloud.google.com/speech/docs/common/auth Мы можем создать ключ API для ресурса GCP (например, Google Maps, Speech, Translate), ограниченный «приложениями iOS» для определенного идентификатора пакета. В принципе, это...
742 просмотров

Google Speech API не возвращает действительный JSON
В настоящее время я получаю недопустимый JSON, например: результаты {альтернативы {расшифровка: "Бруклинский мост"} стабильность: 0,01} Здесь используется пример кода, найденный здесь:...
284 просмотров
schedule 16.12.2022

Звуковые данные Google Cloud Speech API передаются слишком медленно
Я использую приведенный ниже метод для преобразования речи в текст с помощью микрофона, а частота дискретизации составляет 16000. Сначала я тестировал его на компьютере с Windows 10, и он работал нормально, а позже, когда я тестировал тот же скрипт на...
820 просмотров

Тайм-аут API речи Google
Я пытаюсь использовать API-интерфейсы клиента Speech API для преобразования аудиофайла в текст. Пока мне удалось преобразовать короткий аудиоклип, но теперь с более длинным файлом (10 минут) я получаю эту ошибку: Retry total timeout exceeded...
2351 просмотров

Пример кода Google Cloud Speech API Python имеет возможную ошибку
Я работаю с предоставленными фрагментами кода из Google Speech API, здесь . Кода должно быть достаточно, чтобы преобразовать файл .wav в расшифрованный текст. Блок интереса здесь: def transcribe_file(speech_file): """Transcribe the given...
674 просмотров
schedule 29.12.2022

Ресурс исчерпан. Google Cloud Speech
Я пытаюсь расшифровать 45-минутный аудиофайл с помощью речи Google Cloud, но продолжаю получать Ресурс исчерпан (например, контрольная квота) У меня есть бесплатный кредит, который API предлагает вам на год. Пробовал в api explorer и в...
2724 просмотров

Google Speech API из браузера
На странице документации https://cloud.google.com/speech/ есть демонстрационный пример, который слушает речь через браузер и использует API в фоновом режиме. Доступен ли исходный код этой демонстрации? В противном случае голосовой API...
4916 просмотров

Google Speech API: распознает речь из файла OGG
Я использую Google Speech API для распознавания вьетнамской речи в аудиофайле .OGG с помощью Python. Но результатов это не дает.
809 просмотров

Предложение по выбору речи для текста apis
Я новичок в распознавании речи, Android, и у меня есть вариант использования, когда мне нужно создать приложение для Android, которое принимает команды (ограниченный набор команд, менее 100) от пользователей и выполняет некоторую логику. Я немного...
279 просмотров

Автономное распознавание речи в браузере
Я работаю над продуктом, который должен получать информацию от пользователя и выполнять определенные действия на его основе. Мы реализовали его с помощью окна чата с помощью набора текста, и он служит нашей цели. В будущих выпусках мы хотим добавить...
7409 просмотров

Как использовать Google Voice API для распознавания смешанных языков с переключением кода?
Обычно люди используют свой родной язык + английский для разговора. Мне нужно, чтобы Google API распознавал оба языка в образце речи. Например: «aaj ka weather kaisa hai» это предложение содержит как хинди (привет-IN), так и английский (en-IN)...
394 просмотров

Google Speech to text: модель видео в настоящее время не поддерживается для языка: nl-NL
Используемый URL: https://cloud.google.com/speech-to-text/ Я загрузил аудиофайл wav (экспортированный как mp3/wav/flac) через Audacity. Я выбрал «Нидерланды» (голландский), знаки препинания могут быть как на, так и на, и загрузил экспорт....
595 просмотров
schedule 10.01.2023

Может ли API речи Google преобразовывать текст в речь?
Я использовал API речи Google, чтобы успешно преобразовать речь в текст, используя следующий код. import speech_recognition as sr import os #obtain audio from the microphone r = sr.Recognizer() with sr.Microphone() as source: print("Say...
573 просмотров

Одно высказывание Google Speech API
Как работает SingleUtterance Google Speech API? Согласно документации, это способ Google определить, когда говорящий произнес одно высказывание. Я понимаю, что он делает, но хотел бы знать, как? API просто ждет определенной продолжительности...
2181 просмотров

Потоковое аудио в FLAC или AMR_WB в Google Speech API
Мне нужно запустить API речи Google в средах с низкой пропускной способностью. Основываясь на чтении лучших практик, мне кажется, что лучше всего использовать формат AMR_WB. Однако следующий код не создает исключений, и я не получаю ответов в...
319 просмотров
schedule 25.04.2022

Проект потоковой передачи аудио и распознавания речи/текста на Python
У меня есть довольно амбициозный проект, и я хотел изложить свой мыслительный процесс, чтобы увидеть, выполним ли этот проект. Во время радиопередачи радиоведущий обычно выдает билеты, если вы звонили #X в указанный период времени. Так как...
1374 просмотров