Вопросы по теме 'google-speech-api'
Google Speech API не возвращается после подключения
Я пытаюсь разработать приложение для преобразования речи в текст. В качестве теста я провел следующее с этими результатами:
wget -U "Mozilla/5.0" --post-file /home/pi/good-morning-google.flac --header "Тип контента: audio/x-flac; rate=44100" -O -...
69 просмотров
schedule
29.12.2022
Конвертировать mp3 в flac файлы
Я пытаюсь найти способ легко конвертировать mp3 в файлы flac, используя ruby (предпочтительно) на стороне сервера. У меня есть куча аудио, которые я хотел бы транскрибировать с помощью Google Voice API, но он принимает только flac. (между прочим)....
1421 просмотров
schedule
28.12.2022
Файл с кодировкой POST base64 в API речи Google с использованием perl
У меня возникают трудности с кодированием аудиофайла FLAC в base64 при публикации строки json в API речи Google. Я заметил несколько \n в ответе от Google, не уверен, что base64 недостаточно хорош, или, возможно, я не полностью понимаю, как создавать...
1302 просмотров
schedule
04.10.2022
Google Cloud Streaming Speech API
Мне нужно распознавание речи в реальном времени через Google Cloud Speech API. Однако он все еще находится в бета-версии, и в Интернете не так много полезных вещей.
https://cloud.google.com/speech/docs/samples есть несколько образцов доступен...
2084 просмотров
schedule
10.07.2023
Как работает ограничение ключа API Google Cloud Platform для приложений iOS?
В соответствии с:
https://cloud.google.com/speech/docs/common/auth
Мы можем создать ключ API для ресурса GCP (например, Google Maps, Speech, Translate), ограниченный «приложениями iOS» для определенного идентификатора пакета. В принципе, это...
742 просмотров
schedule
15.06.2022
Google Speech API не возвращает действительный JSON
В настоящее время я получаю недопустимый JSON, например:
результаты {альтернативы {расшифровка: "Бруклинский мост"} стабильность: 0,01}
Здесь используется пример кода, найденный здесь:...
284 просмотров
schedule
16.12.2022
Звуковые данные Google Cloud Speech API передаются слишком медленно
Я использую приведенный ниже метод для преобразования речи в текст с помощью микрофона, а частота дискретизации составляет 16000. Сначала я тестировал его на компьютере с Windows 10, и он работал нормально, а позже, когда я тестировал тот же скрипт на...
820 просмотров
schedule
28.05.2022
Тайм-аут API речи Google
Я пытаюсь использовать API-интерфейсы клиента Speech API для преобразования аудиофайла в текст.
Пока мне удалось преобразовать короткий аудиоклип, но теперь с более длинным файлом (10 минут) я получаю эту ошибку:
Retry total timeout exceeded...
2351 просмотров
schedule
29.06.2023
Пример кода Google Cloud Speech API Python имеет возможную ошибку
Я работаю с предоставленными фрагментами кода из Google Speech API, здесь . Кода должно быть достаточно, чтобы преобразовать файл .wav в расшифрованный текст.
Блок интереса здесь:
def transcribe_file(speech_file):
"""Transcribe the given...
674 просмотров
schedule
29.12.2022
Ресурс исчерпан. Google Cloud Speech
Я пытаюсь расшифровать 45-минутный аудиофайл с помощью речи Google Cloud, но продолжаю получать
Ресурс исчерпан (например, контрольная квота)
У меня есть бесплатный кредит, который API предлагает вам на год. Пробовал в api explorer и в...
2724 просмотров
schedule
26.06.2022
Google Speech API из браузера
На странице документации https://cloud.google.com/speech/ есть демонстрационный пример, который слушает речь через браузер и использует API в фоновом режиме. Доступен ли исходный код этой демонстрации?
В противном случае голосовой API...
4916 просмотров
schedule
24.05.2023
Google Speech API: распознает речь из файла OGG
Я использую Google Speech API для распознавания вьетнамской речи в аудиофайле .OGG с помощью Python. Но результатов это не дает.
809 просмотров
schedule
20.04.2022
Предложение по выбору речи для текста apis
Я новичок в распознавании речи, Android, и у меня есть вариант использования, когда мне нужно создать приложение для Android, которое принимает команды (ограниченный набор команд, менее 100) от пользователей и выполняет некоторую логику. Я немного...
279 просмотров
schedule
14.03.2022
Автономное распознавание речи в браузере
Я работаю над продуктом, который должен получать информацию от пользователя и выполнять определенные действия на его основе. Мы реализовали его с помощью окна чата с помощью набора текста, и он служит нашей цели. В будущих выпусках мы хотим добавить...
7409 просмотров
schedule
20.02.2023
Как использовать Google Voice API для распознавания смешанных языков с переключением кода?
Обычно люди используют свой родной язык + английский для разговора. Мне нужно, чтобы Google API распознавал оба языка в образце речи.
Например: «aaj ka weather kaisa hai» это предложение содержит как хинди (привет-IN), так и английский (en-IN)...
394 просмотров
schedule
18.08.2022
Google Speech to text: модель видео в настоящее время не поддерживается для языка: nl-NL
Используемый URL: https://cloud.google.com/speech-to-text/
Я загрузил аудиофайл wav (экспортированный как mp3/wav/flac) через Audacity.
Я выбрал «Нидерланды» (голландский), знаки препинания могут быть как на, так и на, и загрузил экспорт....
595 просмотров
schedule
10.01.2023
Может ли API речи Google преобразовывать текст в речь?
Я использовал API речи Google, чтобы успешно преобразовать речь в текст, используя следующий код.
import speech_recognition as sr
import os
#obtain audio from the microphone
r = sr.Recognizer()
with sr.Microphone() as source:
print("Say...
573 просмотров
schedule
17.07.2022
Одно высказывание Google Speech API
Как работает SingleUtterance Google Speech API? Согласно документации, это способ Google определить, когда говорящий произнес одно высказывание. Я понимаю, что он делает, но хотел бы знать, как? API просто ждет определенной продолжительности...
2181 просмотров
schedule
21.09.2022
Потоковое аудио в FLAC или AMR_WB в Google Speech API
Мне нужно запустить API речи Google в средах с низкой пропускной способностью.
Основываясь на чтении лучших практик, мне кажется, что лучше всего использовать формат AMR_WB.
Однако следующий код не создает исключений, и я не получаю ответов в...
319 просмотров
schedule
25.04.2022
Проект потоковой передачи аудио и распознавания речи/текста на Python
У меня есть довольно амбициозный проект, и я хотел изложить свой мыслительный процесс, чтобы увидеть, выполним ли этот проект.
Во время радиопередачи радиоведущий обычно выдает билеты, если вы звонили #X в указанный период времени. Так как...
1374 просмотров
schedule
25.06.2023