Google Speech API из браузера

На странице документации https://cloud.google.com/speech/ есть демонстрационный пример, который слушает речь через браузер и использует API в фоновом режиме. Доступен ли исходный код этой демонстрации?

В противном случае голосовой API использует файлы flac. Есть ли какой-нибудь проект с открытым исходным кодом, который может записывать flacfiles из браузера (который совместим с этим API — существует много проектов github, но интересно, есть ли официальный)?


person devl    schedule 09.05.2017    source источник
comment
Если это кому-то поможет, мы откроем это как проект github.com/gridcellcoder/cloud -демонстрации речи и зрения   -  person devl    schedule 03.07.2018


Ответы (2)


Если это кому-то поможет, этот подход является хорошим началом для записи звука из браузера:

https://github.com/GoogleCloudPlatform/nodejs-docs-samples/blob/master/speech/recognize.js

https://developers.google.com/web/fundamentals/native-hardware/recording-audio/#acquire_access_to_the_microphone

и https://github.com/mattdiamond/Recorderjs

Изменить: исходный код решения был открыт как отдельный проект: https://github.com/gridcellcoder/cloud-speech-and-vision-demos

person devl    schedule 30.05.2017
comment
эй, @devl, ты когда-нибудь находил способ прямой трансляции из браузера в Google Speech API? - person Khon Lieu; 29.03.2018
comment
@KhonMar Да, мы сделали это, и открыли исходный код проекта github.com/gridcellcoder /cloud-speech-and-vision-demos - person devl; 03.07.2018
comment
Эта информация немного устарела и на самом деле не отвечает на вопрос. Первая ссылка теперь 404. Вторая ссылка о доступе к микрофону в браузере. Третья ссылка - четыре записи. Четвертая ссылка на самом деле не ведет к преобразованию речи в текст из браузера. На самом деле это браузер --› сервер NodeJS --> преобразование речи в текст - person ritmatter; 11.02.2020
comment
@devl при попытке демо у меня не поддерживается язык ошибок? - person user310291; 28.01.2021

да, вы можете получить исходный код на любом языке для голосового API по ссылке github облачной платформы Google: https://github.com/GoogleCloudPlatform/

person André Abboud    schedule 09.05.2017
comment
Спасибо, хотя это общие клиентские библиотеки API. Я ищу точный код для части Преобразуйте свою речь в текст прямо сейчас в браузере, вы не знаете, существует ли он? - person devl; 09.05.2017
comment
да, брат, вы можете использовать эти библиотеки, они полезны для преобразования речи в текст в браузере: talater.com responsivevoice.org надеюсь, что вы отметите мой ответ как полезный :) - person André Abboud; 09.05.2017
comment
хороший сайт, но мы должны разработать собственное решение и не можем отправлять данные извне. Нам нужна библиотека для записи flac из браузера, совместимая с голосовым API. - person devl; 09.05.2017