Существует ли API для технологии распознавания речи Google?

Я хочу попробовать создать слайд-шоу jQuery, используя простые голосовые команды, такие как «следующий» или «предыдущий». Есть ли способ использовать распознавание голоса Google? Я знаю о x-webkit-speech в Chrome, но мне нужно нажать кнопку, чтобы использовать его.

Я попробовал WAMI Массачусетского технологического института, но обнаружил, что он медленнее и менее точен, чем распознавание речи Google.


person Leo Jiang    schedule 12.01.2012    source источник
comment
возможный дубликат Как работает голосовой поиск Google? Есть ли для этого API?   -  person Mateen Ulhaq    schedule 19.01.2012


Ответы (4)


На сегодняшний день это существует для Chrome: http://chrome.blogspot.co.uk/2013/01/hello-browser.html

(документ API)

person Tim Perry    schedule 16.01.2013
comment
Я создал библиотеку JavaScript, которая упаковывает все это и упрощает добавление голосовых команд на ваш сайт или в приложение. Проверьте это на talater.com/annyang. - person Tal Ater; 08.09.2013

Чтобы узнать, как легко это сделать с помощью JavaScript, воспользуйтесь annyang — библиотекой, которая упрощает работу с распознаванием речи. .

person Tal Ater    schedule 02.01.2014

Проблема в том, что будет захватывать речь вашего пользователя и отправлять ее на какой-либо речевой сервер для обработки. x-webkit-speech встроен в браузер, и браузер использует звуковую карту ПК для захвата речи. Только Javascript/Jquery в браузере не может получить доступ к аппаратным устройствам. Я не знаю, предоставляет ли Chrome какие-либо объекты x-webkit-speech в DOM, чтобы вы могли выполнять захват через Javascript.

Тем не менее, люди реконструировали голосовой API Google и использовали его из кода. См. http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ для примера.

person Michael Levy    schedule 12.01.2012
comment
Я не могу использовать его в 2015 году. У кого-нибудь он заработал? - person Kiran P.; 17.06.2015

Я нашел это, я лично не использовал его, я не знаю, полностью ли это то, что вы ищете, но взгляните.

http://captico.com/introduction-speech-2-text-api-by-google/2011/03

person Roger    schedule 12.01.2012
comment
Хороший интерфейс, использующий эту технологию, — textfromtospeech.com/uk/voice-to-text. - person Andrew Fount; 28.01.2017