Одно высказывание Google Speech API

Как работает SingleUtterance Google Speech API? Согласно документации, это способ Google определить, когда говорящий произнес одно высказывание. Я понимаю, что он делает, но хотел бы знать, как? API просто ждет определенной продолжительности "безмолвного" звука? Если да, то как долго продолжительность безмолвного звука приведет к окончанию произнесения?

Есть ли у него какой-то другой алгоритм искусственного интеллекта, который помогает определить, когда кто-то перестал говорить?

Спасибо


person Harry Stuart    schedule 12.09.2018    source источник
comment
Я бы посоветовал удалить здесь тег C # - не имеет значения, на каком языке вы разговариваете с Speech API, и этот тег может оттолкнуть других пользователей, которые ожидают, что этот вопрос будет быть специфичным для C #.   -  person Jon Skeet    schedule 12.09.2018


Ответы (1)


Я не думаю, что подробности раскрываются, на мой взгляд, определение окончания звука - это решение API. Вместо этого он предлагает способ определить, когда было принято такое решение.

В нормальных условиях поток будет продолжать прослушивать и обрабатывать аудио до тех пор, пока не будет поток закрывается напрямую или превышена максимальная длина потока. В такой ситуации устанавливать single_utterance не требуется.

Когда вам это нужно (например, голосовые команды) и установите single_utterance = true, API решит, когда завершить распознавание, и отправит вашему клиенту END_OF_SINGLE_UTTERANCE и прекратить распознавание.

person rsantiago    schedule 04.10.2018