Одно высказывание Google Speech API

Как работает SingleUtterance Google Speech API? Согласно документации, это способ Google определить, когда говорящий произнес одно высказывание. Я понимаю, что он делает, но хотел бы знать, как? API просто ждет определенной продолжительности "безмолвного" звука? Если да, то как долго продолжительность безмолвного звука приведет к окончанию произнесения?

Есть ли у него какой-то другой алгоритм искусственного интеллекта, который помогает определить, когда кто-то перестал говорить?

Спасибо

google-cloud-platform google-speech-api transcription

Harry Stuart 12.09.2018 источник

comment

Я бы посоветовал удалить здесь тег C # - не имеет значения, на каком языке вы разговариваете с Speech API, и этот тег может оттолкнуть других пользователей, которые ожидают, что этот вопрос будет быть специфичным для C #. - Jon Skeet 12.09.2018

Ответы (1)

arrow_upward
2
arrow_downward

Я не думаю, что подробности раскрываются, на мой взгляд, определение окончания звука - это решение API. Вместо этого он предлагает способ определить, когда было принято такое решение.

В нормальных условиях поток будет продолжать прослушивать и обрабатывать аудио до тех пор, пока не будет поток закрывается напрямую или превышена максимальная длина потока. В такой ситуации устанавливать single_utterance не требуется.

Когда вам это нужно (например, голосовые команды) и установите single_utterance = true, API решит, когда завершить распознавание, и отправит вашему клиенту END_OF_SINGLE_UTTERANCE и прекратить распознавание.

rsantiago 04.10.2018

Одно высказывание Google Speech API

Ответы (1)

Похожие вопросы