Как работает SingleUtterance
Google Speech API? Согласно документации, это способ Google определить, когда говорящий произнес одно высказывание. Я понимаю, что он делает, но хотел бы знать, как? API просто ждет определенной продолжительности "безмолвного" звука? Если да, то как долго продолжительность безмолвного звука приведет к окончанию произнесения?
Есть ли у него какой-то другой алгоритм искусственного интеллекта, который помогает определить, когда кто-то перестал говорить?
Спасибо