Я заглянул в Google Cloud Speech API и получил потоковую передачу с моего микрофона, работающего на сервере Node.
Тогда мне было интересно, что было бы лучше всего для потоковой передачи моего микрофона из веб-интерфейса? Отправляет ли он аудиопоток от getUserMedia на сервер Node и передает его в API с клиентом Node API? Или это просто сохранение голосового ввода в файл, который я затем передаю в API?
Цель состоит в том, чтобы «расшифровать» инструкции (одно или два предложения) и отправить результат в другой API.