Я новичок в распознавании речи, Android, и у меня есть вариант использования, когда мне нужно создать приложение для Android, которое принимает команды (ограниченный набор команд, менее 100) от пользователей и выполняет некоторую логику. Я немного погуглил и обнаружил, что можно сделать следующее
- Используйте Google Cloud Voice API
- Используйте встроенную в Android функцию преобразования речи в текст (отличается ли она от Google Cloud Voice API? Если да, то как?). Также каковы плюсы и минусы использования автономного режима речи Android для текста?
- Используйте библиотеки распознавания речи с открытым исходным кодом, такие как Kaldi, CMU Sphinx (похоже, им нужно много усилий для сбора и обучения данных)
Может ли кто-нибудь предложить мне, что из вышеперечисленного лучше всего подходит для моего варианта использования? У меня ограниченный набор команд, и скорость для меня важнее всего.
Я действительно смущен и поэтому задаю этот вопрос. Заранее спасибо.