Вы не можете смешивать языки.
Распознавание речи примерно состоит из 3 частей -> акустическая модель, языковая модель и словарь.
Акустическая модель является результатом обучения данных, содержит взаимосвязь между звуковым сигналом и фонетическим сигналом.
Словарь содержит слова и то, как они произносятся, например, слово TOP произносится как «TAH P» в общем словаре распознавания речи.
Языковая модель - это связь между словами для создания предложений, например. слово «я» связано с «есть», поэтому распознаватель речи очень редко (или никогда) не выдаст результат «я есть» или «я есть».
У каждого языка есть своя акустическая модель (фонетическая), словарь (слова) и языковая модель (предложения), так что мы можем их просто смешивать.
Вопрос в том: возможно ли это?
Ответ: ДА!
Вы можете создать свой собственный язык (в данном случае хинди + английский), используя множество инструментов, один из которых я уже пробовал, называется CMU Sphinx / Pocket Sphinx. Вы можете создать свою собственную модель, обучить ее и сделать словарь. вне этого. Это будет много работы, но вы можете настроить все, что вам нужно для распознавания речи.
Ссылка для любой реализации платформы: https://github.com/cmusphinx
person
Vincent Elbert Budiman
schedule
13.04.2018