Человеческое лицо, эмоции и распознавание голоса

Я ищу хороший метод распознавания лица, эмоций и голоса в C#. Для распознавания лиц я рано использовал Emgu CV, который не точен, а производительность очень низкая в условиях низкой освещенности. Также мне нужно найти эмоции пользователя. Будь то грустный или счастливый. Но с резюме Emgu мне было непросто.

Также для распознавания голоса я пока не могу найти никаких решений, я нашел распознавание речи, но это не то, что мне нужно.

Я не хочу использовать какие-либо онлайн-API. Может ли кто-нибудь предложить мне какие-либо SDK или алгоритмы, с помощью которых я могу реализовать распознавание лица, эмоций и голоса?


person Matt    schedule 13.06.2012    source источник


Ответы (3)


Распознавание лица

Распознавание голоса

Просто взгляните на пространство имен System.Speech.Recognition (посмотрите this и этот ответ).

person gliderkite    schedule 13.06.2012


Я понимаю, что вопрос очень старый, хотя я хотел бы внести свой вклад, так как я также работаю над аналогичным приложением

Для распознавания лиц, эмоций и голоса сейчас доступно множество функций, некоторые из которых приведены ниже.

1) Обнаружение и распознавание лиц с использованием OpenCV: http://ahmedopeyemi.com/main/face-detection-and-recognition-in-c-using-emgucv-3-0-opencv-wrapper-part-1/

Pro: Открытый исходный код, практически бесплатный. Вы можете изменить код в соответствии со своими потребностями. Поддерживаются несколько платформ.

Минусы: точность терпимая, но невысокая. Эту проблему можно решить, изменив библиотеку в соответствии с вашими потребностями.

2) Распознавание лиц и распознавание эмоций: попробуйте Microsoft Cognition Service API

Плюс: очень точно. Он включает в себя множество других услуг, таких как NLP, преобразование речи в текст, преобразование текста в речь, компьютерное зрение, переводчик языка RT и так далее. Точность велика, поскольку сервисы размещены в облаке и обучаются для каждого ввода данных.

Минус: платное решение. Немного дороже. За каждую услугу нужно платить отдельно.

3) Распознавание речи: Google Voice API Pro: аналогично сервису распознавания MS. Точность лучше в шуме. против: Платный. Может не подойти для одноразового коммерческого продукта

4) Распознавание речи и НЛП: wit.ai/api.ai Pro: бесплатно. Может использовать данные из других общедоступных приложений. Точность хорошая. Против: я не нахожу ничего

Попробуйте еще несколько ссылок следующим образом. Может немного помочь.

Система безопасности на основе MS Face API https://www.hackster.io/peejster/facial-recognition-security-system-c6ca6c

person Rahul    schedule 08.08.2017