Публикации по теме 'voice-recognition'


Большие технологии уходят в офлайн
Распознавание речи на устройстве в 2022 году 2022 год стал лучшим годом для распознавания речи на устройствах, учитывая масштабы и частоту объявлений. Google анонсировала Google Cloud Speech On-Device 20 октября. Open AI — создатель знаменитых DALL-E и ChatGPT представил Whisper в сентябре. Apple добавила живые субтитры на устройстве в рамках своих инициатив по обеспечению доступности и конфиденциальности в мае. В марте Microsoft завершила приобретение Nuance за 20 миллиардов..

Вопросы по теме 'voice-recognition'

как работает распознавание голоса в андроиде?
Я хочу знать, как работает распознавание голоса в Android? Какую библиотеку он использует для распознавания голоса? Выполняет ли он процесс распознавания голоса на устройстве/мобильном устройстве или отправляет весь голос на серверы Google и...
17825 просмотров
schedule 27.07.2022

Обнаружение голосовой активности в Android
Я пишу приложение, которое будет вести себя аналогично существующему распознаванию голоса, но будет отправлять звуковые данные в проприетарную веб-службу для выполнения части распознавания речи. Я использую стандартный MediaRecord (который...
3854 просмотров

Как бы вы сравнили произносимое слово с аудиофайлом?
Как бы вы сравнили произносимое слово с аудиофайлом и определили, совпадают ли они? Например, если я скажу «яблоко» своему приложению для iPhone, я хотел бы, чтобы оно записало звук и сравнило его с предварительно записанным аудиофайлом, в котором...
750 просмотров
schedule 18.03.2023

Сравните голосовой wav в Android или голосовой тег (голосовые команды) API
Я разрабатываю приложение, и мне нужен какой-то способ сравнить 2 голоса, если они совпадают или нет, я знаю, что Voice Recognizer - это способ сделать это, но поскольку (я думаю) ему сначала нужно перевести голос в строку, он не будет так подходить...
7568 просмотров

Речевой ввод HTML5 и преобразование текста в речь Google Translate, проблема в Chrome
Я создаю веб-приложение для голосовых и текстовых заметок. Здесь: http://gustavstromberg.se/sandbox/html5/localstorage/ посмотрите его источник (очень коротко, по большей части это css) Это: Распознавание голоса, работает только в хроме...
3593 просмотров

Распознавание голоса Android Все результаты в одном индексе массива
Я пытаюсь проанализировать результаты действия по распознаванию голоса Android и обнаружил, что все слова (разделенные пробелом) находятся в первом индексе массива. Я ожидал, что он поместит все слова в каждый индекс массива. private void...
1071 просмотров
schedule 10.07.2023

Проблемы с реализацией распознавания речи в андроиде
Я новичок в разработке Android, и я попытался запустить код по этой ссылке: http://www.jameselsey.co.uk/blogs/techblog/android-how-to-implement-voice-recognition-a-nice-easy-tutorial/ Но я испытываю ошибки сбоя. Что я должен делать?
546 просмотров

Android – разблокировка телефона голосом
Можно ли разблокировать телефон с помощью голосовой команды, даже когда устройство находится в режиме PowerManager.WakeLock? Я думал об использовании службы в качестве фонового процесса, но может ли телефонное устройство реагировать на блокировку?...
1579 просмотров

Android: преобразование речи в текст и распознавание речи в автономном режиме
Я застрял в одном из моих автономных приложений для Android, где мне нужно автономное распознавание речи и API преобразования речи в текст. Пожалуйста, поделитесь своим мнением и мнением, если кто-то работал над автономным преобразованием речи в...
4622 просмотров

Существует ли API для технологии распознавания речи Google?
Я хочу попробовать создать слайд-шоу jQuery, используя простые голосовые команды, такие как «следующий» или «предыдущий». Есть ли способ использовать распознавание голоса Google? Я знаю о x-webkit-speech в Chrome, но мне нужно нажать кнопку, чтобы...
56560 просмотров

как отобразить настройки распознавания голоса Google в моем приложении?
Я работаю над приложением для Android, в котором я реализовал распознавание голоса и TTS. Поэтому я подумал запустить экран настроек как для распознавания голоса Google, так и для TTS, чтобы пользователь мог изменять настройки из приложения. Я...
3429 просмотров
schedule 29.04.2023

идентификация/распознавание голоса человека
я хочу записать чей-то голос, а затем из информации, которую я получаю о его / ее голосе, я узнаю, говорит ли этот человек снова! проблема в том, что у меня нет информации о том, какая статистика (например, частота) вызывает разницу с человеческим...
9003 просмотров
schedule 19.12.2023

API распознавания речи / голоса Google в AppEngine?
В настоящее время я работаю над проектом Android + AppEngine, используя голос в качестве основного метода ввода. На Android вы можете использовать речевой пакет для перевода голосовых команд в простой текст. Распознавание голоса не выполняется на...
3706 просмотров

Как сопоставить два голосовых файла и вернуть, являются ли они одними и теми же словами?
Я записываю свой голос со словами «Hello World» и сохраняю его как файл-1. Затем запишите голос другого парня с «Hello World» и сохраните его как файл-2. Есть ли способ сопоставить эти два файла? Я имею в виду, что если в двух файлах записаны...
1968 просмотров

Распознавание голоса без интернета в Android
Я искал несколько библиотек распознавания голоса, которые поддерживают Android, но ни одна из них не работает без вызова сервера или без использования Интернета. Мое требование - обнаружить некоторые конкретные ключевые слова и выполнить...
6116 просмотров
schedule 01.10.2022

Человеческое лицо, эмоции и распознавание голоса
Я ищу хороший метод распознавания лица, эмоций и голоса в C# . Для распознавания лиц я рано использовал Emgu CV, который не точен, а производительность очень низкая в условиях низкой освещенности. Также мне нужно найти эмоции пользователя. Будь то...
6400 просмотров

Общие сведения о службе распознавания голоса
Я пытаюсь понять работу RecognitionService и RecognitionService.Callback . Я новичок в этой среде и хотел бы знать, как вызвать функцию onStartListening() в RecognitionService. Я видел сообщение Как зарегистрировать пользовательскую службу...
4322 просмотров

Как создать распознавание голоса в iOS
Я хочу создать приложение на основе распознавания голоса. Есть ли в iOS 5+ какая-либо функция или структура делегата по умолчанию? Как сделать распознавание голоса?
224 просмотров
schedule 23.06.2023

Сегментация фонемы Sphinx4
Я разрабатываю систему, в которой мне нужны Начальный кадр , Конечный кадр и Оценка сегментации для каждой фонемы в слове или предложении. Я использовал команду Sphinx-3: sphinx3_align, чтобы получить следующий результат (пример): SFrm...
629 просмотров

Реализовать вторжение в систему для Android TTS
Мне трудно понять, как решить эту проблему, я не уверен, правильно ли я настраиваю потоки или возможно ли вообще решить проблему правильно. Это приложение для Android, которое считывает определенные строки как TTS (используя собственный TTS...
727 просмотров