Публикации по теме 'speech-recognition'


Как искусственный интеллект делает ваш автомобиль умнее
Возможно, ваш следующий автомобиль не будет беспилотным, но он содержит множество технологий искусственного интеллекта, о которых вы, возможно, не знали. Давайте посмотрим, какие технологии искусственного интеллекта могут быть в вашем автомобиле. Безопасное вождение Камера похожа на глаза автомобиля, а система искусственного интеллекта, стоящая за ней, — это мозг. Обе стороны сотрудничают, чтобы контролировать, отвлекается ли водитель, ведет ли он себя за рулем в нетрезвом виде..

Большие технологии уходят в офлайн
Распознавание речи на устройстве в 2022 году 2022 год стал лучшим годом для распознавания речи на устройствах, учитывая масштабы и частоту объявлений. Google анонсировала Google Cloud Speech On-Device 20 октября. Open AI — создатель знаменитых DALL-E и ChatGPT представил Whisper в сентябре. Apple добавила живые субтитры на устройстве в рамках своих инициатив по обеспечению доступности и конфиденциальности в мае. В марте Microsoft завершила приобретение Nuance за 20 миллиардов..

Расширение возможностей вашего рабочего процесса с помощью голосового меню Python
По мере того, как технологии продолжают развиваться, они открывают для нас новые возможности взаимодействия с нашими устройствами способами, которые когда-то считались футуристическими. Одной из таких инноваций является распознавание голоса — технология, которая быстро стала неотъемлемой частью нашей повседневной жизни. Представьте, что вы отдаете команду компьютеру выполнять задачи, переключать приложения или запускать программы с помощью голоса. В этом блоге мы познакомимся с..

Примечания из статьи о применении моделей, основанных на внимании, для проверки говорящего в зависимости от текста
Прочитайте эту замечательную статью от Google, посвященную применению Модели, основанные на внимании, для идентификации говорящего . Вот мои записи из газеты. Хотя я не ученый, я участвовал в разработке рабочих процессов машинного обучения, чтобы повысить точность распознавания отдельных спикеров в рамках моей работы в Amazon. Традиционно стандартные системы на основе i-Vector и PLDA были развернуты для «независимой от текста» проверки говорящего. Но в последнее время сквозные..

Лучшее и быстрое распознавание речи с помощью критерия автоматической сегментации Wav2Letter
Новая функция Facebook AI для потерь улучшает устаревшую технику в ASR В 2016 году Facebook AI Research (FAIR) открыла новые горизонты с Wav2Letter , полностью сверточной системой распознавания речи. В Wav2Letter FAIR показал, что системы, основанные на сверточных нейронных сетях (CNN), могут работать не хуже традиционных подходов, основанных на рекуррентных нейронных сетях . В этой статье мы сосредоточимся на недостаточно изученном модуле, лежащем в основе Wav2Letter: критерии..

Использование машинного обучения для извлечения эмоций из речи
В предыдущем посте мы уже обсуждали, как использовать PoseNet и Face-API tf-js, чтобы понять различные позы тела и выражения лиц, которые принимают люди. В этом посте мы обсудим, как мы можем классифицировать эмоции человека на основе того, какие слова он подбирает. Введение в проект Как упоминалось в последнем посте, идея систем, предлагаемых в этой серии, будет объединена для создания системы, которая может помочь людям в подготовке к собеседованию при приеме на работу. После языка..

Почему масштабирование — это проблема распознавания речи без ИИ и машинного обучения
Распознавание речи сегодня является одной из наиболее широко используемых технологий во многих предложениях. От диалоговых чат-ботов и программного обеспечения для анализа речи до интерфейса CX, применение технологии распознавания речи разнообразно. Рост популярности распознавания речи можно объяснить активным использованием искусственного интеллекта, поддерживаемого возможностями машинного обучения и обучения данным. Несмотря на то, что работа в области распознавания речи ведется уже..