Информационный бюллетень Heartbeat Vol. 42

Селфи ML, оператор автоматической камеры и многое другое

Новости

Google объявляет о полностью нейронном распознавании речи на устройстве

Кроссплатформенное приложение Google для клавиатуры Gboard получает серьезное обновление - это полноценный, сквозной распознаватель речи, который работает и выполняет логический вывод в реальном времени полностью на устройстве. Это означает минимальную задержку и полную функциональность в автономном режиме. Модель - преобразователь RNN - работает на уровне символов, то есть, когда вы говорите, выходные слова создаются посимвольно, что близко имитирует прямую мгновенную транскрипцию. Модель велика - 80 МБ после квантования - но для полностью функционирующей модели, живущей и выполняющей логический вывод на устройстве, это представляет собой огромный шаг вперед в распознавании речи на мобильных устройствах. "[Читать далее]"

Под капотом с «умной камерой» портала

Новое устройство голосовой связи Facebook, портал, должно произвести фурор благодаря своей умной камере на базе искусственного интеллекта. Устройство действует как оператор камеры - оптимизирует кадрирование кадра, автоматическое масштабирование, распознает людей, когда они входят / выходят из кадра и т. Д. Для реализации этих возможностей команда Facebook расширила свою модель Mask R-CNN, чтобы создать 2D-модель оценки позы, работающая со скоростью 30 кадров в секунду. В анонсе было много хороших обсуждений того, что, почему и как использовать смарт-камеру. "[Читать далее]"

«Seeing AI» от Microsoft позволяет слепым пользователям просматривать фотографии на ощупь

Seeing AI, приложение, которое преобразует визуальные данные в звуковую обратную связь, добавило новую функцию, которая позволяет людям с нарушениями зрения исследовать объекты и лица на фотографиях, касаясь их. Используя обнаружение объектов и распознавание лиц, приложение может описывать затронутые объекты и определять пространственные отношения между ними. Кроме того, приложение теперь изначально поддерживает iPad, который является предпочтительным устройством для многих в этом сообществе. "[Читать далее]"

Самовыражение в реальном времени с помощью дополненной реальности и машинного обучения

Заимствуя сборник программ Snapchat, ARCore от Google добавил возможность дополнять селфи анимированными масками, очками, трехмерными шляпами и т. Д. Новый Augmented Faces API использует машинное обучение для прогнозирования трехмерной геометрии поверхности, что устраняет необходимость в камере со специальным датчиком глубины. Здесь две модели машинного обучения работают в тандеме: модель обнаружения лиц и модель трехмерной сетки, которая работает с обнаруженными лицами. Несомненно, поддержка TensorFlow Lite ускорения графического процессора сыграла огромную роль в создании этой новой функции. "[""Читать далее""]"

Бета-версия Android Q

Компания Android анонсировала и выпустила бета-версию 1 Android Q, своего последнего обновления программного обеспечения. Объявление сосредоточено на нескольких конкретных обновлениях: улучшенная защита конфиденциальности, ярлыки для обмена контентом, поддержка новых типов устройств (например, складных) и поддержка фотографий с динамической глубиной, и это лишь некоторые из них. Что касается машинного обучения, то команда представила NNAPI 1.2, который включает 60 новых операций и ряд оптимизаций производительности, которые помогут ускорить модели для обнаружения объектов и сегментации изображений. "[Читать далее]"

NVIDIA представляет Jetson Nano за 99 долларов

Всего через две недели после того, как Google выпустила свои ускорители Edge TPU, NVIDIA добавила новое устройство в нижнюю часть своей линейки Jetson. Jetson Nano оснащен 128-ядерным графическим процессором Maxwell и четырехъядерным процессором ARM Cortex. Цена Nano начинается всего с 99 долларов, а готовая к производству единица - 129 долларов. "[Читать далее]"

НОВЫЕ РУКОВОДСТВА

Работа с камерой OpenCV для Android

Узнайте, как разобраться с модулем камеры OpenCV для Android, включая особенности поворота, масштабирования и ориентации изображения. "[""Читать далее""]"

Edge TPU: практическая работа с Google Coral USB Accelerator

Первый взгляд на Coral’s Edge TPU USB Accelerator, анонсированный на саммите разработчиков TensorFlow в этом месяце. "[""Читать далее""]"

Работает ли моя модель Core ML на Neural Engine от Apple?

Использование аппаратного ускорения с помощью Apple Neural Engine важно, если вы хотите, чтобы ваше приложение работало быстро и не разряжало аккумулятор пользователя. Узнайте, как определить, работает ли ваша модель Core ML на Engine. "[""Читать далее""]"

[В сторону науки о данных] Запуск MobileNet на микроконтроллерах STM32 на периферии

Интересный взгляд на то, как различные модели MobileNet, уже обученные и оптимизированные для повышения энергоэффективности, могут быть сопоставлены с периферийными устройствами - в данном случае микроконтроллером STM32. ["Читать далее"]

Примечание редактора. Готовы погрузиться в код? Посмотрите Fritz на GitHub. Вы найдете открытые, удобные для мобильных устройств реализации популярных моделей машинного и глубокого обучения, а также обучающие скрипты, шаблоны проектов и инструменты для создания собственных приложений для iOS и Android на базе машинного обучения.

Присоединяйтесь к нам на Slack, чтобы получить помощь в решении технических проблем, поделиться тем, над чем вы работаете, или просто поговорить с нами о мобильной разработке и машинном обучении. И подписывайтесь на нас в Твиттере и LinkedIn, чтобы быть в курсе всего последнего контента, новостей и многого другого из мира мобильного машинного обучения.