Сверточная нейронная сеть

CNN вдохновлены структурой мозга. Это классы нейронных сетей, которые оказались очень эффективными в области распознавания, обработки и классификации изображений.

Применения компьютерного зрения и глубокого обучения на предприятии

Интерес предприятий к технике машинного зрения стремительно растет в последние несколько лет в связи с повышением точности на таких конкурсах, как ImageNet. Методы компьютерного зрения существуют уже несколько десятилетий, но для некоторых вариантов использования требуется определенный уровень точности, чтобы выйти за пределы лаборатории и перейти к реальным производственным приложениям. Достижения, отмеченные в конкурсе ImageNet, показали миру, что возможно, а также предвещали рост сверточных нейронных сетей как метода выбора в компьютерном зрении.

Сверточные нейронные сети могут автоматически изучать инвариантные к местоположению функции, используя сетевую архитектуру, которая изучает функции изображений, а не создает их вручную. Этот аспект подчеркивает ключевое свойство сетей глубокого обучения — способность специалистов по данным выбирать правильную архитектуру для типа входных данных, чтобы сеть могла автоматически изучать функции. Все это также напрямую зависит от наличия достаточного количества данных о качестве, которые должным образом помечены и соответствуют рассматриваемой проблеме.

Мы видим применение компьютерного зрения в различных сферах деятельности предприятия:

  • Страхование
  • Автомобильный
  • Финансовые услуги
  • Средства массовой информации
  • Здравоохранение
  • Розничная торговля
  • Распознавание изображений и OCR
  • Распознавание лиц в социальных сетях
  • Обработка изображения
  • Классификация
  • Маркировка видео
  • Текстовый анализ

Мы видим, как страховые компании используют компьютерное зрение для анализа ущерба активам в соответствии с полисом, чтобы лучше решить, кому следует предложить страховое покрытие.

За последние пять лет автомобильная промышленность активно внедряла компьютерное зрение в такие приложения, как анализ сцены, автоматическое определение полосы движения и автоматическое считывание дорожных знаков для установки ограничений скорости.

Мир средств массовой информации использует компьютерное зрение для распознавания изображений в социальных сетях, чтобы идентифицировать бренды, чтобы компании могли лучше позиционировать свои бренды вокруг соответствующего контента. eBay недавно использовал компьютерное зрение, чтобы позволить пользователям визуально искать товары с фотографиями.

В здравоохранении мы видим классическое применение обнаружения заболеваний с помощью МРТ, где такие компании, как Arterys, теперь получили разрешение FDA на использование глубокого обучения для моделирования данных медицинских изображений. Мы также видим это в партнерских отношениях, таких как отношения между Google, Nvidia и Massachusetts General Hospital для использования глубокого обучения в радиологических задачах.

В розничной торговле мы видим компании, заинтересованные в анализе покупательских тележек покупателей в магазине, чтобы обнаружить товары и дать рекомендации в магазине о том, что еще они могут захотеть купить. Думайте об этом как о механизме рекомендаций для обычной ситуации. Мы также видим, что ритейлеры используют еще более сложные камеры, делающие более сложные изображения, которые моделируются с помощью сверточных нейронных сетей.

Это всего лишь несколько примеров идей компьютерного зрения, которые находятся в разработке или уже используются на предприятиях Global 2000. Похоже, что этот материал для глубокого обучения может появиться еще какое-то время.

Помимо сверточных нейронных сетей, автомобильная промышленность использует сети глубокого обучения и долговременной памяти для анализа данных датчиков для автоматического обнаружения других автомобилей и объектов вокруг автомобиля. На более новых автомобилях, если вы попытаетесь перестроиться на шоссе, не включив сигнал поворота, автомобиль скорректирует вас, автоматически направив вас обратно в свою полосу. Джеймс Лонг поделился с нами этим анекдотом о том, как он рассматривает интегрированное машинное обучение как множитель силы, а не как замену рабочих мест.

Проблемы глубокого обучения в производстве

Компьютерное зрение и глубокое обучение создают проблемы при запуске в производство. Эти проблемы включают в себя:

  • Получение достаточного количества данных хорошего качества
  • Управление ожиданиями руководителей в отношении эффективности модели
  • Быть прагматичными в отношении того, насколько передовой нам нужна наша сеть
  • Планирование приема данных, хранения, безопасности и общей инфраструктуры
  • Понимание того, чем машинное обучение отличается от разработки программного обеспечения, чтобы избежать несоответствия ожиданий

Большинство организаций не собирают достаточно качественных данных, чтобы создать модель, требуемую их направлением бизнеса с точки зрения точности. Специалист по компьютерному зрению должен понимать динамику оценки модели и то, как оценки F1, точность и полнота работают на практике. Эти знания позволят практикующему специалисту по обработке и анализу данных лучше донести до руководства реалистичные ожидания в отношении производительности модели и не ставить проект на грань провала.

На приведенном выше рисунке показано одно из приложений CNN (обнаружение объектов).