Сверточная нейронная сеть
CNN вдохновлены структурой мозга. Это классы нейронных сетей, которые оказались очень эффективными в области распознавания, обработки и классификации изображений.
Применения компьютерного зрения и глубокого обучения на предприятии
Интерес предприятий к технике машинного зрения стремительно растет в последние несколько лет в связи с повышением точности на таких конкурсах, как ImageNet. Методы компьютерного зрения существуют уже несколько десятилетий, но для некоторых вариантов использования требуется определенный уровень точности, чтобы выйти за пределы лаборатории и перейти к реальным производственным приложениям. Достижения, отмеченные в конкурсе ImageNet, показали миру, что возможно, а также предвещали рост сверточных нейронных сетей как метода выбора в компьютерном зрении.
Сверточные нейронные сети могут автоматически изучать инвариантные к местоположению функции, используя сетевую архитектуру, которая изучает функции изображений, а не создает их вручную. Этот аспект подчеркивает ключевое свойство сетей глубокого обучения — способность специалистов по данным выбирать правильную архитектуру для типа входных данных, чтобы сеть могла автоматически изучать функции. Все это также напрямую зависит от наличия достаточного количества данных о качестве, которые должным образом помечены и соответствуют рассматриваемой проблеме.
Мы видим применение компьютерного зрения в различных сферах деятельности предприятия:
- Страхование
- Автомобильный
- Финансовые услуги
- Средства массовой информации
- Здравоохранение
- Розничная торговля
- Распознавание изображений и OCR
- Распознавание лиц в социальных сетях
- Обработка изображения
- Классификация
- Маркировка видео
- Текстовый анализ
Мы видим, как страховые компании используют компьютерное зрение для анализа ущерба активам в соответствии с полисом, чтобы лучше решить, кому следует предложить страховое покрытие.
За последние пять лет автомобильная промышленность активно внедряла компьютерное зрение в такие приложения, как анализ сцены, автоматическое определение полосы движения и автоматическое считывание дорожных знаков для установки ограничений скорости.
Мир средств массовой информации использует компьютерное зрение для распознавания изображений в социальных сетях, чтобы идентифицировать бренды, чтобы компании могли лучше позиционировать свои бренды вокруг соответствующего контента. eBay недавно использовал компьютерное зрение, чтобы позволить пользователям визуально искать товары с фотографиями.
В здравоохранении мы видим классическое применение обнаружения заболеваний с помощью МРТ, где такие компании, как Arterys, теперь получили разрешение FDA на использование глубокого обучения для моделирования данных медицинских изображений. Мы также видим это в партнерских отношениях, таких как отношения между Google, Nvidia и Massachusetts General Hospital для использования глубокого обучения в радиологических задачах.
В розничной торговле мы видим компании, заинтересованные в анализе покупательских тележек покупателей в магазине, чтобы обнаружить товары и дать рекомендации в магазине о том, что еще они могут захотеть купить. Думайте об этом как о механизме рекомендаций для обычной ситуации. Мы также видим, что ритейлеры используют еще более сложные камеры, делающие более сложные изображения, которые моделируются с помощью сверточных нейронных сетей.
Это всего лишь несколько примеров идей компьютерного зрения, которые находятся в разработке или уже используются на предприятиях Global 2000. Похоже, что этот материал для глубокого обучения может появиться еще какое-то время.
Помимо сверточных нейронных сетей, автомобильная промышленность использует сети глубокого обучения и долговременной памяти для анализа данных датчиков для автоматического обнаружения других автомобилей и объектов вокруг автомобиля. На более новых автомобилях, если вы попытаетесь перестроиться на шоссе, не включив сигнал поворота, автомобиль скорректирует вас, автоматически направив вас обратно в свою полосу. Джеймс Лонг поделился с нами этим анекдотом о том, как он рассматривает интегрированное машинное обучение как множитель силы, а не как замену рабочих мест.
Проблемы глубокого обучения в производстве
Компьютерное зрение и глубокое обучение создают проблемы при запуске в производство. Эти проблемы включают в себя:
- Получение достаточного количества данных хорошего качества
- Управление ожиданиями руководителей в отношении эффективности модели
- Быть прагматичными в отношении того, насколько передовой нам нужна наша сеть
- Планирование приема данных, хранения, безопасности и общей инфраструктуры
- Понимание того, чем машинное обучение отличается от разработки программного обеспечения, чтобы избежать несоответствия ожиданий
Большинство организаций не собирают достаточно качественных данных, чтобы создать модель, требуемую их направлением бизнеса с точки зрения точности. Специалист по компьютерному зрению должен понимать динамику оценки модели и то, как оценки F1, точность и полнота работают на практике. Эти знания позволят практикующему специалисту по обработке и анализу данных лучше донести до руководства реалистичные ожидания в отношении производительности модели и не ставить проект на грань провала.
На приведенном выше рисунке показано одно из приложений CNN (обнаружение объектов).