Как обучить модели машинного обучения классифицировать изображения в соответствии с заданными вами ярлыками.

В этом руководстве мы будем использовать AutoML Vision для решения проблемы классификации изображений. Мы научим модель определять вкус чая по изображению его упаковки.

Предварительные условия:

  • Активная подписка на Google Cloud Platform.
  • Четыре или более объекта, которые вы хотите классифицировать.

Создание набора данных

  1. Создайте одно видео для каждого объекта (от 5 до 10 секунд).

Учтите, что в идеальном сценарии необходимо учитывать множество аспектов. Некоторые из них:

  • Разные углы.
  • Несколько уровней освещенности.
  • Состояние объекта

2. Мы будем использовать https://ffmpeg.org/, чтобы получить несколько кадров из видео. AutoML требует не менее 100 изображений на объект для обучения модели.

Конечно, чем больше, тем лучше :)

3. Сохраните кадры в разные папки. Одна папка на этикетку.

Вы можете ознакомиться с официальным руководством для новичков здесь.

Облачная платформа Google

Перейдите на главную страницу Google Cloud Platform и выполните поиск по запросу Vision:

Выберите продукт AutoML Image Classification:

Укажите название проекта Google Cloud и начните с создания нового набора данных.

Дайте модели имя и нажмите кнопку Импортировать изображения позже. Это позволит нам импортировать каждое изображение из папки, связанной с ярлыком, который мы скоро создадим.

На следующем этапе нажмите Новая метка и добавьте по одной метке для каждого объекта, который вы хотите классифицировать . В моем случае это будет четыре разных вкуса: черный, зеленый, лимонный и индийский.

Выберите каждую вновь созданную этикетку и нажмите кнопку Добавить изображения вверху. Выберите вариант Загрузить со своего компьютера. Выберите все изображения из папки, связанной с этим ярлыком.

У нас должно быть более 100 изображений, связанных с каждой из созданных этикеток.

Следующим шагом будет обучение и оценка модели.

Наконец, мы протестируем наш набор данных и модель, попробовав новые изображения и позволив нашему приложению предсказать, какой ярлык мы загружаем.

Согласно прогнозу Google, это изображение упаковки зеленого чая, и они абсолютно верны!

Следующие шаги:

  • Тестирование набора данных в более сложных обстоятельствах (в зависимости от вашего варианта использования).
  • Интегрируйте Google AutoML в свое приложение, как показано на следующей диаграмме:

Заключение:

Это прекрасное время для знакомства с новыми технологиями, такими как машинное обучение и компьютерное зрение.

Не забывайте, что вам не нужно изобретать колесо, вам просто нужно знать, как наилучшим образом использовать доступные вам инструменты.

Обязательно задавайте любые вопросы в комментариях ниже.

Эта статья была первоначально опубликована на сайте Light-it Software 14 мая 2019 г. и написана Мартином Оппенгеймером.