Как обучить модели машинного обучения классифицировать изображения в соответствии с заданными вами ярлыками.
В этом руководстве мы будем использовать AutoML Vision для решения проблемы классификации изображений. Мы научим модель определять вкус чая по изображению его упаковки.
Предварительные условия:
- Активная подписка на Google Cloud Platform.
- Четыре или более объекта, которые вы хотите классифицировать.
Создание набора данных
- Создайте одно видео для каждого объекта (от 5 до 10 секунд).
Учтите, что в идеальном сценарии необходимо учитывать множество аспектов. Некоторые из них:
- Разные углы.
- Несколько уровней освещенности.
- Состояние объекта
2. Мы будем использовать https://ffmpeg.org/, чтобы получить несколько кадров из видео. AutoML требует не менее 100 изображений на объект для обучения модели.
Конечно, чем больше, тем лучше :)
3. Сохраните кадры в разные папки. Одна папка на этикетку.
Вы можете ознакомиться с официальным руководством для новичков здесь.
Облачная платформа Google
Перейдите на главную страницу Google Cloud Platform и выполните поиск по запросу Vision:
Выберите продукт AutoML Image Classification:
Укажите название проекта Google Cloud и начните с создания нового набора данных.
Дайте модели имя и нажмите кнопку Импортировать изображения позже. Это позволит нам импортировать каждое изображение из папки, связанной с ярлыком, который мы скоро создадим.
На следующем этапе нажмите Новая метка и добавьте по одной метке для каждого объекта, который вы хотите классифицировать . В моем случае это будет четыре разных вкуса: черный, зеленый, лимонный и индийский.
Выберите каждую вновь созданную этикетку и нажмите кнопку Добавить изображения вверху. Выберите вариант Загрузить со своего компьютера. Выберите все изображения из папки, связанной с этим ярлыком.
У нас должно быть более 100 изображений, связанных с каждой из созданных этикеток.
Следующим шагом будет обучение и оценка модели.
Наконец, мы протестируем наш набор данных и модель, попробовав новые изображения и позволив нашему приложению предсказать, какой ярлык мы загружаем.
Согласно прогнозу Google, это изображение упаковки зеленого чая, и они абсолютно верны!
Следующие шаги:
- Тестирование набора данных в более сложных обстоятельствах (в зависимости от вашего варианта использования).
- Интегрируйте Google AutoML в свое приложение, как показано на следующей диаграмме:
Заключение:
Это прекрасное время для знакомства с новыми технологиями, такими как машинное обучение и компьютерное зрение.
Не забывайте, что вам не нужно изобретать колесо, вам просто нужно знать, как наилучшим образом использовать доступные вам инструменты.
Обязательно задавайте любые вопросы в комментариях ниже.
Эта статья была первоначально опубликована на сайте Light-it Software 14 мая 2019 г. и написана Мартином Оппенгеймером.