Привет всем,
На прошлой неделе мы говорили о нашем методе сбора данных и наборе данных. Как мы уже упоминали, набор данных содержит несколько дублированных изображений с водяными знаками. На этой неделе мы удалили эти дубликаты и очистили водяные знаки.

Удаление дубликатов

Мы планируем использовать YOLOv5 для определения отношения учащихся. YOLOv5 — это структура CNN, разработанная распределенными разработчиками. CNN является инвариантной к переводу, что означает, что система выдает точно такой же ответ, независимо от того, как сдвинуты ее входные данные. Таким образом, дублированные изображения ничего не сделают, кроме как увеличат размер набора данных для YOLOv5.

Очистка водяных знаков

YOLOv5 должен справляться с низким уровнем шума, но в нашем наборе данных некоторые водяные знаки маскируют существенные особенности, обеспечивающие различие между метками. Поэтому мы максимально убрали эти водяные знаки, которые могли вызвать проблемы.

На следующей неделе

На этой неделе сбор и очистка шагов набора данных завершены. На следующей неделе мы планируем пометить небольшие образцы изображений из каждого класса и протестировать модель YOLOv5 с помощью этих помеченных образцов, чтобы получить представление о моделях YOLOv5 в зависимости от количества изображений.

Кан Али Атеш

Абдулла Энес Эргюн

Баакирбасоглу

Ресурсы

  1. https://github.com/ultralytics/yolov5
  2. Трансляционная симметрия — Википедия
  3. https://www.watermarkremover.io/upload