Сай Маниш Рао Сириконда, Амулла Рохит, Университет Мэриленда, округ Балтимор

Под руководством Dr. Озгур Озтюрк

Введение:

Пандемия COVID-19 поразила всю нашу жизнь, она чуть не остановила весь наш мир на несколько месяцев. Для обнаружения вируса было разработано несколько методов. ОТ-ПЦР является одним из самых популярных. Однако все эти методы были трудоемкими и ресурсоемкими. Альтернативный метод мог бы быть очень полезен для быстрого обнаружения вируса, что очень важно. Карантин инфицированных людей является приоритетом во время такой пандемии. И для этого быстрое распознавание вируса у человека было бы большим благом. Достижения в области глубокого обучения и компьютерного зрения показали многообещающие результаты в извлечении соответствующих функций из медицинских изображений и создании точных прогнозов с использованием глубокого обучения. Эта же технология может быть применена к рентгеновским изображениям грудной клетки для обнаружения COVID-19.

В нашем проекте мы использовали методы трансферного обучения для обучения моделей сверточной нейронной сети (CNN) с целью обнаружения COVID-19. Мы использовали возможности предварительно обученных архитектур, в частности VGG16, VGG19 и DenseNet121, чтобы ускорить процесс обучения модели и извлечь выгоду из их изученных функций. Кроме того, мы разработали собственную модель CNN, чтобы сравнить ее производительность с предварительно обученными моделями.

Используя трансферное обучение, мы смогли использовать знания и функции, полученные этими современными архитектурами из крупномасштабных наборов данных. Это позволило нам эффективно извлекать значимую информацию из рентгеновских изображений грудной клетки, связанную с обнаружением COVID-19. Трансферное обучение не только сэкономило нам значительные вычислительные ресурсы, но и повысило точность и эффективность наших моделей.

Набор данных:

Чтобы найти подходящий набор данных для проекта, мы обратились к Kaggle, популярной платформе для Data Science и Machine Learning. Нам нужен был набор данных, который позволил бы нам эффективно обучать и оценивать наши модели на COVID-19. В нашем поиске мы наткнулись на базу данных рентгенографии COVID-19, которая получила признание, получив награду за набор данных COVID-19 от сообщества Kaggle. Набор данных содержит более 10 000 изображений для COVID-19, такое же количество обычных рентгенограмм грудной клетки и еще 11 000 изображений для инфекций, не связанных с COVID. Учитывая направленность нашего проекта, мы решили исключить из набора данных изображения инфекций, не связанных с COVID.

Предварительная обработка данных:

Сначала мы разделяем набор данных на наборы для обучения, проверки и тестирования. Чтобы обеспечить единообразие, мы изменили размер всех изображений до единой формы. Все наши модели имеют исходный размер по умолчанию 224 x 224, поэтому мы изменили их размер. Мы использовали Data Augmentation, чтобы искусственно увеличить размер набора данных и сделать модели более надежными. Мы также нормализовали значения пикселей, умножив их на 1/255, это поможет уменьшить систематическую ошибку в процессе обучения.

Предварительно обученные модели.

Все три выбранные нами модели были обучены на наборе данных imagenet. И доказали свою превосходную производительность при решении различных задач классификации изображений. Вот их краткий обзор:

VGG16: это архитектура глубокой сверточной нейронной сети, разработанная Visual Geometry Group в Оксфордском университете. Он имеет 16 слоев: 13 сверточных слоев и 3 полносвязных слоя. Эта архитектура известна своей простотой и единообразной структурой с 3 небольшими фильтрами 3 x 3, используемыми по всей сети.

VGG19: это расширение VGG16. Вместо 16 слоев он имеет 19. 16 сверточных и 3 полносвязных слоя. Дополнительные слои позволяют модели фиксировать более сложные функции, а также повышают производительность.

DenseNet121:это глубокая сверточная архитектура нейронной сети, предложенная исследователями Facebook AI Research. Он назван в честь его плотной схемы подключения. Каждый слой полностью связан с каждым другим слоем с прямой связью. Он имеет 121 слой, состоящий из плотных блоков и переходных блоков.

Пользовательская модель:

Чтобы оценить эффективность трансферного обучения, мы также использовали пользовательскую модель CNN. Это последовательная модель с 4 сверточными слоями, за которыми следуют максимальные объединяющие слои, выпадающие слои и плотные слои. Чтобы оставаться в соответствии с другими моделями, мы установили входную форму как (224,224,3) и для этой модели.

Обучение:

Слои добавляются к предварительно обученным моделям по мере необходимости. Мы заморозили предварительно обученные слои, чтобы они не обновлялись во время обучения. Это гарантирует, что знания моделей, полученные в результате обучения на наборе данных ImageNet, не будут потеряны. Мы скомпилировали модели с использованием Adam Optimizer и категориальной функции кросс-энтропийных потерь. Мы установили размер пакета обучающих данных равным 32. Чтобы предотвратить переоснащение, мы реализовали обратный вызов EarlyStopping для отслеживания потери проверки. В случае, если потери при проверке не улучшаются в течение трех последовательных эпох, этот метод останавливает обучение и сбрасывает веса до их лучших значений. Модели учатся на обучающих данных и корректируют свои веса, чтобы минимизировать потери. Мы оцениваем производительность моделей во время обучения, используя набор проверки. Гиперпараметры, такие как batch_size, количество шагов за эпоху, можно изменить по мере необходимости.

Пользовательская модель:

Оценка моделей:

Мы проверили показатели точности всех моделей в тестовом наборе. Пользовательская модель достигла точности 89%. Таким образом, это будет рекорд для других наших моделей. Как и ожидалось, все они работали лучше, чем наша пользовательская модель. VGG19 имеет точность 93% на тестовом наборе, VGG16 — 94%, а DenseNet121 — 95%.

Отчеты о классификации:

Пользовательская модель:

VGG16:

VGG19:

DenseNet121:

Матрицы путаницы:

Вывод:

Как и ожидалось, предварительно обученные модели показали себя намного лучше, чем наша пользовательская модель. Это демонстрирует полезность трансферного обучения. Мы смогли достичь почти 95% точности с предварительно обученными моделями. Это демонстрирует эффективность глубокого обучения в обнаружении COVID-19 с помощью рентгенографии грудной клетки.

Однако важно помнить, что это не окончательный способ диагностики вируса. Его можно использовать как способ быстрой диагностики, чтобы помочь в раннем обнаружении. Для обеспечения устойчивости этого метода и его надежности потребуются дополнительные исследования и клинические испытания. Этот проект может быть использован в качестве основы для будущих разработок в этой области.

Github: https://github.com/SaiManishRao97/COVID-19-project

Ссылки:

М. Э. Х. Чоудхури и др., «Может ли ИИ помочь в скрининге вирусной пневмонии и пневмонии, вызванной COVID-19?», в IEEE Access, vol. 8, стр. 132665–132676, 2020, doi: 10.1109/ACCESS.2020.3010287.

Таусифур Рахман, Амит Кхандакар, Язан Киблави, Анас Тахир, Серкан Кираньяз, Саад бин Абул Кашем, Мохаммад Тарикул Ислам, Сомайя Аль Маадид, Сусу М. Зугайер, Мухаммад Салман Хан, Мухаммад Э.Х. Чоудхури, Изучение влияния методов улучшения изображения на обнаружение COVID-19 с использованием рентгеновских изображений грудной клетки, Компьютеры в биологии и медицине, том 132, 2021 г., 104319, ISSN 0010–4825, https://doi.org/ 10.1016/j.compbiomed.2021.104319.

https://www.kaggle.com/code/sana306/detection-of-covid-positive-cases-using-dl#Data-Modeling