Сегментация изображений: часть 1

Математическая и практическая реализация различных техник сегментации изображений.

Сегментация изображений

Сегментация изображения - это метод, при котором цифровое изображение разбивается на различные подгруппы, называемые сегментами изображения, что помогает снизить сложность изображения, чтобы упростить дальнейшую обработку или анализ изображения. Простыми словами, сегментация - это присвоение пикселям меток. Всем элементам изображения или пикселям, принадлежащим одной категории, присвоена общая метка. Например: возьмем задачу, в которой изображение должно быть предоставлено в качестве входных данных для обнаружения объекта. Вместо обработки всего изображения в детектор можно ввести область, выбранную алгоритмом сегментации. Это предотвратит обработку детектором всего изображения, что сократит время вывода.

Подходы к сегментации изображений

Подход на основе подобия. Этот подход основан на обнаружении сходства между пикселями изображения для формирования сегмента на основе порогового значения. Алгоритмы машинного обучения, такие как кластеризация, основаны на таком подходе к сегментации изображения.
Подход с разрывом. Этот подход основан на неоднородности значений интенсивности пикселей изображения. Методы обнаружения линий, точек и краев используют этот тип подхода для получения промежуточных результатов сегментации, которые впоследствии могут быть обработаны для получения окончательного сегментированного изображения.

Методы сегментации изображений

Сегментация на основе пороговых значений
Сегментация на основе краев
Сегментация по регионам
Сегментация на основе кластеризации
Сегментация на основе искусственной нейронной сети

В этой статье мы рассмотрим сегментацию на основе пороговых значений и краев. Другие методы сегментации будут обсуждаться в следующих частях.

Сегментация на основе пороговых значений

Сегментация с использованием пороговых значений изображения - это простая форма сегментации изображения. Это способ создания двоичного или многоцветного изображения, основанный на установке порогового значения интенсивности пикселей исходного изображения.

В этом процессе определения порога мы будем рассматривать гистограмму интенсивности всех пикселей изображения. Затем мы установим порог для разделения изображения на разделы. Например, рассматривая пиксели изображения в диапазоне от 0 до 255, мы устанавливаем порог 60. Таким образом, всем пикселям со значениями меньше или равными 60 будет предоставлено значение 0 (черный), а всем пикселям будет предоставлено значение больше чем 60 будет предоставлено значение 255 (белый).

Рассматривая изображение с фоном и объект, мы можем разделить изображение на области в зависимости от интенсивности объекта и фона. Но этот порог должен быть идеально установлен, чтобы разделить изображение на объект и фон.

Различные методы определения пороговых значений:

Глобальное пороговое значение: в этом методе мы используем бимодальное изображение. Бимодальное изображение - это изображение с двумя пиками интенсивности на графике распределения интенсивности. Один для объекта и один для фона. Затем мы выводим пороговое значение для всего изображения и используем этот глобальный порог для всего изображения. Недостатком этого типа порога является то, что он очень плохо работает при плохой освещенности изображения.
Ручная установка пороговых значений: следующий процесс выглядит следующим образом:

3. Адаптивная пороговая обработка: чтобы преодолеть эффект освещения, изображение делится на различные подобласти, и все эти области сегментируются с использованием порогового значения, рассчитанного для всех этих областей. Затем эти подобласти объединяются для получения полного сегментированного изображения. Это помогает в определенной степени снизить эффект освещения.

4. Оптимальный порог: можно использовать технику оптимального порогового значения, чтобы свести к минимуму ошибочную классификацию пикселей, выполняемую сегментацией.

Расчет оптимального порога с помощью итеративного метода путем минимизации потерь пикселя при неправильной классификации.

Вероятность значения пикселя определяется следующими формулами:

Мы рассматриваем пороговое значение T как начальное пороговое значение. Если значение пикселя для определяемого пикселя меньше или равно T, то он принадлежит фону, иначе он принадлежит объекту.

E1: Ошибка, если пиксель фона ошибочно классифицирован как пиксель объекта.

E2: Ошибка, если пиксель объекта неправильно классифицирован как пиксель фона.

E (T): полная ошибка в классификации пикселей как фона или объекта. Чтобы получить отличную сегментацию, мы должны минимизировать эту ошибку. Мы делаем это, взяв производную следующего уравнения и приравняв ее к нулю.

Рассмотрим гауссову плотность пикселей, значение P (Z) можно рассчитать как:

После этого можно рассчитать новое значение T, введя его в следующее уравнение:

5. Локальная адаптивная пороговая обработка: из-за различий в освещенности пикселей изображения глобальная пороговая обработка может вызвать трудности при сегментации изображения. Затем изображение делится на более мелкие подгруппы, а затем выполняется адаптивное определение пороговых значений этих отдельных групп. После индивидуальной сегментации этих подгрупп все они объединяются, чтобы сформировать законченное сегментированное изображение исходного изображения. Следовательно, гистограмма подгрупп помогает обеспечить лучшую сегментацию изображения.

Практическая реализация сегментации на основе пороговых значений

Сегментация на основе краев

Сегментация на основе краев основывается на краях, обнаруженных в изображении, с использованием различных операторов обнаружения краев. Эти края отмечают участки изображения с разрывами уровней серого, цвета, текстуры и т. Д. Когда мы перемещаемся из одной области в другую, уровень серого может измениться. Итак, если мы сможем найти этот разрыв, мы сможем найти и край. Доступны различные операторы обнаружения краев, но полученное изображение является промежуточным результатом сегментации, и его не следует путать с окончательным сегментированным изображением. Мы должны выполнить дальнейшую обработку изображения, чтобы сегментировать его. Дополнительные шаги включают объединение сегментов краев, полученных в один сегмент, чтобы уменьшить количество сегментов, а не кусков небольших границ, которые могут помешать процессу заполнения области. Это сделано для получения бесшовной границы объекта. Цель краевой сегментации - получить промежуточный результат сегментации, к которому мы можем применить региональную или любой другой тип сегментации, чтобы получить окончательное сегментированное изображение.

Типы кромок

Края обычно ассоциируются с «величиной» и «направлением». Некоторые детекторы края указывают направление и величину. Мы можем использовать различные детекторы кромок, такие как оператор кромки Собеля, детектор кромки Канни, оператор кромки Кирша, оператор кромки Прюитта, оператор кромки Роберта и т. Д.

Для расчета значения g можно использовать любую из трех формул. После вычисления g и theta мы получаем вектор края с обеими величинами и направлением.