Понимание формы ввода (spatial_window_size) для Niftynet

Я использую Niftynet для сегментации медицинских изображений. Я видел отличное руководство по ограничениям параметров пространственного_окна здесь https://nbviewer.jupyter.org/gist/fepegar/1fb865494cb44ac043c3189ec415d411.

Но мне интересно, как выбрать между возможными формами? Какая логика стоит за ними? Когда выбрать больший или меньший размер пространственного_окна_формы? Что важно при установке этого параметра для изображения, для меток и для вывода? Почему размеры этикетки и изображения отличаются? Меня также интересует, как параметр границы влияет на этот выбор.


person manza    schedule 29.08.2018    source источник


Ответы (1)


Параметр spatial window_size определяет размер обрезки, которую вы хотите получить из ваших входных изображений во время увеличения данных.

Что важно при установке этого параметра для изображения, для меток и для вывода?

Этот параметр должен быть одинаковым в разделах [TRAINING] и [INFERENCE], поскольку конвейер использует spatial_window_size для объединения исправлений в исходное разрешение. Выбор начального размера окна зависит от совместимых форм для вашей архитектуры CNN, размерности вашей входной формы (2D-срезы по сравнению с вокселами) и ограничений вашей памяти (слишком большой и может не поместиться в памяти вашего графического процессора).

Когда выбирать большие или меньшие формы пространственного_окна_размера?

В целом предпочтительнее патчи большего размера (было замечено, что они обеспечивают немного лучшую производительность), и я бы отослал вас к этому ответ на обоснование. Однако это зависит от вашего конкретного набора данных, поэтому я рекомендую вам поэкспериментировать с различными размерами патчей.

Однако вы также можете использовать метод под названием Увеличение размеров ( обратитесь к совету № 9), где вы начинаете обучение, используя spatial_window_size меньшего размера, затем увеличиваете размер и снова обучаете ту же модель, чтобы уменьшить переоснащение и улучшить общую производительность. Обратите внимание, что это будет работать только в том случае, если вы используете полностью сверточные CNN или CNN с некоторой формой объединения пространственных пирамид (где размер входного изображения не имеет значения).

Почему размеры этикетки и изображения отличаются?

Для этого вопроса требуется больше разъяснений (например, конфигурация, исходное разрешение изображения), но, к сожалению, у меня недостаточно репутации, чтобы комментировать.

Параметр border в разделе [INFERENCE] удаляет заполнение из параметра volume_padding_size в разделе [TRAINING]. Согласно документации по конфигурации, граница должна быть не менее floor(N-D)/2, где N представляет собой один из элементов исходного размера вокселя/фрагмента, а D представляет один из элементов выходного размера вокселя/фрагмента сети (spatial_window_size). Для размеров 2D-окна (например, 96 X 96 X 1) border может быть (96,96,0), где последний элемент должен быть равен 0. Поэтому параметр границы зависит от размера окна и не не влияет на то, как мы его выбираем. Скорее, мы выбираем параметр границы в зависимости от того, насколько мы хотим, чтобы сеть сосредоточилась на внешних пикселях, а не на центральных пикселях.

person Joseph Chen    schedule 01.09.2018