Предварительно обученные модели Caffe с большими размерами входных изображений

Не могли бы вы предложить мне обученную модель CNN, которая обучена на большем наборе данных, который поддерживает размер входного изображения> 400x400 пикселей?

В моем случае у меня очень тонкие структуры, если я масштабирую изображения до стандартного размера, например. 224x224 я потеряю эти структуры.


person user570593    schedule 22.04.2016    source источник
comment
если вы работаете с тонкими структурами, почему бы не попытаться обнаружить их, чтобы сосредоточиться только на них. Рассмотрите более быструю RCNN для обнаружения и классификации   -  person Shai    schedule 24.04.2016


Ответы (1)


Без вашего конкретного приложения трудно указать вам подходящие предварительно обученные модели. Однако, независимо от вашего конкретного приложения, я бы предложил следующее:

Вам не обязательно нужна предварительно обученная модель, поддерживающая большие размеры изображений — в зависимости от вашего приложения вам в любом случае необходимо повторно обучить последние несколько слоев (т. е. полносвязные слои). Однако сверточные слои (а также объединяющие слои, слои нормализации локального отклика, слои ReLU и т. д.) не зависят от размера изображения. Таким образом, вы можете взять сверточные слои из предварительно обученной модели (например, из AlexNet или эталонной модели BVLC) и адаптировать полностью подключенную слои в соответствии с вашими потребностями и переобучайте только их.

Тем не менее, здесь есть несколько моделей с увеличенными размерами изображений (все их можно найти в Caffe Model Зоопарк). Однако полезность этих моделей может зависеть от вашего приложения. Вы можете просмотреть prototxt файлы этих моделей, чтобы узнать точный требуемый размер изображения.

person David Stutz    schedule 23.04.2016