Я пытаюсь классифицировать большой набор изображений, используя nVidia DIGITS и Caffe. Все работает хорошо, когда я использую стандартные сети и сети, которые я построил.
Однако, когда я запускаю пример GoogleNet, я вижу результаты нескольких уровней точности. Как может быть несколько уровней точности в CNN? Наличие нескольких уровней потерь вполне понятно, но что означают несколько значений точности? Я получаю несколько графиков точности во время обучения. Подобно этой картинке:
lossX-top1
и lossX-top5
обозначают уровни точности. Я понимаю из prototxt, что они оценивают первые 1 и первые 5 значений точности, но что такое уровни точности lossX?
Несмотря на то, что некоторые из этих графиков сходятся примерно к 98%, когда я вручную тестирую обученную сеть на 'validation.txt'
, я получаю значительно более низкое значение (соответствующее трем нижним графикам точности).
Может ли кто-нибудь пролить свет на это? Как может быть несколько уровней точности с разными значениями?