Я пытаюсь изучить (и сравнить) различные фреймворки глубокого обучения, к тому времени это Caffe и Theano.
http://caffe.berkeleyvision.org/gathered/examples/mnist.html
и
http://deeplearning.net/tutorial/lenet.html
Я следую руководству по запуску этих фреймворков в наборе данных MNIST. Тем не менее, я замечаю значительную разницу в точности и производительности.
Для Caffe очень быстро точность достигает ~ 97%. Фактически, для завершения программы (с использованием графического процессора) требуется всего 5 минут, а окончательная точность на тестовом наборе превышает 99%. Как впечатляет!
Однако на Theano все гораздо беднее. Мне потребовалось более 46 минут (с использованием того же графического процессора), чтобы достичь производительности теста 92%.
Я сбит с толку, поскольку не должно быть такой большой разницы между фреймворками, работающими с относительно одинаковыми архитектурами в одном и том же наборе данных.
Итак, мой вопрос. Является ли число точности, о котором сообщает Caffe, процентом правильного прогноза на тестовом наборе? Если да, то есть ли какое-либо объяснение этому расхождению?
Спасибо.