Во многих вводных курсах по машинному обучению всегда упоминается концепция переобучения. Очевидно, вы не хотите, чтобы ваша модель переоснащалась, поскольку это означает, что модель изучила тонкости обучающего набора, а не параметры обучения, которые в противном случае позволили бы модели хорошо обобщить.

Как видно ниже, мы ищем модель, которая может давать хорошие результаты, но хорошо обобщает (черная линия). Как специалисты в области машинного обучения, мы тратим много времени, пытаясь избежать создания модели, которая настраивается на данные (зеленая линия).

И эта концепция передается в задачи глубокого обучения, где потери при обучении и проверке сравниваются друг с другом. Как показано ниже, расхождение ошибок или потерь может означать, что дела пошли наперекосяк.

Тем не менее, есть серебряная подкладка для переобучения вашей модели.

В модели глубокого обучения, если вы переобучаете свою модель, вы подтверждаете, что в ваших данных есть полезная информация, которая позволяет модели учиться.

Это важно, поскольку это может привести вас к мысли, что собранные вами данные действительно имеют сигнал. Вы обнаружили функции прогнозирования, и актуальной проблемой является поиск правильных данных для решения вашей проблемы.

Поскольку это переоснащение, ваша модель просто быстро изучает тонкости обучающего набора, которые вы можете замедлить или остановить, настроив некоторые параметры. Но, по крайней мере, по крайней мере есть чему поучиться.

Вы, конечно, должны быть осторожны, чтобы ваша модель не училась на шуме данных или различных мешающих факторах, которые могут присутствовать в обучающем наборе, но не на проверочном наборе (т. Е. Распределении значений выборки). Если вы пройдете эти тесты, возможно, вы уже на пути к решению проблемы.

В общем, модель с переобучением - это модель, которая может научиться чему-то достаточно важному для достижения хороших результатов. Теперь вы должны настроить эту модель таким образом, чтобы она могла обобщать данные, отличные от ваших.

Спасибо.