Я работаю над статьей, в которой сосредоточусь на простой проблеме — линейной регрессии на большом наборе данных при наличии стандартного нормального или равномерного шума. В качестве среды моделирования я выбрал Estimator API от TensorFlow.
Я обнаружил, что настройка гиперпараметров на самом деле не имеет большого значения для такой задачи машинного обучения, когда количество шагов обучения можно сделать достаточно большим. Под гиперпараметром я подразумеваю размер пакета или количество эпох в потоке обучающих данных.
Есть ли документ/статья с формальным доказательством этого?