При использовании partial_fit в Scikit SGDClassifier количество итераций для сходимости функций стоимости равно 1, как указано в описании:
Выполните одну эпоху стохастического градиентного спуска на заданных образцах.
Внутри этот метод использует max_iter = 1. Поэтому не гарантируется, что минимум функции стоимости будет достигнут после его однократного вызова. Такие вопросы, как объективная конвергенция и ранняя остановка, должны решаться пользователем.
Как я могу увеличить max_iter, чтобы моя функция стоимости была оптимизирована правильно, а не только за одну итерацию? Или, что касается scikit-описания, как я могу справиться с «объективной конвергенцией» и «ранней остановкой» моего классификатора, используя partial_fit?