У меня есть вопрос относительно доказательства сходимости алгоритма перцептрона Джеффри Хинтона: Слайды лекций.
На слайде 23 написано:
Каждый раз, когда персептрон совершает ошибку, квадрат расстояния до всех этих возможных весовых векторов всегда уменьшается как минимум на квадрат длины вектора обновления.
Моя проблема в том, что я могу сделать сокращение расстояния сколь угодно малым, сдвинув допустимый вектор вправо. Смотрите здесь для изображения:
Итак, как можно гарантировать, что расстояние будет уменьшаться на квадрат длины вектора обновления (синий), если я могу сделать его сколь угодно малым?