Геометрическое доказательство сходимости алгоритма персептрона

У меня есть вопрос относительно доказательства сходимости алгоритма перцептрона Джеффри Хинтона: Слайды лекций.

На слайде 23 написано:

Каждый раз, когда персептрон совершает ошибку, квадрат расстояния до всех этих возможных весовых векторов всегда уменьшается как минимум на квадрат длины вектора обновления.

Моя проблема в том, что я могу сделать сокращение расстояния сколь угодно малым, сдвинув допустимый вектор вправо. Смотрите здесь для изображения:

векторная диаграмма

Итак, как можно гарантировать, что расстояние будет уменьшаться на квадрат длины вектора обновления (синий), если я могу сделать его сколь угодно малым?

R. Downey 01.02.2017 источник

comment

Этот вопрос лучше подходит для stats.stackexchange.com. - Artem Sokolov 02.02.2017

comment

Спасибо за совет. Могу ли я все еще перенести его в статистику? - R. Downey 02.02.2017

Ответы (2)

arrow_upward
0
arrow_downward

Если я правильно читаю его доказательство, есть две причины:

Это касается набора допустимых векторов, а не только одного.
Ссылка на сумму квадратов расстояний до отдельных векторов. Обратите внимание, что обновление перемещает новую точку дальше от коричневой точки (еще один допустимый вектор).
Перемещение одного вектора изменит вектор обновления.

Prune 01.02.2017

arrow_upward
-1
arrow_downward

В доказательстве говорится, что «квадрат расстояния» a ^ 2 + b ^ 2, а не расстояния по прямой (евклидово расстояние), которые могут вызвать проблемы. Поскольку мы обновляем «плохой» вектор весов «по вертикали», сохраняя при этом то же «горизонтальное» расстояние, мы всегда гарантированно приближаемся к допустимому вектору, по крайней мере, на квадрат длины вектора обновления. Я считаю, что это должно быть обобщено на большее количество измерений. Пожалуйста, поправьте меня, если я ошибаюсь.

Max Lin 24.07.2017

Геометрическое доказательство сходимости алгоритма персептрона

Ответы (2)

Похожие вопросы