Какая связь между NEAT и обучением с подкреплением?

Насколько мне известно, NEAT (NeuroEvolution of Augmenting Topologies) - это алгоритм, который использует концепцию эволюции для обучения нейронной сети. С другой стороны, обучение с подкреплением - это тип машинного обучения с концепцией «вознаграждения» более успешных узлов.

В чем разница между этими двумя полями, если они кажутся очень похожими? Или NEAT происходит от обучения с подкреплением?




Ответы (1)


Короче говоря, у них почти нет ничего общего.

NEAT - это эволюционный метод. Это подход «черного ящика» к оптимизации функций. В данном случае - производительность нейронной сети (которую легко измерить) по отношению к. его архитектуре (которую вы изменяете в процессе эволюции).

Обучение с подкреплением касается агентов, обучения политикам, которые должны хорошо себя вести в окружающей среде. Таким образом они решают иную, более сложную задачу. Теоретически вы могли бы изучить NEAT, используя RL, поскольку вы могли бы поставить задачу «учитывая нейронную сеть как состояние, научитесь изменять ее с течением времени для повышения производительности». Решающее различие будет заключаться в следующем: выход NEAT - это сеть, выход RL - это политика, стратегия, алгоритм. Что-то, что можно использовать несколько раз для работы в какой-то среде, выполнения действий и получения награды.

person lejlot    schedule 19.02.2017
comment
Оба подхода очень разные и, как вы говорите, обычно используются в разном контексте. Но обучение с подкреплением не обязательно решает более сложные проблемы (см., Например: arxiv.org/pdf/1703.03864. pdf) - person Pablo; 07.10.2017