Вопросы по теме 'temporal-difference'

Реализация функции потерь (MSVE) в обучении с подкреплением
Я пытаюсь создать агент обучения временной разнице для Отелло. В то время как остальная часть моей реализации, похоже, работает по назначению, мне интересно узнать о функции потерь, используемой для обучения моей сети. В книге Саттона «Обучение с...
239 просмотров