Вопросы по теме 'temporal-difference'
Реализация функции потерь (MSVE) в обучении с подкреплением
Я пытаюсь создать агент обучения временной разнице для Отелло. В то время как остальная часть моей реализации, похоже, работает по назначению, мне интересно узнать о функции потерь, используемой для обучения моей сети. В книге Саттона «Обучение с...
239 просмотров
schedule
03.10.2022