Вопросы по теме 'rllib'

Понимание графиков тензорной доски для PPO в RLLIB
Я новичок в Deep RL и хотел бы тренироваться в собственном тренажерном зале в RLLIB с алгоритмом PPO. Однако у меня возникают некоторые трудности с проверкой успешности настройки гиперпараметров. Помимо очевидной метрики Episode_reward_mean, которая...
507 просмотров

AWS SageMaker RL с ray: ray.tune.error.TuneError: обучаемый объект не указан
У меня есть тренировочный сценарий, основанный на примере AWS SageMaker RL rl_network_compression_ray_custom, но изменен env, чтобы сделать базовый тренажерный зал env Asteroids-v0 (установка зависимостей в основной точке входа в тренировочный...
217 просмотров