В настоящее время я читаю Практическое обучение с подкреплением с помощью Python Судхарсана Равичандирана, и в одном из первых примеров я столкнулся с этой ошибкой AttributeError:
AttributeError 'TimeLimit' object has no attribute 'P'
поднят следующей строкой:
for next_sr in env.P[state][action]:
Я не могу найти никакой документации по env.P, но я нашел здесь похожий пример, написанный на python2: https://gym.openai.com/evaluations/eval_48sirBRSRAapMjotYzjb6w/
Я полагаю, env.P является частью устаревшей библиотеки (даже если книга была опубликована в июне 2018 года, а инкриминируемый код находится на python3), так как я могу ее заменить?