Я хотел бы создать индивидуальную среду тренажерного зала openai с дискретным пространством состояний, но со значениями с плавающей запятой. Если быть более точным, это должен быть диапазон значений с шагом 0,25: 10,0, 10,25, 10,5, 10,75, 11,0, ..., 19,75, 20,0
Есть ли способ сделать это в индивидуальной среде тренажерного зала openai, используя такие пространства, как Discrete, Box, MultiDiscrete или некоторые другие? Discrete требует целого числа, а Box, похоже, не имеет какого-либо параметра шага.