← 上级:RL-06.评估环境与工具链 · 实现:RL-04-01-训练循环与接口约定
Gymnasium 是 RL 实验的事实标准环境 API(承接 OpenAI Gym)。
1 | pip install gymnasium[classic-control] |
一、创建与注册
1 | import gymnasium as gym |
自定义环境:继承 gym.Env,实现 reset、step、render,gym.register 注册 id。
二、Space API
1 | from gymnasium.spaces import Box, Discrete, Dict |
三、常用 Wrapper
1 | from gymnasium.wrappers import RecordEpisodeStatistics, RecordVideo |
| Wrapper | 作用 |
|---|---|
TimeLimit |
内置 max_episode_steps |
ClipAction |
连续动作裁剪 |
TransformObservation |
自定义 obs 变换 |
FrameStackObservation |
帧堆叠 |
四、与训练循环
见 RL-04-01-训练循环与接口约定:reset 返回 (obs, info),step 五元组。
五、小结
- 环境统一 gym.make + reset/step。
- 下一篇:经典基准环境