强化学习——OpenAI Gym——环境理解和显示

Ramya ·

更新时间:2024-11-13

· 650 次阅读

强化学习——OpenAI Gym——环境理解和显示
本文以CartPole为例。
新建Python文件，输入

import gym
env = gym.make("CartPole-v0")              # 定义使用gym库中的环境：CartPole
env = env.unwrapped                        # 打开包装
# 以上两句可换成 env = gym.make('CartPole-v0').unwrapped
print(env.action_space)                    # 动作空间，输出的内容看不懂
print(env.action_space.n)                  # 输出动作个数
print(env.action_space.sample())           # 从动作空间中随机选取一个动作 (0或1)
print(env.observation_space)               # 查看状态空间
print(env.observation_space.shape[0])      # 输出列数，即输出状态个数
print(env.observation_space.high)          # 查看状态的最高值
print(env.observation_space.low)           # 查看状态的最低值
# # # 证明随机抽取的动作(0或1)为int型 # # #
ENV_A_SHAPE = 0 if isinstance(env.action_space.sample(), int) else env.action_space.sample().shape
print(ENV_A_SHAPE)
# # # # # # # # # # # # # # # # # # # # #
# 显示CartPole环境
for i_episode in range(400):                                                        # 400个episode
    s = env.reset()                                                                 # 重置环境
    while True:                                                                     # 开始一个episode
        env.render()                                                                # 显示动画
        a = env.action_space.sample()                                               # 随机选取动作
        s_, r, done, info = env.step(a)                                             # 执行动作，获得反馈
        if done:                                                                    # 如果符合终止条件
            break                                                                   # 跳出本次的episode

运行，得到

Discrete(2)
2
0
Box(4,)
4
[4.8000002e+00 3.4028235e+38 4.1887903e-01 3.4028235e+38]
[-4.8000002e+00 -3.4028235e+38 -4.1887903e-01 -3.4028235e+38]
0

显示动画
在这里插入图片描述

Climber LYX

原创文章 16获赞 13访问量 353 关注私信展开阅读全文
作者：Climber LYX

openai 化学环境 gym 强化学习学习

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

Shell中去除字符串前后空格的方法

Iris 2021-08-03

567

Shell中重定向的深入讲解

Laraine 2020-04-28

836

Laravel访问出错提示：`Warning: require(/vendor/autoload.php): failed to open stream: No such file or di解决方法

Ava 2021-07-28

543

Docker容器跨主机通信中直接路由方式详解

Adelaide 2020-03-28

644

IIS自定义404错误页避免暴露.NET网站路径信息

Urania 2020-03-13

779

apache的多站点虚拟主机配置方法

Vivienne 2020-09-10

989

Windows 环境搭建 PostgreSQL 逻辑复制高可用架构数据库服务

Tia 2023-07-17

1417

Redis数据结构之intset整数集合使用学习

Janna 2023-07-20

1721

Redis数据结构之跳跃表使用学习

Ophelia 2023-07-20

644

Redis数据结构之listpack和quicklist使用学习

Natalia 2023-07-20

1968

大语言模型的开发利器langchainan安装使用快速入门学习

Irma 2023-07-20

829

JupyterNotebook切换conda虚拟环境的实现步骤

Rhea 2023-07-20

931

JupyterNotebook调用指定的虚拟环境的实现示例

Hazel 2023-07-20

1769

JupyterNotebook切换虚拟环境的三种方法

Habiba 2023-07-20

785

Python虚拟环境安装及操作命令详解

Kamiisa 2023-07-20

106

C++前缀树字典树的学习与模拟实现代码示例

Kirima 2023-07-20

1789

VS2019上配置CUDA的环境步骤

Bianca 2023-07-20

889

Linux signal()函数的使用学习

Fawn 2023-07-21

785

linux 和 dockerfile 中配置环境变量的方式总结

Nafisa 2023-07-21

1261

Docker部署Nginx设置环境变量的实现步骤

Irene 2023-07-21

338

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座