没有合适的资源?快使用搜索试试~ 我知道了~
CartPole-OpenAI-GYM:不同方式解决openAI健身房卡特尔问题的方法
共63个文件
json:24个
mp4:16个
md:6个
0 下载量 177 浏览量
2021-04-29
00:30:06
上传
评论
收藏 67.08MB ZIP 举报
温馨提示
话题 杆通过未操作的接头连接到手推车,手推车沿着无摩擦的轨道移动。 该系统是通过向推车施加+1或-1的力来控制的。 钟摆开始直立,目的是防止其跌落。 杆保持直立的每个时间段,都会提供+1的奖励。 当杆子与垂直方向的夹角超过15度时,或者推车从中心移出2.4个单位以上时,情节就会结束。 方法 1.随机动作 在这种方法中,我们根据环境的特定状态选择一个随机动作(左或右)。 毫不夸张地说,这种方法的效果很差,因为它没有考虑到当前状态。 这种方法由于其随机性而无法预测。 在10条步道上,最长生存时间为118个时间步,而acg生存时间约为21个时间步,这是非常糟糕的。 2.使用权向量 在这种方法中,我们采用大小为4的随机权重向量,该向量等于环境状态的维数。 在权重向量和状态之间取一个点积,并根据输出的值采取一个动作,即左或右。 我们看到该方法优于以前的方法,但是该方法不使用任何机器学习算法。 这种
资源推荐
资源详情
资源评论
收起资源包目录
CartPole-OpenAI-GYM-master.zip (63个子文件)
CartPole-OpenAI-GYM-master
reinforcement files
openaigym.manifest.0.12044.manifest.json 225B
openaigym.episode_batch.0.12044.stats.json 135B
openaigym.video.0.12044.video000000.meta.json 2KB
readme.md 60B
openaigym.video.0.12044.video000000.mp4 39KB
prog_rl.py 4KB
test file
test_prog_rl.py 1KB
.ipynb_checkpoints
Untitled-checkpoint.ipynb 2KB
prog_neural_network.py 5KB
images
dqn_final.png 10KB
dqn_initial.png 10KB
score_plot.png 42KB
data
X.npy 64.88MB
y.npy 16.22MB
model
model_dnn.h5 3.83MB
README.md 109B
gif images
reinforcement-gif.gif 167KB
nn.gif 133KB
random.gif 7KB
brute_force.gif 247KB
LICENSE 1KB
prog_bruteforce.py 1KB
prog_random.py 981B
brute_force_files
openaigym.manifest.0.13056.manifest.json 225B
openaigym.episode_batch.0.13056.stats.json 161B
readme.md 64B
openaigym.video.0.13056.video000000.meta.json 2KB
openaigym.video.0.13056.video000000.mp4 26KB
random_files
openaigym.video.0.9116.video001000.mp4 4KB
openaigym.video.0.9116.video000216.meta.json 2KB
openaigym.video.0.9116.video000064.mp4 4KB
openaigym.video.0.9116.video000027.mp4 2KB
openaigym.video.0.9116.video000008.mp4 4KB
openaigym.video.0.9116.video001000.meta.json 2KB
openaigym.video.0.9116.video000343.meta.json 2KB
openaigym.video.0.9116.video000027.meta.json 2KB
openaigym.video.0.9116.video000729.meta.json 2KB
openaigym.video.0.9116.video000125.meta.json 2KB
openaigym.video.0.9116.video000008.meta.json 2KB
openaigym.video.0.9116.video000000.mp4 4KB
openaigym.video.0.9116.video000512.mp4 5KB
openaigym.video.0.9116.video000064.meta.json 2KB
openaigym.video.0.9116.video000729.mp4 2KB
openaigym.video.0.9116.video000001.mp4 2KB
openaigym.video.0.9116.video000343.mp4 2KB
openaigym.video.0.9116.video000001.meta.json 2KB
openaigym.video.0.9116.video000216.mp4 6KB
readme.md 62B
openaigym.episode_batch.0.9116.stats.json 39KB
openaigym.video.0.9116.video000000.meta.json 2KB
openaigym.video.0.9116.video000125.mp4 2KB
openaigym.video.0.9116.video000512.meta.json 2KB
openaigym.manifest.0.9116.manifest.json 1KB
README.md 4KB
nn_files
openaigym.video.0.16540.video000000.mp4 41KB
openaigym.manifest.0.16540.manifest.json 413B
openaigym.video.0.16540.video000001.mp4 19KB
openaigym.video.0.16540.video000008.mp4 73KB
openaigym.video.0.16540.video000008.meta.json 2KB
openaigym.video.0.16540.video000001.meta.json 2KB
readme.md 70B
openaigym.video.0.16540.video000000.meta.json 2KB
openaigym.episode_batch.0.16540.stats.json 501B
共 63 条
- 1
资源评论
NinglingPan
- 粉丝: 19
- 资源: 4645
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Android源码新基线代码更新的方法
- 1_二级程序设计题(34).rar
- 二级程序调试题(填空27+改错7).docx
- HM2314-VB一款N-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
- 基于深度学习的危险驾驶检测算法python源码+视频判断是否闭眼或者张开嘴哈欠和吸烟打电话等手势行为功能涵盖7类.zip
- Free-Fs 开源文件管理系统
- HM2314B-VB一款N-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
- 毕业设计:Python高校学生学业预警系统(源码 + 数据库 + 说明文档)
- HM2312-VB一款N-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
- 毕业设计:Python的在线自主评测系统(源码 + 数据库 + 说明文档)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功