没有合适的资源?快使用搜索试试~ 我知道了~
打击迹线的matlab代码-The-Mean-Squared-Error-of-Double-Q-Learning:双Q学习的均...
共13个文件
py:7个
m:2个
pdf:2个
需积分: 12 3 下载量 148 浏览量
2021-06-04
05:57:47
上传
评论 1
收藏 58KB ZIP 举报
温馨提示
捣迹线的matlab代码双Q学习的均方误差 这是 Neurips 2020 论文“双 Q 学习的均方误差”的复制代码 我们针对不同的环境测试了 Double Q-learning 和 Q-learning。 以下所有实验均使用 Matlab R2018b 和 Python 3.6.9 运行 我们考虑的环境 贝尔德的例子:贝尔德 GridWorld:网格 CartPole:手推车 最大化偏差:偏差,偏差(nn) 贝尔德的实验 文件: bairds/GenBaird.m bairds/simulation_baird.m bairds/plot.py 在simulation_baird.m中,改变输入到函数GenBaird来模拟不同的设置 运行simulation_baird.m,它会生成几个文件,含义与后面指定的GridWorld相同。 绘制均方误差的轨迹:python3 plot.py 网格世界实验 文件: 网格/GenGrid.m 网格/simulation_grid.m 网格/plot.py 在simulation_grid.m中,改变输入到函数GenGrid来模拟不同大小的Gri
资源详情
资源评论
资源推荐
收起资源包目录
The-Mean-Squared-Error-of-Double-Q-Learning-main.zip (13个子文件)
The-Mean-Squared-Error-of-Double-Q-Learning-main
LICENSE 1KB
Bias
plot.py 2KB
bias.py 6KB
Sutton-Barto(tabular).pdf 28KB
README.md 4KB
bairds
plot.py 2KB
simulation_baird.m 8KB
GenBaird.m 1KB
cartpole
cartpole.py 8KB
plot.py 3KB
Bias(nn)
Sutton-Barto(nn).pdf 28KB
plot.py 2KB
bias(nn).py 8KB
共 13 条
- 1
weixin_38525735
- 粉丝: 3
- 资源: 881
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0