没有合适的资源?快使用搜索试试~ 我知道了~
matlab信任模型代码-RL-CBF:RL-脑血流
共54个文件
py:48个
m:4个
yaml:1个
需积分: 48 3 下载量 113 浏览量
2021-05-22
13:38:54
上传
评论
收藏 97KB ZIP 举报
温馨提示
matlab信任模型代码RL-脑血流 该代码在两个无基线模型的算法之上实现了RL-CBF算法:信任区域策略优化(TRPO)和深度确定性策略梯度(DDPG)。 RL-CBF算法在学习过程中提供了安全保证,有关该算法的详细信息,请参见论文“针对安全关键的连续控制任务的端到端安全强化学习”。 我们展示了在两个模拟任务上的学习情况:(1)倒立摆控制,(2)跟随5辆汽车的链。 在每个问题域的每个文件夹中,都有4个实现RL算法的子文件夹:TRPO-CBF-在TRPO顶部运行RL-CBF算法。 对于以下汽车示例,请运行sim.py开始学习。 对于钟摆示例,请运行main.py开始学习。 DDPG-CBF-在DDPG之上运行RL-CBF算法。 对于这两个示例,运行ddpg.py即可开始学习。 TRPO-运行基线TRPO算法进行比较。 对于以下汽车示例,请运行sim.py开始学习。 对于钟摆示例,请运行main.py开始学习。 DDPG-运行基线DDPG算法。 对于这两个示例,运行ddpg.py即可开始学习。 如本文所见,可以在MATLAB中运行plotResults.m和plotCollisions.
资源推荐
资源详情
资源评论
收起资源包目录
RL-CBF-master.zip (54个子文件)
RL-CBF-master
pendulum
plotResults.m 5KB
TRPO
run_trpo.yaml 288B
main.py 1KB
learn.py 1KB
utils.py 7KB
trpo.py 13KB
gae.py 5KB
TRPO-CBF
main.py 1KB
cbf.py 2KB
learn.py 2KB
utils.py 7KB
dynamics_gp.py 4KB
trpo.py 17KB
barrier_comp.py 5KB
gae.py 5KB
DDPG-CBF
learner.py 841B
cbf.py 2KB
ddpg.py 18KB
utils.py 7KB
dynamics_gp.py 3KB
barrier_comp.py 5KB
replay_buffer.py 1KB
DDPG
ddpg.py 16KB
replay_buffer.py 1KB
plotCollisions.m 4KB
car
plotResults.m 5KB
TRPO
car_simulator.py 5KB
learn.py 1KB
utils.py 6KB
trpo.py 13KB
sim.py 1KB
gae.py 5KB
TRPO-CBF
cbf.py 3KB
car_simulator.py 7KB
learn.py 1KB
utils.py 7KB
dynamics_gp.py 4KB
trpo.py 16KB
barrier_comp.py 5KB
sim.py 1KB
gae.py 5KB
DDPG-CBF
learner.py 878B
cbf.py 4KB
car_simulator.py 7KB
ddpg.py 17KB
utils.py 6KB
dynamics_gp.py 4KB
barrier_comp.py 5KB
replay_buffer.py 1KB
DDPG
car_simulator.py 7KB
ddpg.py 15KB
replay_buffer.py 1KB
plotCollisions.m 5KB
README.md 2KB
共 54 条
- 1
资源评论
weixin_38632916
- 粉丝: 4
- 资源: 964
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功