没有合适的资源?快使用搜索试试~ 我知道了~
确定性清洁机器人的基于模型的值迭代算法:强化学习和动态规划的一个例子-matlab开发
共2个文件
zip:2个
需积分: 17 6 下载量 151 浏览量
2021-05-30
11:39:46
上传
评论 1
收藏 5KB ZIP 举报
温馨提示
确定性清洁机器人的基于模型的值迭代算法。 这段代码是值迭代算法的一个非常简单的实现,对于强化学习和动态规划领域的初学者来说,它是一个有用的起点。 确定性清洁机器人 MDP:清洁机器人必须收集用过的罐子,还必须为电池充电。 状态描述了机器人的位置,动作描述了运动的方向。 机器人可以向左或向右移动。 第一个 (1) 和最后 (6) 个状态是终止状态。 目标是找到一种最佳策略,以使任何初始状态的收益最大化。 这里是 Q-iteration(基于模型的值迭代 DP)。 参考:算法 2-1,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien}, 年={2010}, 出版商={CRC Pre
资源推荐
资源详情
资源评论
收起资源包目录
45692-model-based-value-iteration-algorithm-for-deterministic-cleaning-robot.zip (2个子文件)
deterministic_robot_cleaning_v1.zip 2KB
main.zip 2KB
共 2 条
- 1
资源评论
weixin_38706603
- 粉丝: 10
- 资源: 923
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功