确定性清洁机器人的基于模型的值迭代算法：强化学习和动态规划的一个例子-matlab开发

共2个文件

zip：2个

matlab

需积分: 17 6 下载量 151 浏览量 2021-05-30 11:39:46 上传评论 1 收藏 5KB ZIP 举报

温馨提示

确定性清洁机器人的基于模型的值迭代算法。这段代码是值迭代算法的一个非常简单的实现，对于强化学习和动态规划领域的初学者来说，它是一个有用的起点。确定性清洁机器人 MDP：清洁机器人必须收集用过的罐子，还必须为电池充电。状态描述了机器人的位置，动作描述了运动的方向。机器人可以向左或向右移动。第一个 (1) 和最后 (6) 个状态是终止状态。目标是找到一种最佳策略，以使任何初始状态的收益最大化。这里是 Q-iteration（基于模型的值迭代 DP）。参考：算法 2-1，来自： @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}，作者={Busoniu，Lucian 和 Babuska，Robert 和 De Schutter，Bart 和 Ernst，Damien}，年={2010}, 出版商={CRC Pre

确定性清洁机器人的基于模型的值迭代算法：强化学习和动态规划的一个例子-matlab开发

确定性清洁机器人的 Q-learning（无模型值迭代）算法：使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发

随机清洁机器人的基于模型的值迭代算法：强化学习和动态规划（随机）的一个例子-matlab开发

确定性清洁机器人的基于模型的策略迭代算法：使用基于模型的策略迭代方法的强化学习示例-matlab开发

matlab开发-基于模型的机器人导航算法

基于深度强化学习的机器人路径规划.caj

基于改进A*算法的机器人路径规划的MATLAB实现

MATLAB源码集锦-基于模糊控制的路径规划算法的仿真实现-机器人避障

清洁机器人路径规划matlab仿真程序.rar_matlab_全覆盖算法_机器人 覆盖_清洁机器人_覆盖路径算法

基于蚁群算法的机器人路径规划MATLAB源码收藏.zip_基于网格_蚁群算法_路径规划_路径规划 蚁群_路径规划matlab

基于DQN算法实现机器人路径规划问题附matlab代码.zip

机器人python路径规划-基于Q-learning的机器人路径规划系统（matlab）.pdf

可直接运行 基于MATLAB实现的机器人Q-Learning路径规划算法动态仿真设置起点和终点 动态图形显示 程序源代码.rar

Matlab机器人基于RRT*+APF的二值地图动态避障算法实现

11基于遗传算法的机器人路径规划MATLAB源代码.zip_基于遗传算法的无人机的寻径_机器人路径_路径规划 matlab_遗传

基于人工势场的机器人路径规划-MATLAB源程序

【路径规划】基于灰狼算法实现机器人栅格地图路径规划matlab源码.zip

【路径规划】基于蚁群算法实现机器人栅格地图路径规划matlab源码.md

基于ADAMS和MATLAB的四足机器人联合仿真

10基于蚁群算法的机器人路径规划MATLAB源代码.rar_matlab 机器人_最短路径_蚁群 机器人

LSTM时间序列神经网络预测MATLAB代码

Matlab 基于支持向量机(SVM)的数据回归预测 SVM回归

Matlab 基于BP神经网络的数据分类预测 BP分类

ADRC控制器仿真 simulink 2017a版本

2022建模国赛代码(三天坚持不易) 包括K-meas算法、bp预测、回归预测,(python和matlab做的).zip

matlab2020b ubuntu.txt

五自由度机械臂正逆运动学matlab仿真

matlab绘制三维球面及球面曲线

基于蚁群算法的三维路径规划(matlab实现)

基于智能优化算法的双层优化求解(matlab代码)

最新资源

清洁机器人路径规划matlab仿真程序.rar_matlab_全覆盖算法_机器人覆盖_清洁机器人_覆盖路径算法

基于蚁群算法的机器人路径规划MATLAB源码收藏.zip_基于网格_蚁群算法_路径规划_路径规划蚁群_路径规划matlab

可直接运行基于MATLAB实现的机器人Q-Learning路径规划算法动态仿真设置起点和终点动态图形显示程序源代码.rar

10基于蚁群算法的机器人路径规划MATLAB源代码.rar_matlab 机器人_最短路径_蚁群机器人