# Q_learning-and-Saras-using-Matlab
使用matlab在机器人走迷宫环境中测试Q-learninng和Sarsa
<img src="https://github.com/wangjunhe8127/Q_learning-and-Saras-using-Matlab/blob/main/task.jpg" width="500">
这个环境以往都是作为动态规划的场景,在这个任务里,我使用Q-learning和Sarsa分别编写matlab代码进行测试
其中15,16为左上角以及右下角位置,设置为终点,给与+1奖励。
参数
alpha = 0.05;
gamma = 1;
len = 1000;总步数,值越大时间越长,稳定性收敛性越好,可以继续增大以获得更好的效果。
训练时,随机给定初始状态,训练agnet。测试时同样随机给点,结果证明其都可以快速到达与之最近的终点。
最终得到的Q_Learning的Q表和Sarsa的Q表如下:
<img src="https://github.com/wangjunhe8127/Q_learning-and-Saras-using-Matlab/blob/main/result/Q_Qtable.jpg" width="300"> <img src="https://github.com/wangjunhe8127/Q_learning-and-Saras-using-Matlab/blob/main/result/S_Qtable.jpg" width="300">
猰貐的新时代
- 粉丝: 1w+
- 资源: 2886
最新资源
- 【创新无忧】基于龙格库塔优化算法RUN优化广义神经网络GRNN实现数据回归预测附matlab代码.rar
- 【创新无忧】基于龙格库塔优化算法RUN优化广义神经网络GRNN实现光伏预测附matlab代码.rar
- 【创新无忧】基于龙格库塔优化算法RUN优化相关向量机RVM实现北半球光伏数据预测附matlab代码.rar
- 【创新无忧】基于龙格库塔优化算法RUN优化极限学习机ELM实现乳腺肿瘤诊断附matlab代码.rar
- 【创新无忧】基于龙格库塔优化算法RUN优化极限学习机KELM实现故障诊断附matlab代码.rar
- 【创新无忧】基于麻雀搜索优化算法SSA优化广义神经网络GRNN实现电机故障诊断附matlab代码.rar
- 【创新无忧】基于麻雀搜索优化算法SSA优化广义神经网络GRNN实现光伏预测附matlab代码.rar
- 【创新无忧】基于龙格库塔优化算法RUN优化相关向量机RVM实现数据多输入单输出回归预测附matlab代码.rar
- 【创新无忧】基于麻雀搜索优化算法SSA优化极限学习机KELM实现故障诊断附matlab代码.rar
- 【创新无忧】基于麻雀搜索优化算法SSA优化广义神经网络GRNN实现数据回归预测附matlab代码.rar
- 【创新无忧】基于麻雀搜索优化算法SSA优化极限学习机ELM实现乳腺肿瘤诊断附matlab代码.rar
- 【创新无忧】基于麻雀搜索优化算法SSA优化相关向量机RVM实现北半球光伏数据预测附matlab代码.rar
- 【创新无忧】基于能量谷优化算法EVO优化广义神经网络GRNN实现电机故障诊断附matlab代码.rar
- 【创新无忧】基于麻雀搜索优化算法SSA优化相关向量机RVM实现数据多输入单输出回归预测附matlab代码.rar
- 【创新无忧】基于能量谷优化算法EVO优化极限学习机ELM实现乳腺肿瘤诊断附matlab代码.rar
- 【创新无忧】基于能量谷优化算法EVO优化广义神经网络GRNN实现光伏预测附matlab代码.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈