# Q-Learning
+ Successfully implemented Q-Learning for a simple robot navigation problem of a robot moving on a 5 x 5 grid with
one arbitrary goal (reward of +10) and three arbitrary obstacles (reward of -10)
+ Algorithm used is:
1. Initialize q-table with all zeroes
2. Loop
+ Pick a random start state, action(s,a) transition
+ make transistion from(s,a) -> s’
+ receive reward
+ Update Q(s,a) <- R(s,a) + gamma*(max(Q(s’,for all actions possible from next state)))
+ Run from main.m
Kinonoyomeo
- 粉丝: 91
- 资源: 1万+
最新资源
- 车辆船只人员检测3-YOLO(v5至v9)、COCO、CreateML、Darknet、Paligemma、TFRecord、VOC数据集合集.rar
- 物流数据相关标准清单.xlsx
- python语言kssppxhb爬虫程序代码xQZQ.txt
- python语言kssphb爬虫程序代码QZQ.txt
- python语言kssppxhb爬虫程序代码xQZQ1.txt
- python语言kssp爬虫程序代码ZQ.txt
- python语言kssp爬虫程序代码QZQ.txt
- python语言kssp爬虫程序代码QZQ1.txt
- python语言kuaishoushiping爬虫程序代码QZQ.txt
- Python项目开发流程及其各环节注意事项详解
- 汽车-车联网数据相关标准清单.xlsx
- 车辆船只检测4-YOLO(v5至v9)、COCO、CreateML、Darknet、Paligemma、TFRecord、VOC数据集合集.rar
- 基于51单片机的数码管多种波形发生器设计(protues仿真)-毕业设计
- 四足机器人步态控制算法解析与代码实现
- 四足机器人步态控制算法及Python实现
- 四足机器人步态控制算法的技术原理及Python实现
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈