# Square Random Generated Maze Solving Using Q-learning Algorithm and epsilon greedy policy
The aim of this code is solving a randomly generated square maze (dimension ) using a Q-Learning algorithm involving an epsilon greedy policy.
The user is capable of defining 3 parameters:
- Maze Dimension
- Starting point
- Ending point
Firstly, the code will generate a random maze matrix based on those inputs. Then, so as to apply the Q-Learning algorithm, a reward matrix is built distinguishing between wall-cells (extremely low reward), non-wall-cells, start and end locations. Afterwards, a matrix containing the Q-values of all the possible actions is computed (this is the essence of the Q-Learning algorithm). As it is discussed deeply on the report (Maze_Q_Learning_Report.mlx), this process involves and epsilon greedy policy among other significant factors. Finally, the optimal path is defined.
没有合适的资源?快使用搜索试试~ 我知道了~
基于Q-learning算法和ε-greedy策略解决随机生成的方形迷宫问题Matlab代码实现.rar
共15个文件
m:8个
png:2个
txt:1个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 171 浏览量
2024-09-20
22:05:31
上传
评论
收藏 1.03MB RAR 举报
温馨提示
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
资源推荐
资源详情
资源评论
收起资源包目录
基于Q-learning算法和ε-greedy策略解决随机生成的方形迷宫问题Matlab代码实现.rar (15个子文件)
基于Q-learning算法和ε-greedy策略解决随机生成的方形迷宫问题Matlab代码实现
plot_maze_comparison.m 3KB
Q_learning_algorithm.m 2KB
load_solvable_maze.m 217B
maze_solvable_matrix_n_12.mat 235B
Maze_Q_Learning_Report.mlx 234KB
solve_maze.m 2KB
build_maze.m 670B
Maze_Q_Learning_Report.pdf 310KB
Q_Learning_Summary_Code.PNG 34KB
build_reward_matrix.m 2KB
Maze_mainScript.m 1KB
license.txt 1KB
choose_action_epsilon_greedy.m 622B
README.md 919B
Q_Learning_Summary_Course.PNG 570KB
共 15 条
- 1
资源评论
matlab科研社
- 粉丝: 2w+
- 资源: 1960
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- java医院人事管理系统源码数据库 MySQL源码类型 WebForm
- 道路养护病害数据集-含原图和标签
- 2023-04-06-项目笔记 - 第三百一十九阶段 - 4.4.2.317全局变量的作用域-317 -2025.11.16
- 2023-04-06-项目笔记 - 第三百一十九阶段 - 4.4.2.317全局变量的作用域-317 -2025.11.16
- 1503ANDH1503002016_20241116222825
- 时间序列-黄金-15秒数据
- C#HR人事管理系统源码数据库 MySQL源码类型 WebForm
- C#CS餐饮管理系统源码数据库 SQL2008源码类型 WinForm
- 蛾类识别系统(深度学习+UI可视化)
- 时间序列-黄金-5秒数据
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功