人工智能大作业基于强化学习求解迷宫问题python实现源码+项目说明+实验报告+可执行文件.zip

共25个文件

npy：12个

py：10个

exe：1个

版权申诉

人工智能大作业

强化学习

求解迷宫问题

python

实验报告

5星 · 超过95%的资源 42 浏览量 2023-08-09 14:05:20 上传评论 5 收藏 83.23MB ZIP 举报

人工智能大作业-基于强化学习求解迷宫问题python实现源码+项目说明+实验报告+可执行文件【项目介绍】该资源内项目代码都是经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用，也适合小白学习进阶，或者实际项目借鉴参考！当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。如果基础还行，也可在此代码基础上进行修改，以实现其他功能。强化学习求解迷宫问题核心代码 - maze.py: 迷宫类的实现，迷宫信息用一个二维数组表示，数组中的每个数代表一个方格，数字值代表方格类型（如0表示墙, 2表示陷阱, 3表示火）。 - train_qtable.py: Q表类的实现，Q表类有Q值的存储，决策的进行，Q表的学习等功能函数，进行预测和学习时会与迷宫（“环境”）进行交互，对其输入动作，得到反馈。 - train_network.py: 监督学习模型的学习，预测等实现。 - git.py: 监督学习用到的批量式学习仓库。 - maze_map.py: 存储6个事先定义好的迷宫 - draw.py: Q表的可视化以及完整走迷宫过程的呈现。 UI代码 - ui.py: 顶层窗口，有两个标签页 - ui_basic.py: “已有迷宫”标签页的实现，用户可以从我们定义好的几个迷宫中选择一个，进行训练并查看完整的走迷宫过程。 - ui_userDefine.py：“用户自定义”标签页的实现，用户可以输入任意大小的迷宫，自定义火焰周期，训练次数上限。之后进行训练，并以三种不同的速度查看完整的走迷宫结果。 - draw_ui.py: 在ui界面绘制Q表和走迷宫过程。运行方法 - 打开“可执行文件/ui.exe” - 运行“代码/ui.py” - 运行“代码/train_qtable.py”，对maze_map中定义的迷宫进行训练，训练结束后显示Q表和完整走迷宫过程。编译运行环境 python 3.6, pyqt 5.13.1, matplotlib 3.0.2, numpy 1.15.2, Pyinstaller 3.5

资源推荐

资源详情

资源评论

收起资源包目录

人工智能大作业-基于强化学习求解迷宫问题python实现源码+项目说明+实验报告+可执行文件.zip （25个子文件）

项目说明.md 2KB

可执行文件

saved_qtable

maze7_3.npy 6KB

maze7_2.npy 3KB

maze10_2.npy 8KB

maze10_1.npy 8KB

maze7_1.npy 3KB

maze10_3.npy 16KB

ui.exe 82.77MB

代码

draw.py 5KB

maze.py 7KB

train_qtable.py 6KB

saved_qtable

maze7_3.npy 6KB

maze7_2.npy 3KB

maze10_2.npy 8KB

maze10_1.npy 8KB

maze7_1.npy 3KB

maze10_3.npy 16KB

git.py 1KB

maze_map.py 2KB

ui.py 978B

ui_userDefine.py 9KB

draw_ui.py 6KB

ui_basic.py 7KB

train_network.py 5KB

报告.pdf 661KB

人工智能基础

大作业

强化学习：迷宫求解

学号 2017011589

姓名吾尔开西

专业自动化

日期 2019.10.12

目录 
任务描述 ....................................................................................................................................................... 2 
1、  必做任务一 ................................................................................................................................. 2 
2、  必做任务二 ................................................................................................................................. 3 
3、  必做任务三 ................................................................................................................................. 3 
4、  选做任务一 ................................................................................................................................. 3 
问题建模 ....................................................................................................................................................... 4 
1、迷宫 .................................................................................................................................................... 4 
2、Q 表模型 ........................................................................................................................................... 4 
3、监督学习模型 .................................................................................................................................. 5 
4、Q-learning 学习过程 ................................................................................................................... 5 
5、加入时间因子 .................................................................................................................................. 5 
算法设计和代码 ......................................................................................................................................... 6 
1、迷宫类................................................................................................................................................ 6 
2、Q 表模型类 ...................................................................................................................................... 6 
UI 设计和使用说明 .................................................................................................................................... 6 
1、已有迷宫界面 .................................................................................................................................. 6 
2、用户自定义 ...................................................................................................................................... 7 
总结 ................................................................................................................................................................ 7 
 
 
任务描述 
1、 必做任务一 
使用强化学习算法，对于给定的迷宫，训练老鼠在迷宫中寻找蛋糕。