人工智能基础
大作业
强化学习:迷宫求解
学 号 2017011589
姓 名 吾尔开西
专 业 自动化
日 期 2019.10.12
目录
任务描述 ....................................................................................................................................................... 2
1、 必做任务一 ................................................................................................................................. 2
2、 必做任务二 ................................................................................................................................. 3
3、 必做任务三 ................................................................................................................................. 3
4、 选做任务一 ................................................................................................................................. 3
问题建模 ....................................................................................................................................................... 4
1、迷宫 .................................................................................................................................................... 4
2、Q 表模型 ........................................................................................................................................... 4
3、监督学习模型 .................................................................................................................................. 5
4、Q-learning 学习过程 ................................................................................................................... 5
5、加入时间因子 .................................................................................................................................. 5
算法设计和代码 ......................................................................................................................................... 6
1、迷宫类................................................................................................................................................ 6
2、Q 表模型类 ...................................................................................................................................... 6
UI 设计和使用说明 .................................................................................................................................... 6
1、已有迷宫界面 .................................................................................................................................. 6
2、用户自定义 ...................................................................................................................................... 7
总结 ................................................................................................................................................................ 7
任务描述
1、 必做任务一
使用强化学习算法,对于给定的迷宫,训练老鼠在迷宫中寻找蛋糕。
迷宫与图中类似,黑色格子为墙,不能走,老鼠试图走向墙时,会停在原地。白色格子
为空地,可以走。黄色圆圈标志老鼠走过的格子,五角星为老鼠所在位置。起始位置为左上
角,结束位置为右下角。
2、 必做任务二
自行生成不同迷宫(尺寸、地图),完成前述操作。
我对这个任务的理解是:程序中事先定义好了一些不同大小和样式的迷宫,供用户挑选,
此外,用户也可以自己定义迷宫。
3、 必做任务三
若迷宫中存在老鼠夹子,且位置固定,完成前述操作。
如图,红色方格代表陷阱,即老鼠夹子。与黑色方格的墙不同,老鼠可以走向陷阱,而
一旦走入陷阱,游戏失败。
4、 选做任务一
考虑时变因素,如迷宫的某些格子会周期性产生火焰。