没有合适的资源?快使用搜索试试~ 我知道了~
2. 找到 安装的包的目录,然后复制 github 上面的 reversi 文件夹, 到 gym/envs/ 中 3. 在 envs 文件夹中 有__init_
资源详情
资源评论
资源推荐
![](https://csdnimg.cn/release/download_crawler_static/86314991/bg1.jpg)
期末大作业
本次作业要实现的是 利用强化学习 Q-gredient 等知识 玩 atari 游戏中的 黑白棋游戏。
本次作业主要是补全 RL_QG_agent.py 文件.
作业可以 两个人一组,或者一个人一组。需要在报告中注明 自己同组的同学的学号和姓名。
作业可能比较复杂,同学们需要尽早开始做。
###环境配置
本程序需要完全自己实现。游戏的环境 可以调用 openAi 中的 gym 模块。但是 gym 上面
没有这个环境,所以需要自己先配置环境,安装办法:
1. pip install gym[all] # 安装 gym
2. 找到 安装的包的目录,然后复制 github 上面的 reversi 文件夹, 到 gym/envs/ 中
(windows 中的目录路径是
C:\Program Files\Anaconda3\Lib\site-packages\gym\envs)
3. 在 envs 文件夹中 有__init__.py 文件,在文件 末尾,添加注册信息。
(参考 github 上面 __init__.py 文件末尾的注册信息(即 id='Reversi8x8-v0', 的注
册信息))
### 作业主要内容要求
Github 中 reversi_main.py 是一个 demo 程序,主要为了规范后期判作业时候的接口.本作
业后面会运行大家的程序,因此需要统一接口,并且注意保证自己的代码没有错误,可以
运行。训练程序的时候 黑白双方可以自己规定,环境中没有对弈对象。因此训练程序的时
候时自己设置对弈对象。
本次作业需要提交报告,报告至少包括 强化学习介绍 和试验总结 内容,除此之外,作业
报告中需要说明自己同组的同学的 姓名和学号。报告的语言要求是英文。
###评判是以对弈方式进行,测试程序分为 3 个
level,对应的对弈局数分别是 30、30 、40
局,每个 level 的 agent 一方 有一半用黑棋,一半用白棋。最后得分统计方式是 获胜次数
/ 100 * 25。另外本次作业的报告占 15 分。
可以参考的文章:
1. Learning to Play Othello with Deep Neural Networks
2. Reinforcement Learning in the Game of Othello: Learning Against a Fixed Opponent
and Learning from Self-Play
###运行环境
编程环境是 python 3.5 Tensorflow 1.2.0 (统一为 CPU 版本,但自己训练时候不限制,
提交作业的时候修改为 CPU 就 ok)
###注意
如果选择非 tensorflow 的库,需要发邮件声明一下,避免程序无法运行。
一定要保证,reversi_main.py 在本地能够运行,(不要修改此程序)。
###提交文件要求
最后提交的压缩文件中包括,以自己学号为文件名的 pdf 文件 和 一个以自己学号为 文件
夹名字的 文件夹(文件夹中包括 RL_QG_agent.py 和 Reversi 文件夹(里面保存的是网络
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![avatar](https://profile-avatar.csdnimg.cn/ac47610657ab48b5b65004316cfa1530_weixin_35738834.jpg!1)
实在想不出来了
- 粉丝: 26
- 资源: 318
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
最新资源
- 使用ASP.NET Core和Entity Framework Core来构建一个基本的进销存系统.rar
- 深度学习经典数据集+FER2013面部表情识别+附带使用方法的python代码
- Python中,要实现连接多个相机并识别多个二维码.rar
- 使用FFT算法对一个信号进行分析.rar
- 171cms游戏应用下载系统源码.zip
- 基于jsp+servlet+mysql蛋糕甜品店购物网站源码+数据库(期末大作业).zip
- Java项目:在线蛋糕商城系统(java+jsp+mysql)源码+数据库+期末大作业.zip
- ZapyaClient10_7-1.apk
- 织梦cms站长导航网站源码.zip
- 基于SSM+MySQL的网络投票调查问卷系统源码+数据库(java期末大作业).zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback-tip](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)
评论0