### 环境配置
- python == 3.6
- keras-gpu == 2.2.4
- tensorflow-gpu == 1.14.0
### 主要文件说明
- src/config.py 参数配置文件,**其中 `project_root_path` 设置为项目路径,需更改**
- src/coach.py 为强化学习 self-play 训练类
- src/referee.py 为指挥者,指挥两个 player 的交互
- src/web 为一个简单的客户端/服务端,有着更好的体验玩耍该游戏
- 服务端启动:`python -m src.web.server.web_ssl_server`,可能需更改 config.py 下的 web_ssl_cert_file、web_ssl_key_file 等参数
- 客户端启动:使用浏览器打开 `src/web/client/index.html`
- src/main.py 为程序执行文件,可参照 main 下的说明执行相应的命令
- 查看帮助:`python -m src.main --help`
- 训练模型:`python -m src.main train --simu 5 --lr 0.0001 --bs 128 --epochs 20 --use_multiprocessing`,具体参数可参看 src/config.py 中的说明
- 测试模型:`python -m src.main run --vs random_player rl_player`
- tutorial/slide/im0qianqian.pdf 为毕设答辩时所用,毕业论文暂未上传
- data/best.h5 是提供的模型训练好的参数文件
## To-Do
### Web
#### client
- [x] 游戏逻辑
- [x] AI (Minimax + Alpha–beta pruning)
- [x] 交互接口
#### server
- [x] 简易的 web 服务器,用来和客户端进行交互
### Python
- [x] Reversi 游戏逻辑,感谢 Eric P. Nichols 的实现,不过里面有点 bug 千千还是去仔细读懂并修复了QAQ,同时也支持了 Python3
- [x] 不同 AI 参与的指挥者 referee
- [x] Player
- [x] Human 手动操作
- [x] 基于随机策略的 AI
- [x] Botzone 本地 AI 配置(可使用本地 AI 与平台进行对战)
- [x] 基于贪心策略的 AI
- 可贪心使得当前转换棋子数量最大
- 可贪心使得对方行动力最小
- [x] **基于深度强化学习的 AI(最重要)**
- [x] MCTS
- [x] Keras NNet
- [x] 多进程 self-play
- [x] TPU 支持(差一个谷歌云存储 QAQ)
- [x] Botzone
- [x] 本地 AI 配置
- [x] 可参与天梯对局的 AI


不脱发的程序猿
- 粉丝: 21w+
- 资源: 5703
最新资源
- 获取指定zabbix 组的数据的脚本
- QCharts绘制正余弦曲线 Qt Charts 是Qt提供的图表模块,能够绘制常见的折线图、柱状图、饼图等图表
- 苹果cmsV10 仿8x8x 视频图片小说源码 在线充值VIP会员 三级分销 推广 提现 在线
- vmware tools安装步骤.zip
- Y轴云台底座.STEP
- 最新版易支付V6.99 支付程序需要的自取去授权版 支持自定义套餐价格功能权限
- 新版可运营级网盘系统网站源码 支持转存和限速
- C艹程序星空作者快乐星空
- sprinboot整合Oauth2.0、Spring Security,对接数据数据库,支持zuul路由
- 芒果在线咸鱼转转交易猫聊天客服源码-支持分享图
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈


