没有合适的资源?快使用搜索试试~ 我知道了~
AlphaSnake-Zero:基于AlphaGo Zero的算法的增强型学习AI,可以玩同步策略游戏《战栗》

共20个文件
py:14个
gitignore:2个
md:1个

需积分: 10 0 下载量 11 浏览量
2021-03-18
10:35:01
上传
评论
收藏 1.84MB ZIP 举报
温馨提示
介绍<iframe src =“ ” width =“ 640” height =“ 480” frameborder =“ 0” allowfullscreen =“ true”> </ iframe>有关算法的详细说明,请检查。 抽象的 最近,有关强化学习的研究很多。 Q学习或DQN试图解决单人与环境的问题,而AlphaGo等其他方法则尝试双人游戏。在这个项目中,我们尝试找到一种算法来生成在多主体同步策略游戏中表现良好的主体。尽管此项目特定于称为Battlesnake的游戏,但我们使用的方法和算法不限于此。数学适用于具有有限状态和动作空间的任何同步游戏。 要求: 的Python 3.7.6 NumPy 1.18.1 TensorFlow 2.1.0 指示: 转到“代码”文件夹并运行train.py以开始训练模型。它将要求您输入内容。如果输入的起始迭代编号大于0,它将尝试开始使用现
资源推荐
资源详情
资源评论























收起资源包目录

























共 20 条
- 1
资源评论


陈菌菇
- 粉丝: 35
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 2023年问答题系统集成项目管理工程师教材笔记精华归纳整理.docx
- PLC在交通信号灯中的应用.docx
- Web前端开发试题.docx
- 2022移动通信技术个人简历.docx
- 百度深度学习进展介绍.ppt
- VB基本概念函数语句汇总.pdf
- PMP责任汇总(可编辑修改word版).docx
- P2P网络中的语义异构和语义映射(20211114143442).pdf
- 艾泰酒店无线网络运营解决方案高认.doc
- 2023年江西省中小学安全知识网络答题题库答案全.doc
- 2022网络学院毕业自我鉴定.docx
- CH12(网络函数和频率特性new)省名师优质课赛课获奖课件市赛课一等奖课件.ppt
- 2023年实验四动态分区分配算法实验报告及程序.doc
- CAAC-Pioneer-Logistics--CCA.ppt
- 常见网络故障诊断与排除.ppt
- DB21_T_2794_2017_晚熟李生产技术规程.pdf
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
