没有合适的资源?快使用搜索试试~ 我知道了~
RLDiceGame:强化学习骰子游戏
共12个文件
py:8个
dat:1个
r:1个
需积分: 32 1 下载量 54 浏览量
2021-05-02
19:09:45
上传
评论
收藏 88KB ZIP 举报
温馨提示
RLDiceGame 介绍 该存储库中的代码实现了一个简单的框架,用于骰子游戏中的强化学习。 强化学习是指能够从反复试验中学习的机器学习框架。 该框架很大程度上归功于马尔可夫决策过程:每个步骤都由一个状态和在该状态下要执行的选定动作来描述。 下一步包含通过对初始状态执行操作而计算出的新状态。 强化学习增加了一种反馈机制,该机制允许所计算的动作响应于外部提供的分数而改变。 增强型学习与监督式学习相反,后者是一种指导机器根据已知分类对状态进行分类的方法,而无监督式学习则是一种无监督学习的方法,后者是一种机器在训练数据中标识自己的集群的方法。 在强化学习中,提供的反馈是基于初始状态和采取的措施的得分。 作为特定示例,Blue Orange Games为流行的骰子游戏Yamslam提供了训练工具。 线束和游戏仅实现一轮Yamslam,包括初始掷出5个6面骰子,决定保留5个初始掷骰子的子集,然后
资源推荐
资源详情
资源评论
收起资源包目录
RLDiceGame-master.zip (12个子文件)
RLDiceGame-master
.gitignore 713B
README.md 4KB
DiceGen
RollIdentifier.py 4KB
__init__.py 86B
DiceGen.py 3KB
RLGame
__init__.py 33B
RLGame.py 8KB
Yamslam
__init__.py 174B
Yamslam.py 12KB
YamslamTrain.py 7KB
YamslamReference_actiontable.dat 335KB
loadActionTable.R 1KB
共 12 条
- 1
资源评论
普通网友
- 粉丝: 24
- 资源: 4570
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- PM514BA-VB一款N-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
- electromagnetic wave(1).m
- 3D Slicer 5.6.2 win amd64
- 2024年2月下载的windows10镜像中提取的Winre
- PM513BA-VB一款P-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
- 住宅IP:解锁全球网络内容与强化在线隐私的钥匙
- Windographer 5.2.14
- PJ4407-VB一款P-Channel沟道SOP8的MOSFET晶体管参数介绍与应用说明
- 【CSAPP实验8】动态内存分配器
- 单相并网逆变器处理器在环PIL测试
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功