没有合适的资源?快使用搜索试试~ 我知道了~
reinforcement-learning:关于强化学习的笔记和例子
共176个文件
png:77个
fs:44个
config:28个
需积分: 15 5 下载量 20 浏览量
2021-04-28
13:01:45
上传
评论
收藏 5.48MB ZIP 举报
温馨提示
概述 这是关于强化学习的注释和示例的集合。 这些内容基于Richard S. Sutton和Andrew G. Bartow撰写的《》第二版。 内容 该存储库中包含以下注释和示例: 第2章-多臂强盗 第三章-有限马尔可夫决策过程 第4章-动态编程 第5章-蒙特卡洛方法 笔记 二十一点 解决二十一点 二十一点状态值的非政策估计 无限方差 赛马场 第六章-时差学习 笔记 随机游走 批量更新下的随机游走 风之网格世界 悬崖漫步
资源详情
资源评论
资源推荐
收起资源包目录
reinforcement-learning:关于强化学习的笔记和例子 (176个子文件)
App.config 515B
App.config 515B
App.config 515B
App.config 515B
App.config 515B
App.config 515B
App.config 515B
App.config 515B
App.config 515B
App.config 515B
App.config 515B
App.config 515B
App.config 515B
App.config 515B
packages.config 389B
packages.config 389B
packages.config 385B
packages.config 385B
packages.config 385B
packages.config 385B
packages.config 385B
packages.config 385B
packages.config 385B
packages.config 385B
packages.config 385B
packages.config 226B
packages.config 226B
packages.config 226B
Compute.fs 10KB
Compute.fs 7KB
Compute.fs 7KB
Compute.fs 7KB
Compute.fs 6KB
Compute.fs 6KB
Chart.fs 6KB
Compute.fs 6KB
Chart.fs 5KB
Chart.fs 5KB
Compute.fs 5KB
Compute.fs 4KB
Chart.fs 4KB
Compute.fs 4KB
Chart.fs 3KB
Chart.fs 3KB
Track.fs 3KB
Compute.fs 3KB
Chart.fs 3KB
Compute.fs 3KB
Chart.fs 3KB
Chart.fs 2KB
Chart.fs 2KB
Chart.fs 2KB
Chart.fs 2KB
Compute.fs 2KB
Chart.fs 2KB
Chart.fs 2KB
Compute.fs 2KB
Program.fs 1017B
Program.fs 814B
Program.fs 811B
Program.fs 613B
Program.fs 569B
Program.fs 490B
Sample.fs 402B
Program.fs 381B
Program.fs 376B
Program.fs 374B
Program.fs 346B
Program.fs 324B
Program.fs 257B
Program.fs 242B
Program.fs 242B
OffPolicyEstimationOfBlackjackStateValue.fsproj 5KB
RandomWalkUnderBatchUpdating.fsproj 5KB
MultiArmBandits.fsproj 5KB
Racetrack.fsproj 5KB
SolvingBlackjack.fsproj 5KB
InfiniteVariance.fsproj 5KB
JacksCarRental.fsproj 5KB
WindyGridworld.fsproj 5KB
CliffWalking.fsproj 5KB
RandomWalk.fsproj 5KB
Blackjack.fsproj 5KB
GamblersProblem.fsproj 5KB
Gridworld.fsproj 5KB
Gridworld.fsproj 5KB
.gitignore 19B
README.md 4KB
README.md 3KB
README.md 2KB
README.md 2KB
README.md 1KB
README.md 337B
NotesChapter05.pdf 1.45MB
NotesChapter03.pdf 1.18MB
NotesChapter02.pdf 1.03MB
NotesChapter04.pdf 911KB
NotesChapter06.pdf 867KB
Figure-2.4-GradientAscent-AverageReward.png 53KB
Figure-5.8-InfiniteVariance.png 45KB
共 176 条
- 1
- 2
无分别
- 粉丝: 26
- 资源: 4574
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 汇编语言入门与编程实践-低层开发者的必备技能
- WatchIO二进制固件和刷机工具(无需源码编译).zip
- 提取网页核心信息:Python中的Readability与Date Extraction技术
- Swift语言教程:从基础语法到高级特性的全面讲解
- 表白代码(发射爱心).zip学习资料程序
- 常用工具合集(包括汉字转拼音工具、常用数据格式相互转换工具、尺寸相关的工具类).zip
- Delphi编程教程:从入门到精通Windows应用程序开发
- 视觉化编程入门指南:Visual Basic语言教程及其应用领域
- 纯代码实现的3d爱心.zip学习资料语言
- 儿童编程教育中Scratch语言的基础教学及实战示例
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0