没有合适的资源?快使用搜索试试~ 我知道了~
gt_rl_course:强化学习内部课程的资源和材料
共35个文件
py:13个
ipynb:6个
md:6个
需积分: 9 0 下载量 46 浏览量
2021-04-04
01:25:45
上传
评论
收藏 8.96MB ZIP 举报
温馨提示
课程大纲 -1周:课程大纲 幻灯片NL启动并运行Python / conda虚拟环境 第0周:使用Python进行编程 Datacamp的诅咒: 面向对象的编程又称类 遵循本教程: 有关继承的其他信息: 练习: 第一周:RL简介 阅读Sutton&Barto的第一章“简介” 练习: 可选:观看 第二周:多武装的土匪 土匪是只有一个州的MDP。 示例:选择要显示的广告,点击即可获得奖励。 例如:选择一个市场,奖励是在一个市场中出售的单位。 阅读萨顿和巴托的第二章“多武装匪徒” 练习:通过 练习: 在这里,我们编写了Sutton&Barto中p 32的简单强盗算法以及UCB变体。 第3周:理论:马尔可夫决策过程(MDP) 阅读萨顿和巴托的第三章 自选:观看 选书练习第3章 第4周:动态编程(DP) 阅读萨顿和巴托的第四章 观看 练习: 使用动态编程来解决FrozenLake。
资源详情
资源评论
资源推荐
收起资源包目录
gt_rl_course-master.zip (35个子文件)
gt_rl_course-master
.gitignore 139B
week_5
images
.gitkeep 1B
optimal.png 252KB
.gitkeep 1B
Monte_carlo.ipynb 12KB
plot_utils.py 2KB
week_2
gym-bandits-master
setup.py 372B
.gitignore 1KB
LICENSE 1KB
README.md 2KB
gym_bandits
bandit.py 5KB
__init__.py 1KB
scoreboard.py 6KB
ten_armed_testbed.py 9KB
gym_bandits.ipynb 11KB
week_7
18056.pdf 602KB
SSRN-id3304991.pdf 708KB
CALZOLARI_ET_AL_2020.pdf 7.66MB
week_0
oop_exercise.py 674B
week_6
check_test.py 1KB
Temporal_Difference.ipynb 13KB
README.md 260B
plot_utils.py 547B
resources.md 5KB
README.md 3KB
week_8
marl_tictactoe.ipynb 26KB
week_1
tic_tac_toe.py 11KB
exercise_ttt.md 3KB
week_3
exercises_ch3.ipynb 2KB
week_4
check_test.py 3KB
README.md 1KB
Dynamic_Programming_FrozenLake.ipynb 26KB
plot_utils.py 502B
frozenlake.py 4KB
play_rl.sh 71B
共 35 条
- 1
CharlesXiao
- 粉丝: 13
- 资源: 4489
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0