没有合适的资源?快使用搜索试试~ 我知道了~
deep-reinforcement-learning:进行深度强化学习纳米学位课程的回购。 包括
共162个文件
py:74个
ipynb:28个
md:19个
需积分: 9 1 下载量 96 浏览量
2021-04-03
18:47:34
上传
评论
收藏 15.35MB ZIP 举报
温馨提示
深度强化学习纳米学位 该存储库包含与Udacity的“ 计划有关的材料。 目录 讲解 这些教程将引导您实现强化学习中的各种算法。 所有代码都在PyTorch(v0.4)和Python 3中。 :实现动态编程算法,例如策略评估,策略改进,策略迭代和值迭代。 :实施蒙特卡洛方法进行预测和控制。 :实施时差方法,例如Sarsa,Q-Learning和Expected Sarsa。 :了解如何离散化连续状态空间,以及解决Mountain Car环境。 :实现离散化连续状态空间的方法,以实现更好的泛化。 :探索如何使用深度Q网络(DQN)导航航天器而不会坠毁。 :使用C ++ API从3D虚拟机器人仿真中训练强化学习代理。 (外部链接) :使用具有自适应噪声缩放功能的爬坡来平衡移动小车上的杆。 :使用交叉熵法训练汽车在陡峭的山坡上行驶。 :了解如何使用蒙特卡洛政策渐变,解决了经典
资源详情
资源评论
资源推荐
收起资源包目录
deep-reinforcement-learning:进行深度强化学习纳米学位课程的回购。 包括 (162个子文件)
.amlignore 127B
diagnostics.csv 1KB
.gitignore 1KB
pong-REINFORCE.ipynb 1.08MB
Monte_Carlo.ipynb 688KB
Monte_Carlo_Solution.ipynb 570KB
pong-PPO.ipynb 433KB
Temporal_Difference.ipynb 420KB
Tile_Coding.ipynb 344KB
Discretization_Solution.ipynb 331KB
Tile_Coding_Solution.ipynb 308KB
Temporal_Difference_Solution.ipynb 242KB
Discretization.ipynb 156KB
Dynamic_Programming_Solution.ipynb 105KB
Navigation.ipynb 57KB
Navigation.ipynb 57KB
Deep_Q_Network_Solution.ipynb 41KB
REINFORCE.ipynb 34KB
DDPG.ipynb 33KB
CEM.ipynb 32KB
DDPG.ipynb 29KB
Dynamic_Programming.ipynb 24KB
Hill_Climbing.ipynb 20KB
DRL.ipynb 18KB
Deep_Q_Network.ipynb 8KB
Soccer.ipynb 8KB
Tennis.ipynb 7KB
Continuous_Control.ipynb 7KB
Navigation_Pixels.ipynb 7KB
Crawler.ipynb 7KB
Basics.ipynb 6KB
4.jpeg 457KB
push.json 555B
wall.json 320B
test.json 275B
project.json 254B
settings.json 125B
settings.json 44B
LICENSE 1KB
README.md 8KB
README.md 8KB
README.md 8KB
README.md 7KB
README.md 6KB
README.md 3KB
README.md 1KB
README.md 977B
README.md 468B
README.md 462B
README.md 455B
README.md 334B
README.md 327B
README.md 273B
README.md 262B
README.md 260B
README.md 255B
README.md 228B
README.md 193B
QTable.npy 728B
Report.pdf 275KB
Report.pdf 275KB
cheatsheet.pdf 173KB
optimal.png 252KB
Actor-Critic.png 45KB
banana_screenshot.png 36KB
banana_screenshot.png 36KB
performance_100_2000_300_dqn_base.png 27KB
performance_100_2000_300_dqn_base.png 27KB
RL.png 23KB
udacity-logo.png 11KB
nvidia.png 6KB
udacity.png 4KB
None0000000.png 0B
PPO_solution.policy 5.09MB
REINFORCE_solution.policy 5.09MB
REINFORCE.policy 1.29MB
checkpoint_critic.pth 480KB
checkpoint_actor.pth 478KB
checkpoint_100_2000_300_dqn_base.pth 35KB
checkpoint_100_2000_300_dqn_base.pth 35KB
checkpoint.pth 21KB
checkpoint-trained.pth 21KB
checkpoint-mountaincar-trained.pth 20KB
checkpoint.pth 1KB
trainer.py 29KB
environment.py 24KB
utils.py 18KB
models.py 17KB
trainer.py 15KB
trainer_controller.py 15KB
test_ppo.py 13KB
syntheticChrissAlmgren.py 13KB
models.py 13KB
buffer.py 11KB
pong_utils.py 9KB
unity_rl_input_pb2.py 8KB
ddpg_agent.py 8KB
ddpg_agent.py 8KB
ddpg_agent.py 8KB
brain_parameters_proto_pb2.py 7KB
共 162 条
- 1
- 2
EngleSEN
- 粉丝: 48
- 资源: 4502
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0