没有合适的资源?快使用搜索试试~ 我知道了~
DRLND-project-2:Udacity的深度强化学习纳米学位项目2的实施
共14个文件
ipynb:4个
pth:2个
py:2个
需积分: 9 1 下载量 42 浏览量
2021-02-15
03:07:36
上传
评论
收藏 15.18MB ZIP 举报
温馨提示
DRLND-project-2 该存储库包含项目2的实现。 项目详情 到达者 该项目实现了PPO,用于解决Unity环境中的连续控制问题-使机械臂跟随旋转的航点-在具有20个代理的变体版本上。 最终执行记录: 当手臂末端位于目标球体内/目标航路点的固定范围内时,每个代理随时间累积的奖励。 代理的目标是遵循路标。 对于每个代理,状态空间具有33个维度,而动作空间具有4个连续维度。 该任务是情节性的,当特工在100个连续情节中获得+30的平均分数时,该任务被认为已解决。 履带式 该项目的可选/额外/挑战部分是控制爬虫。 在面对正确方向和该方向的速度时,每个四脚实体尝试遵循目标目标时,每个代理随时间累积的奖励。 该环境具有12个代理,每个代理以129维观察状态,并以20维控制动作。 该环境基于。 入门 依存关系 可以根据依赖关系来设置此项目的依赖关系。 以下说明将引导您逐步设置该
资源推荐
资源详情
资源评论
收起资源包目录
DRLND-project-2-master.zip (14个子文件)
DRLND-project-2-master
.gitignore 127B
Continuous_Control.ipynb 7KB
ppo_agent.py 12KB
Crawler.ipynb 11KB
requirements.txt 160B
reacher_solved.gif 4.06MB
Report.ipynb 39KB
README.md 6KB
crawler_solved.gif 4.04MB
checkpoint-crawler.pth 4.56MB
Crawler-Report.ipynb 36KB
drlnd_kernel.png 55KB
checkpoint-reacher-30.pth 3.08MB
model.py 3KB
共 14 条
- 1
资源评论
陈崇礼
- 粉丝: 47
- 资源: 4683
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功