没有合适的资源?快使用搜索试试~ 我知道了~
drlnd_continuous_control:Udacity深度强化学习纳米学位。 项目二
共9个文件
pth:2个
py:2个
log:1个
需积分: 10 1 下载量 104 浏览量
2021-04-16
17:23:38
上传
评论
收藏 439KB ZIP 举报
温馨提示
项目2:连续控制 介绍 对于此项目,您将使用环境。 在这种环境下,双臂可以移动到目标位置。 对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。 因此,座席的目标是在尽可能多的时间步长中保持其在目标位置的位置。 观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。 每个动作是一个带有四个数字的矢量,对应于适用于两个关节的扭矩。 动作向量中的每个条目都应为-1和1之间的数字。 分布式培训 对于此项目,它们提供了两个单独的Unity环境版本: 第一个版本包含一个代理。 第二个版本包含20个相同的代理,每个代理都有自己的环境副本。 我选择了第二个选项 第二个版本对于 , 和类的算法很有用,这些算法使用同一代理的多个(非交互,并行)副本来分发收集经验的任务。 选项2:解决第二个版本 考虑到许多代理的存在,解决第二版环境的障碍略有不同。 特别是,您的特工必须获得+30
资源推荐
资源详情
资源评论
收起资源包目录
drlnd_continuous_control-main.zip (9个子文件)
drlnd_continuous_control-main
checkpoint_actor.pth 85KB
ddpg_agent.py 9KB
requiremets.txt 23B
checkpoint_critic.pth 86KB
model.py 2KB
unity-environment.log 23B
README.md 5KB
P2- Continous Control.ipynb 213KB
report.pdf 133KB
共 9 条
- 1
资源评论
好摩
- 粉丝: 28
- 资源: 4635
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功