没有合适的资源?快使用搜索试试~ 我知道了~
带有MADDPG的网球:在Pytorch上实现MADDPG
4星 · 超过85%的资源 需积分: 50 46 下载量 106 浏览量
2021-02-14
20:52:11
上传
评论 8
收藏 45.93MB ZIP 举报
温馨提示
项目3:合作与竞争 介绍 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或越界将球击中,则其收益为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 下图显示了最终的奖励进度。 环境在1820集中得到解决 算法: 为了解决此环境,我实现了Multi-DDPG算法。 实现的功能如下: 每个特工都有独立的演员和评论家 集中培训:每个代理的批评者不仅将自己的演员的行为和状态作为输入,而且还将所有其他代理的状态和行为作为输入。 由于在测试过程中仅使用参与者,并且参与者仅取决于相应参与者的状态,因此代理可以自由地学习自己的奖励结构。 下图[来源: :
资源推荐
资源评论
资源评论
- 潜力股的逆袭2021-04-01大佬,能不能解释的更清楚一点
- 打酱油的栋栋拐2021-02-24太棒了 找MADDPG算法的应用实在是太难了 谢谢谢谢 先去学习下
- weixin_438603232021-08-16用户下载后在一定时间内未进行评价,系统默认好评。
XanaHopper
- 粉丝: 34
- 资源: 4725
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功