没有合适的资源?快使用搜索试试~ 我知道了~
drlND_CollaborationAndCompetition:两名特工控制球拍在球网上弹跳球
共4个文件
license:1个
md:1个
ipynb:1个
需积分: 9 0 下载量 86 浏览量
2021-04-03
19:49:26
上传
评论
收藏 7KB ZIP 举报
温馨提示
合作与竞争 介绍 两名特工控制球拍,使用环境在球网上弹跳球。 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或将球击出界外,则其获得的奖励为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 该任务是情节性的,并且为了解决环境,您的特工必须获得+0.5的平均分数(在两个特工均取得最高分后,连续100次以上)。 具体来说, 在每个情节之后,我们将每个代理商获得的奖励加起来(不打折),以获得每个代理商的得分。 这将产生2个(可能不同)的分数。 然后,我们取这两个分数中的最大值。 这为每个情节产生一个单一的分数。 当这些分数的平均值(超过100集)至少
资源推荐
资源详情
资源评论
收起资源包目录
drlND_CollaborationAndCompetition-main.zip (4个子文件)
drlND_CollaborationAndCompetition-main
.gitignore 2KB
LICENSE 1KB
README.md 6KB
Tennis.ipynb 9KB
共 4 条
- 1
资源评论
LiuTitanium
- 粉丝: 24
- 资源: 4684
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功