没有合适的资源?快使用搜索试试~ 我知道了~
pySACQ:SAC-Q强化学习算法的PyTorch实施(在OpenAI Gym环境中测试)
共10个文件
py:4个
png:2个
txt:1个
需积分: 49 9 下载量 25 浏览量
2021-05-22
03:30:23
上传
评论 1
收藏 49KB ZIP 举报
温馨提示
**不再维护,由您自担风险** PySACX 此仓库包含SAC-X RL算法[1]的Pytorch实现。 它使用来自OpenAI健身房的Lunar Lander v2环境。 SAC-X算法可以在存在多个稀疏奖励信号的情况下从头开始学习复杂的行为。 理论 除了主要任务奖励外,我们还定义了一系列辅助奖励。 一个重要的假设是,可以在任何状态动作对中评估每个辅助奖励。 奖励定义如下: 辅助任务/奖励 触碰。 最大化接触地面的腿数 悬停平面。 最小化着陆器的平面运动 悬停角度。 最小化着陆器的旋转运动 直立。 最小化着陆器的角度 射门距离。 最小化着陆器和护垫之间的距离 主要任务/奖励 着陆器是否成功着陆(基于着陆成功的稀疏奖励) 每个任务(本文中的意图)在神经网络中都有一个特定的模型头,用于估计参与者和评论者的功能。 在训练过程中执行轨迹时,任务(以及演员内部的模型负责人)将在不同的可用选项
资源推荐
资源详情
资源评论
收起资源包目录
pySACQ-master.zip (10个子文件)
pySACQ-master
local
template.sh 547B
.gitignore 386B
requirements.txt 45B
tasks.py 4KB
README.md 3KB
networks.py 8KB
docs
policy_net.png 20KB
critic_net.png 18KB
model.py 13KB
train.py 6KB
共 10 条
- 1
资源评论
FedAI联邦学习
- 粉丝: 26
- 资源: 4566
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功