没有合适的资源?快使用搜索试试~ 我知道了~
QuaRL:QuaRL是一个开放源代码框架,用于系统地研究将量化应用于强化学习算法的效果
共567个文件
pkl:199个
py:177个
yml:71个
需积分: 10 1 下载量 20 浏览量
2021-05-09
18:53:15
上传
评论
收藏 366.34MB ZIP 举报
温馨提示
争吵:强化学习量化 QuaRL的代码,用于评估量化对不同环境中强化学习策略,培训算法和量化方法的影响的框架, ActorQ是量化的分布式RL培训设置,展示了高达2.5倍的提速。 目录 介绍 深度强化学习已经取得了重要的里程碑,但是,强化学习训练和推理的计算需求仍然很大。 我们使用量化技术(如后期训练量化和量化意识培训)来减少计算成本,这是一种众所周知的降低计算成本的技术,我们在普通环境中对A2C,DDPG,DQN,PPO和D4PG等强化学习算法进行了系统研究。 基于PTQ的有效性,我们提出了ActorQ ,这是一个量化的actor-learner分布式培训系统,该系统可以使学习者以完全的精度运行,而actor以量化的精度运行(fp16,int8)。 我们在强化学习训练中证明了端到端的加速1.5倍至2.5倍,而没有回报的损失。 此外,我们在分布式强化学习培训中分解了各种运行时成本,并显示了
资源推荐
资源详情
资源评论
收起资源包目录
QuaRL:QuaRL是一个开放源代码框架,用于系统地研究将量化应用于强化学习算法的效果 (567个子文件)
make.bat 819B
setup.cfg 747B
setup.cfg 91B
.coveragerc 376B
.coveragerc 137B
Dockerfile.cpu 1KB
baselines_theme.css 988B
Dockerfile 1KB
.dockerignore 10B
.DS_Store 6KB
.DS_Store 6KB
.DS_Store 6KB
.DS_Store 6KB
BipedalWalkerHardcorePPO2.gif 3.5MB
breakout.gif 195KB
.gitignore 350B
.gitignore 103B
.gitignore 42B
Dockerfile.gpu 1KB
logo.jpg 119KB
QuaRL.jpg 27KB
LICENSE 1KB
LICENSE 1KB
Makefile 638B
Makefile 266B
README.md 14KB
benchmark.md 12KB
README.md 10KB
README.md 9KB
CONTRIBUTING.md 4KB
PULL_REQUEST_TEMPLATE.md 2KB
issue-template.md 1KB
issue-template.md 861B
README.md 824B
README.md 375B
MsPacmanNoFrameskip-v4_1.pb 6.66MB
BeamRiderNoFrameskip-v4_1.pb 6.66MB
BreakoutNoFrameskip-v4_1.pb 6.65MB
SeaquestNoFrameskip-v4.pkl 13.26MB
BeamRiderNoFrameskip-v4.pkl 13.22MB
EnduroNoFrameskip-v4.pkl 13.22MB
MsPacmanNoFrameskip-v4.pkl 13.22MB
PongNoFrameskip-v4.pkl 13.21MB
SpaceInvadersNoFrameskip-v4.pkl 13.21MB
QbertNoFrameskip-v4.pkl 13.21MB
BreakoutNoFrameskip-v4.pkl 13.2MB
SeaquestNoFrameskip-v4.pkl 6.55MB
SeaquestNoFrameskip-v4.pkl 6.55MB
SeaquestNoFrameskip-v4.pkl 6.55MB
SeaquestNoFrameskip-v4.pkl 6.55MB
MsPacmanNoFrameskip-v4.pkl 6.52MB
BeamRiderNoFrameskip-v4.pkl 6.52MB
EnduroNoFrameskip-v4.pkl 6.52MB
BeamRiderNoFrameskip-v4.pkl 6.52MB
EnduroNoFrameskip-v4.pkl 6.52MB
MsPacmanNoFrameskip-v4.pkl 6.52MB
BeamRiderNoFrameskip-v4.pkl 6.52MB
EnduroNoFrameskip-v4.pkl 6.52MB
MsPacmanNoFrameskip-v4.pkl 6.52MB
BeamRiderNoFrameskip-v4.pkl 6.52MB
EnduroNoFrameskip-v4.pkl 6.52MB
MsPacmanNoFrameskip-v4.pkl 6.52MB
PongNoFrameskip-v4.pkl 6.51MB
SpaceInvadersNoFrameskip-v4.pkl 6.51MB
QbertNoFrameskip-v4.pkl 6.51MB
PongNoFrameskip-v4.pkl 6.5MB
SpaceInvadersNoFrameskip-v4.pkl 6.5MB
QbertNoFrameskip-v4.pkl 6.5MB
PongNoFrameskip-v4.pkl 6.5MB
SpaceInvadersNoFrameskip-v4.pkl 6.5MB
QbertNoFrameskip-v4.pkl 6.5MB
PongNoFrameskip-v4.pkl 6.5MB
SpaceInvadersNoFrameskip-v4.pkl 6.5MB
QbertNoFrameskip-v4.pkl 6.5MB
BreakoutNoFrameskip-v4.pkl 6.5MB
BreakoutNoFrameskip-v4.pkl 6.5MB
BreakoutNoFrameskip-v4.pkl 6.5MB
BreakoutNoFrameskip-v4.pkl 6.5MB
HumanoidBulletEnv-v0.pkl 3.33MB
AntBulletEnv-v0.pkl 3.11MB
HumanoidBulletEnv-v0.pkl 3.09MB
Walker2DBulletEnv-v0.pkl 3.04MB
HopperBulletEnv-v0.pkl 2.95MB
ReacherBulletEnv-v0.pkl 2.88MB
InvertedDoublePendulumBulletEnv-v0.pkl 2.87MB
InvertedPendulumSwingupBulletEnv-v0.pkl 2.84MB
BipedalWalkerHardcore-v2.pkl 2.8MB
BipedalWalker-v2.pkl 2.8MB
Walker2DBulletEnv-v0.pkl 2.79MB
HopperBulletEnv-v0.pkl 2.7MB
ReacherBulletEnv-v0.pkl 2.63MB
InvertedDoublePendulumBulletEnv-v0.pkl 2.63MB
InvertedPendulumSwingupBulletEnv-v0.pkl 2.59MB
HalfCheetahBulletEnv-v0.pkl 1.72MB
AntBulletEnv-v0.pkl 1.45MB
HalfCheetahBulletEnv-v0.pkl 1.43MB
BipedalWalker-v2.pkl 306KB
AntBulletEnv-v0.pkl 223KB
HalfCheetahBulletEnv-v0.pkl 215KB
Walker2DBulletEnv-v0.pkl 207KB
共 567 条
- 1
- 2
- 3
- 4
- 5
- 6
资源评论
thonxie
- 粉丝: 29
- 资源: 4532
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功