没有合适的资源?快使用搜索试试~ 我知道了~
seed_rl:种子RL
共168个文件
py:79个
png:55个
sh:16个
需积分: 12 0 下载量 182 浏览量
2021-05-26
11:30:26
上传
评论
收藏 16.68MB ZIP 举报
温馨提示
种子 该存储库包含分布式强化学习代理的实现,其中对学习者进行了训练和推断。 实现了四个代理: 实现以下算法: 该代码已经与以下环境接口: 但是,可以使用使用任何强化学习环境。 有关该体系结构的详细说明,请阅读我们的论文。 如果您在工作中使用此存储库中的代码,请引用该论文。 比比克斯 @article{espeholt2019seed, title={SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference}, author={Lasse Espeholt and Rapha{\"e}l Marinier and Piotr Stanczyk and Ke Wang and Marcin Michalski}, year={2019}, eprint={191
资源推荐
资源详情
资源评论
收起资源包目录
seed_rl:种子RL (168个子文件)
Dockerfile.atari 948B
BUILD.bazel 932B
grpc.cc 40KB
seed_r2d2_atari_graphs.csv 35.12MB
Dockerfile.dmlab 3KB
Dockerfile.football 1KB
architecture.gif 2.21MB
ppo.gin 2KB
eval.gin 143B
Dockerfile.grpc 2KB
what_matters_in_on_policy_rl.ipynb 71KB
LICENSE 11KB
README.md 7KB
r2d2_atari_training_curves.md 7KB
README.md 1KB
Dockerfile.mujoco 2KB
Solaris.png 81KB
Krull.png 78KB
YarsRevenge.png 69KB
Zaxxon.png 63KB
BattleZone.png 63KB
PrivateEye.png 62KB
Breakout.png 62KB
Jamesbond.png 62KB
WizardOfWor.png 62KB
Berzerk.png 61KB
KungFuMaster.png 60KB
ChopperCommand.png 60KB
Assault.png 59KB
Tutankham.png 59KB
CrazyClimber.png 58KB
MsPacman.png 57KB
Riverraid.png 56KB
BeamRider.png 55KB
StarGunner.png 55KB
Frostbite.png 55KB
Bowling.png 54KB
Alien.png 54KB
Gravitar.png 53KB
IceHockey.png 52KB
VideoPinball.png 52KB
RoadRunner.png 52KB
BankHeist.png 52KB
Amidar.png 51KB
NameThisGame.png 50KB
Robotank.png 50KB
SpaceInvaders.png 50KB
Asteroids.png 50KB
Seaquest.png 49KB
Asterix.png 49KB
Hero.png 49KB
Centipede.png 48KB
Phoenix.png 47KB
Kangaroo.png 45KB
TimePilot.png 45KB
Qbert.png 44KB
Skiing.png 44KB
Gopher.png 44KB
Venture.png 43KB
UpNDown.png 43KB
FishingDerby.png 42KB
MontezumaRevenge.png 41KB
Tennis.png 40KB
Atlantis.png 40KB
DemonAttack.png 38KB
DoubleDunk.png 38KB
Pitfall.png 38KB
Enduro.png 37KB
Freeway.png 35KB
Boxing.png 34KB
Pong.png 33KB
service.proto 2KB
learner.py 50KB
utils.py 40KB
learner.py 37KB
learner.py 27KB
utils_test.py 24KB
ops_test.py 21KB
learner.py 20KB
running_statistics.py 17KB
continuous_control_agent.py 16KB
networks.py 14KB
parametric_distribution.py 14KB
networks.py 13KB
running_statistics_test.py 13KB
advantages.py 12KB
advantages_test.py 12KB
generalized_onpolicy_loss.py 11KB
ppo_training_step_utils.py 10KB
networks_test.py 10KB
service_pb2.py 10KB
policy_losses.py 9KB
learner_flags.py 9KB
normalizer.py 8KB
atari_preprocessing.py 8KB
actor.py 7KB
learner_test.py 7KB
env_wrappers.py 7KB
games.py 7KB
popart.py 6KB
共 168 条
- 1
- 2
资源评论
逸格草草
- 粉丝: 34
- 资源: 4592
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 【java毕业设计】消防物资存储系统源码(ssm+mysql+说明文档+LW).zip
- 【java毕业设计】高校课程评价系统源码(ssm+mysql+说明文档+LW).zip
- 【java毕业设计】大健康老年公寓管理系统源码(ssm+mysql+说明文档).zip
- 【java毕业设计】小雨杂志在线投稿网站源码(ssm+mysql+说明文档+LW).zip
- 【java毕业设计】汽车租赁故障上报网上租车源码(ssm+mysql+说明文档+LW).zip
- 【java毕业设计】药品销售配送网站系统-源码(ssm+mysql+说明文档+LW).zip
- 多语言实现字符串逆序算法详解与代码示例
- Android Studio中创建简单计算器应用的方法详解
- MATLAB模拟退火算法代码实例及其应用
- 【java毕业设计】家庭食谱管理系统-源码(ssm+mysql+说明文档+LW).zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功