没有合适的资源?快使用搜索试试~ 我知道了~
chainerrl:ChainerRL是建立在Chainer之上的深度强化学习库
共363个文件
py:250个
sh:37个
png:30个
需积分: 9 0 下载量 54 浏览量
2021-02-03
04:38:50
上传
评论
收藏 10.52MB ZIP 举报
温馨提示
ChainerRL ChainerRL是一个深度强化学习库,它使用灵活的深度学习框架在Python中实现了各种最新的深度强化算法。 安装 ChainerRL已通过3.6测试。 有关其他要求,请参见 。 可以通过PyPI安装ChainerRL: pip install chainerrl 也可以从源代码安装: python setup.py install 有关的更多信息,请参阅安装。 入门 您可以先尝试《 ,或查看适用于Atari 2600和Open AI Gym的。 有关更多信息,您可以参考。 演算法 算法 离散动作 连续动作 循环模型 批量培训 CPU异步培训 DQN(包括DoubleDQN等) ✓ ✓(NAF) ✓ ✓ X 分类DQN ✓ X ✓ ✓ X 彩虹 ✓ X ✓ ✓ X 智商 ✓ X ✓ ✓ X DDPG X ✓ ✓ ✓ X A3C ✓ ✓ ✓ ✓(A2C) ✓ 宏ER ✓ ✓ ✓ X ✓ NSQ(N步Q学习) ✓ ✓(NAF) ✓ X ✓ PCL(路径一致性学习)
资源推荐
资源详情
资源评论
收起资源包目录
chainerrl:ChainerRL是建立在Chainer之上的深度强化学习库 (363个子文件)
make.bat 777B
humanoid.gif 5MB
atlas.gif 3.09MB
grasping.gif 747KB
breakout.gif 742KB
.gitignore 95B
MANIFEST.in 34B
quickstart.ipynb 18KB
LICENSE 1KB
Makefile 606B
README.md 8KB
README.md 7KB
README.md 6KB
README.md 6KB
README.md 6KB
README.md 5KB
README.md 5KB
README.md 4KB
README.md 3KB
README.md 3KB
README.md 2KB
README.md 1KB
CONTRIBUTING.md 1KB
README.md 1KB
README.md 893B
README.md 659B
README.md 463B
config.pbtxt 3KB
hint.pbtxt 2KB
learningcurve.png 41KB
learningcurve.png 33KB
Hopper-v2.png 32KB
Walker2d-v2.png 28KB
InvertedPendulum-v2.png 28KB
InvertedPendulum-v2.png 27KB
InvertedDoublePendulum-v2.png 25KB
Hopper-v2.png 25KB
Hopper-v2.png 24KB
Ant-v2.png 23KB
Walker2d-v2.png 22KB
Walker2d-v2.png 22KB
Humanoid-v2.png 21KB
Ant-v2.png 20KB
Ant-v2.png 20KB
HalfCheetah-v2.png 19KB
HalfCheetah-v2.png 18KB
HalfCheetah-v2.png 16KB
Hopper-v2.png 16KB
Walker2d-v2.png 15KB
ChainerRL.png 15KB
Hopper-v2.png 14KB
Walker2d-v2.png 14KB
Swimmer-v2.png 14KB
Reacher-v2.png 14KB
HalfCheetah-v2.png 14KB
Reacher-v2.png 14KB
HalfCheetah-v2.png 14KB
Swimmer-v2.png 12KB
InvertedDoublePendulum-v2.png 10KB
trpo.py 35KB
ppo.py 31KB
acer.py 26KB
test_replay_buffer.py 24KB
dqn.py 22KB
test_acer.py 20KB
test_stateless_recurrent.py 18KB
pcl.py 18KB
test_pretrained_models.py 18KB
ddpg.py 17KB
evaluator.py 17KB
test_ppo.py 17KB
soft_actor_critic.py 15KB
iqn.py 15KB
test_stateless_recurrent_sequential.py 15KB
test_trpo.py 14KB
test_distribution.py 14KB
stateless_recurrent.py 13KB
test_evaluator.py 13KB
td3.py 13KB
test_action_value.py 13KB
distribution.py 12KB
test_async.py 12KB
gaussian_policy.py 12KB
prioritized.py 12KB
action_value.py 12KB
train_dqn_batch_grasping.py 11KB
a2c.py 10KB
state_q_functions.py 10KB
pgt.py 10KB
replay_buffer.py 10KB
atari_wrappers.py 10KB
state_action_q_functions.py 10KB
a3c.py 10KB
train_soft_actor_critic_atlas.py 10KB
train_dqn_ale.py 10KB
train_drqn_ale.py 10KB
train_ppo_ale.py 10KB
train_soft_actor_critic.py 9KB
train_dqn_batch_ale.py 9KB
test_stateless_recurrent_branched.py 9KB
共 363 条
- 1
- 2
- 3
- 4
资源评论
陈崇礼
- 粉丝: 47
- 资源: 4683
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功