没有合适的资源?快使用搜索试试~ 我知道了~
rl_algorithms:RL密钥算法的结构化实现
共151个文件
py:101个
yaml:25个
sh:5个
需积分: 9 0 下载量 24 浏览量
2021-05-13
05:56:59
上传
评论
收藏 1.5MB ZIP 举报
温馨提示
内容 欢迎! 该存储库包含用于Medipixel的研究活动的强化学习算法。 源代码将经常更新。 我们热烈欢迎外部贡献者! :) LunarLanderContinuous-v2上的BC代理 PongNoFrameskip-v4上的RainbowIQN代理 Reacher-v2上的SAC代理 贡献者 感谢这些很棒的人(表情符号键): 振宇公园(Curt) :laptop: 金光焕 :laptop: 达特格 :laptop: 金敏哲 :laptop: 김민섭 :laptop: 李进进 :laptop: 克里斯·尹 :laptop: 韩智城 :laptop: 黄世贤 :construction: 该项目遵循所有参与者的规范。 演算法 优势演员评判(A2C) 深度确定性策略梯度(DDPG) 近端策略优化算法(PPO) 双延迟深度确定性策略梯度算法(TD3) 软演员评论算法(SAC) 行为克隆(BC与DDPG,SAC) 来自演示(DDPGfD,SACfD,DQfD) 彩虹
资源推荐
资源详情
资源评论
收起资源包目录
rl_algorithms:RL密钥算法的结构化实现 (151个子文件)
.all-contributorsrc 2KB
.isort.cfg 177B
CODEOWNERS 309B
Dockerfile 823B
.flake8 246B
.gitignore 164B
MANIFEST.in 42B
mypy.ini 77B
Jenkinsfile 326B
Makefile 758B
README.md 21KB
README.md 2KB
LICENSE.md 1KB
reacher_demo.pkl 1.2MB
lunarlander_continuous_demo.pkl 977KB
lunarlander_discrete_demo.pkl 645KB
losses.py 15KB
replay_buffer.py 14KB
dqn_agent.py 14KB
dqn_agent.py 12KB
atari_wrappers.py 11KB
agent.py 11KB
agent.py 10KB
losses.py 9KB
learner.py 9KB
multiprocessing_env.py 9KB
distributed_logger.py 9KB
learner.py 8KB
agent.py 8KB
wrapper.py 8KB
agent.py 8KB
agent.py 8KB
agent.py 8KB
networks.py 8KB
sac_agent.py 7KB
learner.py 7KB
brain.py 7KB
architecture.py 7KB
dqn_agent.py 7KB
sac_agent.py 7KB
ddpg_agent.py 7KB
ddpg_agent.py 7KB
learner.py 6KB
heads.py 6KB
agent.py 6KB
learner.py 6KB
worker.py 6KB
learner.py 6KB
helper_functions.py 6KB
utils.py 5KB
resnet.py 5KB
distributed_worker.py 5KB
learner.py 5KB
learner.py 5KB
her.py 5KB
distributed_worker.py 5KB
learner.py 5KB
grad_cam.py 5KB
sac_learner.py 5KB
sac_learner.py 4KB
ddpg_learner.py 4KB
segment_tree.py 4KB
run_pong_no_frameskip_v4.py 4KB
linear.py 4KB
ddpg_learner.py 4KB
distillation_buffer.py 4KB
dqn_learner.py 4KB
registry.py 4KB
run_reacher_v2.py 4KB
run_lunarlander_continuous_v2.py 3KB
run_lunarlander_v2.py 3KB
saliency_map.py 3KB
her.py 3KB
test_cnn_cfg.py 3KB
test_config_registry.py 3KB
test_prioritized_buffer.py 3KB
test_run_distillation_agent.py 3KB
config.py 2KB
test_run_agent.py 2KB
test_distillation_buffer.py 2KB
cnn.py 2KB
__init__.py 2KB
registry.py 2KB
distributed_logger.py 2KB
noise.py 2KB
test_helper_funcion.py 2KB
test_run_apex.py 2KB
utils.py 1KB
test_uniform_buffer.py 1KB
utils.py 1KB
buffer.py 1KB
setup.py 1KB
normalizers.py 1KB
reward_fn.py 430B
architecture.py 394B
__init__.py 203B
__init__.py 166B
__init__.py 13B
__init__.py 13B
__init__.py 13B
共 151 条
- 1
- 2
资源评论
易洪艳
- 粉丝: 31
- 资源: 4503
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功