没有合适的资源?快使用搜索试试~ 我知道了~
Popular-RL-Algorithms:软参与者关键(SAC),双延迟DDPG(TD3),参与者关键(ACA2C),近端策略...
共103个文件
py:48个
pyc:15个
ipynb:10个
需积分: 35 9 下载量 140 浏览量
2021-05-13
01:43:40
上传
评论 1
收藏 2MB ZIP 举报
温馨提示
流行的无模型强化学习算法 PyTorch和Tensorflow 2.0在Openai体育馆环境和自行实现的Reacher环境中均实现了最新的无模型强化学习算法。 算法包括软参与者关键(SAC),深度确定性策略梯度(DDPG),双延迟DDPG(TD3),参与者关键(AC / A2C),近端策略优化(PPO),QT-Opt(包括交叉熵( CE)方法) , PointNet ,运输商,循环策略梯度,软决策树等。 请注意,此存储库更多是我在研究和实施期间实施和测试的个人算法集合,而不是正式的开放源代码库/软件包以供使用。 但是,我认为与他人分享它可能会有所帮助,并且我希望对实现进行有益的讨论。 但是我没有花太多时间在清理或构建代码上。 您可能会注意到,每种算法可能都有几种实现方式,在此我特意展示所有这些方式,供您参考和比较。 此外,此存储库仅包含PyTorch实施。 对于RL算法的官方库,
资源详情
资源评论
资源推荐
收起资源包目录
Popular-RL-Algorithms:软参与者关键(SAC),双延迟DDPG(TD3),参与者关键(ACA2C),近端策略优化(PPO),QT-Opt,PointNet的PyTorch实施。 (103个子文件)
checkpoint 63B
ppo.data-00000-of-00001 32KB
ddpg_policy 19KB
ddpg_q 35KB
ddpg_target_q 35KB
.gitignore 114B
.gitmodules 239B
ppo.index 1KB
plot2.ipynb 567KB
CEM_Gaussian_test.ipynb 76KB
CEM_Gaussian_test-checkpoint.ipynb 75KB
plot.ipynb 68KB
plot.ipynb 68KB
plot-checkpoint.ipynb 68KB
CEM_Categorical_test.ipynb 52KB
CEM_Categorical_test-checkpoint.ipynb 52KB
plot.ipynb 35KB
plot-checkpoint.ipynb 34KB
LICENSE 11KB
README.md 7KB
ramble_sac.md 5KB
ppo.meta 138KB
reward_compare_td3.pdf 27KB
reward_compare_td3.pdf 27KB
reward_compare_sac.pdf 16KB
reward_compare.pdf 12KB
ac_cartpole.png 121KB
td3_deterministic.png 90KB
td3_nondeterministic.png 84KB
sac_nonautoentropy.png 64KB
sac_autoentropy.png 55KB
ac.png 46KB
pendulum.png 42KB
ppo_single_2.png 26KB
ppo_single_2 (copy).png 23KB
sac_v2_multiprocess_multi_gpu.py 27KB
policy_networks.py 22KB
td3_multiprocess.py 22KB
sac_v2_multiprocess.py 21KB
policy_networks.py 19KB
sac_v2_multithread.py 18KB
ac.py 18KB
sac_v2.py 17KB
td3.py 17KB
td3.py 17KB
sac_v2.py 17KB
sac.py 16KB
ppo_continuous_multiprocess.py 15KB
ppo_continuous_multiprocess2.py 15KB
ppo_continuous2.py 14KB
ppo_continuous.py 14KB
sac_v2_gru.py 13KB
sac_v2_lstm.py 13KB
td3_lstm.py 13KB
td3_lstm.py 13KB
ddpg.py 12KB
sac_v2_lstm.py 12KB
qt_opt_v3.py 12KB
rdpg.py 12KB
sac_pendulum.py 10KB
ppo_continuous_tf.py 9KB
ddpg_v2.py 9KB
ppo_continuous3.py 8KB
reacher.py 8KB
value_networks.py 8KB
buffers.py 7KB
buffers.py 7KB
ppo_gae_continuous_not_work.py 6KB
value_networks.py 6KB
SDT.py 6KB
sdt_ppo_gae_discrete.py 6KB
optimizers.py 5KB
optimizers.py 5KB
ppo_discrete.py 4KB
ppo_gae_discrete.py 4KB
cem.py 3KB
sdt_train.py 1KB
utils.py 686B
utils.py 686B
_policies.py 588B
initialize.py 515B
initialize.py 515B
RunJupyter.py 159B
policy_networks.cpython-36.pyc 17KB
policy_networks.cpython-36.pyc 14KB
value_networks.cpython-36.pyc 7KB
buffers.cpython-36.pyc 6KB
buffers.cpython-36.pyc 6KB
reacher.pyc 6KB
reacher.cpython-35.pyc 5KB
value_networks.cpython-36.pyc 5KB
reacher.cpython-36.pyc 5KB
SDT.cpython-36.pyc 4KB
sdt_train.cpython-36.pyc 967B
utils.cpython-36.pyc 930B
utils.cpython-36.pyc 930B
initialize.cpython-36.pyc 826B
initialize.cpython-36.pyc 826B
events.out.tfevents.1577364245.quantumiracle-G3-3579 237KB
rdpg_policy 149KB
共 103 条
- 1
- 2
徐志鹄
- 粉丝: 16
- 资源: 4661
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 解决未在远程桌面会话中捕获到鼠标,vmguest.iso软件分享给大家
- JSP+SQL基于WEB的开放性实验管理系统设计与实现(源代码+论文+开题报告+中英文献+答辩PPT).rar
- log4net配置文件!!!!!!!!!!!!!!!!!
- 河南统计面板数据集(2010-2022年).xlsx
- OrcaleDBHelper帮助类!!!!!!!!!!!!
- log4net帮助类,用来写日志!!!!!!!!!!!!!
- Windows10时间同步源
- 信呼OA系统2.1.7版源码
- 3122080306 邹子轩 实验报告二.docx
- 基于STM32 NUCLEO板设计彩色LED照明灯(纯cubeMX开发)(大赛作品,文档完整,可直接运行)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0