没有合适的资源?快使用搜索试试~ 我知道了~
Stable Baselines:一组基于OpenAI Baselines强化学习算法的改进实现-python
共222个文件
py:142个
rst:41个
png:7个
需积分: 49 7 下载量 184 浏览量
2021-06-18
18:24:06
上传
评论
收藏 2.39MB ZIP 举报
温馨提示
Stable Baselines:一组基于OpenAI Baselines强化学习算法的改进实现 Stable Baselines Stable Baselines 是一组基于 OpenAI Baselines 的强化学习算法的改进实现。 您可以在 Medium 文章中阅读有关稳定基线的详细介绍。 这些算法将使研究社区和行业更容易复制、改进和识别新想法,并将创建良好的基线以在其上构建项目。 我们希望这些工具将被用作可以添加新想法的基础,以及将新方法与现有方法进行比较的工具。 我们也希望这些工具的简单性能让初学者尝试更高级的工具集,而不会被实现细节所淹没。 注意:尽管使用简单,但稳定基线 (SB) 假定您对强化学习 (RL) 有一定的了解。 你不应该在没有练习的情况下使用这个库。 在这个程度上,我们在文档中提供了很好的资源来开始使用 RL。 与 OpenAI Baselines 的主要区别 此工具集是 OpenAI Baselines 的一个分支,具有主要的结构重构和代码清理: 所有算法的统一结构 PEP8 兼容(统一代码样式) 文档化的函数和类 更多测试和更多代码覆盖
资源推荐
资源详情
资源评论
收起资源包目录
Stable Baselines:一组基于OpenAI Baselines强化学习算法的改进实现-python (222个子文件)
make.bat 819B
setup.cfg 749B
.coveragerc 376B
baselines_theme.css 988B
Dockerfile 1KB
.dockerignore 10B
breakout.gif 195KB
.gitignore 350B
logo.jpg 119KB
LICENSE 1KB
Makefile 745B
Makefile 638B
README.md 15KB
CONTRIBUTING.md 4KB
PULL_REQUEST_TEMPLATE.md 2KB
issue-template.md 1KB
README.md 375B
expert_cartpole.npz 1.56MB
expert_pendulum.npz 490KB
Tensorboard_example_1.png 183KB
Tensorboard_example_3.png 164KB
mistake.png 145KB
Tensorboard_example_2.png 145KB
logo.png 130KB
learning_curve.png 25KB
try_it.png 12KB
ddpg.py 56KB
base_class.py 52KB
kfac.py 49KB
acer_simple.py 38KB
policies.py 37KB
sac.py 30KB
ppo2.py 29KB
trpo_mpi.py 29KB
td3.py 25KB
build_graph.py 23KB
dqn.py 21KB
acktr.py 21KB
logger.py 21KB
a2c.py 20KB
pposgd_simple.py 19KB
distributions.py 18KB
tf_util.py 17KB
policies.py 15KB
callbacks.py 14KB
dataset.py 14KB
policies.py 13KB
policies.py 12KB
test_vec_envs.py 12KB
base_vec_env.py 11KB
policies.py 11KB
buffers.py 11KB
tf_layers.py 10KB
env_checker.py 10KB
atari_wrappers.py 10KB
subproc_vec_env.py 9KB
runners.py 8KB
cmd_util.py 8KB
replay_buffer.py 8KB
schedules.py 8KB
monitor.py 8KB
her.py 7KB
adversary.py 7KB
test_gail.py 7KB
vec_normalize.py 7KB
test_save.py 7KB
record_expert.py 7KB
segment_tree.py 7KB
save_util.py 7KB
setup.py 7KB
test_load_parameters.py 7KB
conf.py 6KB
test_vec_normalize.py 6KB
test_continuous.py 6KB
buffer.py 6KB
main.py 5KB
test_segment_tree.py 5KB
test_custom_policy.py 5KB
results_plotter.py 5KB
test_lstm_policy.py 5KB
kfac_utils.py 5KB
dummy_vec_env.py 5KB
test_envs.py 5KB
mpi_adam.py 4KB
math_util.py 4KB
bit_flipping_env.py 4KB
test_callbacks.py 4KB
test_her.py 4KB
utils.py 4KB
noise.py 4KB
test_identity.py 4KB
vec_video_recorder.py 4KB
dataset.py 4KB
mpi_running_mean_std.py 4KB
identity_env.py 4KB
evaluation.py 4KB
test_math_util.py 3KB
test_distri.py 3KB
vec_check_nan.py 3KB
test_utils.py 3KB
共 222 条
- 1
- 2
- 3
资源评论
Compass宁
- 粉丝: 30
- 资源: 4643
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功