没有合适的资源?快使用搜索试试~ 我知道了~
bsuite:bsuite是精心设计的实验的集合,这些实验研究了强化学习(RL)代理的核心功能
共252个文件
py:209个
sty:8个
png:8个
需积分: 5 0 下载量 17 浏览量
2021-05-02
16:44:46
上传
评论
收藏 1.06MB ZIP 举报
温馨提示
强化学习行为套件( bsuite ) 介绍 bsuite是经过精心设计的实验的集合,这些实验研究了强化学习(RL)代理的核心功能,其主要目标是两个。 收集清晰,有用和可扩展的问题,以捕获有效和通用学习算法设计中的关键问题。 通过他们在这些共享基准上的表现来研究他们的行为。 该库可自动根据这些基准对任何代理进行评估和分析。 它有助于促进对RL中核心问题的可重复性和可访问性的研究,并最终促进高级学习算法的设计。 展望未来,我们希望纳入研究界的更多优秀实验,并承诺定期由著名研究人员委员会对实验进行审查。 有关更全面的概述,请参见随附的。 技术概述 bsuite是在子目录实验中定义的的集合。 每个子目录对应一个实验,并包含: 定义RL环境的文件,该文件可以配置为提供不同级别的难度或不同的随机种子(例如)。 此环境的一系列关键字参数,在实验的sweep.py文件中的SETTINGS变量
资源推荐
资源详情
资源评论
收起资源包目录
bsuite:bsuite是精心设计的实验的集合,这些实验研究了强化学习(RL)代理的核心功能 (252个子文件)
example_paper.bib 4KB
iclr2019_conference.bib 3KB
references.bib 2KB
references.bib 2KB
icml2019.bst 27KB
iclr2019_conference.bst 26KB
icml_numpapers.eps 25KB
.gitignore 86B
results.ipynb 104KB
LICENSE 11KB
README.md 11KB
README.md 3KB
CONTRIBUTING.md 969B
README.md 729B
README.md 681B
README.md 623B
bar_plot.png 104KB
bar_plot.png 104KB
bar_plot.png 104KB
bar_plot.png 104KB
radar_plot.png 92KB
radar_plot.png 92KB
radar_plot.png 92KB
radar_plot.png 92KB
summary_analysis.py 16KB
wrappers.py 11KB
plotting.py 11KB
agent.py 8KB
agent.py 8KB
bsuite.py 8KB
analysis.py 7KB
sweep.py 7KB
agent.py 6KB
agent.py 6KB
gym_wrapper.py 6KB
cartpole.py 6KB
agent.py 6KB
run.py 6KB
deep_sea.py 6KB
sqlite_logging.py 6KB
agent.py 6KB
cartpole_swingup.py 5KB
agent.py 5KB
agent.py 5KB
run.py 5KB
wrappers_test.py 5KB
run.py 5KB
smoothers.py 4KB
run.py 4KB
analysis.py 4KB
sequence.py 4KB
umbrella_chain.py 4KB
run.py 4KB
sqlite_logging_test.py 4KB
catch.py 4KB
memory_chain.py 4KB
run.py 4KB
run.py 4KB
analysis.py 4KB
analysis.py 4KB
run.py 3KB
mountain_car.py 3KB
discounting_chain.py 3KB
csv_logging.py 3KB
logging_utils.py 3KB
setup.py 3KB
run.py 3KB
mnist.py 3KB
sequence_test.py 3KB
analysis.py 3KB
base.py 3KB
run.py 3KB
run.py 3KB
run.py 3KB
analysis.py 3KB
analysis.py 3KB
replay.py 3KB
analysis.py 3KB
analysis.py 3KB
analysis.py 3KB
analysis.py 3KB
datasets.py 3KB
analysis.py 3KB
analysis.py 3KB
analysis.py 3KB
bandit.py 2KB
analysis.py 2KB
terminal_logging.py 2KB
gym_wrapper_test.py 2KB
sqlite_load_test.py 2KB
sqlite_load.py 2KB
csv_load_test.py 2KB
csv_load.py 2KB
sweep_test.py 2KB
analysis.py 2KB
analysis.py 2KB
pool.py 2KB
replay_test.py 2KB
analysis.py 2KB
experiment.py 2KB
共 252 条
- 1
- 2
- 3
资源评论
穆庭秋
- 粉丝: 31
- 资源: 4671
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- rhino grasshoper布局 套图框.gh
- rhino grasshoper 烘焙 材质 图层 块电池.gh
- rhino grasshoper水柱及波纹.gh
- 算法部署-使用NCNN在Windows+Android平台上部署MTCNN人脸检测算法-优质算法部署项目实战.zip
- 3 GH7用(RH8字体大小显示不正常) 模型内套图框.gh
- rhino grasshoper 椭圆外墙 (修改).gh
- 7 GH平面曲线生造型雕塑.gh
- javaweb项目在线商城系统springboot+vue+mybatis-plus redis mysql数据库-java课程
- 《机器学习基石》-林轩田06
- 算法部署-使用NCNN在Raspberry-Pi4上部署YOLOv4目标检测算法-优质算法部署项目实战.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功