没有合适的资源?快使用搜索试试~ 我知道了~
genrl:一个PyTorch强化学习库,用于可推广和可再现的算法实现,旨在改善RL中的可访问性
共257个文件
py:151个
rst:63个
yml:13个
需积分: 15 0 下载量 115 浏览量
2021-03-20
01:36:24
上传
评论
收藏 396KB ZIP 举报
温馨提示
GenRL是一个PyTorch强化学习库,以可重现,可推广的算法实现为中心,并提高了强化学习的可访问性 GenRL的当前版本为v0.0.2。期待重大变化 强化学习研究的发展比以往任何时候都快。为了跟上不断增长的趋势并确保RL研究保持可重复性,GenRL旨在通过提供以下主要功能来帮助更快地进行纸张复制和基准测试: PyTorch-first :模块化,可扩展和惯用的Python 教程和示例:从基本RL到SOTA Deep RL算法的20多个教程(包括说明)! 统一培训师和日志记录课程:代码可重用性和高级UI 现成的算法实现:流行的RL算法的现成实现。 更快的基准测试:自动超参数调整,环境实现等。 通过将这些功能集成到GenRL中,我们的目标是最终以少于100条线支持任何新算法的实现。 如果您有兴趣进行贡献,请随时解决这些问题并打开PR以获取代码,文档,测试等。如有任何疑问,请查看 安装 G
资源推荐
资源详情
资源评论
收起资源包目录
genrl:一个PyTorch强化学习库,用于可推广和可再现的算法实现,旨在改善RL中的可访问性 (257个子文件)
make.bat 799B
setup.cfg 342B
.isort.cfg 200B
.coveragerc 446B
A2C-CartPole-v0-ep100.db 84KB
.gitignore 144B
Bandit_demo.ipynb 107KB
DQN_demo.ipynb 20KB
LICENSE 1KB
Makefile 638B
README.md 8KB
using_vpg.md 5KB
CONTRIBUTING.md 5KB
Using Custom Policies.md 4KB
CODE_OF_CONDUCT.md 3KB
GETTING_STARTED.md 3KB
Using A2C.md 978B
INSTALL.md 636B
getting_started.md 27B
install.md 19B
placeholder 12B
placeholder 0B
Categorical_DQN.png 65KB
genrl_cropped.png 12KB
genrl.png 12KB
windows_cpu_build.ps1 236B
actor_critic.py 18KB
offpolicy.py 10KB
sac.py 9KB
ppo1.py 9KB
values.py 9KB
base.py 9KB
vector_envs.py 9KB
a2c.py 9KB
run_cb.py 9KB
rollout_storage.py 8KB
bandit.py 8KB
neural_linpos.py 8KB
utils.py 7KB
offpolicy.py 7KB
base.py 7KB
vpg.py 6KB
logger.py 6KB
utils.py 6KB
bayesian.py 6KB
neural_noise_sampling.py 6KB
classical.py 6KB
td3.py 6KB
linpos.py 6KB
genetic_rl.py 6KB
noise.py 5KB
ddpg.py 5KB
buffers.py 5KB
genetic_hyperparam.py 5KB
mushroom_bandit.py 5KB
bandit.py 5KB
base.py 5KB
test_data_bandits.py 5KB
base_model.py 5KB
bootstrap_neural.py 5KB
neural_greedy.py 4KB
categorical.py 4KB
variational.py 4KB
gradient.py 4KB
atari_preprocessing.py 4KB
frame_stack.py 4KB
test_dqn.py 4KB
transition.py 4KB
base.py 4KB
test_dqn_cnn.py 4KB
statlog_bandit.py 4KB
base.py 4KB
deep.py 3KB
adult_bandit.py 3KB
onpolicy.py 3KB
covertype_bandit.py 3KB
normalize.py 3KB
bayesian.py 3KB
magic_bandit.py 3KB
census_bandit.py 3KB
genetic_rl_q_learning.py 3KB
conf.py 3KB
gym_wrapper.py 3KB
onpolicy.py 3KB
thompson.py 3KB
base.py 3KB
neural.py 3KB
utils.py 3KB
ucb.py 3KB
__init__.py 3KB
monitor.py 3KB
deep_cb.py 3KB
epsgreedy.py 3KB
setup.py 3KB
policies.py 3KB
test_utils.py 3KB
a2c_cartpole-v0.py 2KB
suite.py 2KB
models.py 2KB
atari_wrappers.py 2KB
共 257 条
- 1
- 2
- 3
资源评论
信念与梦想
- 粉丝: 40
- 资源: 4659
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- IMG_0694.GIF
- 基于图像的三维模型重建C++源代码+文档说明(高分课程设计)
- 基于聚焦法的工件立体测量方案,根据数据进行三维重建 使用HALCON处理图像,MATLAB拟合数据+源代码+数据集+效果图
- 锄战三国村 修改:货币使用不减 v1.10(2) 原创 (中文).apk
- 基于python实现的单目双目视觉三维重建+源代码+图像图片(高分课程设计)
- 基于C+++OPENCV的全景图像拼接源码(课程设计)
- 基于Python+OpenCV对多张图片进行全景图像拼接,消除鬼影,消除裂缝+源代码+文档说明+界面截图(高分课程设计)
- 基于C++实现的全景图像拼接源码(课程设计)
- 基于SIFT特征点提取和RASIC算法实现全景图像拼接python源码+文档说明+界面截图+详细注释(95分以上课程大作业)
- 基于matlab实现眼部判别的疲劳检测系统+源代码+全部数据+文档说明+详细注释+使用说明+截图(高分课程设计)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功