没有合适的资源?快使用搜索试试~ 我知道了~
Distributed_RL:该存储库适用于处理连续操作空间的非策略算法。 PPO,SAC和我的算法
共22个文件
py:11个
json:2个
jpeg:2个
需积分: 10 1 下载量 34 浏览量
2021-03-28
11:53:33
上传
评论
收藏 6.41MB ZIP 举报
温馨提示
分布式强化学习。 描述 此存储库用于实施分布式RL, 由Pytorch,Ray和Redis使用。 这是我实现(或将要实现)的算法列表 演算法 软演员评论家 V_Trace,IMPALA 穆泽罗 R2D2 安装 Recommend you create the new development conda env for this repo. conda create -n <env> python=3.6 git clone https://github.com/seungju-mmc/Distributed_RL.git git submodule init # pull submodule from git 'baseline' # If you read Readme.md from baseline, understand what it is. git su
资源推荐
资源详情
资源评论
收起资源包目录
Distributed_RL-main.zip (22个子文件)
Distributed_RL-main
.gitmodules 91B
baseline
docs
img
Distributed_image.jpeg 76KB
distributedRL_Str.jpeg 51KB
aa.gif 6.31MB
.DS_Store 6KB
cfg
IMPALA.json 2KB
SAC.json 2KB
run_IMPALA.py 2KB
test__.py 168B
requirements.txt 129B
.gitignore 70B
README.md 978B
SAC
Learner.py 10KB
Player.py 5KB
__pycache__
config.cpython-37.pyc 604B
Config.py 245B
ReplayMemory.py 1KB
run_sac.py 1KB
IMPALA
Learner.py 11KB
Player.py 7KB
Config.py 248B
ReplayMemory.py 3KB
共 22 条
- 1
资源评论
马雁飞
- 粉丝: 23
- 资源: 4519
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 1键切换,随机播放本地音乐(适合管理大量本地音乐),无需联网,珍藏版音乐软件
- canoe的log数据文件读取
- 纸检测55-YOLOv5数据集合集.rar
- 实现vue+docxtemplater导出word文档功能时,需要引入的资源文件
- 个人PPT模板,总结或者作为素材使用
- 纸板、面料、纸类、塑料检测68-YOLO(v5至v9)、COCO、CreateML、Darknet、Paligemma、TFRecord、VOC数据集合集.rar
- 【java源代码】基于spring+vue的音乐推荐管理(完整前后端+mysql+说明文档+LW).zip
- 长文本c++Aes加密
- 纸和塑料检测55-YOLO(v7至v9)、Paligemma、VOC数据集合集.rar
- 烟雾明火分割数据集labelme格式5205张2类别.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功