没有合适的资源?快使用搜索试试~
我知道了~
文库首页
开发技术
其它
simrl:PyTorch中RL算法的简单实现
simrl:PyTorch中RL算法的简单实现
共16个文件
py:13个
gitignore:1个
md:1个
Python
需积分: 10
1 下载量
128 浏览量
2021-03-30
22:53:25
上传
评论
收藏
18KB
ZIP
举报
温馨提示
立即下载
Simrl PyTorch中RL算法的简单实现。 支持的算法 PPO TRPO DDPG DQN A3C SAC
资源推荐
资源详情
资源评论
Pytorch-RL-Agents:我们用Pytorch实现的一些RL算法
浏览:169
pytorch-RL-代理商 SuReLI使用Pytorch实现的一些RL算法。 演算法 DDPG:在呈现的深度确定性策略梯度。 DQN:深度Q网络在呈现 SAC:“软演员评论”中出现的“ TD3: 双延迟深度确定性策略梯度 要求 火炬 健身房 (可选)roboschool 张量板
RLSimpleBaselines:强化学习算法的简单PyTorch实现
浏览:145
强化学习简单基准 “简单基准”旨在作为受OpenAI Spinning Up启发的信息技术学习的教育资源。 简单基准是PyTorch的实现。 表格方法 状态 动态编程 :check_mark: 蒙特卡洛 :check_mark: 时间差异 :check_mark: 函数Approheavy_check_markimators 状态 dqn :check_mark: 加强 :
DeepRL 使用PyTorch的高度模块化实现流行的深度RL算法-python
浏览:60
DeepRL 使用PyTorch的高度模块化实现流行的深度RL算法 DeepRL 如果您有任何问题或想报告错误,请打开一个问题,而不是直接给我发送电子邮件。 PyTorch 对流行的深度强化学习算法的模块化实现。 在玩具任务和具有挑战性的游戏之间轻松切换。 实现的算法:(双/决斗)深度Q-学习(DQN)分类DQN(C51,KL距离分布DQN)分位数回归DQN(连续/离散)同步优势Actor
Reinforcement-Implementation:基准RL算法的实现
浏览:60
强化实施 该项目旨在在连续动作域(mujuco环境)中重现几种无模型的RL算法的结果。 这个项目 使用pytorch包 在单独的文件/最少的文件中独立实现不同的算法 用最简单的风格写的 尝试遵循原始论文并复制其结果 我的第一阶段工作是在PPO文件中重现此图。 A2C ACER(A2C +信任区域):看来此实现存在一些问题...(欢迎报告错误) CEM TRPO(TRPO单路径) PPO
Python-各种DRL算法的PyTorch实现
浏览:84
该项目包括用于单个代理和多代理的各种Deep Reinforcement Learning算法的PyTorch实现。
边做边学深度强化学习:PyTorch程序设计实践 迷宫 Q-Learning
浏览:85
5星 · 资源好评率100%
边做边学深度强化学习:PyTorch程序设计实践 迷宫 Q-Learning
边做边学深度强化学习:PyTorch程序设计实践 迷宫 Sarsa
浏览:165
边做边学深度强化学习:PyTorch程序设计实践 迷宫 Sarsa
面部表情识别2:Pytorch实现表情识别(含表情识别数据集和训练代码).txt
浏览:29
2.面部表情识别2:Pytorch实现表情识别(含表情识别数据集和训练代码):https://blog.csdn.net/guyuealian/article/details/129505205 3.面部表情识别3:Android实现表情识别(含源码,可实时检测):...
Python-GLoVe论文的一个PyTorch简单实现
浏览:82
GLoVe论文的一个PyTorch简单实现.
Deep-RL:Tensorflow实现RL算法
浏览:56
DeepRL Tensorflow流行的深度RL算法的模块化实现。 我的主要原则是通过不同的算法重用尽可能多的组件,并在带有原始像素输入的经典控制任务(如CartPole和Atari游戏)之间轻松切换。 实现的算法: 深度Q学习(DQN) 双重深度Q学习(DDQN) 深度Q学习+优先体验重播(DQN_PER) 双重深度Q学习+优先体验重播(DDQN_PER) 深度Q学习+一日内(DQ
DeepRL:PyTorch中的深度RL算法的模块化实现
浏览:144
DeepRL 如果您有任何疑问或想要报告错误,请打开一个问题,而不是直接通过电子邮件发送给我。 PyTorch中流行的深度RL算法的模块化实现。 在玩具任务和具有挑战性的游戏之间轻松切换。 实现的算法: (双重/决斗/优先)深度Q学习(DQN) 分类DQN(C51) 分位数回归DQN(QR-DQN) (连续/离散)同步优势演员评论家(A2C) 同步N步Q学习(N步DQN) 深度确
code71:算法实现,包括ML,RL或
浏览:98
算法实现 算法实现,包括ML,RL或OR。
RL-SSSP:Djikstra算法的简单RL
浏览:19
RL-SSSP Djikstra算法的RL-单一来源最短路径
PyTorch学习笔记(七):PyTorch可视化
浏览:169
资源PyTorch学习笔记(七):PyTorch可视化知识分享
边做边学深度强化学习:PyTorch程序设计实践 倒立摆 DQN 实现
浏览:35
边做边学深度强化学习:PyTorch程序设计实践 倒立摆 DQN 实现
戴眼镜检测和识别2:Pytorch实现戴眼镜检测和识别(含戴眼镜数据集和训练代码).txt
浏览:154
戴眼镜检测和识别2:Pytorch实现戴眼镜检测和识别(含戴眼镜数据集和训练代码):https://blog.csdn.net/guyuealian/article/details/129263640 戴眼镜检测和识别3:Android实现戴眼镜检测和识别(含源码,可实时检测)...
point-transformer-pytorch:Pytorch中Point Transformer层的实现
浏览:184
5星 · 资源好评率100%
点变压器-火炬在Pytorch中实现自注意层。 上面的简单电路似乎允许他们的小组在点云分类和分割方面胜过所有以前的方法。安装$ pip install point-transformer-pytorch用法import torchfrom point_transformer_pytorch...
博客:pytorch 搭建神经网络最简版 配套资源
浏览:21
博客:pytorch 搭建神经网络最简版 配套资源
SCNN-pytorch:PyTorch中的空间CNN模型使用Cityscapes-dataset
浏览:53
5星 · 资源好评率100%
这是的PyTorch(0.4.1)实现。它可以使用Modified Aligned ResNet作为主干。目前,我们使用Cityscapes数据集训练SCNN。 安装 该代码已通过Anaconda和Python 3.6进行了测试。安装Anaconda环境后: 克隆仓库: git ...
Dual-path RNN: Pytorch实现的时域单通道语音分离的 高效长序列建模
浏览:101
5星 · 资源好评率100%
Dual-path RNN:Pytorch实现的时域单通道语音分离的高效长序列建模 使用 WSJ0 数据集作为我们的训练、测试和验证集。下面是WSJ0的数据下载链接和混合音频代码。 音频混合样本 WSJ0 数据集 创建数据集
边做边学深度强化学习:PyTorch程序设计实践 倒立摆 Q-Learning
浏览:70
边做边学深度强化学习:PyTorch程序设计实践 倒立摆 Q-Learning
neuro-style-pytorch:PyTorch中的神经样式实现!
浏览:47
neuro-style-pytorch:PyTorch中的神经样式实现!
边做边学深度强化学习:PyTorch程序设计实践 迷宫 随机实验
浏览:7
边做边学深度强化学习:PyTorch程序设计实践 迷宫 随机实验代码
吸烟(抽烟)检测和识别2:Pytorch实现吸烟(抽烟)检测和识别(含吸烟(抽烟)数据集和训练代码).txt
浏览:182
吸烟(抽烟)检测和识别1:吸烟(抽烟)数据集说明(含下载链接):...吸烟(抽烟)检测和识别2:Pytorch实现吸烟(抽烟)检测和识别(含吸烟(抽烟)数据集和训练代码):https://blog.csdn.net/guyuealian/article/details/131521338
gradnorm源码 - pytorch实现
浏览:14
gradnorm源码 - pytorch实现
deep-RL-elements:pytorch中的深度RL算法
浏览:191
带有pytorch的Deep RL算法(在jupyter笔记本中编写)。 算法在Atari Games上进行了测试,大多数情况下是使用Pong进行的。 随时提出问题并报告问题的错误。 :) 1.深入的Q学习 2.具有优先体验重放(PER)的DQN 3. ...
matlablm算法代码-torch_mods:pytorch中研究论文的实现
浏览:71
matlab lm算法代码
收起资源包目录
simrl-master.zip
(16个子文件)
simrl-master
setup.py
779B
.gitignore
40B
trpo.py
9KB
LICENSE
1KB
sac.py
9KB
ppo.py
6KB
readme.md
144B
simrl
__init__.py
32B
utils
__init__.py
22B
envs.py
2KB
general.py
2KB
dists.py
11KB
modules.py
12KB
logger.py
2KB
data.py
4KB
version.py
21B
共 16 条
1
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
似蜉蝣
粉丝: 21
资源:
4602
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
基于python实现的医院信息管理系统完整源码+sql数据库+详细注释(高分课程设计)
社区公益共享项目实施方案(2).docx
School数据库文件
华南农业大学Linux综合性实验部署MySql和三种动态语言Java,Python,Go到Docker容器中
左右相机标定图片14组
docker常用命令速查手册
6_Advertising-gd_LearningRate.ipynb
520表白代码浪漫恋爱表白亲吻效果kiss+浪漫表白亲吻.zip
12_base.apk
用 Rust 构建一个待办事项列表应用程序 附源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功