没有合适的资源?快使用搜索试试~
我知道了~
文库首页
开发技术
其它
Python-PyTorch实现了离散和连续控制的REINFORCE
Python-PyTorch实现了离散和连续控制的REINFORCE
共8个文件
py:4个
png:3个
md:1个
Python开发-机器学习
需积分: 37
4 下载量
42 浏览量
2019-08-11
04:08:42
上传
评论
收藏
336KB
ZIP
举报
温馨提示
立即下载
PyTorch实现了离散和连续控制的REINFORCE
资源详情
资源评论
收起资源包目录
Python-PyTorch实现了离散和连续控制的REINFORCE.zip
(8个子文件)
pytorch-REINFORCE-master
reinforce_continuous.py
2KB
normalized_actions.py
475B
main.py
3KB
reinforce_discrete.py
2KB
assets
algo.png
158KB
InvertedPendulum-v1.png
111KB
CartPole-v0.png
89KB
README.md
745B
共 8 条
1
评论
收藏
内容反馈
立即下载
评论0
去评论
最新资源
IMG_5680.JPG
IMG_0437.jpg
基于Java的JAVA项目分析工具设计源码 - JAVAProjectAnalysis
top888.json
读取并解码二维码图片源码
基于Vue的电影资讯和影院详情设计源码 - maizuo
4T第十五届国(sheng)赛模拟题第一套
update.apk
4T第十五届国(sheng)赛模拟题第三套
bp神经网络pid的控制仿真
weixin_39840387
粉丝: 784
资源:
3万+
私信
上传资源 快速赚钱
前往需求广场,查看用户热搜
相关推荐
pytorch-vsumm-reinforce:AAAI 2018-具有深度强化学习功能的无监督视频摘要(PyTorch)
pytorch-vsumm-reforce 此存储库包含AAAI'18论文的Pytorch实施-。 原始的Theano实现可以在找到。 主要要求是 ( v0.4.0 )和python 2.7 。 和可能未安装在您的计算机中。 请安装其他缺少的依赖项。 开始吧 下载预处理的数据集 git clone https://github.com/KaiyangZhou/pytorch-vsumm-rei
tensorflow-reinforce, 在Tensorflow中,强化学习模型的实现.zip
tensorflow-reinforce, 在Tensorflow中,强化学习模型的实现 tensorflow增强一种基于 Tensorflow的强化学习模型的实现。 在 OpenAI体育馆环境中评价模型。 任何贡献/反馈都是受欢迎的。 声明:这些实现仅用于教育目的。 没有保证精确的模型会在没有更改的任何特定的hellowo
BCQ:作者针对连续和离散操作的BCQ的PyTorch实现
批次受限的深度Q学习(BCQ) 批量约束深度Q学习(BCQ)是第一个批量深度强化学习,该算法旨在在不与环境交互的情况下离线学习。 BCQ在我们的首次引入,该专注于连续动作领域。 在后续介绍了BCQ的分立动作版本。 这些算法中的每一个的代码都可以在其对应的文件夹下找到。 比比克斯 @inproceedings{fujimoto2019off, title={Off-Policy Deep R
5星 · 资源好评率100%
离散控制Matlab代码-sliding_mode:与滑模控制器相关的代码:MATLAB实现和基于Python的仿真
离散控制Matlab代码使用离散时间滑模控制器运行仿真的少量代码。 该存储库具有两种实现:一种使用MATLAB,另一种使用Python。 MATLAB代码 MATLAB文件可用于在Simulink的``嵌入式MATLAB函数''内部实现这样的控制器。 也可以仅使用它们进行仿真。 目前,我们仅支持扭曲算法和带有对角CB矩阵的经典SMC控制器。 Python代码 Python代码广泛使用平台的绑定。
离散控制Matlab代码-predictiveControl:实现预测控制技术的Python软件包(例如MPC,E-MPC)
离散控制Matlab代码Python中的预测控制 该软件包在Python2.7中实现了预测控制技术。 目前,它仅支持用于SISO和MIMO系统的模型预测控制(MPC),尽管已添加了用于经济MPC的类(未经测试!)。 依存关系 安装 直接从PyPI安装软件包: pip install predictivecontrol 或克隆存储库并在本地安装: pip -e 用法 只需导入所需的控制器类并使用有
CVPR2019(口头)通过自适应特征修改层(AdaFM)以连续级别调制图像恢复。PyTorch实现_Python_MA.zip
CVPR2019(口头)通过自适应特征修改层(AdaFM)以连续级别调制图像恢复。PyTorch实现_Python_MA.zip
Python-Pytorch实现MaxPoolingLoss
Pytorch实现MaxPoolingLoss
Python-pytorch实现的人脸检测和人脸识别
Deep learning face detection and recognition, implemented by pytorch. (pytorch实现的人脸检测和人脸识别)
3星 · 编辑精心推荐
Chinese-Text-Classification-Pytorch-mas
Chinese-Text-Classification-Pytorch-master。 数据齐全,说明文档详细。点击即用! # 训练并测试: # TextCNN python run.py --model TextCNN # TextRNN python run.py --model TextRNN # TextRNN_Att python ...
胶囊网络python-pytorch版本
胶囊网络python-pytorch版本,参考博客:https://blog.csdn.net/m0_46384757/article/details/121559514
5星 · 资源好评率100%
Python-Pytorch实现用于图像语义分割UNet
Pytorch实现用于图像语义分割:U-Net,具有密集的CRF后处理
3星 · 编辑精心推荐
Python-PyTorch实现基于Transformer的神经机器翻译
PyTorch实现基于Transformer的神经机器翻译
Python-PyTorch实现的轻量seq2seq文本摘要
PyTorch实现的轻量seq2seq文本摘要
Python-Pytorch实现论文LearningtoCompareRelationNetworkforFewShotLearning
Pytorch实现论文: Learning to Compare: Relation Network for Few-Shot Learning
Python-PyTorch实现UNIT网络
PyTorch实现Unsupervised Image-to-Image Translation (UNIT) 网络
Python-pytorch实现MADDPGmultiagentdeepdeterministicpolicygradient
pytorch实现MADDPG (multi-agent deep deterministic policy gradient)
Python-Pytorch实现SelfAttentionGenerativeAdversarialNetworksSAGAN
Pytorch实现Self-Attention Generative Adversarial Networks (SAGAN)
Python-PyTorch实现图形ConvNetsNIPS16
PyTorch实现图形ConvNets,NIPS'16
Python-Pytorch实现iRevNet
Pytorch实现i-RevNet
Python-Pytorch实现渐进式增长GANPGGAN
Pytorch实现“渐进式增长GAN(PGGAN)”
Python-PyTorch实现多种增强学习算法
PyTorch实现多种增强学习算法
Python-用于3D人体姿态估计的PyTorch实现
Python-用于3D人体姿态估计的PyTorch实现 用于3D人体姿态估计的PyTorch实现
5星 · 资源好评率100%
Python-PyTorch实现PyramidNetsDeepPyramidalResidualNetworks
PyTorch实现PyramidNets (Deep Pyramidal Residual Networks)
Python-PyTorch实现QuasiRecurrentNeuralNetworkQRNN
PyTorch实现Quasi-Recurrent Neural Network (QRNN) - 比NVIDIA的cuDNN LSTM快16倍
Python-PyTorch实现ZeroShot无监督CNN超分辨率
PyTorch implementation of 1712.06087 "Zero-Shot" Super-Resolution using Deep Internal Learning
Qt 5实现串口调试助手 (源工程文件、0积分下载)
基于Qt 5实现串口调试助手,程序仅供参考,修改了之前十六进制接收0xA0--0xFF有误的问题,新增了窗口自适应(ui文件设置栅格),文件详情可看博客链接https://blog.csdn.net/m0_51294753/article/details/121405661。
5星 · 资源好评率100%
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
SystemVerilog的听课学习笔记,包括讲义截取、知识点记录、注意事项等细节的标注。 目录如下: 第一章 SV环境构建常识 1 1.1 数据类型 1 四、二值逻辑 4 定宽数组 9 foreach 13 动态数组 16 队列 19 关联数组 21 枚举类型 23 字符串 25 1.2 过程块和方法 27 initial和always 30 func
5星 · 资源好评率100%
AutoSAR标准协议4.2.2
AutoSAR标准协议规范4.2.2,里面包含了AutoSAR组织所规定的AutoSAR架构的标准规范协议原文档。对AutoSAR的学习有一定的借鉴意义
5星 · 资源好评率100%
光伏-储能并网系统仿真.rar
该文件是清华大学储能课的期末大作业。用SIMULINK搭建了一个完整的光伏-储能并网系统。我的博客中介绍了系统实现的具体方法,欢迎查看!
5星 · 资源好评率100%
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0
最新资源