没有合适的资源?快使用搜索试试~
我知道了~
文库首页
开发技术
其它
折扣连续时间马尔可夫决策过程的第一遍g均值优化
折扣连续时间马尔可夫决策过程的第一遍g均值优化
研究论文
0 下载量
67 浏览量
2021-04-04
10:24:57
上传
评论
收藏
228KB
PDF
举报
温馨提示
立即下载
折扣连续时间马尔可夫决策过程的第一遍g均值优化
资源推荐
资源评论
具有不同折扣因子的马尔可夫决策过程的第一遍最优性和方差最小化
浏览:152
具有不同折扣因子的马尔可夫决策过程的第一遍最优性和方差最小化
论文研究 - 连续时间马尔可夫决策过程的方差优化
浏览:201
本文考虑了连续时间马尔可夫决策过程中平均报酬的方差优化问题。 假设状态空间是可计数的,而动作空间是Borel可测量的空间。 本文的主要目的是在确定性平稳策略空间中找到方差最小的策略。 与传统的马尔可夫决策过程不同,方差准则中的成本函数将受到未来行动的影响。 为此,我们通过引入称为伪方差的概念将方差最小化问题转换为标准(MDP)。 通过给出伪方差优化问题的策略迭代算法,推导了原始方差优化问题的最优策
连续时间马尔可夫决策过程的强n折扣和有限水平最优性
浏览:130
本文研究了波兰空间中连续时间马尔可夫决策过程的强n(n = -1,0)折扣和有限水平准则。 允许相应的过渡率不受限制,并且奖励率可能没有上限也没有下限。 在温和条件下,作者通过建立两个等价关系来证明存在强n(n = -1,0)折扣最优平稳策略:一个在标准期望平均奖励和强-1折扣最优之间,另一个在在偏倚和强大的0折扣最优之间。 作者还通过开发规范三元组的有趣特征证明了有限水平控制问题的最优策略的存在
车载视频中基于连续时间马尔可夫决策过程的资源分配方案
浏览:174
车载视频中基于连续时间马尔可夫决策过程的资源分配方案
马尔可夫决策过程理论与应用_13701577
浏览:42
5星 · 资源好评率100%
马尔可夫决策过程理论与应用,刘克,曹平 马尔可夫决策过程理论与应用_13701577
马尔可夫决策过程引论
浏览:170
马尔可夫决策过程引论是学习马尔可夫过程的绝佳参考书目,下载必有收获哦
实用马尔可夫决策过程
浏览:21
4星 · 用户满意度95%
实用马尔可夫决策过程,刘克编著,清华大学出版社
实用马尔可夫决策过程 高清版
浏览:63
实用马尔可夫决策过程 对于智能规划的学习有很大的帮助
MATLAB实现马尔可夫决策程序源码.zip
浏览:60
5星 · 资源好评率100%
资源名:MATLAB实现马尔可夫决策程序源码.zip 资源类型:程序源代码 源码说明: 基于MATLAB实现马尔可夫决策程序源码 包含完整源码和注释 非常适合借鉴学习 适合人群:新手及有一定经验的开发人员
《马尔可夫决策过程》电子书
浏览:92
3星 · 编辑精心推荐
马尔可夫最重要的工作是在1606~1912年间提出并研究了一种能用数学分析方法研究自然过程的一般图式—马尔可夫链,同时开创了一种无后效性的随机过程(马尔可夫过程)的研究.马尔可夫过程在自然科学、工程技术和公共事业...
matlab开发-马尔可夫决策过程摆度控制
浏览:174
matlab开发-马尔可夫决策过程摆度控制。建立了摆锤的马尔可夫决策过程模型,然后找到了摆锤的最优上摆策略。
[免资源分]马尔可夫决策过程
浏览:6
5星 · 资源好评率100%
[免资源分]关于马尔可夫决策过程很全面的资料
POMDP,部分可观察马尔可夫决策过程
浏览:50
POMDP是增强学习的基础,很少见的讲解POMDP的讲义,详细并且清晰,是学习POMDP非常好的参考资料,深入浅出,值得拥有。
马尔可夫决策过程实例讲解.pdf
浏览:57
中文版的MDP详细讲解,包括公式的完整推导过程,内容详细,通俗易懂,是学习MDP和强化学习难得的参考资料。
实用马尔可夫决策过程2.pdf
浏览:174
清晰,可复制文字,学理论,写论文很有帮助! 清晰,可复制文字,学理论,写论文很有帮助! 清晰,可复制文字,学理论,写论文很有帮助! 清晰,可复制文字,学理论,写论文很有帮助!...清晰,可复制文字,学理论,...
MATLAB工具箱大全- 马尔可夫决策过程 (MDP) 工具箱MDPtoolbox
浏览:57
5星 · 资源好评率100%
MATLAB工具箱大全- 马尔可夫决策过程 (MDP) 工具箱MDPtoolbox
第2课 马尔可夫决策过程
浏览:66
第2课 马尔可夫决策过程
马尔可夫决策工程资料
浏览:154
文档详细描述了利用马尔可夫决策过程解决内容分发过程中的调度问题
行人惯性导航零速检测算法
浏览:59
行人惯性导航零速检测算法
混合动力汽车基于规则的控制和ECMS与优化等效因子的实时能源管理策略
浏览:100
混合动力汽车基于规则的控制和ECMS与优化等效因子的实时能源管理策略
基于CORDIC的反正弦和反余弦计算的FPGA实现
浏览:132
5星 · 资源好评率100%
基于CORDIC的反正弦和反余弦计算的FPGA实现
使用3DCNN和卷积LSTM进行手势识别学习时空特征
浏览:178
使用3DCNN和卷积LSTM进行手势识别学习时空特征
BA无标度网络中的SIR模型
浏览:44
BA无标度网络中的SIR模型
基于三次贝塞尔曲线的类汽车曲率连续路径平滑
浏览:87
本文重点研究在大型科学设施环境中工作的类似汽车的车辆的可行路径的生成。 考虑曲率连续性和最大曲率约束,一种新颖的路径平滑算法是根据三次贝塞尔曲线提出的。 在算法中,贝塞尔转弯和贝塞尔路径分别为发达。 Bezier 转弯首先设计用于连接两个任意配置。 然后可以通过以下方式获得贝塞尔路径使用贝塞尔曲线来拟合避免碰撞规划器提供的一系列目标点。 在算法的指导下,车辆可以以预定的方向到达目标点。 模拟实验进
基于机器学习的设备剩余寿命预测方法综述
浏览:77
基于机器学习的设备剩余寿命预测方法综述
基于无差拍预测控制和扰动观测器的永磁同步电机电流控制
浏览:79
基于无差拍预测控制和扰动观测器的永磁同步电机电流控制
基于FPGA的奇异值和特征值分解的快速实现。
浏览:189
基于FPGA的奇异值和特征值分解的快速实现。
基于BP神经网络的人口预测
浏览:29
基于BP神经网络的人口预测
两轮平衡车的建模与控制研究
浏览:32
两轮平衡车的建模与控制研究
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
weixin_38731027
粉丝: 4
资源:
976
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
yuluer知更鸟.7z(1).001
基于python实现的医院信息管理系统完整源码+sql数据库+详细注释(高分课程设计)
社区公益共享项目实施方案(2).docx
School数据库文件
Project1.zip
华南农业大学Linux综合性实验部署MySql和三种动态语言Java,Python,Go到Docker容器中
左右相机标定图片14组
docker常用命令速查手册
6_Advertising-gd_LearningRate.ipynb
520表白代码浪漫恋爱表白亲吻效果kiss+浪漫表白亲吻.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功