没有合适的资源?快使用搜索试试~ 我知道了~
lpcmatlab代码-MDPs_Value-Iteration:马尔可夫决策过程的值迭代算法
共18个文件
png:15个
md:1个
license:1个
需积分: 50 13 下载量 195 浏览量
2021-05-23
18:27:11
上传
评论
收藏 929KB ZIP 举报
温馨提示
lpc matlab代码 :mountain: 马尔可夫决策过程的值迭代算法 该存储库的内容作为计算机科学理学硕士课程的学生要求的概率图形模型课程的一项分配项目。 这段代码的版本中提供的所有资源都是从您可以在参考部分找到的类书中获得的。 算法和信息的这种应用仅用于教育目的 描述: 实现值迭代算法以解决离散的马尔可夫决策过程。 教授: 博士 参与的学生: 马里奥·德·洛斯·桑托斯(Mario De Los Santos)。 Github :。 电子邮件: 指示 下载存储库的文件 验证C ++版本是否至少为C ++ 14 调用文档中标记的功能 以下算法基于教授提供的文档。 用作参考的书位于此文件的末尾。 值迭代算法包括根据Bellman方程迭代地估计每个状态s的值。 下图显示了用于创建该项目的伪代码。 Policy迭代算法由基于Bellman方程迭代地估算每个状态s的值组成,主要区别在于我们将Policy存储在每次迭代中,这将使我们可以将迭代(t)与(t-1)进行比较),那么如果政策相同,则我们将完成该过程,这将以存储成本为您带来计算速度上的优势。 图像2显示了用于创建该项目的伪代码。 示例需要调用该类,如
资源推荐
资源详情
资源评论
收起资源包目录
MDPs_Value-Iteration-main.zip (18个子文件)
MDPs_Value-Iteration-main
Source_code
2021_MGP_Project5_MDPs_Value-Iteration.cpp 17KB
LICENSE 34KB
README.md 4KB
Images
Example_class.PNG 34KB
Bellmans_equation.PNG 12KB
Example_bot.PNG 71KB
Algorithm_pseudocode1.PNG 52KB
Example_bot_states.PNG 111KB
Example_values.PNG 15KB
Example_bot_solved.png 339KB
Example_bear_solved.PNG 15KB
Algorithm_pseudocode.PNG 42KB
Example_bot_Policy.PNG 6KB
Example_bot_iteraction.PNG 133KB
Example_bot_code.PNG 34KB
Example_bear_policy.PNG 12KB
Example_bear_code.PNG 66KB
Example_bear.PNG 42KB
共 18 条
- 1
资源评论
weixin_38657835
- 粉丝: 3
- 资源: 931
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- HCIP-Datacom笔记 (1).pdf
- yolov5,SSD 可能使用到的一些代码
- bbbbbbbbbbbbbbbbbb
- 安卓逆向学习笔记之Frida Stalker 还原OLLVM AES.docx
- 安卓逆向学习笔记之unicorn来trace还原OLLVM Base64.docx
- 最新版本私钥助记词碰撞器大富豪使用python进行制作通过接口的方式进行验证支持多币种多链多网络一分钟万次验证高出货率
- 介绍离散性制造行业的MES系统流程
- Arduino IDE压缩包版本,2024年4月26日,最新版本
- 基于IDEA-CCNL/Randeng-Pegasus-238M-Summary-Chines微调的中文文本摘要任务源码+数据集
- 自动驾驶-状态估计和定位之直方图滤波(Histogram+Filter)定位应用和源码.pdf
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功