没有合适的资源?快使用搜索试试~ 我知道了~
高斯扩散模型matlab代码-Kalman-TD-Model:该程序使用Python允许Kalman-TD模型拟合模拟的行为数据
共8个文件
py:3个
yml:1个
jpg:1个
需积分: 49 15 下载量 71 浏览量
2021-05-26
14:54:22
上传
评论 1
收藏 79KB ZIP 举报
温馨提示
高斯扩散模型matlab代码 该程序使用Python,可以使Kalman-TD模型适合模拟的行为数据。 Matlab中的初始代码基于哈佛大学心理学系和脑科学中心的Samuel Gershman的先前工作。 在他的论文中介绍了该模型,该模型描述了一个包含贝叶斯和强化学习理论的联想学习框架。 有关详细信息,请通过与我联系。 目录 什么是Kalman-TD模型 联想学习理论 学习能力对于动物的生存至关重要。 最近的两个概念使我们对这种学习的发生方式有了更好的理解。 两种理论都可以看作是对开创性Rescorla-Wagner的概括,但是它们是基于关于学习任务的目标和不确定性表示的不同假设而得出的。 代理使用贝叶斯原理估计关联的强度并跟踪其不确定性,并由卡尔曼滤波器(KF)体现。 KF了解预期立即奖励的后验分布 代理人使用强化学习(RL)原理来学习长期累积的未来奖励,并以时间差异(TD)表示。 TD了解预期的未来累积奖励的单一价值 统一模型 这两个理论模型可以以Kalman-TD模型的形式组合在一起。 该实时模型表示权重的分布,而不是点估计。 这与一种更规范的方法是一致的,因为我们可以相信理想的
资源详情
资源评论
资源推荐
收起资源包目录
Kalman-TD-Model-master.zip (8个子文件)
Kalman-TD-Model-master
functions.py 1KB
KalmanTD_model.py 7KB
_config.yml 48B
LICENSE 1KB
fig_simulation_KalmanTD.pdf 16KB
run.py 3KB
FIG1.JPG 74KB
README.md 19KB
共 8 条
- 1
weixin_38696877
- 粉丝: 6
- 资源: 929
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 2001~2022年上市公司数字赋能指数.dta
- 2001~2022年上市公司数字赋能指数.xlsx
- 信息办公石大在线财务管理系统(含源码)-shidacaiwu.rar
- 信息办公电信计费系统完整代码-netctossconformity.rar
- matlab实现TD-SCDMA中初始同步捕捉DwPTS下行同步导频时隙的仿真.zip
- 信息办公玉玺学生信息管理系统-webapps.rar
- 信息办公基于struts的图书管理系统-struts-ts.rar
- 管家婆分销ERP V1 V3 A8II TOP V10.0.2最新全版本通用
- 信息办公基于Ajax+J2EE的MicroERP源码下载-microerp-0.1.rar
- 信息办公双鱼林jsp人事工资系统-wagesmanagesystem.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0