function [stat,done]=jump_learn(stat)
global NO_REPLICATIONS ITERMAX NA NS SMALL TPM TRM
% This function simulates a jump and also updates the learning stats
old_state=stat.old_state;
old_action=stat.old_action;
% Determine current state
current_state=state_finder(stat);
% Record Feedback in stat
stat.current_state=current_state;
stat.rimm=TRM(old_state,current_state,old_action);
% DO LEARNING
stat=qlearn(stat);
% Select next action
next_action=action_selector(stat);
% Get ready to get out of this function
stat.old_state=current_state;
stat.old_action=next_action;
if stat.iter>=ITERMAX
% Learning should end
done=1;
else
done=0;
end
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
计算机视觉-增强学习MATLAB源码 增强学习(Reinforcement Learning)要解决的是这样的问题:一个能感知环境的自治agent,怎样通过学习选择能达到其目标的最优动作。 增强学习目的是构造一个控制策略,使得Agent行为性能达到最大。Agent从复杂的环境中感知信息,对信息进行处理。Agent通过学习改进自身的性能并选择行为,从而产生群体行为的选择,个体行为选择和群体行为选择使得Agent作出决策选择某一动作,进而影响环境。 增强学习是指从动物学习、随机逼近和优化控制等理论发展而来,是一种无导师在线学习技术,从环境状态到动作映射学习,使得Agent根据最大奖励值采取最优的策略;Agent感知环境中的状态信息,搜索策略(哪种策略可以产生最有效的学习)选择最优的动作,从而引起状态的改变并得到一个延迟回报值,更新评估函数,完成一次学习过程后,进入下一轮的学习训练,重复循环迭代,直到满足整个学习的条件,终止学习。
资源详情
资源评论
资源推荐
收起资源包目录
10、增强学习.zip (11个子文件)
10、增强学习
jump_learn.m 697B
main.m 597B
global4.m 399B
global1.m 399B
qlearn.m 480B
action_selector.m 422B
pol_finder.m 341B
state_finder.m 450B
global3.m 399B
WS_FTP.LOG 1KB
global2.m 397B
共 11 条
- 1
mozun2020
- 粉丝: 1w+
- 资源: 131
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 微信小程序源码 车源宝 二手车交易平台 源码下载
- 微信小程序源码 实现 城市切换 demo 根据城市首字母排序城市 选择城市 源码下载
- VMware7.0虚拟机硬盘无法编辑,无法连接到Profile-Driven Storage Service
- arm64内核的mongo镜像
- 基于stm32f103c单片机+MPU6050+0.96英寸OLED显示屏双柄遥控器硬件(原理图+PCB)工程文件.zip
- 整理的关于少儿编程的学习路径,以及如何在小升初,初升高和大学充分的利用起来编程经验的优势
- nhit完整源码+论文学习
- 足球比赛结果统计表2006-2011年大约28W场比赛
- 基于PHP+mysql的社区交流系统(源代码)
- yolov5,SSD 可能使用到的一些代码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0