没有合适的资源?快使用搜索试试~ 我知道了~
移动机器人模糊Q_学习沿墙导航_徐明亮1
需积分: 0 0 下载量 65 浏览量
2022-08-04
17:20:38
上传
评论
收藏 640KB PDF 举报
温馨提示
试读
7页
第一层为输入层,它将由状态 第二层为模糊化层,其中每个节点代 第三层为 T-norm 运算层,该层计算每个规则的 第四层为归一化层,对每一条规则的发射强度 第五
资源详情
资源评论
资源推荐
书书书
第
14
卷 第
6
期
2010
年
6
月
电 机 与 控 制 学 报
ELECTRI C MACHINES AND CONTROL
Vol. 14 No. 6
June 2010
移动机器人模糊
Q -
学习沿墙导航
徐明亮
1,2
,
柴志雷
2
,
须文波
2
(1.
无锡城市职业技术学校 电子信息系
,
江苏 无锡
214063; 2.
江南大学 信息工程学院
,
江苏 无锡
214122)
摘 要
:
针对在基于行为的移动机器人沿墙导航控制器的设计中缺乏足够的先验知识的问题
,
采
用
Q -
学习方法让机器人通过学习来自动构建导航控制器
。
将模糊神经网络和
Q -
学习相结合
,
用模糊神经网络直接逼近连续状态和动作空间中的
Q
值函数
。
利用对
Q
值函数的优化获得控制
输出
。
模糊神经网络中的节点根据状态动作对的各个分量和时间差分的新颖性进行自适应地添加
和构造
,
这样不仅能克服节点选择的困难还能使网络保持适度的规模
。
网络中的参数采用扩展卡
尔曼滤波方法进行自适应调整
。
基于
Khepera 2
机器人的沿墙导航实验验证了该方法的有效性和
优越性
。
关键词
:Q -
学习
;
模糊神经网络
;
沿墙导航
;
移动机器人
中图分类号
:TP 391. 41
文献标志码
: A
文章编号
: 1007- 449X(2010)06- 0083- 06
Wall-following control of a mobile robot with fuzzy Q-learning
XU Ming-liang
1,2
, CHAI Zhi-lei
2
, XU Wen -bo
2
(1. Department of Electronic Information Engineering,Wuxi City College of Vocational Techonology,Wuxi 214063,China;
2. Institute of Information Engineering,Jiangnan University,Wuxi 214122,China)
Abstract:The Q-learning was introduced into navigation control of the wall-following task of mobile robots
where there was no enough priori knowledge available. The Q-value function was approached directly u-
sing Fuzzy Neural Network (FNN). The optimization method was used to search the greedy action with
maximum
Q-value. The nodes of FNN were created incrementally and adaptively according to every ele-
ment of the current pair of state-action and Temporal Difference (TD),which overcame the difficulties of
the choice of nodes and ensured an economic size of the network. Moreover the parameters of the FNN
were updated using Extended Kalman Filter (EKF). The results of the wall-following task of Khepera 2
mobile robot demonstrate the superiority and validity of the proposed method.
Key words:Q-learning; fuzzy neural network; wall-following navigation; mobile robots
收稿日期
: 2009 - 11 - 24
基金项目
:
国家自然科学基金
(60703106)
作者简介
:
徐明亮
(1973—),
男
,
博士
,
讲师
,
研究方向为机器学习
、
智能控制
;
柴志雷
(1975—),
男
,
博士
,
副教授
,
研究方向为嵌入式系统
、
智能控制
;
须文波
(1946—),
男
,
教授
,
博士生导师
,
研究方向为嵌入式系统
、
计算机控制技术
。
0
引 言
导航是移动机器人的一项重要的功能
,
是移动
机器人完成其他智能行为的基础
。
沿墙导航控制是
指机器人在和墙保持一定距离的情况下沿墙运动
,
从更一般意义上来说实际上是机器人与物体保持一
定距离并沿物体轮廓运动
[1]
。
因此沿墙导航实际
上既可以使机器人实现障碍物的避碰
[2]
,
也可以实
现在未知环境的导航
[3]
。
移动机器人的反应式导航是一种直接在机器人
DOI:10.15938/j.emc.2010.06.016
daidaiyijiu
- 粉丝: 15
- 资源: 322
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- TG-2024-05-23-204718255.mp4
- 候志强@181 5428 8938_20240420112107.amr
- spispispispispi
- 实验二:IP协议分析.zip
- 驱动代码驱动代码驱动代码驱动代码
- SVID_20240523_141155_1.mp4
- Code for the complete guide to tkinter tutorial
- 关于百货中心供应链管理系统.zip
- SimpleFolderIcon-master 修改Unity的Project下的文件夹图标
- A python Tkinter widget to display tile based maps
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0