基于滑模思想和Elman网络的操作条件反射学习控制方法资源-CSDN文库

82 浏览量 2021-01-14 20:38:42 上传评论收藏 227KB PDF 举报

资源推荐

资源详情

资源评论

第 26 卷第 9 期

Vol. 26 No. 9

控制与决策

Control and Decision

2011 年 9 月

Sep. 2011

基于滑模思想和 Elman 网络的操作条件反射学习控制方法

文章编号: 1001-0920 (2011) 09-1398-04

阮晓钢, 陈静

(北京工业大学电子信息与控制工程学院，北京 100124)

摘要: 针对一类单输入单输出高阶非线性控制系统, 提出一种基于滑模思想和 Elman 网络的操作条件反

射 (OCR) 学习控制方法. 该方法采用 Elman 网络构造滑模面-行为对的评价函数, 通过滑模面的变化设计奖赏函数,

根据奖赏信号更新评价函数, 实现行为选择概率的更新. 通过每轮次熵的定义, 定量分析了所学知识的变化量. 针对

行走倒立摆系统的仿真实验结果表明, 采用该仿生的 OCR 学习控制方法, 可实现行走倒立摆的平衡控制.

关键词: 操作条件反射；滑模控制；Elman 网络；熵；倒立摆；平衡控制

中图分类号: TP273 文献标识码: A

Operant conditioning reﬂex learning control scheme based on SMC and

Elman network

RUAN Xiao-gang, CHEN Jing

(School of Electronic Information and Control Engineering，Beijing University of Technology，Beijing 100124，China.

Correspondent：CHEN Jing，E-mail：chenjing0828@139.com)

Abstract: A bionic operant conditioning reﬂex(OCR) learning control scheme is proposed based on the thought of sliding

model control(SMC) and Elman network for a class of SISO higher-order nonlinear control system. In this method, an Elman

network is used as an evaluation function of sliding surface and action in the scheme. Reward signal is designed according to

the change of sliding surface, and then the evaluation function is updated through the reward stimulation, while the behavior

choice probability is changed. Through the deﬁnition of entropy for each round, a quantitative analysis about the knowledge

change in the learning process is given. The results of the simulation experiment in the walking inverted pendulum system

show that, bionic OCR learning control is used, which realizes the balancing control for the walking inverted pendulum

system.

Key words: operant conditioning reﬂex；sliding model control；Elman network；entropy；inverted pendulum；balancing

control

1 引引引言言言

仿生自主学习控制是近年来机器人领域的研究

热点, 基于操作条件反射 (OCR) 原理的智能体学习源

于心理学, 是一种集计算机技术、自动控制技术、仿

生学、心理学、生物学于一体的一项理论, 目前对该

理论的研究成果多见于生物实验方面, 在机器人控制

方面应用并不多见. 能够体现操作条件反射原理的理

论主要有概率自动机理论和离散动作的 Q 学习理论,

其中重要的一个特点是行为的概率选择机制.

1938 年, 美国哈佛大学心理学教授 Skinner 发表

了一部具有影响力的著作

[2]

, 由此创立了 Skinner 操

作条件反射理论 (OCR). 操作条件反射

[1-2]

和经典条

件反射

[3]

是联想学习的两个主要的学习方式, 所有的

动物 (包括人类) 都能体现这两种方式. 不同的是, 操

作条件反射 (OCR) 体现的是行为和行为产生的结果

之间的联结关系.

操作条件反射理论得到了国内外学者的广泛关

注, 近年来, 人们把操作条件反射理论应用于机器

人学习和控制方面, 做了大量的实验和研究. 德国的

Brembs 等人

[4-6]

利用果蝇和蜗牛实验, 研究了操作条

件反射, 将“纯”操作条件反射和并行操作条件反射在

一个生物的飞行仿生器中进行了模拟, 指出智能体

收稿日期: 2010-06-01；修回日期: 2010-08-25.

基金项目: 国家 863 计划项目(2007AA04Z226)；国家自然科学基金项目(60774077)；北京市自然科学基金项目

(4102011)；北京市教委重点项目(KZ200810005002).

作者简介: 阮晓钢(1958−), 男, 教授, 博士生导师, 从事机器人、自动控制等研究；陈静(1984−), 女, 博士生, 从事机器

人、智能控制等研究.

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余3页未读，立即下载

评论收藏

内容反馈

weixin_38709379

粉丝: 3
资源: 954

基于滑模思想和Elman 网络的操作条件反射学习控制方法

最新资源

基于滑模思想和Elman 网络的操作条件反射学习控制方法

基于操作条件反射自动机的仿生自主学习方法 (2011年)

基于ESO的一类线性时变系统自学习滑模控制方法

高度控制，滑模变结构控制方法及simulink仿真

滑模控制原理

基于滑模控制的PMSM直接转矩控制

基于EEMD和改进Elman神经网络的电力电缆故障监测及预警算法研究.pdf

基于Elman神经网络的永磁直线同步电机互补滑模控制.pdf

基于Adaboost的改进Elman神经网络港口吞吐量预测方法.pdf

基于改进Elman神经网络的变压器故障诊断方法.pdf

永磁直线伺服系统递归小波Elman神经网络互补滑模控制.pdf

基于灰色预测和Elman神经网络的全国用水量预测.pdf

基于MIV-Elman神经网络的海洋生物酶发酵软测量.pdf

elman网络，预测，神经网络

Elman神经网络控制与LQR的实践与分析.pdf

基于Elman神经网络的火电厂锅炉主汽温自动控制方法研究.pdf

基于粒子群优化的Elman神经网络无模型控制.pdf

Elman网络预测上证股市开盘价_Elman网络预测上证股市开盘价_Elman_elman预测_

elman神经网络的源代码，包括训练和仿真

基于有限元与Elman神经网络的基坑变形预测.pdf

基于改进Elman神经网络的故障诊断模型研究.pdf

基于改进Elman神经网络的空间负荷预测方法.pdf

ga_elman_GAelman_GA优化Elman_Elman_elamn神经网络_优化ELMAN

基于改进磷虾群算法优化Elman神经网络的PEMFC电堆建模.pdf

基于Elman神经网络的电力负荷预测的MATLAB实现

双直线电机伺服系统Elman神经网络互补滑模交叉耦合同步控制.pdf

基于SSA-Elman神经网络的预测模型研究

最新资源