一种基于操作条件反射原理的学习模型资源-CSDN文库

115 浏览量 2021-01-14 12:49:33 上传评论收藏 229KB PDF 举报

资源推荐

资源详情

资源评论

第 29 卷第 6 期

Vol. 29 No. 6

控制与决策

Control and Decision

2014 年 6 月

Jun. 2014

一种基于操作条件反射原理的学习模型

文章编号: 1001-0920 (2014) 06-1016-05 DOI: 10.13195/j.kzyjc.2013.0522

阮晓钢

, 黄静

a,b

, 范青武

, 魏若岩

(北京工业大学 a. 电子信息与控制工程学院，b. 实验学院，北京 100124)

摘要: 针对认知机器人的自主学习问题, 提出一种基于操作条件反射原理的学习模型 (OCLM). 该模型采用状态

空间、操作行为空间、概率分布函数、仿生学习机制、系统熵等进行描述, 给出状态的“负理想度”的概念, 定义了取

向函数的计算方法. 运用模型对机器人避障导航问题进行仿真实验, 并对参数设置进行了讨论. 实验结果表明, 基于

OCLM 模型的机器人能通过与环境的交互获得认知, 成功避障到达目的地, 具有一定的自学习能力, 从而表明了模型

的有效性.

关键词: 学习模型；操作条件反射；自学习；仿生；避障

中图分类号: TP273 文献标志码: A

A learning model based on operant conditioning principles

RUAN Xiao-gang

, HUANG Jing

a,b

, FAN Qing-wu

, WEI Ruo-yan

(a. College of Electronic Information and Control Engineering，b. Pilot College，Beijing University of Technology,

Beijing 100124，China．Correspondent：HUANG Jing，E-mail：mymailhj@sohu.com)

Abstract: Inspired by Skinner’s operant conditioning theory, an operant conditioning learning model is presented to deal

with the autonomous learning problem in cognitive robotics. The model is described by nine elements, including the space

set, the action set, the bionic learning function and the system entropy etc. A notion “negative ideal rate” is deﬁned to

compute the orientation function. The OCLM is applied to solve obstacle avoidance and navigation problems for mobile

robots. The experiment results show that the robot based on the model can autonomously learn how to arrive at the goal in a

collision-free way through interaction with the environment, and show the effectiveness of the proposed model.

Key words: learning model；operant conditioning；autonomous learning；bionics；obstacle avoidance

0 引引引言言言

心理学发展至今, 其理论成果深刻地影响着人工

智能、认知机器人学等相关领域的研究. 学习借鉴心

理学的经典理论, 对其进行数学建模, 用于解决机器

人的实际控制问题, 已成为人工智能、认知机器人研

究的一种新思路.

1938 年, Skinner

[1]

首次提出了操作条件反射的

概念, 并由此创立了操作条件反射理论. 他借鉴巴甫

洛夫的“强化”概念, 并将这一概念的内涵进行了革新.

将“强化”分为正强化和负强化两种, 正强化促使有机

体对刺激的反应概率增加, 负强化促使有机体消除

该刺激的反应增加. 刺激产生反应, 反应影响刺激出

现的概率, 这正是斯金纳操作条件反射理论的核心.

Skinner 的这一理论对智能体的学习行为给出了清晰

的描述, 吸引了很多学者对其进行研究. Zalama 等

[2]

基于 Grossberg 的条件反射模型研究了机器人的避障

问题, 该模型借用经典条件反射理论中“条件刺激”和

“非条件刺激”的概念, 以距离数据为条件刺激, 碰撞

为非条件刺激, 使训练后的机器人能在无导师信号的

情况下学会在任意位置的避障. 此后, Gaudiano 等

[3-4]

进一步发展了该模型, 将其与人工神经网络相结合,

应用在实物机器人 Pioneer 1 和 Khepera 上, 进行了避

障方面的实验, 效果良好, 但是, 模型更侧重于对经

典条件反射的建模, 对操作条件反射涉及较少. Ishii

等

[5]

为了研究动物与机器人之间的交互问题, 基于操

作条件反射理论, 在机器人 WM-6 和老鼠之间对斯金

纳老鼠实验进行了复现, 对比实验表明, 机器人与老

鼠之间的交互加快了操作条件反射建立的速度, 提高

收稿日期: 2013-04-27；修回日期: 2013-07-30.

基金项目: 国家自然科学基金项目(61075110)；北京市自然科学基金项目(KZ201210005001)；国家 973 计划项目

(2012CB720000)；高等学校博士学科点专项科研基金项目(20101103110007).

作者简介: 阮晓钢(1958−), 男, 教授, 博士生导师, 从事控制科学与工程、人工智能与认知科学、机器人学与机器人技术

等研究；黄静(1979−), 女, 博士生, 从事人工智能与认知科学、智能控制的研究.

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余4页未读，立即下载

评论收藏

内容反馈

weixin_38635449

粉丝: 5
资源: 971

一种基于操作条件反射原理的学习模型

基于滑模思想和Elman 网络的操作条件反射学习控制方法

基于操作条件反射的基础神经节行为认知模型

基于操作条件反射自动机的仿生自主学习方法 (2011年)

基于概率自动机的操作条件反射计算模型 (2010年)

一种自治操作条件反射自动机 (2012年)

平行光镜面反射模型DEMO

一种基于Matlab的光伏电池阵列仿真模型.zip

HS-OCPA 学习系统设计及其在机器人

一种具有发育机制的感知行动认知模型.docx

基于反射感知模型的人脸识别算法研究.pdf

Raytracing.rar_RayTracing_光线追踪_反射折射_反射模型

数学建模基于matlab 地震勘探marmousi模型【含Matlab源码 1977期】.zip

6S大气校正模型操作手册

基于亮点模型的典型水下目标回波信号仿真.pdf

强化学习原理_算法及应用

基于多波束声纳数据与反射模型的水下地形重建

基于Watterson模型的短波信道模拟器设计与实现_watterson_短波_短波信道模型_短波信道_Watterson模型_

杂波模型_雷达仿真杂波模型_杂波_

遥感6S大气校正模型资料，包括一些参考文献和测试数据

光学基于Matlab模拟切趾光栅反射谱

基于6s模型的大气校正执行文件

基于单纯形法的新安江次洪模型的参数优化研究

基于分布式布拉格反射器的量子点彩膜.pdf

基于物理模型的真实感水波模拟

一种基于单纯形法的分布式估计算法.pdf

6S 大气校正模型

电信设备-一种基于环境信息的杂波仿真数据生成方法.zip

最新资源