没有合适的资源?快使用搜索试试~ 我知道了~
基于BP神经网络手写体数字识别技术研究文档.doc
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 157 浏览量
2024-01-22
23:12:08
上传
评论
收藏 311KB DOC 举报
温馨提示
试读
29页
在本设计的手写体数字分类器中运用基于误差反向传播的BP算法构造神经网络对训练集中的数据进行训练。根据实际输出量和预期输出量之间的差值,不断的修正权值系数以减小误差,直到达到满足要求的结果。然后用此已经训练好的网络对测试集中的数据进行测试。在分类器的设计实验中,该方法得到了较高的检测率和较低的错误率,该算法具有良好的性能,但是该算法训练集较多速度较慢的问题有待解决。
资源推荐
资源详情
资源评论
1
第 1 章 绪 论
1.1 引言
数字识别技术是图像处理领域中的一个重要研究方向
[1]
。是计算机应用领域中的热点之
一。它又分为在线手写体识别和离线手写体识别。前者系统通过记录手写数字的抬笔、落笔、
笔迹上各像素的空间位置,以及各笔段之间的时间关系等信息,对这些信息进行处理,在处
理过程中,系统以一定的规则提取信息特征,再由识别模块将信息特征与识别库的特征进行
比较、加以识别,最后转化为计算机所使用的文字代码。后者相对于前者没有笔划信息
[2]
,
因此难度更大、应用更广泛,如银行票据、工商报表、财务报表、统计报表等各种表格系统,
本文将介绍如何用神经网络反向传播算法(BP 算法)实现在线手写体数字的识别。
1.2 模式识别概述
模式识别(Pattern Recognition)又常称作模式分类,它是机器识别、计算机识别或
计算机自动识别,其目的在于让计算机自动识别事物。从处理问题的性质和解决问题的方法
等角度,模式识别分为有监督的分类(Supervised Classification)和无监督的分类
� �
2
(Unsupervised Classification)两种。
模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着 20
世纪 40 年代计算机的出现以及 50 年代人工智能的兴起
[2]
,人们当然也希望能用计算机来代
替或扩展人类的部分脑力劳动。(计算机)模式识别在 20 世纪 60 年代初迅速发展并成为一门
新学科。
模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行
处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程
[5]
,是信息科学和人工智能
的重要组成部分。
模式识别与统计学、心理学、语言学、计算机科学 、生物学、控制论等都有关系。它
与人工智能 、 图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人
工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模
式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式
2
识别的技术。
1.3 手写数字识别概述
手写数字识别是“模式识别技术”中的一个重要组成部分,它研究的对象是:如何利用
电子计算机自动辨认人手写在纸张上的阿拉伯数字
【5】
。
在整个 OCR 领域中,最为困难的就是脱机手写字符进行识别。到目前为止,尽管人们在
脱机手写英文、汉字识别的研究领域中已取得很多成就,但距实用还有一定的距离
【7】
。在
手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广。
1.3.1 字符识别处理的分类
字符识别处理的信息可分为如下两类
【8】
:
(一)文字信息,它主要处理各国家、各民族的文字(如:汉字、英文等)书写或印刷
的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统。
(二)数据信息,它是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:
邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。
这几年来我国开始大力推广的“三金”工程在很大程度上要依赖数据信息的输入,如果能通过
手写数字识别技术实现信息的自动录入,无疑会促进这一事业的进展
[19]
。因此,手写数字
的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。
1.3.2 手写数字识别的典型应用
手写数字识别有着极为广泛的应用前景,这也正是它受到世界各国的研究工作者重视的
一个主要原因
【9】
。下面将介绍一些以手写数字识别技术为基础的典型应用。
(一)手写数字识别在大规模数据统计中的应用
在大规模的数据统计
[12]
(如:行业年鉴、人口普查等)中,需要输入大量的数据,以
前需要手工输入,需要耗费大量的人力和物力。近年来在这类工作中采用 OCR 技术已成为一
种趋势。因为在这种应用中,数据的录入是集中组织的,所以往往可以通过专门设计表格和
对书写施加限制以便于机器的自动识别。
目前国内的大多数实用系统都要求用户按指定规范在方格内填写。另外,这些系统往往
采用合适的用户界面对识别结果做全面的检查,最终保证结果正确无误
[4]
。可以看出,这是
3
一类相对容易的应用,对识别核心算法的要求比较低,是目前国内很多单位应用开发的热点
【11】
。
(二)手写数字识别在财务、税务、金融领域中的应用
财务、税务、金融是手写数字识别大有可为的又一领域。随着我国经济的迅速发展,每
天等待处理的财务、税务报表、支票、付款单等越来越多。如果能把它们用计算机自动处理,
无疑可以节约大量的时间、金钱和劳力。与上面提到的大规模数据统计处理相比,在这个领
域的应用难度更大
【9】
,原因有:
1、对识别的精度要求更高;
2、处理的表格通常不止一种,所以一个系统应具有智能地同时处理若干种表格的能力;
3、由于处理贯穿于整个日常工作之中,书写应尽量按一般习惯(如:不对书写者的写
法做限定,书写时允许写连续的字串,而不是在固定的方格内书写),这样对识别及预处理
的核心算法要求也提高了。
1.3.3 手写数字识别技术的现状及展望
随着国家信息化进程的加快,手写数字识别的应用需求将越来越广泛,因此应当加强这
方面的研究工作。应用系统性能的关键与瓶颈仍然在于手写数字识别核心算法性能上
[15]
,
最终目标是研究零误识率和低拒识率的高速识别算法。此外,尽早建立反映中国人书写习惯
的、具有国家标准性质的手写数字样本库也是当务之急。
1.4 神经网络概述
BP(Back Propagation)网络是 1986 年由 Rumelhart 和 McCelland 为首的科学家小组
提出,是一种按误差逆传播算法训练的多层前馈网络
【10】
,是目前应用最广泛的神经网络模
型之一。
神经网络是仿效生物处理模式以获得智能信息处理功能的理论。神经网络着眼于脑的微
观网络结构,通过大量神经元的复杂连接,采用由底到顶的方法,通过自学习、自组织和非
线性动力学所形成的并行分布方式,来处理难于语言化的模式信息
【12】
。例如,人工神经网
络就是模拟人思维的第二种方式。这是一个非线性动力学系统,其特色在于信息的分布式存
储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络
系统所能实现的行为却是极其丰富多彩的。
4
1.4.1 神经网络的发展历史
神经网络早期的研究工作应追溯至本世纪 40 年代。下面以时间顺序,以著名的人物或
某一方面突出的研究成果为线索,简要介绍人工神经网络的发展历史。
1943 年,心理学家 W·Mcculloch 和数理逻辑学家 W·Pitts 在分析、总结神经元基本
特性的基础上首先提出神经元的数学模型。此模型沿用至今,并且直接影响着这一领域研究
的进展。因而,他们两人可称为人工神经网络研究的先驱
【13】
。
1945 年冯·诺依曼领导的设计小组试制成功存储程序式电子计算机,标志着电子计算
机时代的开始。1948 年,他在研究工作中比较了人脑结构与存储程序式计算机的根本区别,
提出了以简单神经元构成的再生自动机网络结构。但是,由于指令存储式计算机技术的发展
非常迅速,迫使他放弃了神经网络研究的新途径,继续投身于指令存储式计算机技术的研究,
并在此领域作出了巨大贡献
【8】
。虽然,冯·诺依曼的名字是与普通计算机联系在一起的,
但他也是人工神经网络研究的先驱之一。
50 年代末,F·Rosenblatt 设计制作了“感知机”,它是一种多层的神经网络。这项工
作首次把人工神经网络的研究从理论探讨付诸工程实践
【12】
。当时,世界上许多实验室仿效
制作感知机,分别应用于文字识别、声音识别、声纳信号识别以及学习记忆问题的研究。然
而,这次人工神经网络的研究高潮未能持续很久,许多人陆续放弃了这方面的研究工作,这
是因为当时数字计算机的发展处于全盛时期
[15]
,许多人误以为数字计算机可以解决人工智
能、模式识别、专家系统等方面的一切问题,使感知机的工作得不到重视;其次,当时的电
子技术工艺水平比较落后,主要的元件是电子管或晶体管,利用它们制作的神经网络体积庞
大,价格昂贵,要制作在规模上与真实的神经网络相似是完全不可能的
【6】
;另外,在 1968
年一本名为《感知机》的著作中指出线性感知机功能是有限的,它不能解决如异感这样的基
本问题,而且多层网络还不能找到有效的计算方法,这些论点促使大批研究人员对于人工神
经网络的前景失去信心
【12】
。
60 年代末期,人工神经网络的研究进入了低潮。Widrow 提出了自适应线性元件网络,
这是一种连续取值的线性加权求和阈值网络
【10】
。后来,在此基础上发展了非线性多层自适
应网络。当时,这些工作虽未标出神经网络的名称,而实际上就是一种人工神经网络模型。
随着人们对感知机兴趣的衰退,神经网络的研究沉寂了相当长的时间。80 年代初期,
模拟与数字混合的超大规模集成电路制作技术提高到新的水平,完全付诸实用化,此外,数
5
字计算机的发展在若干应用领域遇到困难。这一背景预示,向人工神经网络寻求出路的时机
已经成熟
【7】
。美国的物理学家 Hopfield 于 1982 年和 1984 年在美国科学院院刊上发表了两
篇关于人工神经网络研究的论文,引起了巨大的反响。人们重新认识到神经网络的威力以及
付诸应用的现实性。随即,一大批学者和研究人员围绕着 Hopfield 提出的方法展开了进一
步的工作,形成了 80 年代中期以来人工神经网络的研究热潮
【13】
。
1.4.2 BP 神经网络的研究内容及运用方向
神经网络的研究内容相当广泛,反映了多学科交叉技术领域的特点。目前,主要的研究
工作集中在以下几个方面
【18】
:
(一)生物原型研究。从生理学、心理学、解剖学、脑科学、病理学等生物科学方面研
究神经细胞、神经网络、神经系统的生物原型结构及其功能机理。
(二)建立理论模型。根据生物原型的研究,建立神经元、神经网络的理论模型。其中
包括概念模型、知识模型、物理化学模型、数学模型等。
(三)网络模型与算法研究。在理论模型研究的基础上构作具体的神经网络模型,以实
现计算机馍拟或准备制作硬件,包括网络学习算法的研究。这方面的工作也称为技术模型研
究。
(四)人工神经网络应用系统。在网络模型与算法研究的基础上,利用人工神经网络组
成实际的应用系统,例如,完成某种信号处理或模式识别的功能、构作专家系统、制成机器
人等等。
纵观当代新兴科学技术的发展历史,人类在征服宇宙空间、基本粒子,生命起源等科学
技术领域的进程中历经了崎岖不平的道路。我们也会看到,探索人脑功能和神经网络的研究
将伴随着重重困难的克服而日新月异。
1.5 本文的工作
本系统的任务是根据提出的 BP 算法建立一个用与手写体数字识别行为的网络,作为以
后更深一步进行研究的一个标准或者是模型。通过对原始数据集进行采样,得到系统所需要
的数据集,并将其分为两部分,一部分用于对原始的网络进行训练,我们称为训练集,另一
部分用于对训练完毕的网络进行测试和分析,我们称为测试集。
系统的主要目的是用 BP 算法来训练神经网络,通过对网络参数值的 n 次迭代,达到对
剩余28页未读,继续阅读
资源评论
等天晴i
- 粉丝: 3423
- 资源: 10万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功