基于BP神经网络手写体数字识别技术研究文档.doc资源-CSDN文库

版权申诉

神经网络

157 浏览量 2024-01-22 23:12:08 上传评论收藏 311KB DOC 举报

资源推荐

资源详情

资源评论

第 1 章绪论

1.1 引言

数字识别技术是图像处理领域中的一个重要研究方向

[1]

。是计算机应用领域中的热点之

一。它又分为在线手写体识别和离线手写体识别。前者系统通过记录手写数字的抬笔、落笔、

笔迹上各像素的空间位置，以及各笔段之间的时间关系等信息，对这些信息进行处理，在处

理过程中，系统以一定的规则提取信息特征，再由识别模块将信息特征与识别库的特征进行

比较、加以识别，最后转化为计算机所使用的文字代码。后者相对于前者没有笔划信息

[2]

，

因此难度更大、应用更广泛，如银行票据、工商报表、财务报表、统计报表等各种表格系统，

本文将介绍如何用神经网络反向传播算法（BP 算法）实现在线手写体数字的识别。

1.2 模式识别概述

模式识别（Pattern Recognition）又常称作模式分类，它是机器识别、计算机识别或

计算机自动识别，其目的在于让计算机自动识别事物。从处理问题的性质和解决问题的方法

等角度，模式识别分为有监督的分类（Supervised Classification）和无监督的分类

� �

(Unsupervised Classification)两种。

模式识别是人类的一项基本智能，在日常生活中，人们经常在进行“模式识别”。随着 20

世纪 40 年代计算机的出现以及 50 年代人工智能的兴起

[2]

，人们当然也希望能用计算机来代

替或扩展人类的部分脑力劳动。(计算机)模式识别在 20 世纪 60 年代初迅速发展并成为一门

新学科。

模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行

处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程

[5]

,是信息科学和人工智能

的重要组成部分。

模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它

与人工智能、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人

工智能的学习机制；人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模

式识别中的预处理和特征抽取环节应用图像处理的技术；图像处理中的图像分析也应用模式

识别的技术。

1.3 手写数字识别概述

手写数字识别是“模式识别技术”中的一个重要组成部分，它研究的对象是：如何利用

电子计算机自动辨认人手写在纸张上的阿拉伯数字

【5】

。

在整个 OCR 领域中，最为困难的就是脱机手写字符进行识别。到目前为止，尽管人们在

脱机手写英文、汉字识别的研究领域中已取得很多成就，但距实用还有一定的距离

【7】

。在

手写数字识别这个方向上，经过多年研究，研究工作者已经开始把它向各种实际应用推广。

1.3.1 字符识别处理的分类

字符识别处理的信息可分为如下两类

【8】

：

（一）文字信息，它主要处理各国家、各民族的文字（如：汉字、英文等）书写或印刷

的文本信息，目前在印刷体和联机手写方面技术已趋向成熟，并推出了很多应用系统。

（二）数据信息，它是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据，如：

邮政编码、统计报表、财务报表、银行票据等等，处理这类信息的核心技术是手写数字识别。

这几年来我国开始大力推广的“三金”工程在很大程度上要依赖数据信息的输入，如果能通过

手写数字识别技术实现信息的自动录入，无疑会促进这一事业的进展

[19]

。因此，手写数字

的识别研究有着重大的现实意义，一旦研究成功并投入应用，将产生巨大的社会和经济效益。

1.3.2 手写数字识别的典型应用

手写数字识别有着极为广泛的应用前景，这也正是它受到世界各国的研究工作者重视的

一个主要原因

【9】

。下面将介绍一些以手写数字识别技术为基础的典型应用。

（一）手写数字识别在大规模数据统计中的应用

在大规模的数据统计

[12]

（如：行业年鉴、人口普查等）中，需要输入大量的数据，以

前需要手工输入，需要耗费大量的人力和物力。近年来在这类工作中采用 OCR 技术已成为一

种趋势。因为在这种应用中，数据的录入是集中组织的，所以往往可以通过专门设计表格和

对书写施加限制以便于机器的自动识别。

目前国内的大多数实用系统都要求用户按指定规范在方格内填写。另外，这些系统往往

采用合适的用户界面对识别结果做全面的检查，最终保证结果正确无误

[4]

。可以看出，这是

一类相对容易的应用，对识别核心算法的要求比较低，是目前国内很多单位应用开发的热点

【11】

。

（二）手写数字识别在财务、税务、金融领域中的应用

财务、税务、金融是手写数字识别大有可为的又一领域。随着我国经济的迅速发展，每

天等待处理的财务、税务报表、支票、付款单等越来越多。如果能把它们用计算机自动处理，

无疑可以节约大量的时间、金钱和劳力。与上面提到的大规模数据统计处理相比，在这个领

域的应用难度更大

【9】

，原因有：

1、对识别的精度要求更高；

2、处理的表格通常不止一种，所以一个系统应具有智能地同时处理若干种表格的能力；

3、由于处理贯穿于整个日常工作之中，书写应尽量按一般习惯（如：不对书写者的写

法做限定，书写时允许写连续的字串，而不是在固定的方格内书写），这样对识别及预处理

的核心算法要求也提高了。

1.3.3 手写数字识别技术的现状及展望

随着国家信息化进程的加快，手写数字识别的应用需求将越来越广泛，因此应当加强这

方面的研究工作。应用系统性能的关键与瓶颈仍然在于手写数字识别核心算法性能上

[15]

，

最终目标是研究零误识率和低拒识率的高速识别算法。此外，尽早建立反映中国人书写习惯

的、具有国家标准性质的手写数字样本库也是当务之急。

1.4 神经网络概述

BP（Back Propagation）网络是 1986 年由 Rumelhart 和 McCelland 为首的科学家小组

提出，是一种按误差逆传播算法训练的多层前馈网络

【10】

，是目前应用最广泛的神经网络模

型之一。

神经网络是仿效生物处理模式以获得智能信息处理功能的理论。神经网络着眼于脑的微

观网络结构，通过大量神经元的复杂连接，采用由底到顶的方法，通过自学习、自组织和非

线性动力学所形成的并行分布方式，来处理难于语言化的模式信息

【12】

。例如，人工神经网

络就是模拟人思维的第二种方式。这是一个非线性动力学系统，其特色在于信息的分布式存

储和并行协同处理。虽然单个神经元的结构极其简单，功能有限，但大量神经元构成的网络

系统所能实现的行为却是极其丰富多彩的。

1.4.1 神经网络的发展历史

神经网络早期的研究工作应追溯至本世纪 40 年代。下面以时间顺序，以著名的人物或

某一方面突出的研究成果为线索，简要介绍人工神经网络的发展历史。

1943 年，心理学家 W·Mcculloch 和数理逻辑学家 W·Pitts 在分析、总结神经元基本

特性的基础上首先提出神经元的数学模型。此模型沿用至今，并且直接影响着这一领域研究

的进展。因而，他们两人可称为人工神经网络研究的先驱

【13】

。

1945 年冯·诺依曼领导的设计小组试制成功存储程序式电子计算机，标志着电子计算

机时代的开始。1948 年，他在研究工作中比较了人脑结构与存储程序式计算机的根本区别，

提出了以简单神经元构成的再生自动机网络结构。但是，由于指令存储式计算机技术的发展

非常迅速，迫使他放弃了神经网络研究的新途径，继续投身于指令存储式计算机技术的研究，

并在此领域作出了巨大贡献

【8】

。虽然，冯·诺依曼的名字是与普通计算机联系在一起的，

但他也是人工神经网络研究的先驱之一。

50 年代末，F·Rosenblatt 设计制作了“感知机”，它是一种多层的神经网络。这项工

作首次把人工神经网络的研究从理论探讨付诸工程实践

【12】

。当时，世界上许多实验室仿效

制作感知机，分别应用于文字识别、声音识别、声纳信号识别以及学习记忆问题的研究。然

而，这次人工神经网络的研究高潮未能持续很久，许多人陆续放弃了这方面的研究工作，这

是因为当时数字计算机的发展处于全盛时期

[15]

，许多人误以为数字计算机可以解决人工智

能、模式识别、专家系统等方面的一切问题，使感知机的工作得不到重视；其次，当时的电

子技术工艺水平比较落后，主要的元件是电子管或晶体管，利用它们制作的神经网络体积庞

大，价格昂贵，要制作在规模上与真实的神经网络相似是完全不可能的

【6】

；另外，在 1968

年一本名为《感知机》的著作中指出线性感知机功能是有限的，它不能解决如异感这样的基

本问题，而且多层网络还不能找到有效的计算方法，这些论点促使大批研究人员对于人工神

经网络的前景失去信心

【12】

。

60 年代末期，人工神经网络的研究进入了低潮。Widrow 提出了自适应线性元件网络，

这是一种连续取值的线性加权求和阈值网络

【10】

。后来，在此基础上发展了非线性多层自适

应网络。当时，这些工作虽未标出神经网络的名称，而实际上就是一种人工神经网络模型。

随着人们对感知机兴趣的衰退，神经网络的研究沉寂了相当长的时间。80 年代初期，

模拟与数字混合的超大规模集成电路制作技术提高到新的水平，完全付诸实用化，此外，数

字计算机的发展在若干应用领域遇到困难。这一背景预示，向人工神经网络寻求出路的时机

已经成熟

【7】

。美国的物理学家 Hopfield 于 1982 年和 1984 年在美国科学院院刊上发表了两

篇关于人工神经网络研究的论文，引起了巨大的反响。人们重新认识到神经网络的威力以及

付诸应用的现实性。随即，一大批学者和研究人员围绕着 Hopfield 提出的方法展开了进一

步的工作，形成了 80 年代中期以来人工神经网络的研究热潮

【13】

。

1.4.2 BP 神经网络的研究内容及运用方向

神经网络的研究内容相当广泛，反映了多学科交叉技术领域的特点。目前，主要的研究

工作集中在以下几个方面

【18】

：

（一）生物原型研究。从生理学、心理学、解剖学、脑科学、病理学等生物科学方面研

究神经细胞、神经网络、神经系统的生物原型结构及其功能机理。

（二）建立理论模型。根据生物原型的研究，建立神经元、神经网络的理论模型。其中

包括概念模型、知识模型、物理化学模型、数学模型等。

（三）网络模型与算法研究。在理论模型研究的基础上构作具体的神经网络模型，以实

现计算机馍拟或准备制作硬件，包括网络学习算法的研究。这方面的工作也称为技术模型研

究。

（四）人工神经网络应用系统。在网络模型与算法研究的基础上，利用人工神经网络组

成实际的应用系统，例如，完成某种信号处理或模式识别的功能、构作专家系统、制成机器

人等等。

纵观当代新兴科学技术的发展历史，人类在征服宇宙空间、基本粒子，生命起源等科学

技术领域的进程中历经了崎岖不平的道路。我们也会看到，探索人脑功能和神经网络的研究

将伴随着重重困难的克服而日新月异。

1.5 本文的工作

本系统的任务是根据提出的 BP 算法建立一个用与手写体数字识别行为的网络，作为以

后更深一步进行研究的一个标准或者是模型。通过对原始数据集进行采样，得到系统所需要

的数据集，并将其分为两部分，一部分用于对原始的网络进行训练，我们称为训练集，另一

部分用于对训练完毕的网络进行测试和分析，我们称为测试集。

系统的主要目的是用 BP 算法来训练神经网络，通过对网络参数值的 n 次迭代，达到对

剩余28页未读，继续阅读

评论收藏

内容反馈

版权申诉

等天晴i

粉丝: 3423
资源: 10万+

基于BP神经网络手写体数字识别技术研究文档.doc

(完整)基于BP神经网络的手写数字识别实验报告.docx

基于BP神经网络的手写数字识别实验报告.pdf

【手写数字识别】基于BP神经网络手写数字识别系统含Matlab源码.zip

基于BP神经网络的手写数字识别.zip

(2021年整理)基于BP神经网络的手写数字识别实验报告.docx

BP神经网络实现手写数字识别matlab实现_神经网络_BP神经网络_手写数字识别_数字识别_手写字体识别

基于BP神经网络的手写数字识别研究人工智能.doc

BP神经网络实现手写数字输入识别python

【手写数字识别】基于BP神经网络手写数字识别matlab源码含GUI.zip

【含操作视频】基于BP神经网络的手写数字识别,数据库为MNIST,BP神经网络为自己编程实现不采用工具箱

【手写数字识别】基于BP神经网络手写数字识别matlab源码含GUI一、简介.zip

利用BP神经网络实现手写体数字识别

基于BP神经网络的手写数字识别.pdf

BP神经网络实现手写数字识别matlab实现.zip

【手写数字识别】基于BP神经网络手写数字识别matlab源码含GUI2.zip

BP神经网络实现手写数字识别matlab实现,基于bp神经网络的手写数字识别,matlab源码.zip.zip

基于BP神经网络的手写数字识别实验报告.doc

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

民宿网站

桌面聊天室

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

2023泛娱乐社交出海手册-ZEGO即构科技

4个亲测好用的ChatGPT4渠道

HAI-2024斯坦福AI指数报告（中文译版）.pdf

最新资源