课程设计报告-手写体数字识别系统的设计与实现.doc_机器学习手写体数字字符识别资源-CSDN文库

版权申诉

75 浏览量 2023-10-21 15:16:29 上传评论收藏 532KB DOC 举报

资源推荐

资源详情

资源评论

摘要

手写体数字识别系统依托计算机应用软件为载体，利用 C++程序

设计的相关知识，运用模块设计等相关技术，最终完成手写体设计系

统的程序综合设计。

关键字：手写体数字处理模式识别程序设计

一、论题概述

模式识别是六十年代初迅速发展起来的一门学科。由于它研究的是如何用机

器来实现人(及某些动物)对事物的学习、识别和判断能力，因而受到了很多科技

领域研究人员的注意，成为人工智能研究的一个重要方面。

字符识别是模式识别的一个传统研究领域。从50年代开始，许多的研究者就

在这一研究领域开展了广泛的探索，并为模式识别的发展产生了积极的影响。

字符识别一般可以分为两类:1.联机字符识别;2.光学字符识别(Optical

Chara- cter Recognition，OCR)或称离线字符识别。在联机字符识别中，计算机

能够通过与计算机相连的输入设备获得输入字符笔划的顺序、笔划的方向以及字

符的形状，所以相对OCR来说它更容易识别一些。但联机字符识别有一个重要的

不足就是要求输入者必须在指定的设备上书写，然而人们在生活中大部分的书写

情况是不满足这一要求的，比如人们填写各种表格资料，开具支票等。如果需要

计算机去认识这些己经成为文字的东西，就需要OCR技术。比起联机字符识别来，

OCR不要求书写者在特定输入设备上书写，它可以与平常一样书写，所以OCR的应

用更为广泛。OCR所使用的输入设备可以是任何一种图像采集设备，如CCD、扫描

仪、数字相机等。通过使用这类采集设备，OCR系统将书写者已写好的文字作为

图像输入到计算机中，然后由计算机去识别。由于OCR的输入只是简单的一副图

像，它就不能像联机输入那样比较容易的从物理特性上获得字符笔划的顺序信息，

因此OCR是一个更具挑战性的问题。

数字识别是多年来的研究热点，也是字符识别中的一个特别问题，它是本文

研究的重点。数字识别在特定的环境下应用特别广泛，如邮政编码自动识别系统，

税表和银行支票自动处理系统等。一般情况下，当涉及到数字识别时，人们往往

要求识别器有很高的识别可靠性，特别是有关金额的数字识别时，如支票中填写

的金额部分，更是如此。因此针对这类问题的处理系统设计的关键环节之一就是

设计出高可靠性和高识别率的数字识别方法。然而可以说还没有哪个数字识别器

达到完美的识别效果。

在过去的数十年中，研究者们提出了许许多多的识别方法。按使用的特征不

同，这些方法可以分为两类:基于结构特征的方法和基于统计特征的方法。结构

特征通常包括圆、端点、交叉点、笔划、轮廓等，统计特征通常包括点密度的测

量、矩、特征区域等，一般来说，两类特征各有优势。例如，使用统计特征的分

类器易于训练，而且对于使用统计特征的分类器，在给定的训练集上能够得到相

对较高的识别率，而结构特征的主要优点之一是能描述字符的结构，在识别过程

中能有效地结合几何和结构的知识，因此能够得到可靠性较高的识别结果。

二、模式识别与 BP 神经网络

在观察各种事物或接受各种客观现象时，人们总是不断地进行模式识别。各

种具有相似的特征又不完全相同的事物和现象组成不同的类别。在同一类别中，

事物和现象不尽相同，但它们总是表现出某些方面的相近之处。例如，每个人写

出来的数字“8”可能千差万别，但它们的共同之处在于，它们都属于数字，

“8”这个范畴。也就是说，这些千差万别的数字“8”的共性是它们具有相同的

属性特征。

人的思维可以对初次见到的事物进行分类。比如，即使人们初到一个城市，

也可以轻易地辨认出“街道”、“房屋”、“汽车”这样的事物。同样，看到另

外一种写法的“8”，人们仍然可以清楚地知道它的含义。正是人脑的这种推广

能力，使得人们利用见到过的有限事物和现象，形成各种事物类别的概念。这些

有限的、个别的事物和现象就可以称为模式，而整个类别的现象和事物则可以称

为模式类，或者简称为类。人们根据所见模式的特性，将其划归为某一类的过程，

实际上就是模式识别的过程。

模式识别这个词既可以是指人对事物的，一个分析、描述、判断和识别的过

程，也可以是指利用计算机对某些物理对象进行分类的这门学科。模式和集合的

概念是分不开的，模式可以看作是集合论中的元素，而类则可以看作是子集。

神经网络的概念、原理和设计是受生物、特别是人脑神经系统的启发提出的.

神经网络由大量简单的处理单元来模拟真实人脑神经网络的机构和功能以及若

干基本特性,是一个高度复杂的非线性自适应动态处理系统.BP 网络是 1986 年由

Rinehart 和 McCelland 为首的科学家小组提出,是一种按误差逆传播算法训练的

剩余15页未读，继续阅读

内容反馈

版权申诉

等天晴i

粉丝: 3526
资源: 10万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip