图像模式识别—VC++技术实现.pdf

所需积分/C币:41 2016-09-24 17:29:10 21.68MB PDF
收藏 收藏 1
举报

图像模式识别—VC++技术实现
第8章聚类分析… 159 8.1聚类的设计… ……………………………………………159 8.2模式相似性测量 8.3基于试探的未知类别聚类算法 ·“.·:····· 167 8.3.1最临近规则的试探法…………… ·:··.·····4.··.··· 167 8.3.2最大最小距离算法………… 172 8.4层次聚类算法…… ◆鲁鲁4·P●p晋音D鲁↓静看4鲁 …………………175 8.4.1最短距离法 …176 8.4.2最长距离法 180 8.43中间距离法 香婚鲁··量◆ψ··香非◆多鲁自●·鲁命·音·命罪。·自·鲁4如垂垂·●p ………184 8.4.4重心法… 845类平均距离法 ……………193 8.5动态聚类算法… ……201 8.5.1K均值算法 …………202 8.5.2迭代自组织的数据分析算法( ISODATA)…………………… ……205 小结 ■号會即 ·.‘·····.······.········ 213 习题 章D·.··日··4甲··合···· ……213 第9章模糊聚类分析 9.1模糊集的基本概念 …………214 9,2模糊集运算 4·4.·4···+ 西● …………217 9.2.1模棚子集运算…… 聊鲁 …217 9.2.2模糊集运算性质 218 9.3模糊关系… ……………218 9.4模糊集在模式识别中的应用 ………………223 9.5模糊聚类分析 ●·b雪 ■昏·◆··血婚D鲁···●自●D···鲁鲁p自 224 小结 240 弓题 鲁·q鲁辛自●■■▲·‘··晶. …240 第10章遗传算法聚类分析 10.1遗传算法基本概念 看自自曲看 241 10.2遗传算法的构成要素… ·:.·4·· 243 10.2.1染色体的编码……… …………………243 10.2.2适应度函数 音4·····4。4音事D·申··◆·■垂●番 ………244 10.23遗传算子……………… 245 10.3控制参数的选择 247 10.4基于遗传算法的聚类分析… D·喜 247 小结…………… .,.,甲.··4··dd·t·咖 266 习题 266 附录A几种主要矩阵运算的程序代码 …267 参考文献 ·甲甲即。看·● · ···““---·- 275 Ⅲ 第1章模式识别的基本概念 本章要点: 团模式识别的基本概念 图像识别 团位图基础 1.1模式识别的基本概念 模式识别( Pattern Recognition)就是机器识别、计算机识别或机器自动识别,目的在于让 机器自动识别事物。例如手写数字的识别,就是将手写的数字分到具体的数字类别中;智能交 通管理系统的识别,就是判断是否有汽车闯红灯,闯红灯的汽车车牌号码:还有文字识别,语音 识别,图像中物体识别,等等。该学科研究的目的是使机器能做人类能做的事,具备人所具有 的对各种事物与现象进行分析描述与判断的部分能力。模式识别是直观的、无所不在的。实 际上人类在日常生活的每个环节都从事着模式识别的活动。人和动物的模式识别能力是极 其平常的,但对计算机来说却是非常困难。让机器能识别分类,需要研究识别的方法,这就是 这门学科的任务。 模式识别研究的内容是利用计算机对客观物体进行分类,在错误概率最小的条件下,使识 别的结果尽量与客观物体相符合。让机器辨别事物的最基本方法是计算,原则上讲是对计算 机要分析的事物与标准模板的相似程度进行计算。例如要识别一个手写的数字,就要将它与 0到9的模板做比较,看跟哪个模板最相似或最接近。因此首先要能度量,从中看出不同事物 之间的差异,才能分辨当前要识别的事物。因此找到度量不同类事物差异的有效方法最为 关键。 在模式识别学科中,就“模式”与“模式类”而言,模式类是一类事物的代表,而“模式”则是 某一事物的具体体现如数字0,1,2,3,4,5,6,7,8,9是模式类而用户任意手写的一个数字或 仟意一个印刷数字则是“模式”,是数字的具体化。 1.模式的描述方法 在模式识别技术中,被观测的每个对象称为样品,例如,在手写数字识别中每个手写数字 可以作为一个样品如果共写了N个数字,我们把这N个数字叫做N个样品(X1,X2,…,x, …,xN),其中数字0有N个样品,数字1有N1个样品,数字2有N2个样品数字3有N3 个样品 共有ω1,a2,…,aM(M=10)个不同的类别。 对于一个样品来说必须确定一些与识别有关的因素作为研究的根据,每一个因素称为 个特征。模式就是样品所具有的特征描述。模式的特征集由处于同一个特征空间的特征向量 表示,特征向量的每个元素称为特征,该向量也因此称为特征向量。一般地用小写英文字母 2 图像模式识别——VC++技术实现 x,y,z来表示特征。如果一个样品X有n个特征,则可把X看做一个n维列向量,该向量x 称为特征向量,记作 抽取图像特征的目的是为了进行分类,识别图像。也就是说把图像变成n维空间的一个 向量,实际上就是看成n维空间中的一个点,这样有利于从几何上考虑问题,计算时比较方 便 若有一批样品共有N个,每个样品有n个特征,这些数值可以构成一个n行N列的矩 阵,称为原始资料矩阵,见表1-1。 表1-1原始资料矩阵 样品 XI X 符征 x 2N 工, 模式识别问题就是根据X的n个特征来判别模式X属于a1,a2,…,oM类中的哪一类。 待识别的不同类模式都在同一特征空间中考察,不同类物体由于性质上的不同,它们在各自特 征取值范围上有所不同因而在特征空间的不同区域中出现。要记住向量的运算是建立在各 个分量基础之上的。因此,模式识别系统的目标是在特征空间和解释空间之间找到一种映射 关系。特征空间是由从模式得到的对分类有用的度量、属性或基元构成的空间。解释空间由 M个所属类别的集合构成。 如果一个对象的特征观察值为{x1,x2,…,xn},它可构成一个n维的特征向量值x,即 X=(x1,x2,…,xn),式中,x1,x2,…,xn为特征向量x的各个分量。一个特征可以看作n 维空间中的向量或点,此空间称为模式的特征空间Rn。在模式识别过程中,要对许多具体对 象进行测量以获得许多观测值,其中有均值、方差、协方差与协方差矩阵。 1)均值 N个样品的均值可表示为 x=N∑x=( 其中云是第个特征的平均值,元=N∑x2 2)方差 方差用来描述一批数的分散程度,第i个特征的N个数的方差公式是 第1章模式识别的基本概念 (1-2 j=1 方差的平方根称为均方差,, ∑(x-x:) 3)协方差与协方差矩阵 在N个样品中,第i个特征和第j个特征之间的协方差定义为: (ik xi(rk-i 对于同一批样品来说很明显有s;=5 如果一批样品有n个特征x1,x2,…,xn。求出每两个特征的协方差,总共得到n2个值, 将这n2个值排列成以下的n维方阵称为协方差矩阵 S= 协方差矩阵是对称矩阵,而且主对角线元素s就是特征x;的方差s,i=1,2,…,n。 例如有10个学生,其中5个男生,5个女生。对每个学生取身高体重两项指标作为特 征,测得的数据如表12所示。 表1-2学生数据 样品(学生 男生 女生 特征(指标) X X X3 X X X x1(身高/m) 1701.751.651.801.781.601.55 1.651.70 x2(体重/kg 65 65 7060 45 45 55 10个样品的均值为 -10∑x=(1.678,585 男生和女生样品点的均值为 ∑ⅹ:=(1.736,660) x2)=1∑x:=(1.62,51.0)T 特征x1对于仝体样品的方差为 0 [(1.70-1678)2+(175-1.678)2+…+(1.70-1.678)2]=0.00684 特征x1对于男生和女生样品的方差分别为 s(1) [(1.70-1.736)2+(1.75-1.736)2+…+(178-1736)2]=000373 1(2)=x1, (160-1.62)2+(1.55-1.62)2+…+(1.70-1.62)2]=000325 图像模式识别——VC++技术实现 全体样品点中特征x1与x1的协方差s1即s,x1与x2的协方差为 (1.70-1.678)(65-58.5)+(1.75-1.678)(70-58.5)+… 10 (1.70-1.678)(55-58.5)]=0.636 在男生和女生样品点中分别有 512(15~[(170-1736)(65-66)+(1.75-1736)(70-66)+…+ (1.78-1.736)(55-66)]=0.18 12 [(1.60-162)(65-51.0)+(1.55-1.62)(45-51.0)+ (1.70-1.62)(55-51.0)}=0.163 很明显,无论对于哪一批样品点总有S21=12 2.模式识别系统 个典型的模式识别系统如图1-1所示,由数据获取、预处理、特征提取、分类决策及分类 器设计五部分组成。一般分为上下两部分。上半部分完成未知类别模式的分类;下半部分属 于设计分类器的训练过程,利用样品进行训练,确定分类器的具体参数,完成分类器的设计。 而分类决策在识别过程中起作用,对待识别的样品进行分类决策。 一一一一一一一一一 1未知类别模式的分类 数据获取 预处理 特征提取 分类决策 分类结果 训练样本输入 预处理 特征选择 确定判别函最 分类器设计 改进判别函数 误差检验 图1-1模式识别的过程 模式识别系统组成单元功能如下。 ①数据获取。用计算机可以运算的符号来表示所研究的对象,一般获取的数据类型有以 下几种。 ●二维图像:文字、指纹、地图、照片等。 一维波形:脑电图、心电图、季节震动波形等。 物理参量和逻辑值:体温、化验数据、参量正常与否的描述。 ②预处理。对输入测量仪器或其他因素所造成的退化现象进行复原,去噪声,提取有用 信息 ③特征提取。对原始数据进行变换,得到最能反映分类本质的特征。将维数较高的测量 空间(原始数据组成的空间)转变为维数较低的特征空间(分类识别赖以进行的空间)。 ④分类决策。在特征空间中用模式识别方法把被识别对象归为某一类别。 ⑤分类器设计。基本做法是收集样品训练集在此基础上确定判别函数,改进判别函数 第1章模式识别的基本概念 和误差检验 模式识别的关键是解决如何用计算机对样品进行分类。执行模式识别的计算机系统称为 模式识别系统。设计人员按需要设计模式识别系统,而该系统被用来执行模式分类的具体 仟务。 3.統计模式识别主要研究问题 统计模式识别主要研究问题有:特征的选择与优化、分类判别、聚类。 1)特征的选择与优化 如何确定合适的特征空间是设计模式识别系统一个十分重要的问题,对特征空间进行优 化有两种基本方法。一是特征选择,如果所选用的特征空间能使同类物体分布具有紧致性,将 为分类器设计成功提供良好的基础;反之,如果不同类别的样品在该特征空间中混杂在一起, 再好的设计方法也无法提高分类器的准确性。另一种是特征的组合优化,通过一种映射变换 改造原特征空间,构造一个新的精简的特征空间。 2)分类判别 分类判别的前提是已知若干个样品的类别以及每个样品的特征,在此基础上才能对待测 样品进行分类判别。例如,手写阿拉伯数字的判别是一个具有10类的分类问题,由于同一个 数字,不同的人有不同的写法,甚至同一个人刈同一个数字也有多种写法,机器首先要知道大 多数手写数字的形状特征,它们属于哪一类。因此对分类问题需要建立样品库。根据这些样 品库建立判别分类函数,这一过程是由机器来实现的,称为学习过程,然后对一个未知的新对 象分析它的特征,快定它属于哪一类。这是一种监督分类的方法。 3)聚类 聚类分析前提是已知若于对象和它们的特征,但是不知道每个对象属于哪一类,而且事先 并不知道究竟分成多少类,在此基础上用某种相似性度量的方法,把特征相似的归为一类,即 人以类聚,物以群分”。例如,手写了若干个阿拉伯数字把相同的数字归为一类。这是一种 非监督学习的方法。 机器识别也往往倩鉴人的思维活动像人类一样找出待识别物的外形或颜色等特征,进行 分析、判断然后加以分门别类,即识别它们。模式识别的方法很多,很难将其全部概括,也很 难说哪种方法最佳,常常需要枨据实际的情况运用多种方法进行实验,然后选择最佳的分类 方法。 1.2图像识别 模式识别是人工智能领域应用的基础,它利用计算机和光学系统来识别计算机“看到”的 图像信息模拟人的视觉;用计算机和声音传感器来识别计算机接收到的声波信息模拟人的 听觉;用计算机通过压力温度、气体、液体等传感器来识别计算机获得的各种特征信息,模拟 人的触觉和嗅觉等功能。在视觉听觉和触觉的识别中,基于视觉图像识别具有特别重大的意 义。从信息论的角度来看,“图像所包含的信息量最大,内容极为广泛,具体来说可以是各种 物体的黑白或彩色图画、手写字符遥感图片、声波信号Ⅹ射线透视胶片、指纹图案、空间物 体,等等。这些对象可以概括为两个类型,一是有直觉形象的——图片、相片、图案、文字图样 等;一是无直觉形象而只有数据或信号的波形—语言、声音、心电图、地震波等。图像识别目 6 图像模式识别——VC++技术实现 的在于用计算机自动处理某些信息系统,以代替人去完成图像分类及辨识的任务,对图像识别 来说,无论是数据、信号或平面图形,甚至物体,都是除掉与它们各不相同的物理内容考虑对 它们进行“分类”这一共性来研究的。针对这一共性,以统一的观点把同一种共性者归为一类, 另一种共性者归为另一类。例如手写阿拉伯数字就需分为10类,手写英文字母就要分成 26类。 1.图像识别过程 1)图像预处理 为了研究图像内容的识别首先要对获得的图像信息进行预处理,滤去于扰、噪声,当图像 信息微弱无法辨识时,还须对图像进行增强处理,几何调整,颜色校正等,以便人、机分析。 刈于文字信息的处理,在定位和分离之后还需要采用平滑处理细化处理和边界跟踪。平 滑的目的是去掉笔道中孤立的黑点,以及笔道边缘小的凹凸处。细化处理的目的是获得文字 的骨架或轮廓,减少信息量,即将字符的笔道宽度减少为一个模式元素的宽度,这样剩下来的 是原字符的骨架。 例如汽车牌照的识别邮政信件的分拣都需要滤去背景、干扰、噪声等信息,定位分离出 不同的数字,还需要平滑、细化和边缘跟踪检测,这些都属于图像处理的范畴。这一过程输入 是图像,输出也是图像。 2)图像分割 为了从图像中找到需要识别的物体,还要对图像进行分割,也就是定位和分离出不同的待 识别物体。这一过程输入是整幅图像输出是像元图像。 3)图像特征抽取 在需要识别的物体被分割出来的基础上,提取需要的特征,并对某些参数进行计算测量 根据测量结果进行分类。例如,车牌照、邮政信件的数字定位分割之后,对每个数字进行特征 提取。这一过程输入是庞大的信息图像,输出则是少量的特征信息,而且这些特征信息仅仅代 表物体,无法还原回原物体。 4〉图像分类 根据提取的特征值,利用模式识别的方法进行分类,确定类别名称,以便对图像的重要信 息得到一种理解和解释。这一过程输入是特征信息,输出是类别名称。 图像识别过程如图12所示。 图像处理 图做识别 图像输入 团像预处理 图像分制像元图图像特征抽取 特征图像分类 舒 图12图像识别四个主要步骤 第1章模式识别的基本概念 一个汽车车牌识别的全过程如图13所示。 输入图像 去掉背景 定位车牌 分割字符 识别输出 抽取各个字符特征 图13汽车车牌识别过程 由此可见,如果模式识别的任务来源是图像这样的识别系统称为图像识别。 2.图像识别的应用 图像识别广泛应用于机械、冾金、勘探、农业、造林渔业、天文气象、医务、邮电、交通、公 安、财务等部门,以及许多工矿企业中。到目前为止,图像识别受到广泛的重视,世界各国已经 研制成多种名样的自动识别机和有视觉的机器人。这里例举出图像识别在以下方面的应用。 ①机器视觉识别:通过相机捕捉图像,分析图像的描述信息,作为自动化视觉检验或装配 线的自动化。 ②文字和字符识别:信函分拣,文件处理,卡片输入,稿件输入,支票查对,期刊阅读,自动 排版等。 ③图形识别:遥感和航空照片分析,指纹、唇纹和面貌辨认,X光,显微图像,热成象及超 声图像检查等。 ④声音识别:语音识别和鉴定,侦听和机器故障判断等。 ⑤生物医学应用:疾病诊断,癌细胞、白血球、染色体检查,修复手术控制设计等。 (T业应用:产品质量检验,集成电路设计,自动键合,图形设计等。 ⑦预报问题:天气预报,工业烟雾预报,地震预报,经济预报等。 1.3位图基础 1.3.1数字图像的基本概念 计算机内的数字图像通常用由采样点的值所组成的矩阵来表示: f(0,0) f(0,1) f(0,M-1) f(1,0) f(1,1) f(1,M-1) f(N-1,0)f(N-1,1) f(N-1,M-1) 每一个采样单元叫做一个像素(piel),上式中,M,N分别为数宇图像在横纵方向上的 像素总数。图像文件按其数字图像格式的不同一般具有不同的扩展名。最常见的图像格式是 位图格式,其文件名以BMP为扩展名 数字图像的颜色深度表示每一像素的颜色值所占的二进制位数。颜色深度越大则能表示 的颜色数目越多。颜色深度的不同,就产生不同种类的图像文件,在计算机中常使用如下类型 的图像文件。

...展开详情
试读 127P 图像模式识别—VC++技术实现.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    img
    axiqia
    • 分享宗师

      成功上传21个资源即可获取

    关注 私信 TA的资源

    上传资源赚积分,得勋章
    最新推荐
    图像模式识别—VC++技术实现.pdf 41积分/C币 立即下载
    1/127
    图像模式识别—VC++技术实现.pdf第1页
    图像模式识别—VC++技术实现.pdf第2页
    图像模式识别—VC++技术实现.pdf第3页
    图像模式识别—VC++技术实现.pdf第4页
    图像模式识别—VC++技术实现.pdf第5页
    图像模式识别—VC++技术实现.pdf第6页
    图像模式识别—VC++技术实现.pdf第7页
    图像模式识别—VC++技术实现.pdf第8页
    图像模式识别—VC++技术实现.pdf第9页
    图像模式识别—VC++技术实现.pdf第10页
    图像模式识别—VC++技术实现.pdf第11页
    图像模式识别—VC++技术实现.pdf第12页
    图像模式识别—VC++技术实现.pdf第13页
    图像模式识别—VC++技术实现.pdf第14页
    图像模式识别—VC++技术实现.pdf第15页
    图像模式识别—VC++技术实现.pdf第16页
    图像模式识别—VC++技术实现.pdf第17页
    图像模式识别—VC++技术实现.pdf第18页
    图像模式识别—VC++技术实现.pdf第19页
    图像模式识别—VC++技术实现.pdf第20页

    试读已结束,剩余107页未读...

    41积分/C币 立即下载 >