人们常说:眼睛是心灵的窗户,通过眼睛人们可以轻易地交流情感,眼睛也是与外
人们可以很容易“看到”一幅画,但这一“简单”过程并不如此简单,大致上它可以分
为以下几个阶段:首先是通过眼睛将图成像在视网膜上;其次大脑对图像进行理解;最
后根据处理的结果做出反应。用比较专业一点的语言来描述,该过程包括了识别、描述
与理解三个层次;这其中还隐含了边缘检测(各物体的轮廓等)、图像的分割(各物体
区域的划分)等阶段。以上实际上概述了视觉系统的三个层次,即低层阶段:基于图像
特征提取及分割阶段;中层阶段:基于物体的几何模型与图像特性表达阶段;高层阶段:
基于景物知识的描述、识别与理解阶段,这是根据先验知识介入的程度划分的,且实现
起来也越来越困难。
毫无疑问,如何人工实现这一过程是极具挑战性和应用前景的一项工作,计算机视
觉也因此而应运而生。计算机视觉是研究用计算机和成像设备来模拟人和生物视觉系统
功能的技术学科,其目标是从图像或图像序列中获取对外部世界的认知和理解,即利用
二维图像恢复三维环境中物体的几何信息,比如形状、位置、姿态、运动等,并能描述、
识别与理解。
计算机视觉的基础是各种成像设备,例如 CCD(Charge Coupled Device )摄像机
(数码相机属于此类型)、红外摄像机、医学上常用的核磁共振成像、X 射线成像等,
这些设备不仅可以成像,还可以获取比人眼更丰富的图像,人们可以形象地把摄像机看
成计算机视觉的视网膜部分。可以说从人类拍摄出第一幅图像开始,就为计算机视觉的
诞生奠定了基础。
而计算机视觉的核心是数字电子计算机,其发展可谓突飞猛进,在计算和存储能力
上,人脑已经无法与之相比,人们的目标就是利用计算机非凡的计算处理能力来代替人
脑实现对图像的理解,而计算机日新月异的发展也使得这一愿望越来越成为可能。
用于指导“计算机”这个大脑运作的核心是计算机视觉的理论方法,计算机视觉使用
的理论方法主要基于几何、概率和运动学计算与三维重构的视觉计算理论,它的基础包
括射影几何学、刚体运动力学、概率论与随机过程、图像处理、人工智能等理论。 在
20 世纪 70 年代,视觉研究大多采用模式识别的方法;80 年代,开始采用空间几何的
方法以及物理知识进行视觉研究;90 年代以后,随着智能机器人视觉研究的发展,引
入了许多新的理论与技术如主动视觉理论、不变量理论、融合技术等,并应用于许多计
算机视觉系统中。
研究计算机视觉,不得不提的是英国已故科学家戴维·马尔(David Marr),他在
计算机视觉发展史上可谓写下了浓重的一笔。在 20 世纪 70 年代末,他提出了第一个
评论0
最新资源