没有合适的资源?快使用搜索试试~ 我知道了~
计算机视觉与计算机图形学
1 下载量 149 浏览量
2022-10-28
01:15:19
上传
评论
收藏 1.09MB PDF 举报
温馨提示
试读
16页
计算机视觉与计算机图形学
资源详情
资源评论
资源推荐
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代
替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为更
适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和
技术,试图建立能够从图像或者多维数据中获取„信息‟的人工智能系统。这里所 指的信息
指 Shannon 定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号
中提 取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中 “感
知”的科学。
定义
计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对
采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所
做的那样。 计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领
域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研
究之中。其中包括计算机科学 和工程、信号处理 、物理学、应用数学和统计学,神经生理
学和认知科学 等。
解析
视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种
智能 /自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国 把对计
算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重
大挑战(grand challenge)。计算机视觉的挑战是要为计算机和机器人 开发具有与人类水平
相当的视觉能力。机器视觉 需要图象信号,纹理 和颜色建模,几何处理和推理,以及物体
建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。作为一门学科,计
算机视觉开始于 60 年代初,但在计算机视觉的基本研究中的许多重要进展是在 80 年代取得
的。计算机视觉与人类视觉密切相关,对人类视觉有一个正确的认识将对计算机视觉的研究
非常有益。为此我们将先介绍人类视觉。 人类正在进入信息时代,计算机将越来越广
泛地进入几乎所有领域。一方面是更多未经计算机专业训练的人也需要应用计算机,而另一
方面是计算机的功能越来越强,使用方法越来越复杂。这就使人在进行交谈和通讯时的灵活
性与目前在使用计算机时所要求的严格和死板之间产生了尖锐的矛盾。人可通过视觉和听
觉,语言与外界交换信息,并且可用不同的方式表示相同的含义,而目前的计算机却要求严
格按照各种程序语言来编写程序,只有这样计算机才能运行。为使更多的人能使用复杂的计
算机,必须改变过去的那种让人来适应计算机,来死记硬背计算机的使用规则的情况。而是
反过来让计算机来适应人的习惯和要求,以人所习惯的方式与人进行信息交换,也就是让计
算机具有视觉、听觉和说话等能力。这时计算机必须具有逻辑推理和决策的能力。具有上述
能力的计算机就是智能计算机 。 智能计算机不但使计算机更便于为人们所使用,同时
如果用这样的计算机来控制各种自动化装置特别是智能机器人 ,就可以使这些自动化系统
和智能机器人具有适应环境,和自主作出决策的能力。这就可以在各种场合取代人的繁重工
作,或代替人到各种危险和恶劣环境中完成任务。
原理
计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑
完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解
世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目
标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种
程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导
航,目前还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,目
前人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视
觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替 人脑 的作用,但
并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而且应该根
据计算机系统 的特点来进行视觉信息的处理。但是,人类视觉系统 是迄今为止,人们所知
道的功能最强大和 完善的视觉系统。如在以下的章节中会看到的那样,对人类视觉处理机
制的研究将给计算机视觉的研究提供启发和指导。因此,用计算机信息处理的方法研究人类
视觉的机理,建立人类视觉的计算理论,也是一个非常重要和信人感兴趣的研究领域。这方
面的研究被称为计算视觉(Computational Vision)。计算视觉可被认为是计算机视觉中的一
个研究领域。
相关
有不少学科的研究目标与计算机视觉相近或与此有关。这些学科中包括图象处理、 模
式识别 或图象识别、景物分析、图象理解等。由于历史发展或领域本身的特点这些学科互
有差别,但又有某种程度的相互重迭。
图象处理
图象处理技术把输入图象转换成具有所希望特性的另一幅图象。例如,可通过处理使输
出图象有较高的信-噪比,或通过增强处理突出图象的细节,以便于操作员的检验。在计算
机视觉研究中经常利用图象处理技术进行预处理和特征抽取 。
模式识别
模式识别技术 根据从图象抽取的统计特性或结构信息,把图象分成予定的类别。例如,
文字识别或指纹识别 。在计算机视觉中模式识别技术经常用于对图象中的某些部分,例如
分割区域的识别和分类。
图象理解
给定一幅图象,图象理解程序不仅描述图象本身,而且描述和解释图象所代表的景物,
以便对图象代表的内容作出决定。在人工智能 视觉研究的初期经常使用景物分析这个术语,
以强调二维图象与三维景物之间的区别。图象理解除了需要复杂的图象处理以外还需要具有
关于景物成象的物理规律的知识以及与景物内容有关的知识。 在建立计算机视觉系统
时需要用到上述学科中的有关技术,但计算机视觉研究的内容要比这些学科更为广泛。计算
机视觉的研究与人类视觉的研究密切相关。为实现建立与人的视觉系统相类似的通用计算机
视觉系统的目标需要建立人类视觉的计算机理论。
现状
计算机视觉领域的突出特点是其多样性与不完善性。这一领域的先驱可追溯到更早的时
候,但是直到 20 世纪 70 年代后期,当计算机的性能提高到足以处理诸如图像这样的大规模
数据时,计算机视觉才得到了正式的关注和发展。然而这些发展往往起源于其他不同领域的
需要,因而何谓“计算机视觉问题”始终没有得到正式定义,很自然地, “计算机视觉问题 ”
应当被如何解决也没有成型的公式。 尽管如此,人们已开始掌握部分解决具体计算机
视觉任务的方法,可惜这些方法通常都仅适用于一群狭隘的目标(如:脸孔、 指纹 、文字
等),因而无法被广泛地应用于不同场合。 对这些方法的应用通常作为某些解决复杂问
题的大规模系统 的一个组成部分(例如医学图像的处理,工业制造中的质量控制与测量)。
在计算机视觉的大多数实际应用当中,计算机被预设为解决特定的任务,然而基于 机器学
习的方法正日渐普及,一旦机器学习的研究进一步发展,未来“泛用型”的电脑视觉应用或许
可以成真。 人工智能所研究的一个主要问题是:如何让系统具备“计划”和“决策能力”?
从而使之完成特定的技术动作(例如:移动一个机器人通过某种特定环境)。这一问题便与
计算机视觉问题息息相关。在这里,计算机视觉系统作为一个感知器,为决策提供信息。另
外一些研究方向包括模式识别和机器学习(这也隶属于人工智能领域,但与计算机视觉有着
重要联系),也由此,计算机视觉时常被看作人工智能与计算机科学的一个分支。 物理
是与计算机视觉有着重要联系的另一领域。 计算机视觉关注的目标在于充分理解电磁
波——主要是可见光与红外线部分——遇到物体表面被反射所形成的图像,而这一过程便是
基于光学物理和固态物理,一些尖端的图像感知系统甚至会应用到量子力学理论,来解析影
像所表示的真实世界。同时,物理学中的很多测量难题也可以通过计算机视觉得到解决,例
如流体运动。也由此,计算机视觉同样可以被看作是物理学的拓展。 另一个具有重要
意义的领域是神经生物学,尤其是其中生物视觉系统的部分。 在整个 20 世纪中,人类
对各种动物的眼睛、神经元、以及与视觉刺激相关的脑部组织都进行了广泛研究,这些研究
得出了一些有关“天然的”视觉系统如何运作的描述(尽管仍略嫌粗略),这也形成了计算机
视觉中的一个子领域——人们试图建立人工系统,使之在不同的复杂程度上模拟生物的视觉
运作。同时计算机视觉领域中,一些基于机器学习的方法也有参考部分生物机制。 计
算机视觉的另一个相关领域是信号处理。很多有关单元变量信号的处理方法,尤其对是时变
信号的处理,都可以很自然的被扩展为计算机视觉中对二元变量信号或者多元变量信号的处
理方法。但由于图像数据的特有属性,很多计算机视觉中发展起来的方法,在单元信号的处
理方法中却找不到对应版本。这类方法的一个主要特征,便是他们的非线性以及图像信息的
多维性,以上二点作为计算机视觉的一部分,在信号处理学中形成了一个特殊的研究方向。
除了上面提到的领域,很多研究课题同样可被当作纯粹的数学问题。例如,计算机视觉中的
很多问题,其理论基础便是统计学,最优化理论以及几何学。 如何使既有方法通过各
种软硬件实现,或说如何对这些方法加以修改,而使之获得合理的执行速度而又不损失足够
精度,是现今电脑视觉领域的主要课题。
用途
人类正在进入信息时代,计算机将越来越广泛地进入几乎所有领域。一方面是更多未经
计算机专业训练的人也需要应用计算机,而另一方面是计算机的功能越来越强,使用方法越
来越复杂。这就使人在进行交谈和通讯时的灵活性与目前在使用计算机时所要求的严格和死
板之间产生了尖锐的矛盾。人可通过视觉和听觉,语言与外界交换信息,并且可用不同的方
式表示相同的含义,而目前的计算机却要求严格按照各种程序语言来编写程序,只有这样计
算机才能运行。为使更多的人能使用复杂的计算机,必须改变过去的那种让人来适应计算机,
来死记硬背计算机的使用规则的情况。而是反过来让计算机来适应人的习惯和要求,以人所
习惯的方式与人进行信息交换,也就是让计算机具有视觉、听觉和说话等能力。这时计算机
必须具有逻辑推理和决策的能力。具有上述能力的计算机就是智能计算机。 智能计算
机不但使计算机更便于为人们所使用,同时如果用这样的计算机来控制各种自动化装置特别
是智能机器人,就可以使这些自动化系统和智能机器人具有适应环境,和自主作出决策的能
力。这就可以在各种场合取代人的繁重工作,或代替人到各种危险和恶劣环境中完成任务。
计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成
处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世
界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标
以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程
度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,
目前还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,目前人
们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅
助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意
味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而且应该根据计算
机系统的特点来进行视觉信息的处理。但是,人类视觉系统是迄今为止,人们所知道的功能
最强大和完善的视觉系统。如在以下的章节中会看到的那样,对人类视觉处理机制的研究将
给计算机视觉的研究提供启发和指导。因此,用计算机信息处理的方法研究人类视觉的机理,
建立人类视觉的计算理论,也是一个非常重要和信人感兴趣的研究领域。这方面的研究被称
为计算视觉(Computational Vision)。计算视觉可被认为是计算机视觉中的一个研究领域。
异同
计算机视觉,图象处理,图像分析 ,机器人视觉和机器视觉是彼此紧密关联的学科。
如果你翻开带有上面这些名字的教材,你会发现在技术和应用领域上他们都有着相当大部分
的重叠。这表明这些学科的基础理论 大致是相同的,甚至让人怀疑他们是同一学科被冠以
不同的名称。 然而,各研究机构,学术期刊,会议及公司往往把自己特别的归为其中
某一个领域,于是各种各样的用来区分这些学科的特征便被提了出来。下面将给出一种区分
方法,尽管并不能说这一区分方法完全准确。 计算机视觉的研究对象主要是映射到单
幅或多幅图像上的三维场景,例如三维场景的重建。计算机视觉的研究很大程度上针对图像
的内容。 图象处理与图像分析的研究对象主要是二维图像,实现图像的转化,尤其针
对像素 级的操作,例如提高图像对比度,边缘提取,去噪声和几何变换如图像旋转 。这一
特征表明无论是图像处理 还是图像分析其研究内容都和图像的具体内容无关。 机器视
觉主要是指工业领域的视觉研究,例如自主机器人 的视觉,用于检测和测量的视觉。这表
明在这一领域通过软件 硬件,图像感知与控制理论往往与图像处理得到紧密结合来实现高
效的机器人控制或各种实时操作。 模式识别使用各种方法从信号中提取信息,主要运
用统计学的理论。此领域的一个主要方向便是从图像数据中提取信息。 还有一个领域
被称为成像技术。这一领域最初的研究内容主要是制作图像,但有时也涉及到图像分析和处
理。例如,医学成像就包含大量的医学领域的图像分析。 对于所有这些领域,一个可
能的过程是你在计算机视觉的实验室工作,工作中从事着图象处理,最终解决了机器视觉领
域的问题,然后把自己的成果发表在了模式识别的会议上。
问题
几乎在每个计算机视觉技术的具体应用都要解决一系列相同的问题。这些经典的问题包
括:
识别
一个计算机视觉,图像处理和机器 视觉所共有的经典问题便是判定一组图像数据中是
否包含某个特定的物体,图像特征或运动状态。这一问题通常可以通过机器自动解决,但是
剩余15页未读,继续阅读
复杂的程序猿
- 粉丝: 2
- 资源: 271
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0