没有合适的资源?快使用搜索试试~ 我知道了~
基于内容的图像检索CBIR HOUGH
4星 · 超过85%的资源 需积分: 10 43 下载量 18 浏览量
2009-02-18
22:16:56
上传
评论
收藏 563KB DOC 举报
温馨提示
试读
18页
伴随网络时代数字家庭概念的产生,20世纪90年代多媒体硬件和软件技术得到迅速发展,多媒体已广泛地应用于多个领域,如公共信息业、广告、教育、医学、商业及娱乐等。可获取的图像等多媒体数据急剧增长。如何组织、表达、存储、管理、查询和检索这些海量的数据,是对传统数据库技术的一个重大挑战[1]。由于图像具有形象、直观、内容丰富等特点,接近人们的认知方式,成为不可或缺的多媒体内容。如果没有对图像等多媒体数据有效存储、检索的方法,大量信息将淹没在数据的海洋之中,而无法被人们识别和利用。因此,如何将数字图像处理、模式识别技术、计算机视觉技术与传统数据库技术结合起来,建立高效的图像检索机制成为迫切需要解决的问题。
资源推荐
资源详情
资源评论
<<地理信息科学进展>><<空间认知与空间模型>>课程报告
基于内容的图像检索综述
1. 前言
伴随网络时代数字家庭概念的产生,20世纪90年代多媒体硬件和软件技术得到迅速发
展,多媒体已广泛地应用于多个领域,如公共信息业、广告、教育、医学、商业及娱乐等。
可获取的图像等多媒体数据急剧增长。如何组织、表达、存储、管理、查询和检索这些海
量的数据,是对传统数据库技术的一个重大挑战
[1]
。由于图像具有形象、直观、内容丰富
等特点,接近人们的认知方式,成为不可或缺的多媒体内容。如果没有对图像等多媒体数
据有效存储、检索的方法,大量信息将淹没在数据的海洋之中,而无法被人们识别和利用。
因此,如何将数字图像处理、模式识别技术、计算机视觉技术与传统数据库技术结合起来,
建立高效的图像检索机制成为迫切需要解决的问题。
2. 图像检索概述
图像检索的本质是对图像特征的提取与基于特征的匹配技术,图像的特征包括图像的
文本特征、视觉特征,所谓图像的文本特征是指与图像相关的文本信息,比如图像的名称、
对图像的注解文字等,而目前比较成熟应用于网络环境下的图像检索系统比如Google、百
度等均属于这类。图像的视觉特征是指图像本身所拥有的视觉信息,又可以进一步分为通
用的视觉特征和领域特征,如颜色、纹理、形状等属于图像通用特征,而光谱特征则属于
地理科学中遥感影像独有的特征。
从发展演变历程来看,根据图像检索系统所提取图像特征可分为两类,第一类即基于
图像文本特征的检索,TBIR,第二类即基于图像视觉特征的内容检索,CBIR。
传统的TBIR技术应用于早期的图像检索,其研究主要在数据库领域中进行,首先对图
像用文本进行手工注解,然后用基于文本的数据库管理系统进行检索。这种方法实现容易
被广泛应用,但是它依赖于人对图像的注解,当图像数量急剧增大时,人工注解的方法所
<<地理信息科学进展>><<空间认知与空间模型>>课程报告
需工作量太大,而且不同人对同一幅图像的理解角度也是不同的,注解的主观性导致检索
的查全率偏低。
90年代以来,基于内容的检索成为一个研究热点,它是直接根据图像内部的各种物理
特征,在数据库中检索具有相似特征的图像。
基于内容图像检索与传统的基于文本检索方式相比,具有如下特点
[2]
:
(1)突破了关键词检索基于文本特征的局限,直接从媒体内容中提取特征线索。
(2)检索方式多种多样。基于内容的图像检索可以提供浏览方式、基于实例的检索方
式以及基于草图的检索方式等等。
(3)人机交互式检索。基于内容的图像检索系统通常采用参数调整方法、聚类分析方
法、概率学习方法和神经网络方法等,通过人机交互的方式来捕捉和建立图像低层特征和
高层语义之间的关联,即相关反馈技术。
(4)相似性匹配检索:基于内容的检索是按照一定的匹配算法将输入图像的特征与特
征库中的特征元数据进行相似性匹配,将满足一定相似性的一组初始结果按照相似度大小
排列,提供给用户。
尽管CBIR相对于TBIR有了很大进步,但是这种基于机器对图像各种特征的理解在某
些场景中不能替代基于文本的描述,比如一幅图像下面可能蕴含着某种寓意或者一个事件,
但是单纯从内容是无法获取这一切的,如果能将对图像的注解应用于基于内容的检索,无
疑将极大的提高检索查准率。
在Internet环境下,MPEG专家组制定了一个基于内容的多媒体描述方案,即MPEG-7
[3]
标准,对各种不同类型的多媒体信息内容的描述方式进行了标准化定义,从而实现CBIR与
TBIR的互连。
3. 基于内容的图像检索
图像的内容包括图像的视觉信息等物理特征,还包括视觉特征所带来的高层语义特征。
物理特征属于低层视觉信息,主要包括颜色、纹理、形状;语义信息属于图像的高层视觉
信息,主要包括对象、空间关系、场景、行为、情感等图像内容。
基于内容的图像检索的目的一般可为三类:(1)准确查询,找出一致的复制件;
(2)范围查询,找出与输入图像特征相差在一定范围内的图像;(3)K-最近邻查询,根
据输入图像与待检测图像的相似度对检索结果进行排序
[2]
。
<<地理信息科学进展>><<空间认知与空间模型>>课程报告
3.1 CBIR 的应用
对图像内容检索的研究起步于二十世纪80年代,到了网络技术逐渐普及的90年代才取
得较大的突破,多种成果开始转化为应用技术,而日益增长的应用需求反过来推动其研究
向更高的层次发展。如下领域开始应用和驱动图像检索技术的发展。
防止犯罪等司法部门
应用人脸识别技术,根据专家对犯罪嫌疑人的头像特征的描绘图像,定位犯罪人的
真实面目。
军事领域
可以用于武器的精确制导,通过实时获取的图像信息,对其进行解译,保证打击的
准确性。
版权保护领域
针对商标与设计专利类的图像进行检索,防止专利纠纷的产生。
建筑和工程设计
通过对建筑及工程设计物体的图像检索,可以聚类相同风格特色的建筑及工程设计
产品。
广告业、艺术设计
应用图像检索,可以找到需要的各种素材,进行艺术设计的再创造。
医学领域
对各种医学透视CT图像进行检索,可以快速定位类似病例,及时快速的帮助病人
找到病因,会对临床、医学研究、远程医疗、异地会诊乃至医学教育等方面产生积极和
深远的影响。
古生物学、考古学
通过对古生物化石图像的解释,确定古生物所属类型等信息,便于发现新的物种;
应用于古文物的图像检索,通过对比,签定文物的真伪、所属历史时期等。
地理信息系统和遥感
对遥感图像的检索,主要是解译影像数据中的建筑、村庄、耕地等不同种类地物信
息,制作实时、准确、逼真效果的专题图件,应用于地理信息系统中矢量处理模块。
安全技术
应用指纹、眼膜识别技术,对用户的指纹或者眼膜提取图像特征进行匹配,鉴定用
<<地理信息科学进展>><<空间认知与空间模型>>课程报告
户真实身份。
3.2 CBIR 的基本原理
CBIR的基本原理形式化定义:任给定一个检索图像示例P,计算其特征向量
F=(F
1
,F
2
,F
3
,…F
n
),其中F
i
为图像的第i种特征;根据F检索图像特征索引库,得到与F距
离最小的特征向量F
’
,则F
’
所对应的图像P
’
即为与P最相似的检索结果
[1]
。CBIR系统典型的
架构如下所示。
系统主要包括用户界面、检索和存储系统三部分,其中图像特征索引技术和相似度匹
配技术是系统的核心部分,直接影响着系统检索的查全率和查准率。其中检索和存储系统
都要对原始图像进行特征向量计算,不同之处在于索引库的生成采用离线方式,而查询检
索部分需要实时在线计算。匹配度的计算将决定检索结果的产生以及结果的排序,因此也
具有十分重要的意义。
除此之外,图像检索一般不是一蹴而就的过程,中间需要用户的干预和交互,应用反
馈模型可以增强系统的理解能力,从而提高查准率。
3.3 图像内容的索引表示方法
3.3.1 低层图像特征
特征向量计算 相似度匹配
数字图像
对象特征索引库
原始图像库
检索结果
剩余17页未读,继续阅读
资源评论
- zhutoulwz2013-01-04还可以,挺好用的
- 微风嬉笑2014-07-07还行吧,评价的有点儿晚~
- jjxsh_tju2013-11-28图象检索方面的算法
- army_hg2015-04-14不错的代码,不过功能还是简单了点。
the_second123
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功