收稿日期: 2007唱03唱07; 修回日期: 2007唱05唱29 基金项目: 国家自然科学基金资助项目(70473067)
作者简介:孙吉红(1971唱) ,女,山东莱州人,副教授,博士研究生,主要研究方向为信息检索、信息挖掘( sunjh263@sohu.com) ;刘伟成(1971唱) ,
男,图书馆副馆长,讲师,博士,主要研究方向为信息检索、信息服务系统;焦玉英(1942唱) ,女,教授,博导,主要研究方向为信息检索、咨询服务.
多 媒 体 信 息 检 索 研 究 与 展 望
倡
孙吉红
1,2
, 刘伟成
3
, 焦玉英
2
(1.山东轻工业学院 信息科学与技术学院, 济南 250353; 2.武汉大学 信息管理学院, 武汉 430072; 3.武汉科
技大学 管理学院, 武汉 430081)
摘 要: 对近几年在多媒体信息检索领域的研究成果进行分析,总结了多媒体信息检索的研究现状,指出了该
研究领域的发展方向,最后提出了多媒体信息检索技术研究面临的挑战。
关键词: 多媒体; 信息检索; 检索技术; 系统评价
中图分类号: TP37; TP391畅3 文献标志码: A 文章编号: 1001唱3695(2008)03唱0646唱04
Research and prospect on multimedia information retrieval
SUN Ji唱hong
1,2
, LIU Wei唱cheng
3
, JIAO Yu唱ying
2
(1.School of Information Science & Technology, Shandong Institute of Light Industry, Jinan 250353, China; 2.School of Information Manage唱
ment, Wuhan University, Wuhan 430072, China; 3.School of Management, Wuhan University of Science & Technology, Wuhan 430081,
China)
Abstract: The paper summarized the current research of the multimedia information retrieval and pointed out the development
trend.And gave the challenges that the research on the technologies of the multimedia information retrieval is facing.
Key words: multimedia; information retrieval; retrieval technology; system evaluation
多媒体信息检索(multimedia information retrieval, MIR) 最
早是基于计算机视觉算法的。 该算法重点是对图像、视频、音
频进行基于特征的相似度搜索。 比较流行的 MIR 系统是出现
于 20 世纪 90 年代中期的 QBIC 和 Virage;几年以后,相似度搜
索的基本概念便被应用到几种 Internet 图像搜索引擎中,包括
Webseek 和 Webseer 系统。 其更大的影响是将基于特征的相
似度搜索直接聚合到企业层数据库( 如 Informix DataBlades、
IBM DB2 Extenders、Oracle Cartridges)。
在当今数字化与网络化时代,多媒体日益成为互联网信息
高速公路上传送数据的主要部分。 多学科的相互融合和交叉
以及科学、艺术和文化的彼此渗透更促使了 MIR 的发展。 因
此,MIR 的研究成为信息检索研究领域中的热点。
当前有几个学术会议专门讨论 MIR 领域的课题。 其中包
括 MIR 方面的 ACM SIGMM 学术讨论会( ACM SIGMM Work唱
shop)(http: //www.liacs.nl/~mir) 和图像视频检索方面的国
际会议( International Conference on Image and Video Retrieval)
(http: //www.civr.org)。 关于可搜索 MIR 图书馆研究的组织
有多媒体 搜索 检索 联 合会 ( Association for Multimedia Search
and Retrieval)( http://www.amsr.org)。 除此之外,一般的多媒
体会议也涉足到了与 MIR 有关的问题。
1 多媒体信息检索研究现状
当前的 MIR 系统存在极大的局限性,如无法了解更多用
户的词汇用语和用户的满意度,还没有典型可靠的真实测试集
对系统进行评价或对系统进行基准调试( 这显然与用户的满
意度相关)。 总之,由于不能消除计算机和人类之间的语义鸿
沟,当前的系统还不能对社会产生巨大的影响。
现在流行的研究课题的目标是通过消除语义鸿沟来提高
多媒体检索的效率,包括新特征、新媒体、评价/基准、浏览和摘
要等。
1畅1 新特征和相似度量
目前的研究不仅在改善搜索算法方面展开,而且开始向产
生基于颜色、纹理和形状的新特征和相似度量方面进行。 例如
NF、RGB 和 m 颜色空间等新颜色特征在照明不变性、直观性
和感知均匀性等领域都得以深入研究和充分应用。 对于视频
和音频,则向视频和音频内容分析方面开展研究。
近十年内,人们对图像匹配及其结构进行了大量的研究。
在纹理理解方面,Ojala 等人
[1]
发现将简单的纹理柱状图组合
到一起,其性能优于如马尔可夫特征的传统纹理模型;Jafari唱
Khouzani 等人
[2]
提出一种基于 Radon 变换方向的新的纹理特
征(Radon 变换方向具有旋转不变式的重要优点);Veltkamp 等
人
[3 ]
从计算几何角度对艺术级的形状匹配进行了描述;Sebas唱
tian 等人
[4]
提出 了采 用 振 动 曲线 图 进 行 形状 识 别 的 方法。
Foote
[5]
介绍了一种针对基于局部自相似度的音频特征,这种
特征的重要优点是能被计算出任何音频信号,并且它在各种各
样的音频分割和检索应用中都有良好作用。 Bakker 和 Lew
[6]
提出了几种新的音频特征,称为频谱微分和微分交换率。 他们
在讲话、音乐、乐器、汽车、爆炸或安静等声音样本自动标记的
环境中对这些新音频特征进行了评价,并达到了预期的效果。
对各种新特征来说,同等重要的是决定它们之间相似度的
方法。 Sebe 等人
[7]
对假定一个训练集如何得到一个最佳相似
度量作了论述。 他们发现距离平方和是最差的相似度量,
而柯
第 25 卷第 3 期
2008 年 3 月
计 算 机 应 用 研 究
Application Research of Computers
Vol.25 No.3
Mar.2008
评论0
最新资源