基于内容的视频信息检索(2004年)资源-CSDN文库

自然科学

论文

需积分: 10 39 浏览量 2021-05-13 23:42:53 上传评论收藏 825KB PDF 举报

资源推荐

资源详情

资源评论

２００４年１２月北京广播学院学报（自然科学版）Ｄｅｃｅ畅２００４

第１１卷　第４期ＪＯＵＲＮＡＬＯＦＢＥＩＪＩＮＧＢＲＯＡＤＣＡＳＴＩＮＧＩＮＳＴＩＴＵＴＥＶｏｌ畅１１，Ｎｏ畅４

（ＳＣＩＥＮＣＥＡＮＤＴＥＣＨＮＯＬＯＧＹ）

基于内容的视频信息检索

杨有山，张秀丽

（北京广播电子信息工程系，北京１０００２４）

摘　要：本文从基于内容的视频信息检索技术的优点和系统结构出发，对基于内容的视频检索系统的功能模

块（视频录入、镜头检测、关键帧提取、视频描述、可视化界面）的功能和相关实现技术作了一定的介绍，重点讨

论了与压缩域视频相关的技术。最后提出了进一步研究的问题。

关键词：基于内容的视频信息检索；镜头边缘检测；关键帧提取；特征描述；可视化界面；视频数据库

中图分类号：Ｏ４５１，ＴＮ２　文献标识码：Ａ　文章编号：１００７－８８１９（２００４）０４－００２４－０９

１　引言

随着信息时代的到来，特别是计算机技术和

网络技术的发展，海量的信息在全球被采集、传

输、流通和应用。在这些信息中最大量的就是视

觉信息，这对我们管理视觉信息的方法提出了更

高的要求。

视觉信息有其自身的特点，那就是数据量大，

抽象程度低，所以视觉信息膨胀带来的问题也非

常严重。很多领域由于对大量的视觉信息无法有

效的处理而使采集的视觉信息闲置。由于越来越

多的视觉信息数据库的建立和人们对视觉信息越

来越多的需求，视觉信息的描述和检索已经成为

了当今研究的热点，如何有效的描述视觉信息、如

何实现基于内容的信息检索等一系列问题成为多

媒体信息相关部门努力研究的重点。随着信息化

的进一步深入，基于内容的视频信息检索必将成

为科研人员必须解决的问题之一。

基于内容的视觉信息检索大体上分为两类：

基于内容的图象信息检索和基于内容的视频信息

检索。本文主要对基于内容的视频信息检索技术

进行相关的讨论。

收稿日期：２００４－０４－２０

２　基于内容的视觉信息检索系统

２．１　传统视频检索系统的局限性

传统视频信息管理系统是通过访问字符串属

性的方式查询视频信息。在系统的描述端，使用

相关模型、框架模型、面向目标的模型等表达方

案，用字符串表达与内容无关的原数据。在系统

的查询端使用同样的文字标识符，借助于对视频

的编号通过标签来匹配，使对视频的检索变成了

对标签的检索。下面就是传统视频信息检索系统

的工作框图。

传统视频检索系统的优点是：简单、快速。但

是传统视频检索系统采用单纯基于文本的方式，

所以有其自身难以解决的问题影响着管理方法的

有效性和检索结果的准确性，这主要体现在以下

几个方面。

（１）在传统视频检索系统中，描述的模糊性

是其自身难以克服的先天不足。因为视频信息内

容的丰富性决定了很难用语言标签准确、完整的

描述视频信息的全部内容，这就使得对视频信息

的描述存在很大的模糊性，大大影响了检索结果

的准确性。

４２

　　（２）文字描述是对视频信息的一种特定的抽

象，这就要求描述方法要符合一定的标准，这也就

增加了文字描述的不确定性，因为如果描述标准

改变了，那么视频描述标签也得重新制作才能适

应新的查询要求，也就是特定的标签只符合特定

的查询要求。

（３）随着人们对信息依赖性的加强，人们对

视频资料中包含的具体信息的需求也越来越多。

传统的对视频的描述都是通过手工注释完成的，

所以说如果采用传统的描述方式，那么越来越多

的重复劳动是不可避免的，这样不仅浪费了大量

的人力、物力，而且观察者在疲劳的状态下工作的

准确性也会大大降低。

图１　传统的视频检索系统工作框图

　　（４）由于文字标签都是通过观察者选定后加

在视频标签上的，因此视频描述很大程度上受到

主观因素的影响，不同的观察者或同一个观察者

在不同的条件下对同一幅图像会给出不同的描

述，有时这种差异会很大。因而传统的描述方法

不够客观，在没有统一标准的时候有可能会自相

矛盾。

在这里必须强调一点，以上的内容只是在讨

论传统描述方法（也就是基于文本的描述方法）的

局限性，并不是说文本描述是错误的、在基于内容

的视频描述方案中是没有用处的。恰恰相反，在

基于内容的视频信息描述中，文本描述是重要的

描述部分。在ＭＰＥＧ－７标准中，文本描述作为

高级描述符的一部分被重点定义。因为对于任何

一种描述方式，视频资料的基本信息（如：片名、导

演、主演、出场日期、制片厂、发行商等）是必不可

少的，任何一种描述系统都不可能自动地将这些

基本信息提取出来，这些信息必须由观察者为视

频资料制作标签。所以说，基于内容的视频信息

描述方案并不是放弃了传统的文本描述方式，而

是最大限度的减少具有极强主观性的文本标签

项，并在描述方案中加入低级语义描述子（低级语

义描述子是ＭＥＰＧ－７标准中的概念，它包括视

频文件的帧数、运动性、摄像机运动，关键帧的直

方图、纹理、轮廓等一系列视频信息的客观特征描

述）使描述系统能够客观、准确、全面的描述视频

信息。

２．２　新一代的视频检索系统

为了克服传统检索方式的局限性，新一代基

于内容的视频检索系统正在被人们广泛的研究并

实际应用。下图是基于内容的视频检索系统的工

作框图。

图２　基于内容的视频检索系统工作框图

　　基于内容的视频检索就是指根据视频的内容及上下文关系，对大规模视频数据库中的视频数

５２

第４期　杨有山等：基于内容的视频信息检索　　　

剩余8页未读，继续阅读

评论收藏

内容反馈

weixin_38552239

粉丝: 13
资源: 955

基于内容的视频信息检索 (2004年)

最新资源

基于内容的视频信息检索 (2004年)

基于内容的视觉信息检索

基于内容的视觉信息检索综述

ImageLocationEstimation:用于估计项目（通常是图像或视频）的地理位置（经纬度）的软件。 它基于文本元数据，并利用语言建模方法进行信息检索。 用于 MedialEval 放置任务

findkit：一个用于基于内容的信息检索的Python库

电信设备-基于抽取视频关键逻辑信息检索视频的方法及系统.zip

基于FTP的网络视频检索与播放软件设计 (2004年)

压缩域DCT系数对图像视频检索影响的研究 (2004年)

A Hybrid Movie Recommender System Based on Neural Networks

电信设备-基于内容的遥感图像变化检测信息检索方法.zip

LIRE:开源库，用于基于内容的图像检索，视觉信息检索

基于内容的卫星云图处理与信息检索技术研究

基于深度学习的视频敏感信息检索的研究.pdf

ssim.rar_图像 姿态_图像自相似性_目标检测_自相似性_视频相似检测

基于sift的简化算法下图像快速匹配.docx

基于P2P的在线流媒体服务系统

基于SIFT算法的影像匹配精度评价研究

数据库系统工程师-2004-2007真题

RSS案例视频,RSS阅读器

基于等效直方图的Swift模板匹配

“学习支撑系统”信息化需求报告

sift camshift视频中的目标检测 程序与论文

云计算下协作标注系统中用户标注机制探讨.pdf

最新资源

ImageLocationEstimation:用于估计项目（通常是图像或视频）的地理位置（经纬度）的软件。它基于文本元数据，并利用语言建模方法进行信息检索。用于 MedialEval 放置任务

ssim.rar_图像姿态_图像自相似性_目标检测_自相似性_视频相似检测

sift camshift视频中的目标检测程序与论文