没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
2004 年 12 月 北京广播学院学报(自然科学版) Dece畅2004
第 11 卷 第 4 期 JOURNAL OF BEIJING BROADCASTING INST IT U TE Vol畅11 ,No畅4
(SCIENCE AND TECHNOLOGY )
基 于 内 容 的 视 频 信 息 检 索
杨有山 ,张秀丽
(北京广播电子信息工程系 ,北京 100024)
摘 要 :本文从基于内容的视频信息检索技术的优点和系统结构出发 ,对基于内容的视频检索系统的功能模
块(视频录入 、镜头检测 、关键帧提取 、视频描述 、可视化界面)的功能和相关实现技术作了一定的介绍 ,重点讨
论了与压缩域视频相关的技术 。 最后提出了进一步研究的问题 。
关键词 :基于内容的视频信息检索 ;镜头边缘检测 ;关键帧提取 ;特征描述 ;可视化界面 ;视频数据库
中图分类号 :O451 ,TN2 文献标识码 :A 文章编号 :1007 - 8819(2004)04 - 0024 - 09
1 引言
随着信息时代的到来 ,特别是计算机技术和
网络技术的发展 ,海量的信息在全球被采集 、传
输 、流通和应用 。 在这些信息中最大量的就是视
觉信息 ,这对我们管理视觉信息的方法提出了更
高的要求 。
视觉信息有其自身的特点 ,那就是数据量大 ,
抽象程度低 ,所以视觉信息膨胀带来的问题也非
常严重 。 很多领域由于对大量的视觉信息无法有
效的处理而使采集的视觉信息闲置 。 由于越来越
多的视觉信息数据库的建立和人们对视觉信息越
来越多的需求 ,视觉信息的描述和检索已经成为
了当今研究的热点 ,如何有效的描述视觉信息 、如
何实现基于内容的信息检索等一系列问题成为多
媒体信息相关部门努力研究的重点 。 随着信息化
的进一步深入 ,基于内容的视频信息检索必将成
为科研人员必须解决的问题之一 。
基于内容的视觉信息检索大体上分为两类 :
基于内容的图象信息检索和基于内容的视频信息
检索 。 本文主要对基于内容的视频信息检索技术
进行相关的讨论 。
收稿日期 :2004 - 04 - 20
2 基于内容的视觉信息检索系统
2 .1 传统视频检索系统的局限性
传统视频信息管理系统是通过访问字符串属
性的方式查询视频信息 。 在系统的描述端 ,使用
相关模型 、框架模型 、面向目标的模型等表达方
案 ,用字符串表达与内容无关的原数据 。 在系统
的查询端使用同样的文字标识符 ,借助于对视频
的编号通过标签来匹配 ,使对视频的检索变成了
对标签的检索 。 下面就是传统视频信息检索系统
的工作框图 。
传统视频检索系统的优点是 :简单 、快速 。 但
是传统视频检索系统采用单纯基于文本的方式 ,
所以有其自身难以解决的问题影响着管理方法的
有效性和检索结果的准确性 ,这主要体现在以下
几个方面 。
(1) 在传统视频检索系统中 ,描述的模糊性
是其自身难以克服的先天不足 。 因为视频信息内
容的丰富性决定了很难用语言标签准确 、完整的
描述视频信息的全部内容 ,这就使得对视频信息
的描述存在很大的模糊性 ,大大影响了检索结果
的准确性 。
42
(2) 文字描述是对视频信息的一种特定的抽
象 ,这就要求描述方法要符合一定的标准 ,这也就
增加了文字描述的不确定性 ,因为如果描述标准
改变了 ,那么视频描述标签也得重新制作才能适
应新的查询要求 ,也就是特定的标签只符合特定
的查询要求 。
(3) 随着人们对信息依赖性的加强 ,人们对
视频资料中包含的具体信息的需求也越来越多 。
传统的对视频的描述都是通过手工注释完成的 ,
所以说如果采用传统的描述方式 ,那么越来越多
的重复劳动是不可避免的 ,这样不仅浪费了大量
的人力 、物力 ,而且观察者在疲劳的状态下工作的
准确性也会大大降低 。
图 1 传统的视频检索系统工作框图
(4) 由于文字标签都是通过观察者选定后加
在视频标签上的 ,因此视频描述很大程度上受到
主观因素的影响 ,不同的观察者或同一个观察者
在不同的条件下对同一幅图像会给出不同的描
述 ,有时这种差异会很大 。 因而传统的描述方法
不够客观 ,在没有统一标准的时候有可能会自相
矛盾 。
在这里必须强调一点 ,以上的内容只是在讨
论传统描述方法(也就是基于文本的描述方法)的
局限性 ,并不是说文本描述是错误的 、在基于内容
的视频描述方案中是没有用处的 。 恰恰相反 ,在
基于内容的视频信息描述中 ,文本描述是重要的
描述部分 。 在 M PEG - 7 标准中 ,文本描述作为
高级描述符的一部分被重点定义 。 因为对于任何
一种描述方式 ,视频资料的基本信息(如 :片名 、导
演 、主演 、出场日期 、制片厂 、发行商等)是必不可
少的 ,任何一种描述系统都不可能自动地将这些
基本信息提取出来 ,这些信息必须由观察者为视
频资料制作标签 。 所以说 ,基于内容的视频信息
描述方案并不是放弃了传统的文本描述方式 ,而
是最大限度的减少具有极强主观性的文本标签
项 ,并在描述方案中加入低级语义描述子(低级语
义描述子是 M EPG - 7 标准中的概念 ,它包括视
频文件的帧数 、运动性 、摄像机运动 ,关键帧的直
方图 、纹理 、轮廓等一系列视频信息的客观特征描
述)使描述系统能够客观 、准确 、全面的描述视频
信息 。
2 .2 新一代的视频检索系统
为了克服传统检索方式的局限性 ,新一代基
于内容的视频检索系统正在被人们广泛的研究并
实际应用 。 下图是基于内容的视频检索系统的工
作框图 。
图 2 基于内容的视频检索系统工作框图
基于内容的视频检索就是指根据视频的内容 及上下文关系 ,对大规模视频数据库中的视频数
52
第 4 期 杨有山等 :基于内容的视频信息检索
剩余8页未读,继续阅读
资源评论
weixin_38552239
- 粉丝: 13
- 资源: 955
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 【Unity科幻机器人资源包】SCI FI ROBOTS PACK VOL 1
- 算法训练-使用JAX训练CLIP算法-支持fine-tuning-优质项目实战.zip
- C语言在游戏开发中的应用及其代码实践
- 算法剪枝-基于Pytorch的YOLOX目标检测算法剪枝pruning-算法轻量化-附项目源码-优质项目实战.zip
- 算法加速-基于GPU加速word2vec实现-附项目源码-优质项目实战.zip
- 算法部署-使用NCNN在Android+iOS平台上部署YOLOv5目标检测算法-优质算法部署项目实战.zip
- 算法部署-TensorRT算子开发之Swish-plugin.zip
- 算法部署-darknet-to-ncnn模型转换工具-支持主流网络如resnet+yolo等.zip
- 如何处理键盘侠·伍德提到的DF(Distance Field)的网格体材质混合问题
- 安卓版H5超链接link-v2.0.0
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功