没有合适的资源?快使用搜索试试~ 我知道了~
论文研究-基于加权优化的自然场景分类方法研究.pdf
需积分: 10 0 下载量 64 浏览量
2019-07-23
00:06:42
上传
评论
收藏 1.56MB PDF 举报
温馨提示
试读
5页
为了提高了静态图像中自然场景分类的识别精度,采用一种基于加权优化的聚类方法。将文本领域的文字激活力矩阵方法应用到图像分类领域,将视觉词汇的数目减少使得运行时间减少,并降低了对存储内存的占用。在特征编码阶段采用局部约束线性编码算法,并将其应用在空间金字塔模型的向量量化中,该算法能有效降低量化误差改善分类效果。实验结果表明,提出的基于加权优化的局部约束线性编码算法能够获得更好的分类效果。
资源推荐
资源详情
资源评论
收稿日期:20150311;修回日期:20150421 基金项目:国家自然科学基金资助项目(61274105);沪江基金资助项目(C14002)
作者简介:张亚杰(1989),男,河南汤阴人,硕士研究生,主要研究方向为图像分类、计算机视觉(zhang_yajie6@163.com);马秀梅(1989),
女,江苏泰州人,硕士,主要研究方向为图像分类、模式识别、计算机视觉;张轩雄(1965),男,重庆人,教授,博士,主要研究方向为微电子机械系统
技术、传感技术、SOI技术.
基于加权优化的自然场景分类方法研究
张亚杰,马秀梅,张轩雄
(上海理工大学 信息与控制工程研究所 上海市教委光电系统智能控制重点实验室,上海 200093)
摘 要:为了提高了静态图像中自然场景分类的识别精度,采用一种基于加权优化的聚类方法。将文本领域的文
字激活力矩阵方法应用到图像分类领域,将视觉词汇的数目减少使得运行时间减少,并降低了对存储内存的占用。
在特征编码阶段采用局部约束线性编码算法,并将其应用在空间金字塔模型的向量量化中,该算法能有效降低量
化误差改善分类效果。实验结果表明,提出的基于加权优化的局部约束线性编码算法能够获得更好的分类效果。
关键词:自然场景分类;加权优化;文字激活力矩阵;局部约束线性编码;支持向量机
中图分类号:TP3914 文献标志码:A 文章编号:10013695(2016)05159105
doi
:10.3969/j.issn.10013695.2016.05.069
Classificationmethodofnaturalscenebasedonweightedoptimization
ZhangYajie,MaXiumei,ZhangXuanxiong
(ShanghaiMECKeyLaboratoryofIntelligentControlofOpticalElectricalSystem,InseituteofInformation& ControlEngineering,Universityof
ShanghaiforScience&Technology,Shanghai200093)
Abstract:Inordertoimprovetheclassificationaccuracyofnaturalscenesinastaticimage,thispaperusedaclusteringmethod
basedonweightedoptimization.Itappliedthewordactivationforcematrixmethodintextfieldtoimageclassification
,andre
ducedboththenumberofvisualwordsandtherunningtime,besides,reducedtheoccupationofmemory.Inthecodingstage,
thepaperusedthelocalityconstrainedlinearcodingalgorithmtovectorquantizationinthespatialpyramidmodel.Theproposed
algorithmcaneffectivelyreducethequantizationerrortoimprovetheclassificationresult.Theexperimentalresultsshowthatthe
proposedLLCalgorithmbasedonweightedoptimizationcangetabetterclassificationeffect.
Keywords:naturalsceneclassification;weightedoptimization;wordactivationforce(WAF)matrix;localityconstrainedlinear
coding
(LLC);supportvectormachine(SVM)
!
引言
随着互联网技术的高速发展,现在每天都会产生海量的数
字图像,怎样通过简单、快速和高效的方法对这些图像进行组
织和处理就显得非常重要。图像的场景分类,就是要利用计算
机模拟人类的视觉感知原理,对包含若干语义信息的场景图库
实现自动标注的过程,为实现合理、有效地管理海量图像数据
奠定了坚实的基础,也成为了近年来计算机视觉研究领域的关
键问题之一。
在目 前 的 图 像 分 类 领 域 中,词 汇 包 模 型 (
bagofword,
BOW)
[1]
是应用最广泛的方法之一,但是传统的 BOW 没有考
虑到局部图像描述符的空间分布信息,这严重制约了该方法的
图像描述能力。后来的空间金字塔匹配模型(
spatialpyramid
matching
,SPM)
[2]
加入了图像的空间信息,分类效果比传统的
BOW 方 法要好 很 多。但 是 基 于 BOW 的 SPM 模型 使 用 K
means聚类
[3]
作为矢量量化(vectorquantization,VQ)
[4]
方法,
该方法中有两个因素都影响了图像的描述能力,即聚类中心的
选择和生成字典的大小。文献[5]中的 SCSPM(sparsecoding+
SPM)对上述方法进行了改进,但由于稀疏编码(sparsecoding,
SC)对每部分的特征独立编码,没有考虑各部分特征间的联
系,从而丢失了许多相似性信息。为了保留这些信息,文献
[
6]中提出了局部约束线性编码算法(localityconstrainedlinear
coding
,LLC),解决了稀疏编码求解过程中因追求稀疏性而可
能运用完全不同的视觉词汇来表达相似特征的问题。本文结
合图像场景特征与行为对象特征并使用 LLC编码算法将特征
描述子映射到局部坐标上,然后运用最大池化(maxpooling)
[6]
法将映射得到的坐标整合成图像描述符。
为了能够得到更好的分类效果,本文在特征联合之前对特
征进行了一些优化过程:首先进行了特征加权的优化,大量的
研究表明,每个特征对聚类结果的影响程度并不完全一样,即
不同的特征在聚类中的贡献度并不相同。但是传统
Kmeans
算法在聚类过程中平等地赋予了所有特征相同的地位。本文
针对传统 Kmeans聚类算法的上述问题,使用了一种特征加权
Kmeans聚 类 算 法
[7]
优 化 了 视 觉 词 汇 表;将 文 本 中 的
WAFS
[8,9]
理论应用到图像领域,使得运行时间减少,而且显著
降低了存储内存的使用。
最 后,通 过 线 性 支 持 向 量 机 (supportvectormachine,
SVM)
[10]
进行分类,从实验结果可以看出,本方的法获得了理
想的分类效果。
本文实验的算法流程如图 1所示。
第 33卷第 5期
2016年 5月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol33No5
May 2016
资源评论
weixin_39840515
- 粉丝: 446
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功