没有合适的资源?快使用搜索试试~ 我知道了~
基于粒子群算法寻最优属性关联下的零样本语义自编码器.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 171 浏览量
2023-02-23
20:12:23
上传
评论
收藏 652KB DOCX 举报
温馨提示
试读
12页
基于粒子群算法寻最优属性关联下的零样本语义自编码器.docx
资源推荐
资源详情
资源评论
1. 引言
在图像分类任务中,为保证测试集与数据集类别相同,在每次增加新的图像类别时需
要对模型重新进行训练。从而,传统的图像识别方法在大量新类别出现时图像分类效果会
显著下降。为解决现实生活中海量类别的存在,使计算机具有知识迁移的能力,“零样本学
习”成为研究焦点
[1-4]
。基于属性的零样本分类是通过对不同类别之间的共享属性进行学
习,从而实现从训练类别到测试类别的迁移。在零样本发展的前期阶段,对属性的考察仅
仅停留在二值
[5]
层面,“1”表示具有该属性的性质,“0”则表示不具有。采用二值属性对于共
享属性层描述过于简单,从而使该模型对语义的理解存在偏差,因此相对属性(Relative
Attribute, RA)
[6]
这一概念被提出,并在零样本图像分类中取得了良好的分类效果
[7]
。相对属
性的属性值是连续的,其大小可以表示为样本具有该属性的相对强弱程度,从而提高了属
性信息的准确性。作为样本的另一种表示,属性携带的语义信息可以建立起已知类别与未
知类别的联系。鉴于深度神经网络的特征学习能力,将语义信息用于引导底层特征学习过
程,从而获得具有鉴别性信息的共享特征
[8,9]
。语义自编码器(Semantic AutoEncoder,
SAE)
[10]
将属性作为隐藏层,实现了零样本图像底层特征到语义属性的映射,取得了突破性
进展。然而,从深度神经网络学习的图像底层特征中提取出的共享属性信息用作零样本分
类时,会使属性之间固有的相关性信息丢失,如何对丢失信息进一步补偿成为零样本图像
分类的重要研究内容。
在传统的属性学习
[11-13]
方法中,很少考虑到这些相关性信息并予以补偿。随着对零样
本学习研究的逐渐深入
[14-16]
,现有的属性相关性的研究证明了属性相关性的挖掘有利于属
性分类器性能的提高
[17-22]
。Liu 等人
[17]
采用属性相关性矩阵与原始共享属性进行运算从而
将相关性信息引入属性层。Wang 等人
[18]
利用互信息对属性间关系进行衡量。Biswas 等人
[19]
提出将语义属性相关性引入嵌入空间的跨越空间结构。Quercia 等人
[20]
发现,应该对不同
城市感知属性之间的相关性进行建模,以通过适当共享视觉知识来实现更有效和准确的相
对属性学习。Min 等人
[21]
提出了一种多任务深度相对属性学习网络,通过多任务连体网络
同时学习所有相对属性,解决了成对排名算法独立学习每个感知属性时造成的不同属性之
间的关系的丢失。通过将属性相关性向多维度扩展,Qiao 等人
[22]
研究了多个属性之间的相
关性,从而构造属性链,结果表明当属性链长为 2 时属性分类器性能达到最优。因此,本
文重点研究二元属性相关性,将属性相关性引入共享属性层中,以提升零样本图像分类时
的信息量和准确度。
本文提出一种自动寻找最优属性相关方法,弥补 SAE 在属性学习中缺少的属性相关
性信息,对属性进行相关性信息补偿。该方法将属性相关性求解转化为参数寻优,使用经
典启发式粒子群优化算法(Partial Swarm Optimization, PSO)寻找最优的嵌入属性相关性信息
的新属性。首先,学习属性与属性间的相关性,在原始的共享属性层中加入相关性变量。
考虑到参数与目标之间的单向可解性,利用 PSO 平衡原始属性与相关性变量间的关系。在
每次分类过程中都要对新的属性进行排序,然后将预测的属性值映射到标签。通过交叉验
证下的双向损失函数来衡量本次迭代过程中求解的映射矩阵性能,将此函数作为 PSO 算法
寻优的适应度函数。实验结果表明,该方法在零样本图像分类数据集的性能相较于其他方
法可以得到明显提升。
2. 基于语义自编码器的零样本图像分类
语义自编码器
[10]
是一种特殊的自编码器,其最显著的特点是中间隐藏层为一层语义
层。网络结构如图 1 所示。其中,输入层为基础的特征向量空间,隐藏层是一层语义层。
可将输入层特征向量空间进行压缩编码和解码,输出层为经过隐藏层处理后恢复出来的特
征向量空间。在进行编解码的过程中,使用原始数据对编码器和解码器进行额外的约束,
使得编码后的数据尽可能恢复成为原来的数据。
图 1 SAE 结构框架
下载: 全尺寸图片 幻灯片
给出样本底层特征 X,共享属性层有 H 个相对属性表示为
Score=(a1,a2,⋅⋅⋅,aH)Score=(a1,a2,···,aH),训练类别与测试类别分别为
Y=(y1,y2,⋅⋅⋅,yK)Y=(y1,y2,···,yK),Z=(z1,z2,⋅⋅⋅,zL)Z=(z1,z2,···,zL),其中 K, L 分别表示训练
集样本数和测试集样本数。假设输入层到隐藏层的映射矩阵为 W,隐藏层到输出层的映射
矩阵为 W∗W∗,那么 W 和 W∗W∗为对称的,即 W 为 W∗W∗的转置矩阵。为了使输出和输
入尽可能地相似,可以定义 SAE 的目标函数为误差的二范数:
min∥X−W∗WX∥2Fmin‖X−W∗WX‖F2
(1)
为了简化模型,加上限制条件 WX=S,其中 S 为数据特征 X 对应的属性向量。对式
(1)做 W∗=WTW∗=WT 变换,进一步转换为优化问题:
minW∥∥X−WTS∥∥2F+κ∥WX−S∥2FminW‖X−WTS‖F2+κ‖WX−S‖F2
(2)
因此,变换后的目标函数式(2)是凸函数,κκ 为大于 0 的权重系数。改写式(2),可得
minW∥∥XT−STX∥∥2F+κ∥WX−S∥2FminW‖XT−STX‖F2+κ‖WX−S‖F2
(3)
由于需要求式(3)的极值,所以需要对其进行求导操作,导数为零便可获得相应的结果
−S(XT−STW)+κ(WX−S)XT=0−S(XT−STW)+κ(WX−S)XT=0
(4)
化简后的表达式可以假设 A=SSTA=SST, B=κXXTB=κXXT, C=(1+κ)SXTC=(1+κ)SXT,
式(4)可以变换为
AW+WB=CAW+WB=C
(5)
该方程为西尔韦斯特方程,可以通过 Bartels-Stewart 算法求解得出。
SAE 可以通过学习训练样本(X, Y)中的属性知识完成从底层特征到属性值的映射,用
属性共享机制将学习到的知识迁移到未知类别中,实现类别边界的突破。在用 SAE 进行零
样本分类时,SAE 的中间层为训练图像相对属性的分数值。在使用 SAE 编码器模型的时
候,就可以获取到从视觉底层特征到语义共享属性层的映射矩阵 W。在测试的过程中,使
用训练得到的 W 可以将测试图像的底层特征映射成相对属性分数值,然后利用高斯分布的
概念来统计计算得出均值和方差,最后利用最大似然估计来预测出其测试样本标签。
3. 基于粒子群算法寻最优属性关联下的零样本语义自编码器
3.1 语义属性相关性分析
基于描述类别的属性的可共享性,共享属性层的属性与属性之间存在一定的语义相关
性
[23]
。如在描述动物时,“会飞”与“有翅膀”以及“会游泳”与“无皮毛”大多数情况总是相关
联的。将这些相关属性予以结合或者引入相关性信息可以对分类起到积极作用,弥补共享
属性层的信息丢失。为表述这些属性之间的正负相关性以及相关程度,根据类别、属性以
及训练样本个数,计算训练样本属性-属性的相关性,将其记作相关性矩阵。
假设数据中共有 NN 个训练样本,aniani 为第 n 个样本的第 i 个属性值。如果用 RijRij
表示属性 aiai, ajaj 间的相关性,其计算公式可表示为
Rij=∑n=1N(ani−ai¯¯¯¯)(anj−aj¯¯¯¯¯)∑n=1N(ani−ai¯¯¯¯)2∑n=1N(anj−aj¯¯¯¯¯)2−−−−−−−−−−−−−−−−−−−−−−−�⎷��Rij=∑n=1N(ani−ai¯)(anj−aj¯)∑n=1N(ani−ai¯)2∑n=1N(anj−aj¯)2
(6)
其中,ai¯¯¯¯ai¯表示在整个训练样本中第 i 个属性的平均值。根据
RijRij (−1<−1<Rij<1Rij<1)的正负以及大小可以判断两属性之间呈正相关还是负相关,以及
相关程度。
3.2 粒子群优化属性相关性下的语义自编码器(PSO-SAE, PSA)
在零样本分类中,K, L 为训练集和测试集样本数,样本总数为 K+L。样本有 H 个相对
属性,则样本表示为 H×(K+L)H×(K+L)的属性矩阵,记作 Score∈RH×(K+L)Score∈
剩余11页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3552
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功