基于粒子群算法寻最优属性关联下的零样本语义自编码器.docx

版权申诉

171 浏览量 2023-02-23 20:12:23 上传评论收藏 652KB DOCX 举报

资源推荐

资源详情

资源评论

1. 引言

在图像分类任务中，为保证测试集与数据集类别相同，在每次增加新的图像类别时需

要对模型重新进行训练。从而，传统的图像识别方法在大量新类别出现时图像分类效果会

显著下降。为解决现实生活中海量类别的存在，使计算机具有知识迁移的能力，“零样本学

习”成为研究焦点

[1-4]

。基于属性的零样本分类是通过对不同类别之间的共享属性进行学

习，从而实现从训练类别到测试类别的迁移。在零样本发展的前期阶段，对属性的考察仅

仅停留在二值

[5]

层面，“1”表示具有该属性的性质，“0”则表示不具有。采用二值属性对于共

享属性层描述过于简单，从而使该模型对语义的理解存在偏差，因此相对属性(Relative

Attribute, RA)

[6]

这一概念被提出，并在零样本图像分类中取得了良好的分类效果

[7]

。相对属

性的属性值是连续的，其大小可以表示为样本具有该属性的相对强弱程度，从而提高了属

性信息的准确性。作为样本的另一种表示，属性携带的语义信息可以建立起已知类别与未

知类别的联系。鉴于深度神经网络的特征学习能力，将语义信息用于引导底层特征学习过

程，从而获得具有鉴别性信息的共享特征

[8,9]

。语义自编码器(Semantic AutoEncoder,

SAE)

[10]

将属性作为隐藏层，实现了零样本图像底层特征到语义属性的映射，取得了突破性

进展。然而，从深度神经网络学习的图像底层特征中提取出的共享属性信息用作零样本分

类时，会使属性之间固有的相关性信息丢失，如何对丢失信息进一步补偿成为零样本图像

分类的重要研究内容。

在传统的属性学习

[11-13]

方法中，很少考虑到这些相关性信息并予以补偿。随着对零样

本学习研究的逐渐深入

[14-16]

，现有的属性相关性的研究证明了属性相关性的挖掘有利于属

性分类器性能的提高

[17-22]

。Liu 等人

[17]

采用属性相关性矩阵与原始共享属性进行运算从而

将相关性信息引入属性层。Wang 等人

[18]

利用互信息对属性间关系进行衡量。Biswas 等人

[19]

提出将语义属性相关性引入嵌入空间的跨越空间结构。Quercia 等人

[20]

发现，应该对不同

城市感知属性之间的相关性进行建模，以通过适当共享视觉知识来实现更有效和准确的相

对属性学习。Min 等人

[21]

提出了一种多任务深度相对属性学习网络，通过多任务连体网络

同时学习所有相对属性，解决了成对排名算法独立学习每个感知属性时造成的不同属性之

间的关系的丢失。通过将属性相关性向多维度扩展，Qiao 等人

[22]

研究了多个属性之间的相

关性，从而构造属性链，结果表明当属性链长为 2 时属性分类器性能达到最优。因此，本

文重点研究二元属性相关性，将属性相关性引入共享属性层中，以提升零样本图像分类时

的信息量和准确度。

本文提出一种自动寻找最优属性相关方法，弥补 SAE 在属性学习中缺少的属性相关

性信息，对属性进行相关性信息补偿。该方法将属性相关性求解转化为参数寻优，使用经

典启发式粒子群优化算法(Partial Swarm Optimization, PSO)寻找最优的嵌入属性相关性信息

的新属性。首先，学习属性与属性间的相关性，在原始的共享属性层中加入相关性变量。

考虑到参数与目标之间的单向可解性，利用 PSO 平衡原始属性与相关性变量间的关系。在

minW∥∥X−WTS∥∥2F+κ∥WX−S∥2FminW⁡‖X−WTS‖F2+κ‖WX−S‖F2

(2)

因此，变换后的目标函数式(2)是凸函数，κκ 为大于 0 的权重系数。改写式(2)，可得

minW∥∥XT−STX∥∥2F+κ∥WX−S∥2FminW⁡‖XT−STX‖F2+κ‖WX−S‖F2

(3)

由于需要求式(3)的极值，所以需要对其进行求导操作，导数为零便可获得相应的结果

−S(XT−STW)+κ(WX−S)XT=0−S(XT−STW)+κ(WX−S)XT=0

(4)

化简后的表达式可以假设 A=SSTA=SST, B=κXXTB=κXXT, C=(1+κ)SXTC=(1+κ)SXT，

式(4)可以变换为

AW+WB=CAW+WB=C

(5)

该方程为西尔韦斯特方程，可以通过 Bartels-Stewart 算法求解得出。

SAE 可以通过学习训练样本(X, Y)中的属性知识完成从底层特征到属性值的映射，用

属性共享机制将学习到的知识迁移到未知类别中，实现类别边界的突破。在用 SAE 进行零

样本分类时，SAE 的中间层为训练图像相对属性的分数值。在使用 SAE 编码器模型的时

候，就可以获取到从视觉底层特征到语义共享属性层的映射矩阵 W。在测试的过程中，使

用训练得到的 W 可以将测试图像的底层特征映射成相对属性分数值，然后利用高斯分布的

概念来统计计算得出均值和方差，最后利用最大似然估计来预测出其测试样本标签。

3. 基于粒子群算法寻最优属性关联下的零样本语义自编码器

3.1 语义属性相关性分析

基于描述类别的属性的可共享性，共享属性层的属性与属性之间存在一定的语义相关

性

[23]

。如在描述动物时，“会飞”与“有翅膀”以及“会游泳”与“无皮毛”大多数情况总是相关

联的。将这些相关属性予以结合或者引入相关性信息可以对分类起到积极作用，弥补共享

属性层的信息丢失。为表述这些属性之间的正负相关性以及相关程度，根据类别、属性以

及训练样本个数，计算训练样本属性-属性的相关性，将其记作相关性矩阵。

假设数据中共有 NN 个训练样本，aniani 为第 n 个样本的第 i 个属性值。如果用 RijRij

表示属性 aiai, ajaj 间的相关性，其计算公式可表示为

Rij=∑n=1N(ani−ai¯¯¯¯)(anj−aj¯¯¯¯¯)∑n=1N(ani−ai¯¯¯¯)2∑n=1N(anj−aj¯¯¯¯¯)2−−−−−−−−−−−−−−−−−−−−−−−�⎷��Rij=∑n=1N(ani−ai¯)(anj−aj¯)∑n=1N(ani−ai¯)2∑n=1N(anj−aj¯)2

(6)

其中，ai¯¯¯¯ai¯表示在整个训练样本中第 i 个属性的平均值。根据

RijRij (−1<−1<Rij<1Rij<1)的正负以及大小可以判断两属性之间呈正相关还是负相关，以及