原文信息
论文题目:Dual-branch Network with Hypergraph Feature Augmentation and Adaptive Logits
Adjustment for Long-tailed Visual Recognition
录用期刊:Applied Soft Computing (中科院一区、TOP 期刊)
作者列表
1) 韩佳艺 中国石油大学(北京)人工智能学院 控制科学与工程 博 22 级
2) 刘建伟 中国石油大学(北京)人工智能学院 自动化系 教师
3) 徐璟东 中国石油大学(北京)人工智能学院 控制科学与工程 硕 22 级
摘要
本文提出了一种基于解耦学习框架的超图特征增强和自适应逻辑调整的长尾视觉识别
(HALR)算法。对于表征学习任务,我们从混合输入样本中提取超图特征,以捕获图像的
全局空间上下文语义信息。对于分类器学习任务,我们提出了一个自适应逻辑调整函数,该
函数自动纠正预测分数偏差,从而产生鲁棒决策边界。
背景与动机
长尾分布存在数据稀缺性和显著的类不平衡问题,导致模型对头类的预测倾向增加,对尾类
的预测性能降低。传统的长尾学习方法可以缓解尾类的信息缺失问题。然而,这些方法没有
充分利用图像中包含的复杂非线性高阶关系以及头尾类之间的交互信息。在尾类数据稀缺的
情况下,如何充分利用有限样本中的隐含信息是一个亟待解决的问题。
针对这些问题,我们提出了一种基于超图特征增强和自适应逻辑调整的长尾双分支模型。超
图特征增强策略优化潜在特征表示,逻辑调整函数自动校准模型置信度偏差。我们的 HALR
同时改进了解耦长尾学习的表征学习和分类器学习任务。此外,我们采用余弦相似度度量学
习方法来约束全局和局部混合一致性。在四个基准数据集的大量实验证实了我们提出的模型
的有效性。
设计与实现