基于多分支神经网络模型的弱监督细粒度图像分类方法
本文提出了基于多分支神经网络模型的弱监督细粒度图像分类方法,以解决传统基于注意力机制的神经网络无法联合关注局部特征和旋转不变特征的问题。该方法首先使用轻量级类激活图(CAM)网络定位有潜在语义信息的局部区域,然后设计可变形卷积的残差网络 ResNet-50 和旋转不变编码的方向响应网络(ORN),最后组合三个分支内损失和分支间损失优化整个网络。
该方法的核心在于使用多分支神经网络模型,可以同时关注局部特征和旋转不变特征,从而提高图像分类的准确率。实验结果表明,所提方法在 CUB-200-2011 和 FGVC_Aircraft 数据集上的分类准确率分别达到 87.7% 和 90.8%,与多注意力卷积神经网络(MA-CNN)方法相比,分别提高了 1.2 个百分点和 0.9 个百分点;在 Aircraft_2 数据集上的分类准确率达到 91.8%,比 ResNet-50 网络提高了 4.1 个百分点。
该方法的优点在于可以同时关注局部特征和旋转不变特征,从而提高图像分类的准确率。此外,该方法还可以应用于其他领域,如图像识别、目标检测等。
知识点:
1. 多分支神经网络模型:一种神经网络模型,可以同时关注多个特征,提高图像分类的准确率。
2. 轻量级类激活图(CAM)网络:一种神经网络模型,用于定位有潜在语义信息的局部区域。
3. 可变形卷积:一种卷积神经网络技术,能够处理旋转不变的特征。
4. 方向响应网络(ORN):一种神经网络模型,能够处理旋转不变的特征。
5. 弱监督学习:一种机器学习方法,不需要大量的标注数据,能够从少量的标注数据中学习到有用的信息。
6. 细粒度图像分类:一种图像分类任务,需要对图像进行细粒度的分类。
7. 深度学习:一种机器学习方法,使用人工神经网络来学习和Representation 数据。
8. 机器学习:一种人工智能方法,使用算法和模型来学习和Representation 数据。
本文提出的方法可以提高图像分类的准确率,且可以应用于其他领域,如图像识别、目标检测等。