![](https://csdnimg.cn/release/download_crawler_static/89323963/bg1.jpg)
2 DATA ANALYSIS
Identify the category of foliar diseases in apple trees
刘芳新
中山大学 智能科学与技术 21312482
Abstract
本课程设计报告探讨了Kaggle举办的FGVC8(CVPR2021-workshop)Plant Pathology-2021数据集
分类任务。通过将标签进行独热编码转化为多标签分类问题,我们研究了两种卷积神经网络模型来
解决本分类任务。本报告分析了Plant Pathology-2021数据集的样本细节,并详细介绍了LeNet模型
与Vision Transformer模型的构建、训练与优化过程以及它们在Plant Pathology-2021分类任务上不同的
性能差 距。我们还讨论了ArcFaceLoss与CrossEntropyLoss在本任务上的效果对比,以及对比数据集裁
剪的效果。最后,本报告提出了一些可能的优化方向。
Keywords: one-hot,LeNet,VIT,Plant Pathology-2021,ArcFaceLoss
1 Introduction
苹果是世界上最重要的温带水果作物之一。
叶病对苹果园的整体生产力和质量构成重大威胁。
目前苹果园的疾病诊断过程是基于人类的人工侦
察,这既耗时又昂贵。尽管基于计算机视觉的模
型在植物疾病识别方面显示出了前景,但仍有一
些局限性需要解决。不同苹果品种或栽培中新品
种的单一疾病视觉症状的巨大差异是基于计算机
视觉的疾病识别的主要挑战。这些变化源于自然
和图像捕获环境的差异,例如,叶片颜色和叶片形
态、感染组织的年龄、不均匀的图像背景以及成像
过程中不同的光照等。 Plant Pathology-2021是数
据集通过表示在不同成熟阶段和一天中不同时间
在不同焦距相机设置下拍摄的叶片图像的非均匀
背景来反映真实的现场场景。我们所获得的数据
集包含3000张图片的训练集,600张图片的验证集
与600张图片的测试集。
学号: 21312482
课程: 计算机视觉
日期:2023 年 11 月 25 日
Email:liufx7@mail2.sysu.edu.cn
2 Data Analysis
2.1 Label Distribution
我们首先关注训练集内标签数量,简单统计
后如图1所示,可见不同标签之间会有极大的样本
数量差异。
图 1: 不同样本数量的标签统计
此外,我们可以使用条形统计图来直观演示
1