# HuaLuCup2020
2020中国华录杯数据湖算法大赛 吸烟打电话赛道 rank4
* [模型权重下载(百度云)](https://pan.baidu.com/s/1wMMSkKVjPtQFQuwvrOsd8Q) 提取码:kmhw
## 赛题描述
* 比赛连接 [2020中国华录杯·数据湖算法大赛—定向算法赛(吸烟打电话检测)](https://dev.ehualu.com/dev/home/competition/competitionDetail?competitionId=3)
本赛题基于这些数据,初赛需要识别<b>吸烟</b>,<b>打电话</b>, <b>正常</b>三个类别,复赛额外添加了<b>同时吸烟打电话</b>的类别,难点在于数据集中人物清晰度有限,而且人物的像素大小不一,。
<p float="left">
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/1.jpg" height="200" />
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/2.jpg" height="200" />
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/6.jpg" height="200" />
</p>
## 比赛流程和任务
比赛分为初赛和复赛两个阶段。但由于初赛前期数据质量较低,主办方中间更换过一次数据集,因此根据实际算法设计,实际打榜过程可以分为 <b>初赛阶段一</b>,<b>初赛阶段二</b>
和 <b>复赛阶段</b>。
下面将会分别按照这三个阶段,主要介绍算法设计和数据处理过程
## 初赛阶段一
### 数据分析
* 初赛更换高质量数据集之前,主要难点在于训练集和测试集边缘分布差距较大,且训练集中存在大量噪声图像。其中训练集中<b>正常</b>类别和测试集的分布
比较接近,都是监控场景下的图像。而训练集中的<b>吸烟</b>和<b>打电话</b>类别多为网络图像或影视截图,测试集中仍然以监控场景下的图像为主。
<p float="left">
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/4.jpg" height="200" />
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/5.jpg" height="200" />
</p>
* 为了缓解背景差距较大(监控场景和网络图像/影视截图),使用了MixUP数据增强策略来解决这个问题。
<p float="left">
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/7.png" height="200" />
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/8.png" height="200" />
</p>
* 此外,对于样本类别分布和图像高宽比也进行了统计。针对标签分布不一致的问题,使用了翻转,旋转,高斯噪声等方式进行了扩充;针对图像尺度差距
较大,以及高宽比差距较大的问题,分别使用了多尺度输入图像和Padding的方式进行训练。
<p float="left">
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/9.jpg" height="200" />
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/10.jpg" height="200" />
</p>
### 模型设计
* 首先尝试了直接使用<b>ResNext101_32x8d</b>网络提取特征+<b>Softmax</b>分类器进行多分类的方式,但线上评分只有0.5左右。
* 结合上述数据分析过程,认为对于数据分布差异较大的情况下,不适合使用<b>Softmax</b>进行分类,转而使用<b>SVM</b>分类器增大类间距,并使用两个二分类器 :
<b>是否是"正常类别"</b>,<b>"吸烟"还是"打电话"</b>,这种方案获得了线上0.8的评分,截止官方更换数据集,排名在第5名。
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/11.png" width="100%" />
## 初赛阶段二
### 数据分析
* 根据参赛选手的反馈,官方在初赛中更换了训练集和测试集,数据质量有了很大的提升。主要体现在训练集和测试集的边缘分布更加相似,监控场景下的图像
和网络图像/影视截图的标签分布更加接近。
### 模型设计
* 针对数据质量较高的情况下,且分类任务较为简单(三分类)。因此就直接使用<b>ResNext101_32x8d</b>提取特征+<b>Softmax</b>分类的方案。
* 部分图像中,<b>吸烟</b>,<b>打电话</b>的区域较小,无法有效的从少量的像素中提取出有效的特征进行分类,因此使用了CBAM注意力机制来增强这些
特征的表达。
* 初赛最终网络结构如下:
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/12.png" width="100%" />
## 复赛阶段
### 数据分析
* 复赛阶段添加了<b>同时吸烟打电话</b>的类别。此外,还增加了<b>图像中出现香烟和手机,但没有在人手里的干扰图像</b>,以及人在图像中所占比例非常小的情况。
<p float="left">
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/15.jpg" height="200" />
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/13.jpg" height="200" />
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/14.jpg" height="200" />
</p>
* 为了更好的提升模型的泛化能力,从数据角度出发,我们更加细致的把数据分为了7种场景,并针对各个场景进行数据扩充(翻转等,爬取Ins图像)。对于爬取
的图像,我们使用<b>伪标签</b>进行了标注。7种场景,和扩充后的数据分布如下图所示:
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/16.png" width="100%" />
<p float="left">
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/17.png" height="180" />
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/18.png" height="180" />
</p>
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/hw.png" width="100%" />
* 训练集中 <b>干扰图像</b> 的数量较少,因此我们爬取并裁剪了手机,香烟的图像,并在行人重识别数据集上通过复制粘贴来进行扩充。
<p float="left">
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/19.png" height="200" />
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/20.png" height="200" />
</p>
### 模型设计
* 复赛开始阶段,我们延续了初赛的网络结构,即引入<b>CBAM</b>模块。但经过实际评分结果和特征图的可视化分析,我们认为<b>CBAM</b>虽然能够增强关键
特征的表达,但是复赛数据中存在<b>图像中出现香烟和手机,但没有在人手里的干扰图像</b>,对于这种情况,<b>CBAM</b>反而会干扰模型正常的学习过程。
* 为了仍然保持模型对关键区域的特征表达,我们使用了<b>self-attention</b>注意力机制。
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/21.png" width="100%" />
* 通过实验发现,<b>self-attention</b>对于线上评分的贡献有限,且会增加一定的额外计算开销,因此在最终提交的模型中我们去掉了全部额外注意力机制,转而
对<b>吸烟,打电话区域</b>像素值过少的情况进行了研究,并且基于<b>ResNext101_32x8d</b>进行了多尺度的特征融合,最终网络结构如下:
<img src="https://github.com/ielym/HuaLuCup2020/blob/main/datas/train/22.png" width="100%" />
* 最终,在比赛要求推理速度的范围内 (<b>200ms</b>),我们使用了<b>ResNext101_32x8d</b>,<b>ResNet50</b>和<b>Efficient-b7</b>三模型融合。推理时
数据增强和训练时一致,没有使用TTA。
### 训练调参
* <b>Loss</b> : 为了同时保证模型训练过程中的稳定性和泛化能力,我们同时使用了<b>CrossEntropy Loss</b>和<b>LabelSmooth CE Loss</b>进行联合训练。
* <b>LR<b> : 初始学习率设置为1e-4,使用余弦学习率衰减策略。
* <b>Optimizer</b> : Adam优化器,默认参数。
* <b>输入图像分辨率</b> 对于三个模型,分别为\[404,436,468,500\],\[704,736,768,800\],\[536,568,600,632,664\]多尺度分辨率。
## 比赛总结
比赛结束后,我们发现对于增强吸烟打电话关键区域的特征�
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
教育部认可的大学生竞赛备赛资料代码,源码,竞赛总结,所有源码均经过严格测试,可以直接运行,可以放心下载使用。有任何使用问题欢迎随时与博主沟通 全国电子设计大赛、全国大学生智能汽车竞赛、蓝桥杯、集成电路创新创业大赛、光电设计竞赛、挑战杯、大创项目、互联网+、三创赛、计算机设计竞赛、创新创业大赛、ACM-ICPC国际大学生程序设计竞赛、全国大学生数学建模竞赛、全国大学生电子商务“创新、创意及创业”挑战赛、全国大学生节能减排社会实践与科技竞赛、全国大学生工程训练综合能力竞赛、全国大学生机器人大赛-RoboMaster、RoboCon、“西门子杯”中国智能制造挑战赛、中国大学生计算机设计大赛、世界技能大赛、中国高校计算机大赛-大数据挑战赛、团体程序设计天梯赛、移动应用创新赛、网络技术挑战赛、全国大学生信息安全竞赛、“中国软件杯”大学生软件设计大赛、全国大学生光电设计竞赛、中国机器人及人工智能大赛、“大唐杯”全国大学生移动通信5G技术大赛、华为ICT大赛、全国大学生嵌入式芯片与系统设计竞赛、中国高校智能机器人创意大赛
资源推荐
资源详情
资源评论
收起资源包目录
2020中国华录杯数据湖算法大赛 吸烟打电话赛道 rank4.zip (45个子文件)
cm
utils.py 3KB
datas
train
2.jpg 6KB
10.jpg 5KB
19.png 109KB
13.jpg 36KB
14.jpg 30KB
6.jpg 10KB
15.jpg 21KB
12.png 821KB
1.jpg 5KB
23.png 612KB
11.png 408KB
5.jpg 7KB
8.png 61KB
21.png 298KB
17.png 44KB
16.png 740KB
7.png 52KB
20.png 57KB
18.png 16KB
3.jpg 13KB
hw.png 395KB
9.jpg 7KB
22.png 973KB
4.jpg 5KB
ME-DIS-3.jpg 1.03MB
predict.py 5KB
trainb7.py 4KB
train50.py 3KB
train101.py 3KB
logs
log.txt 2.61MB
models
efficientnet.py 10KB
model.py 2KB
efficient_utils.py 12KB
resnet.py 13KB
data_gen_predict.py 3KB
.gitignore 2KB
cfg
_metrics.py 1KB
_fit.py 4KB
_criterion.py 3KB
_modelcheckpoint.py 2KB
_reducelr.py 1KB
_history.py 2KB
data_gen_train.py 6KB
README.md 8KB
共 45 条
- 1
资源评论
妄北y
- 粉丝: 1w+
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功