目标检测是计算机视觉的一部分,根据整张图像内容进行描述,并结合目标
物体的特征信息,确定该物体的类别与位置。目标检测将目标的定位和识别合
二为一,能够在特定的环境下实时且准确地检测出目标。目标检测技术常用于
人脸检测、智慧交通、无人驾驶、遥感目标检测、行人计数、安全系统等各大
领 域 。 随 着 深 度 学 习 的 发 展 , 卷 积 神 经 网 络 ( convolutional neural
networks,CNN)
[1]
被广泛应用,基于深度学习的目标检测技术将目标检测推向
发展新高潮。其中,在追求速度与精度并行的算法中,基于深度学习的单阶段目
标检测算法脱颖而出。与其他深度学习目标检测算法不同的是,单阶段目标检
测算 法结构简单,可以直接检测图像输出结果,没有候选区域的分 类,因此 相比
其他深度学习目标检测算法速度更快,计算效率更高。典型的单阶段目标检测
算法包括 YOLO(you only look once)系列
[2,3,4]
和 SSD(single shot multibox
detector)系列
[5,6,7,8,9]
。但在单阶段目标检测算法的研究过程中出现了很多问题,
例如模型检测精度较低,尤其对小目标及遮挡目标的检测更为困难。为解决单
阶段目标检测与两阶段目标检测之间的精度差距,Lin 等人
[10]
提出 RetinaNet,解
决了正负样本不均衡的问题,改进了背景样本的权重,使得模型更能关注较难检
测的样本。
由于小目标物体分辨率较低且特征信息不明显,如何更精准地检测到小目
标是目标检测领域的热点研究问题。文献[11]针对视频目标检测算法面临的挑
战,从骨干网络、算法结构和数据集等方面总结了改进后的视频目标检测算法
的优势和劣势。文献[12]针对边界/语义增强、全局/局部结合和辅助网络三方
面的基于深度学习的显著性目标检测进行对比分析。文献[13]总结了目标类别
检测核心技术与该研究的难点和发展方向。文献[14]从单阶段目标检测、两阶
段目标检测以及结合生成对抗网络等方面总结了各种算法的改进过程。这些综
述在目标检测的基础上从数据类别、检测特点以及算法改进等方面总结了当前
主流的目标检测研究趋势。但目前存在的基于深度学习的目标检测文献综述仅
综合了各种算法的优缺点,未系统地从某一方面归纳目标检测的改进方法。
综上所述,本文从单阶段目标检测算法的角度出发,总结了在此基础上改进
的适用于小目标检测的方法。通过优化 Anchor Box、引入注意力机制、优化
残差网络和密集连接模块、特征融合、特征增强、引入其他网络、改进损失函
数等几个方面的研究,总结归纳了基于深度学习的单阶段小目标检测的最新研
究成果及未来的研究方向。
评论0
最新资源