近些年,随着无人机(unmanned aerial vehicle,UAV)相关技术的发展,无人机凭借其轻便快速的特性,在农业、电网和城市巡检等领域得到了广泛的应用。但无人机航拍影像中,由于拍摄高度较高,图像中的各类感兴趣的目标如行人、自行车等尺度较小,且容易受环境干扰,导致难以被常规目标检测算法检测出来。因此提高算法对无人机航拍图像中小目标的检测能力成为了目标检测领域一个具有挑战性的研究方向。
近几年,卷积神经网络(convolutional neural network,CNN)在计算机视觉领域中取得了巨大的突破。
无人机影像小目标检测是当前计算机视觉领域的一个重要研究课题,主要由于无人机在各种应用场景中广泛使用,例如农业监测、电力线路巡检和城市安全监控。然而,无人机高空拍摄的图像通常包含大量的小目标,如行人、车辆等,这些目标由于尺寸小、易受环境因素干扰,使得传统的目标检测算法在处理这类图像时表现不佳。
YOLO(You Only Look Once)系列算法作为实时目标检测的代表,以其高效和精确性受到广泛关注。YOLOv5作为YOLO系列的最新版本,通过优化网络结构和训练策略,显著提升了目标检测的速度和精度。但在处理无人机影像中的小目标时,YOLOv5仍然存在一定的局限性。
为了解决这一问题,研究人员提出了改进版的YOLOv5——Drone-YOLO。Drone-YOLO着重在以下几个方面进行了优化:
1. **多尺度检测分支**:为了增强模型对不同大小目标的检测能力,Drone-YOLO引入了一个新的检测分支,这使得模型能更好地适应无人机影像中目标尺度的变化。
2. **特征金字塔网络(Feature Pyramid Network, FPN)**:设计了多层次信息聚合的特征金字塔网络结构,FPN允许模型从不同层级的特征图中捕获不同尺度的信息,从而实现跨层次信息的融合,增强了对小目标的检测能力。
3. **多尺度通道注意力机制**:引入了一种基于多尺度通道注意力的特征融合模块,该机制可以动态地调整不同尺度特征的重要性,使模型更加关注小目标,从而减少小目标的遗漏。
4. **解耦分类与回归任务**:在预测头上,Drone-YOLO将分类任务与回归任务分开处理,这种策略有助于更精确地定位小目标,并通过优化的Alpha-IoU损失函数来提升检测效果。
5. **性能与效率**:尽管进行了多项改进,Drone-YOLO在保持高检测精度的同时,推理延时仅需16.78毫秒,显示了良好的实时性。
实验结果显示,Drone-YOLO在VisDrone无人机影像数据集上的平均精度(AP50)相比于YOLOv5提高了4.91%,并且在处理小目标时表现出优于其他主流模型的检测效果。这表明Drone-YOLO是一个有效的解决方案,适用于无人机航拍影像的小目标检测任务。
改进的YOLOv5算法Drone-YOLO通过增强模型对小目标的关注度、优化信息融合方式以及解耦分类与回归任务,成功提升了无人机影像中小目标的检测性能。这样的研究成果对于推动无人机在各种复杂环境中的应用,特别是在需要精准目标识别的场景下,具有重要的理论和实践价值。