我们是如何改进YOLOv3进行红外小目标检测的资源-CSDN文库

共142个文件

cfg：89个

py：21个

txt：10个

目标检测

需积分: 5 56 浏览量 2024-02-21 01:11:22 上传评论 1 收藏 845KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

我们是如何改进YOLOv3进行红外小目标检测的（142个子文件）

densenet201-bifpn.cfg 24KB

res152-tridenet.cfg 22KB

yolov3-dwconv-cbam.cfg 14KB

yolov3-spp-matrix.cfg 13KB

yolov3-dwconv-cbam.cfg 12KB

res2netlite.cfg 12KB

csresnext50-panet-spp.cfg 11KB

yolov3-spp-pan-scale.cfg 10KB

yolov3-1cls.cfg 9KB

c60_a30sysmetric.cfg 9KB

yolov3-spp3.cfg 9KB

yolov3-spp-9a.cfg 9KB

yolov3-spp.cfg 8KB

yolov3s.cfg 8KB

yolov3-spp-1cls.cfg 8KB

yolov3-spp-3cls.cfg 8KB

yolov3-9a.cfg 8KB

enet-6a.cfg 8KB

yolov3.cfg 8KB

yolov3-1cls.cfg 8KB

csmobilenetv2.cfg 8KB

mobilenetv2-tiny.cfg 8KB

mobilenetv2.cfg 7KB

mobilenetv2.cfg 6KB

mobilenetv2-tiny.cfg 6KB

dense-v3-tiny-spp.cfg 5KB

dense-yolov3-tiny.cfg 5KB

res-slim2-v3-tiny.cfg 3KB

dense-slim2-v3-tiny-spp.cfg 3KB

dense-slim3-v3-tiny-spp.cfg 3KB

dt-6a-spp-RF.cfg 3KB

res10-6a-spp.cfg 3KB

yolov3-tiny-3l-9a.cfg 3KB

dt-6a-conv.cfg 2KB

dt-6a-spp2.cfg 2KB

dt-6a-vov.cfg 2KB

dt-6a-dense-spp.cfg 2KB

dt-6a-prn-spp.cfg 2KB

dt-6a-multi-se.cfg 2KB

dt-6a-spp-ffm.cfg 2KB

dt-6a-16d-up4.cfg 2KB

yolov3-tiny-prn.cfg 2KB

dt-6a-spp-multi-se.cfg 2KB

dt-6a-RFB.cfg 2KB

dt-6a-spp-cbam-branch.cfg 2KB

dt-6a-bifpn.cfg 2KB

dt-6a-add-spp.cfg 2KB

dt-6a-spp-multi-gray.cfg 2KB

dt-6a-maxpoolone.cfg 2KB

dt-6a-spp-11-13-15.cfg 2KB

dt-6a-spp.cfg 2KB

dt-6a-spp-fl.cfg 2KB

dt-6a-slim-spp.cfg 2KB

dt-6a-corner-spp.cfg 2KB

dt-6a-spp-11-15.cfg 2KB

dt-6a-spp-9-13.cfg 2KB

dt-6a-spp-5-13.cfg 2KB

dt-6a-spp-5-9.cfg 2KB

dt-6a-spp-13-se.cfg 2KB

dt-6a-spp-acconv.cfg 2KB

yolov3-tiny-1cls.cfg 2KB

yolov3-tiny-6a.cfg 2KB

dt-6a-dilated.cfg 2KB

yolov3-tiny-dwconv.cfg 2KB

dt-6a-spp-15.cfg 2KB

dt-6a-spp-11.cfg 2KB

dt-6a-spp-13.cfg 2KB

dt-6a-spp-9.cfg 2KB

dt-6a-spp-5.cfg 2KB

dt-6a-sk.cfg 2KB

dt-6a-aspp.cfg 2KB

dt-6a-se.cfg 2KB

yolov3-tiny-cbam.cfg 2KB

dt-6a-32d-up4.cfg 2KB

dt-6a-ppm.cfg 2KB

yolov3-tiny-se.cfg 2KB

dt-6a-spp-dwconv.cfg 2KB

dt-6a-cbam.cfg 2KB

yolov3-tiny.cfg 2KB

yolov3-tiny-3cls.cfg 2KB

dimtarget2.cfg 2KB

dt-16d-6a.cfg 2KB

dt-6a-swish.cfg 2KB

dt-8d-6a.cfg 2KB

dt-4d-6a.cfg 2KB

dt-3a.cfg 1KB

dimtarget.cfg 1KB

dt-16d-3a.cfg 1KB

dimtargetSingle.data 910B

voc.data 126B

coco2017.data 87B

coco2014.data 85B

coco1cls.data 80B

coco16.data 77B

coco64.data 77B

coco1.data 75B

.gitignore 78B

examples.ipynb 860KB

README.md 30KB

共 142 条

# 我们是如何改进YOLOv3进行红外小目标检测的？介绍pprp、BBuf、小武一起在过年期间完成的一个目标检测项目，将描述我们模型改进的思路、实验思路、结果汇总和经验性总结。声明：这篇文章经过了三人同意，并且所有创新点也将被公布。此外，由于经验上的不足，可能整个实验思路不够成熟，如有问题还烦请指教。 ## 1. 红外小目标检测红外小目标检测的目标比较小，目标极其容易和其他物体混淆，有一定的挑战性。另外，这本质上也是一个小目标领域的问题，很多适用于小目标的创新点也会被借鉴进来。 ![数据来源自@小武](https://img-blog.csdnimg.cn/20200831212549491.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0REX1BQX0pK,size_16,color_FFFFFF,t_70#pic_center) 此外，该数据集还有一个特点，就是分背景，虽然同样是检测红外小目标，区别是背景的不同，我们对数据集进行了统计以及通过人工翻看的方式总结了其特点，如下表所示： | 背景类别 | 数量 | 特点 | 数据难度 | 测试mAP+F1 | 建议 | | -------------------- | ---- | ------------------------------------------------------------ | -------- | ---------- | ----------------------------------------------- | | trees | 581 | 背景干净，目标明显，数量较多 | 低 | 0.99+0.97 | 无 | | cloudless_sky | 1320 | 背景干净，目标明显，数量多 | 低 | 0.98+0.99 | 无 | | architecture | 506 | 背景变化较大，目标形态变化较大，数量较多 | 一般 | 0.92+0.96 | focal loss | | continuous_cloud_sky | 878 | 背景干净，目标形态变化不大，但个别目标容易会发生和背景中的云混淆 | 一般 | 0.93+0.95 | focal loss | | complex_cloud | 561 | 目标形态基本无变化，但背景对目标的定位影响巨大 | 较难 | 0.85+0.89 | focal loss | | sea | 17 | 背景干净，目标明显，数量极少 | 一般 | 0.87+0.88 | 生成高质量新样本，可以让其转为简单样本（Mixup） | | sea_sky | 45 | 背景变化较大，且单张图像中目标个数差异变化大，有密集的难点，且数量少 | 困难 | 0.68+0.77 | paste策略 | 通过以上结果，可以看出背景的不同对结果影响还是蛮大的，最后一列也给出了针对性的建议，打算后续实施。 ## 2. 实验过程首先，我们使用的是U版的yolov3: `https://github.com/ultralytics/yolov3`，那时候YOLOv4/5、PPYOLO还都没出，当时出了一个《从零开始学习YOLOv3》就是做项目的时候写的电子书，其中的在YOLOv3中添加注意力机制那篇很受欢迎我们项目的代码以及修改情况可以查看：`https://github.com/GiantPandaCV/yolov3-point` 将数据集转成VOC格式的数据集，之前文章有详细讲述如何转化为标准的VOC数据集，以及如何将VOC格式数据集转化为U版的讲解。当时接触到几个项目，都需要用YOLOv3，由于每次都需要转化，大概分别调用4、5个脚本吧，感觉很累，所以当时花了一段时间构建了一个一键从VOC转U版YOLOv3格式的脚本库: `https://github.com/pprp/voc2007_for_yolo_torch`。到此时为止，我们项目就已经可以运行了，然后就是很多细节调整了。 ### 2.1 修改Anchor 红外小目标的Anchor和COCO等数据集的Anchor是差距很大的，为了更好更快速的收敛，采用了BBuf总结的一套专门计算Anchor的脚本： ```python #coding=utf-8 import xml.etree.ElementTree as ET import numpy as np def iou(box, clusters): """ 计算一个ground truth边界盒和k个先验框(Anchor)的交并比(IOU)值。参数box: 元组或者数据，代表ground truth的长宽。参数clusters: 形如(k,2)的numpy数组，其中k是聚类Anchor框的个数返回：ground truth和每个Anchor框的交并比。 """ x = np.minimum(clusters[:, 0], box[0]) y = np.minimum(clusters[:, 1], box[1]) if np.count_nonzero(x == 0) > 0 or np.count_nonzero(y == 0) > 0: raise ValueError("Box has no area") intersection = x * y box_area = box[0] * box[1] cluster_area = clusters[:, 0] * clusters[:, 1] iou_ = intersection / (box_area + cluster_area - intersection) return iou_ def avg_iou(boxes, clusters): """ 计算一个ground truth和k个Anchor的交并比的均值。 """ return np.mean([np.max(iou(boxes[i], clusters)) for i in range(boxes.shape[0])]) def kmeans(boxes, k, dist=np.median): """ 利用IOU值进行K-means聚类参数boxes: 形状为(r, 2)的ground truth框，其中r是ground truth的个数参数k: Anchor的个数参数dist: 距离函数返回值：形状为(k, 2)的k个Anchor框 """ # 即是上面提到的r rows = boxes.shape[0] # 距离数组，计算每个ground truth和k个Anchor的距离 distances = np.empty((rows, k)) # 上一次每个ground truth"距离"最近的Anchor索引 last_clusters = np.zeros((rows,)) # 设置随机数种子 np.random.seed() # 初始化聚类中心，k个簇，从r个ground truth随机选k个 clusters = boxes[np.random.choice(rows, k, replace=False)] # 开始聚类 while True: # 计算每个ground truth和k个Anchor的距离，用1-IOU(box,anchor)来计算 for row in range(rows): distances[row] = 1 - iou(boxes[row], clusters) # 对每个ground truth，选取距离最小的那个Anchor，并存下索引 nearest_clusters = np.argmin(distances, axis=1) # 如果当前每个ground truth"距离"最近的Anchor索引和上一次一样，聚类结束 if (last_clusters == nearest_clusters).all(): break # 更新簇中心为簇里面所有的ground truth框的均值 for cluster in range(k): clusters[cluster] = dist(boxes[nearest_clusters == cluster], axis=0) # 更新每个ground truth"距离"最近的Anchor索引 last_clusters = nearest_clusters return clusters # 加载自己的数据集，只需要所有labelimg标注出来的xml文件即可 def load_dataset(path): dataset = [] for xml_file in glob.glob("{}/*xml".format(path)): tree = ET.parse(xml_file) # 图片高度 height = int(tree.findtext("./size/height")) # 图片宽度 width = int(tree.findtext("./size/width")) for obj in tree.iter("object"): # 偏移量 xmin = int(obj.findtext("bndbox/xmin")) / width ymin = int(obj.findtext("bndbox/ymin")) / height xmax = int(obj.findtext("bndbox/xmax")) / width ymax = int(obj.findtext("bndbox/ymax")) / height xmin = np.float64(xmin) ymin = np.float64(ymin) xmax = np.float64(xmax) ymax = np.float64(ymax) if xmax == xmin or ymax == ymin: print(xml_file) # 将Anchor的长宽放入dateset，运行kmeans获得Anchor dataset.append([xmax - xmin, ymax - ymin]) return np.array(dataset) if __name__ == '__main__': ANNOTATIONS_PATH = "F:\Annotations" #xml文件所在文件夹 CLUSTERS = 9 #聚类数量，anchor数量 INPUTDIM = 416 #输入网络大小 data = load_dataset(ANN

评论收藏

内容反馈