期末实训--垃圾目标检测2.6.zip资源-CSDN文库

共2000个文件

yml：712个

py：412个

md：266个

版权申诉

89 浏览量 2024-09-06 19:01:49 上传评论收藏 84.62MB ZIP 举报

1 目标检测的定义目标检测（Object Detection）的任务是找出图像中所有感兴趣的目标（物体），确定它们的类别和位置，是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态，加上成像时光照、遮挡等因素的干扰，目标检测一直是计算机视觉领域最具有挑战性的问题。目标检测任务可分为两个关键的子任务，目标定位和目标分类。首先检测图像中目标的位置（目标定位），然后给出每个目标的具体类别（目标分类）。输出结果是一个边界框（称为Bounding-box，一般形式为(x1,y1,x2,y2)，表示框的左上角坐标和右下角坐标），一个置信度分数（Confidence Score），表示边界框中是否包含检测对象的概率和各个类别的概率（首先得到类别概率，经过Softmax可得到类别标签）。 1.1 Two stage方法目前主流的基于深度学习的目标检测算法主要分为两类：Two stage和One stage。Two stage方法将目标检测过程分为两个阶段。第一个阶段是 Region Proposal 生成阶段，主要用于生成潜在的目标候选框（Bounding-box proposals）。这个阶段通常使用卷积神经网络（CNN）从输入图像中提取特征，然后通过一些技巧（如选择性搜索）来生成候选框。第二个阶段是分类和位置精修阶段，将第一个阶段生成的候选框输入到另一个 CNN 中进行分类，并根据分类结果对候选框的位置进行微调。Two stage 方法的优点是准确度较高，缺点是速度相对较慢。常见Tow stage目标检测算法有：R-CNN系列、SPPNet等。 1.2 One stage方法 One stage方法直接利用模型提取特征值，并利用这些特征值进行目标的分类和定位，不需要生成Region Proposal。这种方法的优点是速度快，因为省略了Region Proposal生成的过程。One stage方法的缺点是准确度相对较低，因为它没有对潜在的目标进行预先筛选。常见的One stage目标检测算法有：YOLO系列、SSD系列和RetinaNet等。 2 常见名词解释 2.1 NMS(Non-Maximum Suppression) 目标检测模型一般会给出目标的多个预测边界框，对成百上千的预测边界框都进行调整肯定是不可行的,需要对这些结果先进行一个大体的挑选。NMS称为非极大值抑制，作用是从众多预测边界框中挑选出最具代表性的结果，这样可以加快算法效率，其主要流程如下：设定一个置信度分数阈值，将置信度分数小于阈值的直接过滤掉将剩下框的置信度分数从大到小排序，选中值最大的框遍历其余的框，如果和当前框的重叠面积(IOU)大于设定的阈值（一般为0.7），就将框删除（超过设定阈值，认为两个框的里面的物体属于同一个类别）从未处理的框中继续选一个置信度分数最大的，重复上述过程，直至所有框处理完毕 2.2 IoU(Intersection over Union) 定义了两个边界框的重叠度，当预测边界框和真实边界框差异很小时，或重叠度很大时，表示模型产生的预测边界框很准确。边界框A、B的IOU计算公式为: 2.3 mAP(mean Average Precision) mAP即均值平均精度，是评估目标检测模型效果的最重要指标，这个值介于0到1之间，且越大越好。mAP是AP(Average Precision)的平均值，那么首先需要了解AP的概念。想要了解AP的概念，还要首先了解目标检测中Precision和Recall的概念。首先我们设置置信度阈值（Confidence Threshold）和IoU阈值（一般设置为0.5，也会衡量0.75以及0.9的mAP值）：当一个预测边界框被认为是True Positive（TP）时，需要同时满足下面三个条件： Confidence Score > Confidence Threshold 预测类别匹配真实值(Ground truth)的类别预测边界框的IoU大于设定的IoU阈值不满足条件2或条件3，则认为是False Positive（FP）。当对应同一个真值有多个预测结果时，只有最高置信度分数的预测结果被认为是True Positive，其余被认为是False Positive。 Precision和Recall的概念如下图所示： Precision表示TP与预测边界框数量的比值 Recall表示TP与真实边界框数量的比值改变不同的置信度阈值，可以获得多组Precision和Recall，Recall放X轴，Precision放Y轴，可以画出一个Precision-Recall曲线，简称P-R

资源推荐

资源详情

资源评论

收起资源包目录

期末实训--垃圾目标检测2.6.zip （2000个子文件）

demo_bare_metal.c 2KB

main.cc 15KB

object_detector.cc 12KB

keypoint_postprocess.cc 9KB

keypoint_detector.cc 8KB

preprocess_op.cc 6KB

picodet_postprocess.cc 4KB

utils.cc 2KB

config_parser.cc 1KB

arm-none-eabi-gcc.cmake 3KB

main.cpp 14KB

keypoint_postprocess.cpp 10KB

mask_rcnn_r50_fpn_1x_coco.cpp 10KB

main.cpp 10KB

keypoint_postprocess.cpp 10KB

lapjv.cpp 10KB

yolov3_darknet53_270e_coco.cpp 9KB

ppyolo_mbv3_large_coco.cpp 9KB

lapjv.cpp 9KB

picodet_mnn.cpp 9KB

ppyoloe_crn_s_300e_coco.cpp 9KB

picodet_lcnet_1_5x_416_coco.cpp 8KB

picodet.cpp 8KB

tinypose_128x96.cpp 8KB

picodet_mnn.cpp 7KB

keypoint_detector.cpp 7KB

picodet_openvino.cpp 7KB

main.cpp 7KB

keypoint_detector.cpp 7KB

.gitignore 55B

.gitignore 0B

rbox_iou_utils.h 10KB

trajectory.h 8KB

trajectory.h 7KB

preprocess_op.h 6KB

preprocess_op.h 5KB

pipeline.h 5KB

keypoint_postprocess.h 5KB

preprocess_op.h 5KB

object_detector.h 4KB

keypoint_detector.h 4KB

picodet_mnn.h 4KB

keypoint_detector.h 4KB

jde_detector.h 4KB

config_parser.h 4KB

predictor.h 4KB

keypoint_detector.h 4KB

sde_predictor.h 3KB

keypoint_detector.h 3KB

object_detector.h 3KB

jde_predictor.h 3KB

config_parser.h 3KB

keypoint_postprocess.h 3KB

picodet.h 3KB

keypoint_postprocess.h 2KB

picodet_openvino.h 2KB

mask_rcnn_r50_fpn_1x_coco.h 2KB

tracker.h 2KB

picodet_lcnet_1_5x_416_coco.h 2KB

yolov3_darknet53_270e_coco.h 2KB

ppyoloe_crn_s_300e_coco.h 2KB

ppyolo_mbv3_large_coco.h 2KB

tinypose_128x96.h 2KB

postprocess.h 2KB

tracker.h 2KB

lapjv.h 2KB

tvm_runtime.h 2KB

lapjv.h 1KB

picodet_postprocess.h 1KB

utils.h 1KB

crt_config.h 1001B

cpplint_pre_commit.hook 841B

clang_format.hook 36B

picodet_mnn.hpp 3KB

street.jpeg 500KB

picedet_demo.jpeg 428KB

VehicleDetection_001.jpeg 85KB

001.jpeg 79KB

garbage29.jpg 3.28MB

garbage26.jpg 2.44MB

garbage28.jpg 2.43MB

garbage34.jpg 2.27MB

garbage27.jpg 2.27MB

car.jpg 2.18MB

garbage23.jpg 2.09MB

garbage40.jpg 2.09MB

garbage24.jpg 1.94MB

garbage35.jpg 1.92MB

garbage32.jpg 1.84MB

garbage33.jpg 1.71MB

garbage36.jpg 1.55MB

共 2000 条

# PP-YOLOE-SOD 小目标检测模型(PP-YOLOE Small Object Detection) <img src="https://user-images.githubusercontent.com/82303451/182520025-f6bd1c76-a9f9-4f8c-af9b-b37a403258d8.png" title="VisDrone" alt="VisDrone" width="300"><img src="https://user-images.githubusercontent.com/82303451/182521833-4aa0314c-b3f2-4711-9a65-cabece612737.png" title="VisDrone" alt="VisDrone" width="300"><img src="https://user-images.githubusercontent.com/82303451/182520038-cacd5d09-0b85-475c-8e59-72f1fc48eef8.png" title="DOTA" alt="DOTA" height="168"><img src="https://user-images.githubusercontent.com/82303451/182524123-dcba55a2-ce2d-4ba1-9d5b-eb99cb440715.jpeg" title="Xview" alt="Xview" height="168"> ## 内容 - [简介](#简介) - [切图使用说明](#切图使用说明) - [小目标数据集下载](#小目标数据集下载) - [统计数据集分布](#统计数据集分布) - [SAHI切图](#SAHI切图) - [模型库](#模型库) - [VisDrone模型](#VisDrone模型) - [COCO模型](#COCO模型) - [切图模型](#切图模型) - [拼图模型](#拼图模型) - [注意事项](#注意事项) - [模型库使用说明](#模型库使用说明) - [训练](#训练) - [评估](#评估) - [预测](#预测) - [部署](#部署) - [引用](#引用) ## 简介 PaddleDetection团队提供了针对VisDrone-DET、DOTA水平框、Xview等小目标场景数据集的基于PP-YOLOE改进的检测模型 PP-YOLOE-SOD，以及提供了一套使用[SAHI](https://github.com/obss/sahi)(Slicing Aided Hyper Inference)工具的切图和拼图的方案。 - PP-YOLOE-SOD 是PaddleDetection团队自研的小目标检测特色模型，使用**数据集分布相关的基于向量的DFL算法** 和 **针对小目标优化的中心先验优化策略**，并且**在模型的Neck(FPN)结构中加入Transformer模块**，以及结合增加P2层、使用large size等策略，最终在多个小目标数据集上达到极高的精度。 - 切图拼图方案**适用于任何检测模型**，建议**使用 PP-YOLOE-SOD 结合切图拼图方案**一起使用以达到最佳的效果。 - 官方 AI Studio 教程案例请参考 [基于PP-YOLOE-SOD的无人机航拍图像检测案例全流程实操](https://aistudio.baidu.com/aistudio/projectdetail/5036782)，欢迎一起动手实践学习。 - 第三方 AI Studio 教程案例可参考 [PPYOLOE：遥感场景下的小目标检测与部署(切图版)](https://aistudio.baidu.com/aistudio/projectdetail/4493701) 和 [涨分神器！基于PPYOLOE的切图和拼图解决方案](https://aistudio.baidu.com/aistudio/projectdetail/4438275)，欢迎一起动手实践学习。 **注意:** - **不通过切图拼图而直接使用原图或子图**去训练评估预测，推荐使用 PP-YOLOE-SOD 模型，更多细节和消融实验可参照[COCO模型](#COCO模型)和[VisDrone模型](./visdrone)。 - 是否需要切图然后使用子图去**训练**，建议首先参照[切图使用说明](#切图使用说明)中的[统计数据集分布](#统计数据集分布)分析一下数据集再确定，一般数据集中**所有的目标均极小**的情况下推荐切图去训练。 - 是否需要切图然后使用子图去**预测**，建议在切图训练的情况下，配合着**同样操作的切图策略和参数**去预测(inference)效果更佳。但其实即便不切图训练，也可进行切图预测(inference)，只需**在常规的预测命令最后加上`--slice_infer`以及相关子图参数**即可。 - 是否需要切图然后使用子图去**评估**，建议首先确保制作生成了合适的子图验证集，以及确保对应的标注框制作无误，并需要参照[模型库使用说明-评估](#评估)去**改动配置文件中的验证集(EvalDataset)的相关配置**，然后**在常规的评估命令最后加上`--slice_infer`以及相关子图参数**即可。 - `--slice_infer`的操作在PaddleDetection中默认**子图预测框会自动组合并拼回原图**，默认返回的是原图上的预测框，此方法也**适用于任何训好的检测模型**，无论是否切图训练。 ## 切图使用说明 ### 小目标数据集下载 PaddleDetection团队整理提供的VisDrone-DET、DOTA水平框、Xview等小目标场景数据集的下载链接可以参照 [DataDownload.md](./DataDownload.md)。 ### 统计数据集分布对于待训的数据集(默认已处理为COCO格式，参照 [COCO格式数据集准备](../../docs/tutorials/data/PrepareDetDataSet.md#用户数据转成COCO数据)，首先统计**标注框的平均宽高占图片真实宽高的比例**分布：以DOTA水平框数据集的train数据集为例： ```bash python tools/box_distribution.py --json_path dataset/DOTA/annotations/train.json --out_img box_distribution.jpg --eval_size 640 --small_stride 8 ``` - `--json_path` ：待统计数据集 COCO 格式 annotation 的json标注文件路径 - `--out_img` ：输出的统计分布图的路径 - `--eval_size` ：推理尺度（默认640） - `--small_stride` ：模型最小步长（默认8）统计结果打印如下： ```bash Suggested reg_range[1] is 13 # DFL算法中推荐值，在 PP-YOLOE-SOD 模型的配置文件的head中设置为此值，效果最佳 Mean of all img_w is 2304.3981547196595 # 原图宽的平均值 Mean of all img_h is 2180.9354151880766 # 原图高的平均值 Median of ratio_w is 0.03799439775910364 # 标注框的宽与原图宽的比例的中位数 Median of ratio_h is 0.04074914637387802 # 标注框的高与原图高的比例的中位数 all_img with box: 1409 # 数据集图片总数(排除无框或空标注的图片) all_ann: 98905 # 数据集标注框总数 Distribution saved as box_distribution.jpg ``` **注意:** - 一般情况下，在原始数据集全部有标注框的图片中，**原图宽高的平均值大于1500像素，且有1/2以上的图片标注框的平均宽高与原图宽高比例小于0.04时(通过打印中位数得到该值)**，建议进行切图训练。 - `Suggested reg_range[1]` 为数据集在优化后DFL算法中推荐的`reg_range`上限，即`reg_max + 1`，在 PP-YOLOE-SOD 模型的配置文件的head中设置这个值。 ### SAHI切图针对需要切图的数据集，使用[SAHI](https://github.com/obss/sahi)库进行切图： #### 安装SAHI库：参考[SAHI installation](https://github.com/obss/sahi/blob/main/README.md#installation)进行安装，`pip install sahi`，参考[installation](https://github.com/obss/sahi/blob/main/README.md#installation)。 #### 基于SAHI切图以DOTA水平框数据集的train数据集为例，切分后的**子图文件夹**与**子图json标注文件**共同保存在`dota_sliced`文件夹下，分别命名为`train_images_500_025`、`train_500_025.json`： ```bash python tools/slice_image.py --image_dir dataset/DOTA/train/ --json_path dataset/DOTA/annotations/train.json --output_dir dataset/dota_sliced --slice_size 500 --overlap_ratio 0.25 ``` - `--image_dir`：原始数据集图片文件夹的路径 - `--json_path`：原始数据集COCO格式的json标注文件的路径 - `--output_dir`：切分后的子图及其json标注文件保存的路径 - `--slice_size`：切分以后子图的边长尺度大小(默认切图后为正方形) - `--overlap_ratio`：切分时的子图之间的重叠率 **注意:** - 如果切图然后使用子图去**训练**，则只能**离线切图**，即切完图后保存成子图，存放在内存空间中。 - 如果切图然后使用子图去**评估或预测**，则既可以**离线切图**，也可以**在线切图**，PaddleDetection中支持切图并自动拼图组合结果到原图上。 ## 模型库 ### [VisDrone模型](visdrone/) | 模型 | COCOAPI mAPval 0.5:0.95 | COCOAPI mAPval 0.5 | COCOAPI mAPtest_dev 0.5:0.95 | COCOAPI mAPtest_dev 0.5 | MatlabAPI mAPtest_dev 0.5:0.95 | MatlabAPI mAPtest_dev 0.5 | 下载 | 配置文件 | |:---------|:------:|:------:| :-

评论收藏

内容反馈

版权申诉