目标检测-使用Yolov5+Pytorch训练自己的数据集-超详细流程教程-优质项目实战.zip

共69个文件

py：20个

jpg：14个

yaml：9个

版权申诉

目标检测

Yolov5

Pytorch

深度学习

53 浏览量 2024-02-19 11:04:32 上传评论收藏 13.81MB ZIP 举报

在本教程中，我们将深入探讨如何使用Yolov5和PyTorch框架进行目标检测，以及如何训练自己的数据集。目标检测是计算机视觉领域的重要任务，它涉及识别图像中的特定对象并确定其位置。Yolov5是一款高效、准确且易于使用的深度学习目标检测模型，而PyTorch则是一个流行的深度学习框架，提供了灵活的神经网络构建和训练工具。我们需要理解Yolov5的工作原理。YOLO（You Only Look Once）是一种实时目标检测系统，以其速度快和精度高而受到广泛关注。Yolov5是该系列的最新版本，通过优化网络架构和训练策略，进一步提升了检测性能。它采用了单阶段检测方法，直接预测边界框和类别概率，减少了计算步骤，从而提高了速度。在使用Yolov5训练自定义数据集之前，你需要准备以下内容： 1. 数据集：收集包含标注的图像，每个图像至少需要标注出目标对象的位置和类别。标注通常以JSON或CSV格式存储，包含了边界框坐标和对应的类标签。 2. 数据预处理：将数据集划分为训练集和验证集，并对图像进行缩放、归一化等预处理操作，确保模型能够有效地学习。 3. 配置文件：修改Yolov5提供的配置文件（如`yaml`），设置模型参数，如学习率、批次大小、训练轮数等，同时指定数据集路径和类别数量。接下来，我们将按照以下步骤进行训练： 1. 安装环境：确保已安装Python、PyTorch和Yolov5。可以使用`conda`或`pip`来安装必要的库和依赖项。 2. 准备数据：将你的数据集组织成Yolov5可读的格式，这通常包括创建`train.txt`和`val.txt`文件，分别列出训练和验证集的图像路径。 3. 运行训练：使用命令行工具运行训练脚本，例如： ``` python train.py --weights yolov5s.pt --data your_data.yaml --img 640 --batch 16 --epochs 300 ``` 这里，`--weights`指定预训练权重，`--data`是配置文件，`--img`是输入图像尺寸，`--batch`是批次大小，`--epochs`是训练轮数。 4. 监控训练：训练过程中，模型会定期保存最佳权重，根据验证集的损失和精度来评估模型性能。你可以通过日志文件跟踪训练进度。 5. 测试与部署：训练完成后，使用测试集评估模型性能。你可以用`test.py`脚本进行测试，并生成结果可视化。一旦满意，可以将模型集成到实际应用中，进行实时目标检测。此外，对于初学者来说，理解PyTorch中的模型架构、损失函数和优化器也是至关重要的。Yolov5的模型结构基于Darknet，由一系列卷积层、批归一化和激活函数组成，形成了检测目标的多个输出层。损失函数通常包括定位损失和分类损失，优化器如AdamW可以帮助模型更快地收敛。在项目实战中，你可能还会遇到数据增强、模型微调、多GPU训练等高级话题。数据增强可以通过随机翻转、旋转、裁剪等方式增加模型的泛化能力。如果资源允许，使用多GPU训练可以显著缩短训练时间。通过这个教程，你将掌握使用Yolov5和PyTorch进行目标检测的完整流程，包括数据预处理、模型训练、评估和部署。实践是检验真理的唯一标准，动手尝试才是提升技能的最佳途径。祝你在目标检测的道路上取得成功！

资源推荐

资源详情

资源评论

收起资源包目录

目标检测_使用Yolov5+Pytorch训练自己的数据集_超详细流程教程_优质项目实战.zip （69个子文件）

目标检测_使用Yolov5+Pytorch训练自己的数据集_超详细流程教程_优质项目实战

inference

output

zidane.jpg 249KB

bus.jpg 480KB

images

zidane.jpg 165KB

bus.jpg 476KB

results.txt 44KB

README_v3.md 3KB

weights

readme 42B

download_weights.sh 204B

data

coco128.yaml 1KB

score.yaml 599B

coco.yaml 2KB

get_coco2017.sh 975B

hubconf.py 3KB

runs

readme 35B

README_YOLO_v5.md 8KB

utils

utils.py 46KB

__init__.py 0B

google_utils.py 4KB

activations.py 2KB

datasets.py 34KB

torch_utils.py 8KB

yolov5_trt.py 16KB

datasets

03_train_val_split.py 571B

01_check_img.py 1KB

04_myData_label.py 2KB

score

labels

readme 35B

images

readme 36B

02_check_box.py 2KB

README.pdf 3.39MB

Dockerfile 2KB

gen_wts.py 558B

requirements.txt 871B

models

yolov5m.yaml 1KB

yolov5s.yaml 1KB

yolov5l.yaml 1KB

score

yolov5x.yaml 1KB

common.py 3KB

yolov3-spp.yaml 2KB

onnx_export.py 2KB

experimental.py 3KB

yolov5x.yaml 1KB

yolo.py 10KB

detect.py 7KB

train.py 21KB

test.py 12KB

.dockerignore 3KB

README.md 9KB

readmepic

readme1

84200349-729f2680-aa5b-11ea-8f9a-604c9e01a658.png 208KB

84186698-c4d54d00-aa45-11ea-9bde-c632c1230ccd.png 316KB

YOLOv4_author2.jpg 33KB

83082816-59e54880-a039-11ea-8abe-ab90cc1ec4b0.jpeg 251KB

82944393-f7644d80-9f4f-11ea-8b87-1a5b04f555f1.jpg 392KB

readme2

pic

83666389-bab4d980-a581-11ea-898b-b25471d37b83.jpg 265KB

datalist.png 11KB

83667635-90641b80-a583-11ea-8075-606316cebb9c.jpeg 552KB

test_batch0_pred.jpg 338KB

train_batch0.jpg 674KB

20200514_p6_5_247_one.jpg 507KB

t1.jpg 200KB

train_batch1.jpg 659KB

83667810-d7eaa780-a583-11ea-8de8-5cca0673d076.png 240KB

results.png 196KB

train_batch2.jpg 678KB

78174482-307bb800-740e-11ea-8b09-840693671042.png 177KB

83667642-90fcb200-a583-11ea-8fa3-338bbf7da194.jpeg 774KB

test_batch0_gt.jpg 347KB

83667626-8c37fe00-a583-11ea-997b-0923fe59b29b.jpeg 550KB

教程.md 8KB

tutorial.ipynb 3.11MB

## [YOLO v5](https://github.com/ultralytics/yolov5)在医疗领域中消化内镜目标检测的应用 ### YOLO v5训练自己数据集详细教程 :bug: :bug: 现在YOLOv5 已经更新到6.0版本了，但是其训练方式同本Repo是一致的，只需要按照对应版本安装对应Python环境即可，其数据集的构建，配置文件的修改，训练方式等完全与本Repo一致！ :bug: :bug: 我们提供了YOLOv5 TensorRT调用和INT8量化的C++和Python代码（其TensorRT加速方式不同于本Repo提供的TensorRT调用方式），有需要的大佬可在issues中留言！ **Xu Jing** ------ :fire: 由于官方新版YOLO v5的backbone和部分参数调整，导致很多小伙伴下载最新官方预训练模型不可用，这里提供原版的YOLO v5的预训练模型的百度云盘下载地址链接：https://pan.baidu.com/s/1SDwp6I_MnRLK45QdB3-yNw 提取码：423j ------ + YOLOv4还没有退热，YOLOv5已经发布！ + 6月9日，Ultralytics公司开源了YOLOv5，离上一次YOLOv4发布不到50天。而且这一次的YOLOv5是完全基于PyTorch实现的！ + YOLO v5的主要贡献者是YOLO v4中重点介绍的马赛克数据增强的作者 <a href="https://apps.apple.com/app/id1452689527" target="_blank"> <img src="readmepic/readme1/82944393-f7644d80-9f4f-11ea-8b87-1a5b04f555f1.jpg" width="1000"></a> > 本项目描述了如何基于自己的数据集训练YOLO v5 <img align="center" src="readmepic/readme1/84200349-729f2680-aa5b-11ea-8f9a-604c9e01a658.png" width="1000"> 但是YOLO v4的二作提供给我们的信息和官方提供的还是有一些出入： <img align="center" src="readmepic/readme1/YOLOv4_author2.jpg" width="800"> #### 0.环境配置安装必要的python package和配置相关环境 ``` # python3.6 # torch==1.3.0 # torchvision==0.4.1 # git clone yolo v5 repo git clone https://github.com/ultralytics/yolov5 # clone repo # 下载官方的样例数据（这一步可以省略） python3 -c "from yolov5.utils.google_utils import gdrive_download; gdrive_download('1n_oKgR81BJtqk75b00eAjdv03qVCQn2f','coco128.zip')" # download dataset cd yolov5 # 安装必要的package pip3 install -U -r requirements.txt ``` #### 1.创建数据集的配置文件`dataset.yaml` [data/coco128.yaml](https://github.com/ultralytics/yolov5/blob/master/data/coco128.yaml)来自于COCO train2017数据集的前128个训练图像，可以基于该`yaml`修改自己数据集的`yaml`文件 ```ymal # train and val datasets (image directory or *.txt file with image paths) train: ./datasets/score/images/train/ val: ./datasets/score/images/val/ # number of classes nc: 3 # class names names: ['QP', 'NY', 'QG'] ``` #### 2.创建标注文件可以使用LabelImg,Labme,[Labelbox](https://labelbox.com/), [CVAT](https://github.com/opencv/cvat)来标注数据，对于目标检测而言需要标注bounding box即可。然后需要将标注转换为和**darknet format**相同的标注形式，每一个图像生成一个`*.txt`的标注文件（如果该图像没有标注目标则不用创建`*.txt`文件）。创建的`*.txt`文件遵循如下规则： - 每一行存放一个标注类别 - 每一行的内容包括`class x_center y_center width height` - Bounding box 的坐标信息是归一化之后的（0-1） - class label转化为index时计数是从0开始的 ```python def convert(size, box): ''' 将标注的xml文件标注转换为darknet形的坐标 ''' dw = 1./(size[0]) dh = 1./(size[1]) x = (box[0] + box[1])/2.0 - 1 y = (box[2] + box[3])/2.0 - 1 w = box[1] - box[0] h = box[3] - box[2] x = x*dw w = w*dw y = y*dh h = h*dh return (x,y,w,h) ``` 每一个标注`*.txt`文件存放在和图像相似的文件目录下，只需要将`/images/*.jpg`替换为`/lables/*.txt`即可（这个在加载数据时代码内部的处理就是这样的，可以自行修改为VOC的数据格式进行加载）例如： ``` datasets/score/images/train/000000109622.jpg # image datasets/score/labels/train/000000109622.txt # label ``` 如果一个标注文件包含5个person类别（person在coco数据集中是排在第一的类别因此index为0）： <img width="500" align="center" alt="Screen Shot 2020-04-01 at 11 44 26 AM" src="./readmepic/readme2/pic/78174482-307bb800-740e-11ea-8b09-840693671042.png"> #### 3.组织训练集的目录将训练集train和验证集val的images和labels文件夹按照如下的方式进行存放 <img width="500" align="center" alt="Screen Shot 2020-04-01 at 11 44 26 AM" src="./readmepic/readme2/pic/datalist.png"> 至此数据准备阶段已经完成，过程中我们假设算法工程师的数据清洗和数据集的划分过程已经自行完成。 #### 4.选择模型backbone进行模型配置文件的修改在项目的`./models`文件夹下选择一个需要训练的模型，这里我们选择[yolov5x.yaml](https://github.com/ultralytics/yolov5/blob/master/models/yolov5x.yaml),最大的一个模型进行训练，参考官方README中的[table](https://github.com/ultralytics/yolov5#pretrained-checkpoints),了解不同模型的大小和推断速度。如果你选定了一个模型，那么需要修改模型对应的`yaml`文件 ```yaml # parameters nc: 3 # number of classes <------------------ UPDATE to match your dataset depth_multiple: 1.33 # model depth multiple width_multiple: 1.25 # layer channel multiple # anchors anchors: - [10,13, 16,30, 33,23] # P3/8 - [30,61, 62,45, 59,119] # P4/16 - [116,90, 156,198, 373,326] # P5/32 # yolov5 backbone backbone: # [from, number, module, args] [[-1, 1, Focus, [64, 3]], # 1-P1/2 [-1, 1, Conv, [128, 3, 2]], # 2-P2/4 [-1, 3, Bottleneck, [128]], [-1, 1, Conv, [256, 3, 2]], # 4-P3/8 [-1, 9, BottleneckCSP, [256]], [-1, 1, Conv, [512, 3, 2]], # 6-P4/16 [-1, 9, BottleneckCSP, [512]], [-1, 1, Conv, [1024, 3, 2]], # 8-P5/32 [-1, 1, SPP, [1024, [5, 9, 13]]], [-1, 6, BottleneckCSP, [1024]], # 10 ] # yolov5 head head: [[-1, 3, BottleneckCSP, [1024, False]], # 11 [-1, 1, nn.Conv2d, [na * (nc + 5), 1, 1, 0]], # 12 (P5/32-large) [-2, 1, nn.Upsample, [None, 2, 'nearest']], [[-1, 6], 1, Concat, [1]], # cat backbone P4 [-1, 1, Conv, [512, 1, 1]], [-1, 3, BottleneckCSP, [512, False]], [-1, 1, nn.Conv2d, [na * (nc + 5), 1, 1, 0]], # 17 (P4/16-medium) [-2, 1, nn.Upsample, [None, 2, 'nearest']], [[-1, 4], 1, Concat, [1]], # cat backbone P3 [-1, 1, Conv, [256, 1, 1]], [-1, 3, BottleneckCSP, [256, False]], [-1, 1, nn.Conv2d, [na * (nc + 5), 1, 1, 0]], # 22 (P3/8-small) [[], 1, Detect, [nc, anchors]], # Detect(P3, P4, P5) ] ``` #### 5.Train ```bash # Train yolov5x on score for 300 epochs $ python3 train.py --img-size 640 --batch-size 16 --epochs 300 --data ./data/score.yaml --cfg ./models/score/yolov5x.yaml --weights weights/yolov5x.pt ``` #### 6.Visualize 开始训练后，查看`train*.jpg`图片查看训练数据，标签和数据增强，如果你的图像显示标签或数据增强不正确，你应该查看你的数据集的构建过程是否有问题 <img width="1000" align="center" alt="Screen Shot 2020-04-01 at 11 44 26 AM" src="./readmepic/readme2/pic/train_batch0.jpg"> 一个训练epoch完成后，查看`test_batch0_gt.jpg`查看batch 0 ground truth的labels <img width="1000" align="center" alt="Screen Shot 2020-04-01 at 11 44 26 AM" src="./readmepic/readme2/pic/test_batch0_gt.jpg"> 查看`test_batch0_pred.jpg`查看test batch 0的预测 <img width="1000" align="center" alt="Screen Shot 2020-04-01 at 11 44 26 AM" src="./readmepic/readme2/pic/test_batch0_pred.jpg"> 训练的losses和评价指标被保存在Tensorboard和`results.txt`log文件。`results.txt`在训练结束后会被可视化为`results.png` ```python >>> from utils.utils import plot_results >>> plot_results() # 如果你是用远程连接请安装配置Xming: https://blog.csdn.net/akuoma/article/details/82182913 ``` <img wid

评论收藏

内容反馈

版权申诉