## [YOLO v5](https://github.com/ultralytics/yolov5)在医疗领域中消化内镜目标检测的应用
### YOLO v5训练自己数据集详细教程
**Xu Jing**
------
:fire: 由于官方新版YOLO v5的backbone和部分参数调整,导致很多小伙伴下载最新官方预训练模型不可用,这里提供原版的YOLO v5的预训练模型的百度云盘下载地址
链接:https://pan.baidu.com/s/1SDwp6I_MnRLK45QdB3-yNw
提取码:423j
------
+ YOLOv4还没有退热,YOLOv5已经发布!
+ 6月9日,Ultralytics公司开源了YOLOv5,离上一次YOLOv4发布不到50天。而且这一次的YOLOv5是完全基于PyTorch实现的!
+ YOLO v5的主要贡献者是YOLO v4中重点介绍的马赛克数据增强的作者
<a href="https://apps.apple.com/app/id1452689527" target="_blank">
<img src="readmepic/readme1/82944393-f7644d80-9f4f-11ea-8b87-1a5b04f555f1.jpg" width="1000"></a>
> 本项目描述了如何基于自己的数据集训练YOLO v5
<img align="center" src="readmepic/readme1/84200349-729f2680-aa5b-11ea-8f9a-604c9e01a658.png" width="1000">
但是YOLO v4的二作提供给我们的信息和官方提供的还是有一些出入:
<img align="center" src="readmepic/readme1/YOLOv4_author2.jpg" width="800">
#### 0.环境配置
安装必要的python package和配置相关环境
```
# python3.6
# torch==1.3.0
# torchvision==0.4.1
# git clone yolo v5 repo
git clone https://github.com/ultralytics/yolov5 # clone repo
# 下载官方的样例数据(这一步可以省略)
python3 -c "from yolov5.utils.google_utils import gdrive_download; gdrive_download('1n_oKgR81BJtqk75b00eAjdv03qVCQn2f','coco128.zip')" # download dataset
cd yolov5
# 安装必要的package
pip3 install -U -r requirements.txt
```
#### 1.创建数据集的配置文件`dataset.yaml`
[data/coco128.yaml](https://github.com/ultralytics/yolov5/blob/master/data/coco128.yaml)来自于COCO train2017数据集的前128个训练图像,可以基于该`yaml`修改自己数据集的`yaml`文件
```ymal
# train and val datasets (image directory or *.txt file with image paths)
train: ./datasets/score/images/train/
val: ./datasets/score/images/val/
# number of classes
nc: 3
# class names
names: ['QP', 'NY', 'QG']
```
#### 2.创建标注文件
可以使用LabelImg,Labme,[Labelbox](https://labelbox.com/), [CVAT](https://github.com/opencv/cvat)来标注数据,对于目标检测而言需要标注bounding box即可。然后需要将标注转换为和**darknet format**相同的标注形式,每一个图像生成一个`*.txt`的标注文件(如果该图像没有标注目标则不用创建`*.txt`文件)。创建的`*.txt`文件遵循如下规则:
- 每一行存放一个标注类别
- 每一行的内容包括`class x_center y_center width height`
- Bounding box 的坐标信息是归一化之后的(0-1)
- class label转化为index时计数是从0开始的
```python
def convert(size, box):
'''
将标注的xml文件标注转换为darknet形的坐标
'''
dw = 1./(size[0])
dh = 1./(size[1])
x = (box[0] + box[1])/2.0 - 1
y = (box[2] + box[3])/2.0 - 1
w = box[1] - box[0]
h = box[3] - box[2]
x = x*dw
w = w*dw
y = y*dh
h = h*dh
return (x,y,w,h)
```
每一个标注`*.txt`文件存放在和图像相似的文件目录下,只需要将`/images/*.jpg`替换为`/lables/*.txt`即可(这个在加载数据时代码内部的处理就是这样的,可以自行修改为VOC的数据格式进行加载)
例如:
```
datasets/score/images/train/000000109622.jpg # image
datasets/score/labels/train/000000109622.txt # label
```
如果一个标注文件包含5个person类别(person在coco数据集中是排在第一的类别因此index为0):
<img width="500" align="center" alt="Screen Shot 2020-04-01 at 11 44 26 AM" src="./readmepic/readme2/pic/78174482-307bb800-740e-11ea-8b09-840693671042.png">
#### 3.组织训练集的目录
将训练集train和验证集val的images和labels文件夹按照如下的方式进行存放
<img width="500" align="center" alt="Screen Shot 2020-04-01 at 11 44 26 AM" src="./readmepic/readme2/pic/datalist.png">
至此数据准备阶段已经完成,过程中我们假设算法工程师的数据清洗和数据集的划分过程已经自行完成。
#### 4.选择模型backbone进行模型配置文件的修改
在项目的`./models`文件夹下选择一个需要训练的模型,这里我们选择[yolov5x.yaml](https://github.com/ultralytics/yolov5/blob/master/models/yolov5x.yaml),最大的一个模型进行训练,参考官方README中的[table](https://github.com/ultralytics/yolov5#pretrained-checkpoints),了解不同模型的大小和推断速度。如果你选定了一个模型,那么需要修改模型对应的`yaml`文件
```yaml
# parameters
nc: 3 # number of classes <------------------ UPDATE to match your dataset
depth_multiple: 1.33 # model depth multiple
width_multiple: 1.25 # layer channel multiple
# anchors
anchors:
- [10,13, 16,30, 33,23] # P3/8
- [30,61, 62,45, 59,119] # P4/16
- [116,90, 156,198, 373,326] # P5/32
# yolov5 backbone
backbone:
# [from, number, module, args]
[[-1, 1, Focus, [64, 3]], # 1-P1/2
[-1, 1, Conv, [128, 3, 2]], # 2-P2/4
[-1, 3, Bottleneck, [128]],
[-1, 1, Conv, [256, 3, 2]], # 4-P3/8
[-1, 9, BottleneckCSP, [256]],
[-1, 1, Conv, [512, 3, 2]], # 6-P4/16
[-1, 9, BottleneckCSP, [512]],
[-1, 1, Conv, [1024, 3, 2]], # 8-P5/32
[-1, 1, SPP, [1024, [5, 9, 13]]],
[-1, 6, BottleneckCSP, [1024]], # 10
]
# yolov5 head
head:
[[-1, 3, BottleneckCSP, [1024, False]], # 11
[-1, 1, nn.Conv2d, [na * (nc + 5), 1, 1, 0]], # 12 (P5/32-large)
[-2, 1, nn.Upsample, [None, 2, 'nearest']],
[[-1, 6], 1, Concat, [1]], # cat backbone P4
[-1, 1, Conv, [512, 1, 1]],
[-1, 3, BottleneckCSP, [512, False]],
[-1, 1, nn.Conv2d, [na * (nc + 5), 1, 1, 0]], # 17 (P4/16-medium)
[-2, 1, nn.Upsample, [None, 2, 'nearest']],
[[-1, 4], 1, Concat, [1]], # cat backbone P3
[-1, 1, Conv, [256, 1, 1]],
[-1, 3, BottleneckCSP, [256, False]],
[-1, 1, nn.Conv2d, [na * (nc + 5), 1, 1, 0]], # 22 (P3/8-small)
[[], 1, Detect, [nc, anchors]], # Detect(P3, P4, P5)
]
```
#### 5.Train
```bash
# Train yolov5x on score for 300 epochs
$ python3 train.py --img-size 640 --batch-size 16 --epochs 300 --data ./data/score.yaml --cfg ./models/score/yolov5x.yaml --weights weights/yolov5x.pt
```
#### 6.Visualize
开始训练后,查看`train*.jpg`图片查看训练数据,标签和数据增强,如果你的图像显示标签或数据增强不正确,你应该查看你的数据集的构建过程是否有问题
<img width="1000" align="center" alt="Screen Shot 2020-04-01 at 11 44 26 AM" src="./readmepic/readme2/pic/train_batch0.jpg">
一个训练epoch完成后,查看`test_batch0_gt.jpg`查看batch 0 ground truth的labels
<img width="1000" align="center" alt="Screen Shot 2020-04-01 at 11 44 26 AM" src="./readmepic/readme2/pic/test_batch0_gt.jpg">
查看`test_batch0_pred.jpg`查看test batch 0的预测
<img width="1000" align="center" alt="Screen Shot 2020-04-01 at 11 44 26 AM" src="./readmepic/readme2/pic/test_batch0_pred.jpg">
训练的losses和评价指标被保存在Tensorboard和`results.txt`log文件。`results.txt`在训练结束后会被可视化为`results.png`
```python
>>> from utils.utils import plot_results
>>> plot_results()
# 如果你是用远程连接请安装配置Xming: https://blog.csdn.net/akuoma/article/details/82182913
```
<img width="1000" align="center" alt="Screen Shot 2020-04-01 at 11 44 26 AM" src="./readmepic/readme2/pic/results.png">
#### 7.推断
```python
$ python3 detect.py --source file.jpg # image
file.mp4 # video
./dir # directory
0 # webcam
rtsp://170.93.143.139/rtplive/470011e600ef003a004ee33696235daa # rtsp stream
h
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
YOLO-v5.zip (97个子文件)
.git
info
exclude 240B
objects
pack
pack-49452c46ca5372a848f42e634be5b07decfc69a5.idx 13KB
pack-49452c46ca5372a848f42e634be5b07decfc69a5.pack 13.9MB
info
HEAD 23B
description 73B
packed-refs 114B
config 266B
index 7KB
refs
tags
remotes
origin
HEAD 32B
heads
master 41B
hooks
commit-msg.sample 896B
pre-receive.sample 544B
fsmonitor-watchman.sample 3KB
pre-rebase.sample 5KB
prepare-commit-msg.sample 2KB
update.sample 4KB
pre-push.sample 1KB
pre-commit.sample 2KB
post-update.sample 189B
applypatch-msg.sample 478B
pre-applypatch.sample 424B
logs
HEAD 189B
refs
remotes
origin
HEAD 189B
heads
master 189B
Dockerfile 2KB
requirements.txt 871B
data
get_coco2017.sh 975B
coco.yaml 2KB
coco128.yaml 1KB
score.yaml 599B
datasets
02_check_box.py 2KB
01_check_img.py 1KB
03_train_val_split.py 571B
score
images
readme 36B
labels
readme 35B
04_myData_label.py 3KB
.dockerignore 3KB
README.pdf 3.39MB
models
experimental.py 3KB
yolov5m.yaml 1KB
yolo.py 10KB
yolov3-spp.yaml 2KB
yolov5x.yaml 1KB
yolov5l.yaml 1KB
onnx_export.py 2KB
__pycache__
yolo.cpython-37.pyc 8KB
common.cpython-37.pyc 5KB
experimental.cpython-37.pyc 4KB
score
yolov5x.yaml 1KB
common.py 3KB
yolov5s.yaml 1KB
LICENSE 34KB
readmepic
readme1
83082816-59e54880-a039-11ea-8abe-ab90cc1ec4b0.jpeg 251KB
84186698-c4d54d00-aa45-11ea-9bde-c632c1230ccd.png 316KB
84200349-729f2680-aa5b-11ea-8f9a-604c9e01a658.png 208KB
82944393-f7644d80-9f4f-11ea-8b87-1a5b04f555f1.jpg 392KB
YOLOv4_author2.jpg 33KB
readme2
教程.md 8KB
pic
test_batch0_pred.jpg 338KB
t1.jpg 200KB
datalist.png 11KB
results.png 196KB
train_batch0.jpg 674KB
83667642-90fcb200-a583-11ea-8fa3-338bbf7da194.jpeg 774KB
train_batch2.jpg 678KB
test_batch0_gt.jpg 347KB
83667810-d7eaa780-a583-11ea-8de8-5cca0673d076.png 240KB
20200514_p6_5_247_one.jpg 507KB
83667635-90641b80-a583-11ea-8075-606316cebb9c.jpeg 552KB
train_batch1.jpg 659KB
83666389-bab4d980-a581-11ea-898b-b25471d37b83.jpg 265KB
83667626-8c37fe00-a583-11ea-997b-0923fe59b29b.jpeg 550KB
78174482-307bb800-740e-11ea-8b09-840693671042.png 177KB
runs
readme 35B
utils
google_utils.py 4KB
activations.py 2KB
__init__.py 0B
datasets.py 34KB
utils.py 46KB
__pycache__
utils.cpython-37.pyc 33KB
datasets.cpython-37.pyc 24KB
__init__.cpython-37.pyc 125B
torch_utils.cpython-37.pyc 8KB
google_utils.cpython-37.pyc 2KB
torch_utils.py 8KB
README_YOLO_v5.md 8KB
results.txt 44KB
README.md 9KB
test.py 12KB
inference
images
bus.jpg 476KB
zidane.jpg 165KB
output
weights
download_weights.sh 204B
readme 42B
tutorial.ipynb 3.11MB
hubconf.py 3KB
detect.py 7KB
train.py 21KB
共 97 条
- 1
资源评论
qq_32332831
- 粉丝: 0
- 资源: 3
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- HTTP协议基础概念解析及其演进过程
- 钢管切割机Creo 7.0全套技术资料100%好用.zip
- MiHealth.apk
- 【深度学习专栏】ch06配套资源
- 机床自动上下料机械手 移载机械手sw14可编辑全套技术资料100%好用.zip
- 小学生出题软件v6.3.3.zip
- MATLAB代码:基于MATLAB的三母线高斯赛德尔潮流分析计算 关键词:潮流计算 电力系统 高斯赛德尔迭代法 MATLAB 参考文献+自制详细实验文档 仿真平台:MATLAB 主要内容:潮流计算是判
- DilateFormer实战:使用DilateFormer实现图像分类任务
- 疫苗预约系统:数据库设计与数据安全性
- 粒子群MPPT多峰值寻优 针对扰动、电导等无法用在局部遮阴下,使用粒子群pso算法克服 附使用说明及解析,包括扰动法PO与粒子群PSO法
- 极片自动制片成型模切机sw16可编辑全套技术资料100%好用.zip
- 基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)
- 酒店客房管理系统:集成技术与服务创新
- 5个小游戏源代码和图片、音频等资源
- 知攻善防-应急响应靶机-web2-z05-z07.zip
- Python毕业设计Django+Neo4j基于医疗知识图谱的问答系统项目源码+使用说明
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功