【免费】【小白CV】手把手教你用YOLOv5训练自己的数据集（从Windows环境配置到模型部署）_梁瑛平的博客-CSDN博客.pdf

需积分: 0 119 浏览量 2021-12-02 17:12:38 上传评论 7 收藏 6.47MB PDF 举报

资源推荐

资源详情

资源评论

【⼩⽩CV】⼿把⼿教你⽤YOLOv5训练⾃⼰的数据集（从Windows环境配置

到模型部署）

BIT可达鸭

20688

分类专栏：

深度学习-计算机视觉

⽂章标签： python

深度学习

⽬标检测

图像处理

计算机视觉

2020-12-04 18:43:39 版权

【⼩⽩CV】⼿把⼿教你⽤YOLOv5训练⾃⼰的数据集（从环境配置到模型部署）

本⽂禁⽌转载

前⾔：

1. 安装Anaconda：

2. 创建虚拟环境：

3. 安装pytorch：

4. 下载源码和安装依赖库：

5. 数据标注：

5. 数据预处理：

6. 下载预训练模型：

7. 开始训练：

关注我的公众号：

本⽂禁⽌转载

前⾔：

今天有时间，就写⼀下⽤yolov5训练⾃⼰数据集的博客吧。

1. 安装Anaconda：

Anaconda官⽹：https://www.anaconda.com/

下载完成后打开⼀路Yes即可，只需要注意这⾥要将conda添加到PATH：

安装完成后打开cmd：

输⼊conda -V，查看是否安装成功：

出现版本号即为安装成功。

2. 创建虚拟环境：

这⾥我们需要为yolov5单独创建⼀个环境，输⼊：

选y：

等待相关库安装：

安装完成后，输⼊：

激活环境：

3. 安装pytorch：

yolov5最新版本需要pytorch1.6版本以上，因此我们安装pytorch1.7版本。由于我事先安装好了CUDA10.1，因此在环境中输⼊：

即可安装：

然后查看CUDA是否可⽤：

这⾥显示True表明正常安装。

4. 下载源码和安装依赖库：

源码地址：https://github.com/ultralytics/yolov5

下载后解压，在⽬录内打开cmd并激活环境：

安装依赖库：

5. 数据标注：

数据标注我们要⽤labelimg，使⽤pip即可安装：

这⾥我⽤百度爬⾍爬取图像：

代码：

cmd输⼊labelimg打开标注软件：

打开后选取图像所在⽂件夹，进⾏标注：

标注完成后，每张图像会⽣成对应的xml标注⽂件：

深度学习-模型压缩（

…

68篇

深度学习-计算机视觉

124篇

基于深度学习的脑电

…

14篇

强化学习

2篇

数字图像处理

6篇

图计算系统/图神经⽹络

8篇

⽬录

【⼩⽩CV】⼿把⼿教你⽤YOLOv5训练

…

本⽂禁⽌转载

前⾔：

1. 安装Anaconda：

2. 创建虚拟环境：

3. 安装pytorch：

4. 下载源码和安装依赖库：

5. 数据标注：

5. 数据预处理：

6. 下载预训练模型：

7. 开始训练：

关注我的公众号：

分类专栏

深度学习-计算机视觉

专栏收录该内容

124 篇⽂章64 订阅

¥99.00

¥29.90

会员免费订 9折续费

conda create -n torch107 python=3.7

activate torch107

pip install torch==1.7.0+cu101 torchvision==0.8.1+cu101 torchaudio===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html

pip install -r requirements.txt

pip install labelimg

import os

import re

import sys

import urllib

import json

import socket

import urllib.request

import urllib.parse

import urllib.error

设置超时

from random import randint

import time

timeout = 5

socket.setdefaulttimeout(timeout)

class Crawler:

睡眠时⻓

__time_sleep = 0.1

__amount = 0

__start_amount = 0

__counter = 0

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}

__per_page = 30

获取图⽚

url

内容等

# t

下载图⽚时间间隔

def __init__(self, t=0.1):

self.time_sleep = t

获取后缀名

@staticmethod

def get_suffix(name):

m = re.search(r'\.[^\.]*$', name)

if m.group(0) and len(m.group(0)) <= 5:

return m.group(0)

else:

return '.jpeg'

保存图⽚

def save_image(self, rsp_data, word):

if not os.path.exists("./" + word):

os.mkdir("./" + word)

判断名字是否重复，获取图⽚⻓度

self.__counter = len(os.listdir('./' + word)) + 1

for image_info in rsp_data['data']:

try:

if 'replaceUrl' not in image_info or len(image_info['replaceUrl']) < 1:

continue

obj_url = image_info['replaceUrl'][0]['ObjUrl']

thumb_url = image_info['thumbURL']

url = 'https://image.baidu.com/search/down?tn=download&ipn=dwnl&word=download&ie=utf8&fr=result&url=%s&thumburl=%s'

urllib.parse.quote(obj_url), urllib.parse.quote(thumb_url))

time.sleep(self.time_sleep)

suffix = self.get_suffix(obj_url)

指定

和

referrer

，减少

403

opener = urllib.request.build_opener()

opener.addheaders = [

('User-agent', 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36'

]

urllib.request.install_opener(opener)

保存图⽚

filepath = './{}/PME_{}_A{}'.format(word, randint(

1000000, 500000000), str(self.__counter) + str(suffix))

for _ in range(5):

urllib.request.urlretrieve(url, filepath)

if os.path.getsize(filepath) >= 5:

break

if os.path.getsize(filepath) < 5:

print("下载到了空⽂件，跳过!")

os.unlink(filepath)

continue

except urllib.error.HTTPError as urllib_err:

print(urllib_err)

continue

except Exception as err:

time.sleep(1)

print(err)

print("产⽣未知错误，放弃保存")

continue

else:

print("图+1,已有" + str(self.__counter) + "张图")

self.__counter += 1

return

开始获取

def get_images(self, word):

search = urllib.parse.quote(word)

# pn int

图⽚数

pn = self.__start_amount

while pn < self.__amount:

url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord=%s&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=&hd=&latest=&copyright=&word=%s&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&pn=%s&rn=%d&gsm=1e&1594447993172='

search, search, str(pn), self.__per_page)

设置

header

防

403

try:

time.sleep(self.time_sleep)

req = urllib.request.Request(url=url, headers=self.headers)

page = urllib.request.urlopen(req)

rsp = page.read()

except UnicodeDecodeError as e:

print(e)

print('-----UnicodeDecodeErrorurl:', url)

except urllib.error.URLError as e:

print(e)

print("-----urlErrorurl:", url)

except socket.timeout as e:

print(e)

print("-----socket timout:", url)

else:

解析

json

try:

rsp_data = json.loads(rsp)

self.save_image(rsp_data, word)

读取下⼀⻚

print("下载下⼀⻚")

pn += 60

except Exception as e:

continue

finally:

page.close()

print("下载任务结束")

return

def start(self, word, total_page=2, start_page=1, per_page=30):

"""

爬⾍⼊⼝

:param word: 抓取的关键词

:param total_page: 需要抓取数据⻚数总抓取图⽚数量为⻚数 x per_page

:param start_page:起始⻚码

:param per_page: 每⻚数量

:return:

"""

self.__per_page = per_page

self.__start_amount = (start_page - 1) * self.__per_page

self.__amount = total_page * self.__per_page + self.__start_amount

self.get_images(word)

if __name__ == '__main__':

crawler = Crawler(0.05) #

抓取延迟为

0.05

crawler.start('玩⼿机')

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

博客专栏课程下载问答社区插件认证

⽬标检测

搜索

会员中⼼收藏动态消息

创作

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

评论收藏

内容反馈

叫我胡胡

粉丝: 0
资源: 1

【小白CV】手把手教你用YOLOv5训练自己的数据集（从Windows环境配置到模型部署）_梁瑛平的博客-CSDN博客.pdf

基于YOLOv5的旋转目标检测系统源码+数据集+模型.zip

YOLOv5快速训练助手

基于Paddle实现YOLOv5在移动端部署（源码+说明文档）.rar

基于ncnn-android部署YOLOv5（源码+说明文档）.rar

yolov5-安全帽识别模型-yolov5可以直接使用-节省好几天的训练时间

TensorFlow 官方文档中文版 - v1.2.pdf

Lab4-梁瑛平-1120182525-实验报告1

yolov5s_模型.zip

一文读懂YOLOv5 与 YOLOv4.pdf

基于YOLOv7训练自己数据集源码+voc转yolo脚本.rar

yolov5口罩检测数据集.rar

基于YOLOv7训练自己数据集并自动标注（源码+数据+权重文件+说明文档）.rar

yolov5抽烟检测数据集.rar

利用yolov5和TensorRT从0到1实现目标检测的模型训练到模型部署全过程

yolov5数据集生成（celeba、wideface、xml解析）

Windows版YOLOv4-tiny目标检测实战：训练自己的数据集

模型部署+目标检测YOLOv5+C++ - Opencv部署

YOLO-目标检测的进化.pdf

pytorch 实现yolo3详细理解（五）训练自己数据集和csv数据集标签处理

yolov5模型部署到安卓手机-源代码

基于YOLOv5 ROS部署版实现行人和红绿灯识别（源码+权重+说明文档）.rar

YOLOV5交通标志识别检测数据集+代码+模型+教学视频

YOLOv5目标检测数据集-在医疗领域中消化内镜目标检测的应用+预训练模型+提供PDF训练教程下载

YOLOv5目标检测模型及数据集

交通标示牌yoloV3模型数据集

yolov7训练自己数据集（完整源码+说明文档+数据）

1_sixyin-music-source-v1.0.7.js

misaka-v3.3.8.zip

最新资源