基于Stemblock+shufflenet改进YOLOv5的垃圾分类检测系统

共19个文件

png：11个

py：7个

md：1个

版权申诉

深度学习

计算机视觉

目标检测

网络

159 浏览量 2024-02-04 19:22:29 上传评论收藏 10.12MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

Stemblock-Shufflenet-Enhanced-YOLOv5-Trash-Sorting-Detection-System-main_2.zip （19个子文件）

Stemblock-Shufflenet-Enhanced-YOLOv5-Trash-Sorting-Detection-System-main

8121d5f4265546248882a9497b952d06.png 1.62MB

7979225b3459405596d38d1d5cfff157.png 286KB

1acc9ea733694e08943fdb0bbe25ca09.png 63KB

StemBlock.py 896B

198a870ed88647d3886c02df6257ee90.png 127KB

shufflenet.py 4KB

a2be36ad3c3d46fab1ab64b85f80bd70.png 2.04MB

convert.py 2KB

4611558973bc4d2595e1b93dc6aec0f3.png 82KB

a968e078d27a4f459e136fccb07a6a5b.png 2.01MB

common.py 2KB

5f924d89bcd940a5ae9b809738487c11.png 206KB

_整理数据文件夹结构.py 84B

f73a68b7e5464f7fa82861452f1eb1c5.png 73KB

确保以下几点_.py 517B

_data.py 200B

7f5dffa42bbc4ba4be72d0996308a2a9.png 222KB

933b37a9231940f9abc1a7378c015baa.png 3.56MB

README.md 31KB

# 基于Stemblock+shufflenet改进YOLOv5的垃圾分类检测系统 # 1.研究背景与意义垃圾分类是一项重要的环保任务，旨在减少垃圾对环境的污染和资源的浪费。随着城市化进程的加快和人口的增长，垃圾问题日益突出，传统的垃圾分类方式已经无法满足需求。因此，开发一种高效准确的垃圾分类检测系统具有重要的现实意义。近年来，深度学习技术在计算机视觉领域取得了巨大的突破，特别是目标检测算法的发展。其中，YOLO（You Only Look Once）是一种快速且准确的目标检测算法，已经被广泛应用于各种场景。然而，传统的YOLO算法在垃圾分类任务中存在一些问题，如对小尺寸垃圾的检测效果较差，对于垃圾类别的识别准确率有待提高等。为了解决这些问题，本研究将基于Stemblock和Shufflenet的改进方法应用于YOLOv5算法，以提高垃圾分类检测系统的性能。Stemblock是一种用于加速卷积神经网络的模块，通过优化网络的初始部分，可以提高网络的特征提取能力和计算效率。Shufflenet是一种轻量级的卷积神经网络结构，可以在保持较高准确率的同时，大幅减少网络的参数量和计算量。本研究的主要目标是设计一种高效准确的垃圾分类检测系统，以实现自动化的垃圾分类。具体来说，本研究将通过以下几个方面的工作来达到目标：首先，通过引入Stemblock模块，优化YOLOv5的初始部分，提高网络的特征提取能力和计算效率。Stemblock模块可以有效地减少网络的冗余计算，提高特征图的质量和多样性。其次，结合Shufflenet的轻量级结构，进一步减少网络的参数量和计算量，提高垃圾分类检测系统的实时性和效率。Shufflenet通过引入逐通道的分组卷积和通道重排操作，可以在保持较高准确率的同时，大幅减少网络的计算复杂度。最后，通过大量的实验验证和对比分析，评估改进后的YOLOv5算法在垃圾分类任务中的性能表现。本研究将使用公开的垃圾分类数据集进行训练和测试，比较改进后的算法与传统的YOLOv5算法在准确率、召回率和速度等方面的差异。本研究的意义在于提出了一种基于Stemblock和Shufflenet改进的YOLOv5算法，用于垃圾分类检测系统。该算法具有较高的准确率和实时性，可以有效地应用于实际的垃圾分类场景中。通过自动化的垃圾分类，可以减少人工分类的工作量，提高垃圾分类的效率和准确性，从而为环境保护和资源回收做出贡献。此外，本研究还为深度学习在目标检测领域的应用提供了一种新的思路和方法，对相关研究具有一定的参考价值。 # 2.图片演示 ![在这里插入图片描述](a2be36ad3c3d46fab1ab64b85f80bd70.png#pic_center) ![在这里插入图片描述](8121d5f4265546248882a9497b952d06.png#pic_center) ![在这里插入图片描述](a968e078d27a4f459e136fccb07a6a5b.png#pic_center) # 3.视频演示 [基于Stemblock+shufflenet改进YOLOv5的垃圾分类检测系统](https://www.bilibili.com/video/BV1dj411a7fM/?spm_id_from=333.999.0.0&vd_source=ff015de2d29cbe2a9cdbfa7064407a08) # 4.数据集的采集＆标注和整理 #### 图片的收集首先，我们需要收集所需的图片。这可以通过不同的方式来实现，例如使用现有的数据集、 ![在这里插入图片描述](933b37a9231940f9abc1a7378c015baa.png) #### 使用labelImg进行标注 labelImg是一个图形化的图像注释工具，支持VOC和YOLO格式。以下是使用labelImg将图片标注为VOC格式的步骤：（1）下载并安装labelImg。（2）打开labelImg并选择“Open Dir”来选择你的图片目录。（3）为你的目标对象设置标签名称。（4）在图片上绘制矩形框，选择对应的标签。（5）保存标注信息，这将在图片目录下生成一个与图片同名的XML文件。（6）重复此过程，直到所有的图片都标注完毕。 ![在这里插入图片描述](7979225b3459405596d38d1d5cfff157.png) #### 转换为YOLO格式由于YOLO使用的是txt格式的标注，我们需要将VOC格式转换为YOLO格式。可以使用各种转换工具或脚本来实现。下面是一个简单的方法是使用Python脚本，该脚本读取XML文件，然后将其转换为YOLO所需的txt格式。 ```python #!/usr/bin/env python3 # -*- coding: utf-8 -*- import xml.etree.ElementTree as ET import os classes = [] # 初始化为空列表 CURRENT_DIR = os.path.dirname(os.path.abspath(__file__)) def convert(size, box): dw = 1. / size[0] dh = 1. / size[1] x = (box[0] + box[1]) / 2.0 y = (box[2] + box[3]) / 2.0 w = box[1] - box[0] h = box[3] - box[2] x = x * dw w = w * dw y = y * dh h = h * dh return (x, y, w, h) def convert_annotation(image_id): in_file = open('./label_xml\%s.xml' % (image_id), encoding='UTF-8') out_file = open('./label_txt\%s.txt' % (image_id), 'w') # 生成txt格式文件 tree = ET.parse(in_file) root = tree.getroot() size = root.find('size') w = int(size.find('width').text) h = int(size.find('height').text) for obj in root.iter('object'): cls = obj.find('name').text if cls not in classes: classes.append(cls) # 如果类别不存在，添加到classes列表中 cls_id = classes.index(cls) xmlbox = obj.find('bndbox') b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text)) bb = convert((w, h), b) out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n') xml_path = os.path.join(CURRENT_DIR, './label_xml/') # xml list img_xmls = os.listdir(xml_path) for img_xml in img_xmls: label_name = img_xml.split('.')[0] print(label_name) convert_annotation(label_name) print("Classes:") # 打印最终的classes列表 print(classes) # 打印最终的classes列表 ``` #### 整理数据文件夹结构我们需要将数据集整理为以下结构： ``` -----data |-----train | |-----images | |-----labels | |-----valid | |-----images | |-----labels | |-----test |-----images |-----labels ``` 确保以下几点：所有的训练图片都位于data/train/images目录下，相应的标注文件位于data/train/labels目录下。所有的验证图片都位于data/valid/images目录下，相应的标注文件位于data/valid/labels目录下。所有的测试图片都位于data/test/images目录下，相应的标注文件位于data/test/labels目录下。这样的结构使得数据的管理和模型的训练、验证和测试变得非常方便。 # 5.核心代码讲解 #### 5.1 common.py ```python class CRM(nn.Module): def __init__(self, c1, c2, k=3, s=2): super(CRM, self).__init__() self.conv1 = nn.Sequential( nn.Conv2d(c1, c2, k, s, padding=1, bias=False), nn.BatchNorm2d(c2), nn.ReLU(inplace=True), ) self.mp = nn.MaxPool2d(kernel_size=3, stride=2, padding=1) def forward(self, x): res = self.mp(self.conv1(x)) return res def channel_shuffle(x, groups): batch_size, num_channels, height, width = x.data.size() channels_per_group = num_channels // groups x = x.view(batch_size, groups, channels_per_group, height, width) x = x.permute(0, 2, 1, 3, 4).contiguous() x = x.view(batch_size, -1, height, width) return x class InvertedResidual(nn.Module): def __init__(self, inp, oup, stride): super(InvertedResidual, self).__init__()

评论收藏

内容反馈

版权申诉