基于Pyotrch开发的深度学习物体分类系统（图形化界面），包含物体分类中的数据集搜集、模型训练、模型测试和可视化界面等流程

共73个文件

jpg：35个

py：24个

jpeg：6个

版权申诉

5星 · 超过95%的资源 7 浏览量 2023-01-05 14:53:37 上传评论 2 收藏 94.72MB ZIP 举报

《基于PyTorch开发的深度学习物体分类系统详解》深度学习在计算机视觉领域取得了显著的进步，其中物体分类是其核心任务之一。本系统利用PyTorch这一强大的深度学习框架，构建了一个完整的物体分类系统，涵盖了从数据集的构建到模型训练、测试，再到结果的可视化，全程采用图形化界面，使得操作更为直观易用。我们要理解数据集在物体分类中的重要性。数据集是深度学习模型学习的基础，它包含了大量标记的图像样本，用于训练模型识别不同类别的物体。在本系统中，你需要准备一个涵盖各种物体类别且标注清晰的数据集。通常，这包括收集图像，进行预处理（如归一化、裁剪、缩放等）以及为每个图像分配相应的类别标签。接下来，是模型的构建阶段。PyTorch提供了丰富的神经网络模块，可以快速构建复杂的模型结构。常用的物体分类模型有ResNet、VGG、DenseNet等。这些模型通过卷积层、池化层、全连接层等构建，能够学习到图像的特征表示。在本系统中，你可以选择一个预训练模型作为起点，进行微调以适应特定的数据集，或者从头开始训练自定义模型。模型训练是深度学习的核心环节。PyTorch的动态计算图机制使得模型训练过程灵活且高效。在这个阶段，模型会逐步调整权重以最小化损失函数，通常选用交叉熵损失函数，以优化模型对类别预测的准确性。同时，还需要合理设置学习率、优化器、批次大小和训练轮数等超参数，以达到最佳性能。模型训练完成后，会进入测试阶段。这个阶段主要目的是评估模型在未见过的数据上的表现。通过计算精度、召回率、F1分数等指标，我们可以了解模型的泛化能力。本系统可能提供了一个友好的测试接口，方便用户上传待分类的图像，系统会返回预测的类别及其置信度。可视化界面是系统的一大亮点。通过图形化界面，用户可以直观地看到训练过程中的损失曲线、准确率变化，以及模型预测的结果。此外，界面可能还支持参数调整，允许用户实时查看更改参数后模型的性能变化，从而更好地理解模型的行为。基于PyTorch的物体分类系统是一个全方位的深度学习解决方案，它整合了数据处理、模型构建、训练、测试和可视化等多个关键步骤。通过此系统，无论是科研人员还是开发者，都能更便捷地进行物体分类任务，进一步推动计算机视觉技术的发展。

资源推荐

资源详情

资源评论

收起资源包目录

pytorch110_classification-master.zip （73个子文件）

pytorch110_classification-master

data_split.py 5KB

record

heatmap_resnet50d.png 37KB

torchutils.py 6KB

files

data_test.py 5KB

train_without_val_beit.py 7KB

main.py 10KB

train_without_val.py 7KB

timm_models.py 440B

main_shuili.py 10KB

mv_imgs.py 703B

predict.py 3KB

readme.md 19KB

data_clean.py 2KB

utils

export_onnx.py 2KB

get_flops.py 609B

old

train_alexnet.py 9KB

img2folder.py 1KB

free_gpu.py 148B

window.py 11KB

csv_utils.py 460B

val_alexnet.py 7KB

timm_models.py 500B

requirements.txt 41B

pretrained

resnet50d_ra2-464e36ba.pth 97.82MB

requirements.txt 246B

window.py 9KB

images

test_imgs

mini

22679076_bdb4c24401_m.jpg 34KB

8181477_8cb77d2e0f_n.jpg 40KB

24781114_bc83aa811e_n.jpg 37KB

6953297_8576bf4ea3.jpg 80KB

5547758_eea9edfd54_n.jpg 28KB

5673551_01d1ea993e_n.jpg 35KB

12240303_80d87f77a3_n.jpg 31KB

11746080_963537acdc.jpg 92KB

27466794_57e4fe5656.jpg 40KB

24459548_27a783feda.jpg 29KB

7355522_b66e5d3078_m.jpg 22KB

5673728_71b8cb57eb.jpg 29KB

11746276_de3dec8201.jpg 67KB

8223949_2928d3f6f6_n.jpg 57KB

10791227_7168491604.jpg 29KB

mini_result

dandelion

8181477_8cb77d2e0f_n.jpg 40KB

7355522_b66e5d3078_m.jpg 22KB

8223949_2928d3f6f6_n.jpg 57KB

tulips

22679076_bdb4c24401_m.jpg 34KB

11746080_963537acdc.jpg 92KB

11746276_de3dec8201.jpg 67KB

10791227_7168491604.jpg 29KB

daisy

5547758_eea9edfd54_n.jpg 28KB

5673551_01d1ea993e_n.jpg 35KB

roses

24781114_bc83aa811e_n.jpg 37KB

12240303_80d87f77a3_n.jpg 31KB

sunflowers

6953297_8576bf4ea3.jpg 80KB

27466794_57e4fe5656.jpg 40KB

24459548_27a783feda.jpg 29KB

5673728_71b8cb57eb.jpg 29KB

506659320_6fac46551e.jpg 47KB

tmp

tmp_upload.png 1.63MB

tmp_upload.jpg 137KB

single_result_vid.jpg 54KB

tmp_upload.jpeg 21KB

single_result.jpg 4KB

upload_show_result.jpg 132KB

up.jpeg 21KB

right.jpeg 27KB

lufei.png 216KB

logo.jpeg 33KB

up.jpeg 28KB

qq.png 151KB

right.jpeg 25KB

train.py 10KB

test.py 7KB

data_get.py 2KB

# 手把手教你使用Pytorch训练自己的分类模型 ![封面](https://vehicle4cm.oss-cn-beijing.aliyuncs.com/imgs/%E5%B0%81%E9%9D%A2.png) 之前更新过一起tf版本的训练自己的物体分类模型，但是很多兄弟反应tf版本的代码在GPU上无法运行，这个原因是tf在30系显卡上没有很好的支持。所以我们重新更新一期Pytorch版本的物体分类模型训练教程，在这个教程里面，你将会学会**物体分类的基本概念+数据集的处理+模型的训练和测试+图形化界面的构建**。我这里使用的显卡是NVIDIA RTX3060 6G的笔记本显卡。为了避免带货的嫌疑，我就不说具体的机器型号了，实际的体验中呢，一般4G以上的显存跑个resnet和yolo之类的是没有问题的，如果你是科研人员的话（科研人员估计也不会看我的博客），则需要更牛的服务器来支持你的研究。 ## 基本概念 ![gogo](https://vehicle4cm.oss-cn-beijing.aliyuncs.com/imgs/gogo.jpg) 从左向右依次是图像分类，目标检测，语义分割和实例分割。 **图像分类**是指为输入图像分配类别标签。自 2012 年采用深度卷积网络方法设计的 AlexNet 夺得 ImageNet 竞赛冠军后，图像分类开始全面采用深度卷积网络。2015 年，微软提出的 ResNet 采用残差思想，将输入中的一部分数据不经过神经网络而直接进入到输出中，解决了反向传播时的梯度弥散问题，从而使得网络深度达到 152 层，将错误率降低到 3.57%，远低于 5.1%的人眼识别错误率，夺得了ImageNet 大赛的冠军。 **目标检测**指用框标出物体的位置并给出物体的类别。2013 年加州大学伯克利分校的 Ross B. Girshick 提出 RCNN 算法之后，基于卷积神经网络的目标检测成为主流。之后的检测算法主要分为两类，一是基于区域建议的目标检测算法，通过提取候选区域，对相应区域进行以深度学习方法为主的分类，如 RCNN、Fast-RCNN、Faster-RCNN、SPP-net 和 Mask R-CNN 等系列方法。二是基于回归的目标检测算法，如 YOLO、SSD 和 DenseBox 等。 **图像分割**指将图像细分为多个图像子区域。2015 年开始，以全卷积神经网络（FCN）为代表的一系列基于卷积神经网络的语义分割方法相继提出，不断提高图像语义分割精度，成为目前主流的图像语义分割方法。实例分割则是实例级别的语义分割。我们本期教程主要是<font color='red'>图像分类</font>，即给定一张图片，模型判断出他的具体类别。 ## 环境配置 ### Anaconda 和 Pycahrm安装 nvidia-驱动下载地址：[官方驱动 | NVIDIA](https://www.nvidia.cn/Download/index.aspx?lang=cn) ![image-20221206174728937](https://vehicle4cm.oss-cn-beijing.aliyuncs.com/imgs/image-20221206174728937.png) 使用代码之前请先确保电脑上已经安装好了anaconda和pycharm。环境的基本配置请看这期博客：[如何在pycharm中配置anaconda的虚拟环境_肆十二的博客-CSDN博客_pycharm配置anaconda虚拟环境](https://blog.csdn.net/ECHOSON/article/details/117220445) miniconda下载地址：[Index of /anaconda/miniconda/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror](https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/) ![image-20221206173858594](https://vehicle4cm.oss-cn-beijing.aliyuncs.com/imgs/image-20221206173858594.png) conda加速 ```bash conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/main/ conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/pytorch/ conda config --set show_channel_urls yes pip config set global.index-url https://mirrors.ustc.edu.cn/pypi/web/simple ``` Pycharm的下载地址：[Other Versions - PyCharm (jetbrains.com)](https://www.jetbrains.com/pycharm/download/other.html) ![image-20221206173934245](https://vehicle4cm.oss-cn-beijing.aliyuncs.com/imgs/image-20221206173934245.png) ### 代码环境配置代码环境配置步骤较多，建议按照视频教程操作，下面只列出关键命令，方便大家复制粘贴。 ```bash conda create -n cls-42 python==3.8.5 conda activate cls-42 conda install pytorch==1.10.0 torchvision==0.11.0 torchaudio==0.10.0 cudatoolkit=11.3 cd 自己本地的代码目录（或者在本地代码目录的上方打开cmd） pip install -r requirements.txt ``` ## 数据集 ### 数据集的搜集数据集一般有两种方式获取，一种可以通过自己拍摄或者是爬虫爬取建立自建的数据集，这里在本科毕设和大作业的过程中用的比较多，另外一种是使用公开的数据集，后续我这边也会更新一些视觉相关的数据集，大家可以在这里自行查找：[肆十二的博客_CSDN博客-大作业,目标检测,个人心得领域博主](https://blog.csdn.net/ECHOSON?type=download) ![image-20221206174854041](https://vehicle4cm.oss-cn-beijing.aliyuncs.com/imgs/image-20221206174854041.png) 对于公开数据集，比如医学分割，我们一般从这个网址获取： ```bash https://www.isic-archive.com/#!/onlyHeaderTop/gallery ``` 我们这里提供了一个爬虫的程序，可以帮助大家从百度图片中爬取自己需要的图片，程序的名称是`data_get.py`，使用起来非常方便，大家直接运行程序之后，属于自己想要爬取的图片即可，这段程序我直接放在这里。 ```python # -*- coding: utf-8 -*- # @Time : 2021/6/17 20:29 # @File : get_data.py # @Software: PyCharm # @Brief : 爬取百度图片 import requests import re import os headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.125 Safari/537.36'} name = input('请输入要爬取的图片类别：') num = 0 num_1 = 0 num_2 = 0 x = input('请输入要爬取的图片数量？（1等于60张图片，2等于120张图片）：') list_1 = [] for i in range(int(x)): name_1 = os.getcwd() name_2 = os.path.join(name_1, 'data/' + name) url = 'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=' + name + '&pn=' + str(i * 30) res = requests.get(url, headers=headers) htlm_1 = res.content.decode() a = re.findall('"objURL":"(.*?)",', htlm_1) if not os.path.exists(name_2): os.makedirs(name_2) for b in a: try: b_1 = re.findall('https:(.*?)&', b) b_2 = ''.join(b_1) if b_2 not in list_1: num = num + 1 img = requests.get(b) f = open(os.path.join(name_1, 'data/' + name, name + str(num) + '.jpg'), 'ab') print('---------正在下载第' + str(num) + '张图片----------') f.write(img.content) f.close() list_1.append(b_2) elif b_2 in list_1: num_1 = num_1 + 1 continue except Exception as e: print('---------第' + str(num) + '张图片无法下载----------') num_2 = num_2 + 1 continue # 为了防止下载的数据有坏图，直接在下载过程中对数据进行清洗 print('下载完成,总共下载{}张,成功下载:{}张,重复下载:{}张,下载失败:{}张'.format(num + num_1 + num_2, num, num_1, num_2)) ``` 比如这里我想要爬取向日葵的图片，运行之后输入向日葵，然后输入想要爬取的图片数量即可。 ![image-20221129140549793](https://cmfighting.oss-cn-shenzhen.aliyuncs.com/iiimgs/image-20221129140549793.png) 输入完成之后，爬取之后的图片将会自动保存在data目录下。 ![image-20221129140629126](https://cmfighting.oss-cn-shenzhen.aliyuncs.com/iiimgs/image-20221129140629126.png) ### 数据集清洗在实际的使用中，opencv对中文的支持并不好，在一些封装好的以opencv作为后端的api中�

评论收藏

内容反馈

版权申诉