SSD目标检测算法(SingleShotMultiBoxDetector)

共64个文件

py：30个

pyc：24个

jpg：4个

版权申诉

目标检测

yolo

24 浏览量 2024-09-05 21:09:40 上传评论收藏 566KB ZIP 举报

(简单,明了,易用,全中文注释,单机多卡训练,视频检测)( If you train the model on a single computer and mutil GPU, this pro….zip目标检测（Object Detection）是计算机视觉领域的一个核心问题，其主要任务是找出图像中所有感兴趣的目标（物体），并确定它们的类别和位置。以下是对目标检测的详细阐述：一、基本概念目标检测的任务是解决“在哪里？是什么？”的问题，即定位出图像中目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态，加上成像时光照、遮挡等因素的干扰，目标检测一直是计算机视觉领域最具挑战性的任务之一。二、核心问题目标检测涉及以下几个核心问题：分类问题：判断图像中的目标属于哪个类别。定位问题：确定目标在图像中的具体位置。大小问题：目标可能具有不同的大小。形状问题：目标可能具有不同的形状。三、算法分类基于深度学习的目标检测算法主要分为两大类： Two-stage算法：先进行区域生成（Region Proposal），生成有可能包含待检物体的预选框（Region Proposal），再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法：不用生成区域提议，直接在网络中提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列（YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等）、SSD和RetinaNet等。四、算法原理以YOLO系列为例，YOLO将目标检测视为回归问题，将输入图像一次性划分为多个区域，直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征，使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层，通过卷积层提取图像特征，通过全连接层输出预测结果。五、应用领域目标检测技术已经广泛应用于各个领域，为人们的生活带来了极大的便利。以下是一些主要的应用领域：安全监控：在商场、银行

资源推荐

资源详情

资源评论

收起资源包目录

SSD目标检测算法(Single Shot MultiBox Detector)(简单,明了,易用,全中文注释,单机多卡训练,视频检测)( If you train the model on a single computer and mutil GPU, this pro….zip （64个子文件）

content

Demo_eval.py 1KB

Demo_detect_video.py 537B

Utils

utils.py 812B

__init__.py 187B

visdom_op.py 3KB

Boxs_op.py 5KB

Cal_mean_std.py 727B

voc_cal_ap.py 14KB

Hash.py 347B

__pycache__

Hash.cpython-37.pyc 466B

voc_cal_ap.cpython-37.pyc 12KB

visdom_op.cpython-37.pyc 3KB

Boxs_op.cpython-37.pyc 5KB

Cal_mean_std.cpython-37.pyc 855B

__init__.cpython-37.pyc 236B

Demo_detect_one_image.py 647B

LICENSE 11KB

Configs.py 4KB

Model

__init__.py 152B

base_models

__init__.py 60B

VGG

__init__.py 62B

vgg16.py 5KB

__pycache__

__init__.cpython-37.pyc 193B

vgg16.cpython-37.pyc 5KB

__pycache__

__init__.cpython-37.pyc 187B

trainer.py 8KB

ssd_model.py 5KB

load_pretrained_weight.py 737B

evaler.py 4KB

structs

__init__.py 180B

MultiBoxLoss.py 3KB

Anchors.py 2KB

__pycache__

Anchors.cpython-37.pyc 2KB

MultiBoxLoss.cpython-37.pyc 3KB

__init__.cpython-37.pyc 333B

Predictor.cpython-37.pyc 3KB

PostProcess.cpython-37.pyc 3KB

Predictor.py 2KB

PostProcess.py 3KB

__pycache__

ssd_model.cpython-37.pyc 4KB

evaler.cpython-37.pyc 3KB

__init__.cpython-37.pyc 297B

trainer.cpython-37.pyc 6KB

.idea

.gitignore 39B

Weights

trained

README.md 62B

pretrained

README.md 422B

Images

000133_det.jpg 63KB

000133.jpg 145KB

000531_det.jpg 34KB

jetbrains-variant-3.png 178KB

000531.jpg 76KB

__pycache__

Configs.cpython-37.pyc 2KB

README.md 9KB

Data

Dataset_VOC.py 6KB

__init__.py 193B

Transfroms.py 3KB

Transfroms_utils.py 15KB

__pycache__

Transfroms_utils.cpython-37.pyc 15KB

Dataloader.cpython-37.pyc 4KB

Transfroms.cpython-37.pyc 2KB

__init__.cpython-37.pyc 344B

Dataset_VOC.cpython-37.pyc 4KB

Dataloader.py 5KB

Demo_train.py 1KB

GIthub使用指北: **1.想将项目拷贝到自己帐号下就fork一下.** **2.持续关注项目更新就star一下** **3.watch是设置接收邮件提醒的.** --- # SSD-Pytorch SSD目标检测算法(Single Shot MultiBox Detector)(简单,明了,易用,中文注释) (If you train the model on a single computer and mutil GPU, this program will be your best choice , easier to use and easier to understand) 模型.训练.检测等流程全部面向对象实现,简单易用. 全中文备注,详细说明每一步步骤. 欢迎 [![](https://img.shields.io/github/stars/yatengLG/SSD-Pytorch?style=social)](https://github.com/yatengLG/SSD-Pytorch/star) [![](https://img.shields.io/github/forks/yatengLG/SSD-Pytorch?style=social)](https://github.com/yatengLG/SSD-Pytorch/fork) ![image](Images/000133_det.jpg) *** ## 特点相较于其他SSD项目,本项目在模型实现上更为合理.多GPU调用方面更加简单灵活. 将[基础网络,额外层]合并,利于替换基础网络,也便于改变网络连接情况,将[Conf分类网络和loc回归网络]单独出来作为整体,也便于修改增删,至此便是全部的模型构架,输出的是分类网络和回归网络的结果.这种架构使得模型的输出不论是在多GPU还是单GPU环境中输出保持了一致,在多GPU训练扩展时优势尤为显著,避免了很多扩展上的麻烦. 并在模型中预留了检测图片以及检测视频的方法.在初始化模型,载入权重后,便可直接调用进行检测.避免了多次重复编写的以及调用的麻烦. 将[后处理]单独作为一个结构,便于在测试以及检测过程中使用,既方便又便捷,也便于其他项目进行扩展使用. 将[损失函数]以及训练过程写入[训练器]中,不论在结构合理性还是使用合理性方面都更为合适. [训练器]中集成了训练所需的全部操作,[损失函数],[优化器],[学习率衰减]等,并将由于本项目[数据载入器]分为训练以及测试俩种,故而也加入了训练器中.使得训练器一次配置,多次使用,通过预留的接口,在不失方便的同时保留了灵活性.设置好训练器参数后,只需传入模型以及数据集即可完成训练,并将训练过程实时的通过visdom可视化出来. [测试器]同[训练器] 本项目各部分均可极少修改后用于其他目标检测项目. 由于工作原因,后续会不定时更新,添加摄像头检测以及配置更多的基础网络 *** **本项目单机多卡,通过torch.nn.DataParallel实现,将单机环境统一包装.支持单机单卡,单机多卡,指定gpu训练及测试,但不支持多机多卡和cpu训练和测试. 不限定检测时的设备(cpu,gpu均可).** ```text 本项目所有相关参数均已通过Configs文件进行了配置,且均有详细中文注释;如需指定,备份一份,重新修改即可. 只需要在Configs 中修改_C.DEVICE.TRAIN_DEVICES gpu编号即可实现使用不同gpu进行训练及测试. 或在trainer 中传入train_devices参数进行gpu指定. 对模型,训练,测试,检测,数据集,数据载入等均进行了封装,在不降低灵活性的同时,使结构更为清晰明了,对模型的训练等操作也更为易用. 模型方面,将[基础网络,额外层]合并为一体,将[分类网络和回归网络]合并为一体,损失函数数据集方面,只需修改Configs配置文件中的数据集根目录即可顺利训练自己的数据(目前只支持VOC格式) 数据载入方面,Our_Dataloader 接近于一个无限数据载入,只需循环,即可从数据集中无限循环的取出数据.不占内存,不用计算,按需取出. 另本项目训练器,测试器等均有良好的适用性,在其他项目中可以直接使用.(训练器,测试器中,调用了数据载入器) 代码中均有详细中文备注,较好理解 ``` ## 项目结构 | 文件夹| 文件 |说明 | |:-------:|:-------:|:------:| | **Data** | 数据相关 | | | Dataloader| 数据加载器类'Our_Dataloader', 'Our_Dataloader_test'| | | Dataset_VOC|VOC格式数据集类| | | Transfroms|数据Transfroms| | | Transfroms_tuils|Transfroms子方法| | **Model**| 模型相关| | | base_models/VGG|现只有vgg模型,后期会更新其他模型| | | structs/Anchors|默认检测框生成器| | | structs/MutiBoxLoss|SSD损失函数| | | structs/PostProcess|后处理| | | structs/Predictor|分类及回归网络| | | evaler |验证器,用于在数据集上对模型进行验证(测试),计算ap,map | | | ssd_model|SSD模型类 | | | trainer|训练器,用于在数据集上训练模型 | | **Utils**|各种工具| | |boxs_op |各种框体操作,编码解码,IOU计算,框体格式转换等| | **Weights**| 模型权重存放处| | | pretrained|预训练模型权重存放处| | | trained |训练过程中默认模型存放处| | ---- | Configs.py|配置文件,包含了模型定义,数据以及训练过程,测试过程等的全部参数,建议备份一份再进行修改| | ---- | Demo_train.py| 模型训练的例子,训练过程中的模型会保存在Weights/Our/ | | ---- | Demo_eval.py| 模型测试的例子,计算模型ap,map | | ---- | Demo_detect_one_image.py|检测单张图片例子| | ---- | Demo_detect_video.py|视频检测例子,传入一个视频,进行检测| | 预训练模型权重| |下载后存放于Weight/pretrained/下 | | |:-------:|:-------:|:------:|:------:| |ssd300_vgg预训练模型|vgg_ssd300_voc0712.pkl|百度网盘链接: https://pan.baidu.com/s/1BxrH5oqmD7Nj3ORfSka00Q|提取码:k1b2 |vgg预训练模型|vgg16_reducedfc.pth|百度网盘链接:https://pan.baidu.com/s/1BPqFeo0FtKZVrqM7Y-c6Vg|提取码:24se 提供的SSD预训练模型，只是一个参考，请依据自身项目对Config参数进行设定。 # Requirements 1. pytorch 2. opencv-python 3. torchvision >= 0.3.0 4. [Vizer](https://github.com/lufficc/Vizer) (在代码实现上也借鉴了lufficc大神的一些思想) 5. visdom # Demo例子本项目Demo均是完整的训练,测试,检测过程,可直接运行. ## Train训练本项目采用visdom进行训练过程可视化. visdom安装及运行: ```visdom安装 pip install visdom 安装 python -m visdom.server 运行打开网页`127.0.0.1:8097` 进行训练过程可视化 ``` **训练器支持单机单卡,单机多卡训练,不支持多机多卡以及cpu.** 训练例子: ```python # 实例化模型. 模型的具体各种参数在Config文件中进行配置 net = SSD(cfg) # 将模型移动到gpu上,cfg.DEVICE.MAINDEVICE定义了模型所使用的主GPU # 模型的参数更新会在主GPU上进行. net.to(cfg.DEVICE.MAINDEVICE) # 初始化训练器,训练器参数已通过cfg进行配置;也可传入参数进行配置,但不建议 trainer = Trainer(cfg, max_iter=None, batch_size=None, train_devices=None, model_save_step=None, model_save_root=None, vis = None, vis_step=None) # 训练器开始在数据集上训练模型 trainer(net, train_dataset) ``` ## Eval测试 **对模型进行测试,测试器支持单机单卡,单机多卡测试,但不支持多机多卡,cpu.** 测试例子: ```python net = SSD(cfg) # 将模型移动到gpu上,cfg.DEVICE.MAINDEVICE定义了模型所使用的主GPU net.to(cfg.DEVICE.MAINDEVICE) # 模型从权重文件中加载权重 net.load_pretrained_weight('Weights/pretrained/vgg_ssd300_voc0712.pkl') # 初始化验证器,验证器参数通过cfg进行配置;也可传入参数进行配置,但不建议 evaler = Evaler(cfg, eval_devices=None) # 验证器开始在数据集上验证模型 ap, map = evaler(model=net, test_dataset=test_dataset) print(ap) print(map) ``` ## Detect检测 **检测过程本项目给出俩个例子,分别为单张图片检测与视频检测** 单张图片检测,通过调用模型Detect_single_img方法实现.支持gpu与cpu,依模型运行环境而定. ```python # 实例化模型 net = SSD(cfg) # 使用cpu或

评论收藏

内容反馈

版权申诉