【免费】deep-learning-for-image-processing-master.zip资源-CSDN文库

共597个文件

py：471个

md：36个

txt：34个

需积分: 0 136 浏览量 2024-04-18 20:10:23 上传评论收藏 3.22MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

deep-learning-for-image-processing-master.zip （597个子文件）

events.out.tfevents.1603791769.localhost.localdomain.178338.0 12KB

events.out.tfevents.1604746311.localhost.41577.0 4KB

yolov3-spp.cfg 9KB

checkpoint 77B

.gitignore 212B

up.html 4KB

jquery.min.js 84KB

imagenet_class_index.json 35KB

palette.json 5KB

coco91_indices.json 2KB

person_keypoints.json 667B

pascal_voc_indices.json 388B

pascal_voc_classes.json 348B

pascal_voc_classes.json 347B

class_indices.json 102B

LICENSE 34KB

README.md 9KB

README.md 8KB

README.md 7KB

README.md 6KB

README.md 5KB

README.md 4KB

README.md 3KB

README.md 2KB

summary_problem.md 2KB

README.md 2KB

README.md 1KB

README.md 869B

README.md 810B

README.md 757B

README.md 644B

README.md 513B

README.md 510B

issue-template.md 481B

README.md 423B

README.md 405B

README.md 206B

pascal_label_map.pbtxt 705B

deeplabv3_resnet50.png 340KB

HRNet.png 329KB

lraspp.png 245KB

torch_fcn.png 204KB

u2net.png 198KB

person.png 194KB

res50_ssd.png 194KB

yolov3spp.png 154KB

unet.png 117KB

both.png 88KB

fasterRCNN.png 58KB

accuracy.png 41KB

syncbn.png 33KB

training_time.png 18KB

rpn_function.py 29KB

datasets.py 28KB

swin_model.py 28KB

model.py 28KB

model.py 27KB

utils.py 26KB

roi_head.py 23KB

共 597 条

# Mask R-CNN ## 该项目参考自pytorch官方torchvision模块中的源码(使用pycocotools处略有不同) * https://github.com/pytorch/vision/tree/master/references/detection ## 环境配置： * Python3.6/3.7/3.8 * Pytorch1.10或以上 * pycocotools(Linux:`pip install pycocotools`; Windows:`pip install pycocotools-windows`(不需要额外安装vs)) * Ubuntu或Centos(不建议Windows) * 最好使用GPU训练 * 详细环境配置见`requirements.txt` ## 文件结构： ``` ├── backbone: 特征提取网络 ├── network_files: Mask R-CNN网络 ├── train_utils: 训练验证相关模块（包括coco验证相关） ├── my_dataset_coco.py: 自定义dataset用于读取COCO2017数据集 ├── my_dataset_voc.py: 自定义dataset用于读取Pascal VOC数据集 ├── train.py: 单GPU/CPU训练脚本 ├── train_multi_GPU.py: 针对使用多GPU的用户使用 ├── predict.py: 简易的预测脚本，使用训练好的权重进行预测 ├── validation.py: 利用训练好的权重验证/测试数据的COCO指标，并生成record_mAP.txt文件 └── transforms.py: 数据预处理（随机水平翻转图像以及bboxes、将PIL图像转为Tensor） ``` ## 预训练权重下载地址（下载后放入当前文件夹中）： * Resnet50预训练权重 https://download.pytorch.org/models/resnet50-0676ba61.pth (注意，下载预训练权重后要重命名，比如在train.py中读取的是`resnet50.pth`文件，不是`resnet50-0676ba61.pth`) * Mask R-CNN(Resnet50+FPN)预训练权重 https://download.pytorch.org/models/maskrcnn_resnet50_fpn_coco-bf2d0c1e.pth (注意，载预训练权重后要重命名，比如在train.py中读取的是`maskrcnn_resnet50_fpn_coco.pth`文件，不是`maskrcnn_resnet50_fpn_coco-bf2d0c1e.pth`) ## 数据集，本例程使用的有COCO2017数据集和Pascal VOC2012数据集 ### COCO2017数据集 * COCO官网地址：https://cocodataset.org/ * 对数据集不了解的可以看下我写的博文：https://blog.csdn.net/qq_37541097/article/details/113247318 * 这里以下载coco2017数据集为例，主要下载三个文件： * `2017 Train images [118K/18GB]`：训练过程中使用到的所有图像文件 * `2017 Val images [5K/1GB]`：验证过程中使用到的所有图像文件 * `2017 Train/Val annotations [241MB]`：对应训练集和验证集的标注json文件 * 都解压到`coco2017`文件夹下，可得到如下文件夹结构： ``` ├── coco2017: 数据集根目录 ├── train2017: 所有训练图像文件夹(118287张) ├── val2017: 所有验证图像文件夹(5000张) └── annotations: 对应标注文件夹 ├── instances_train2017.json: 对应目标检测、分割任务的训练集标注文件 ├── instances_val2017.json: 对应目标检测、分割任务的验证集标注文件 ├── captions_train2017.json: 对应图像描述的训练集标注文件 ├── captions_val2017.json: 对应图像描述的验证集标注文件 ├── person_keypoints_train2017.json: 对应人体关键点检测的训练集标注文件 └── person_keypoints_val2017.json: 对应人体关键点检测的验证集标注文件夹 ``` ### Pascal VOC2012数据集 * 数据集下载地址： http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html#devkit * 对数据集不了解的可以看下我写的博文：https://blog.csdn.net/qq_37541097/article/details/115787033 * 解压后得到的文件夹结构如下： ``` VOCdevkit └── VOC2012 ├── Annotations 所有的图像标注信息(XML文件) ├── ImageSets │ ├── Action 人的行为动作图像信息 │ ├── Layout 人的各个部位图像信息 │ │ │ ├── Main 目标检测分类图像信息 │ │ ├── train.txt 训练集(5717) │ │ ├── val.txt 验证集(5823) │ │ └── trainval.txt 训练集+验证集(11540) │ │ │ └── Segmentation 目标分割图像信息 │ ├── train.txt 训练集(1464) │ ├── val.txt 验证集(1449) │ └── trainval.txt 训练集+验证集(2913) │ ├── JPEGImages 所有图像文件 ├── SegmentationClass 语义分割png图（基于类别） └── SegmentationObject 实例分割png图（基于目标） ``` ## 训练方法 * 确保提前准备好数据集 * 确保提前下载好对应预训练模型权重 * 确保设置好`--num-classes`和`--data-path` * 若要使用单GPU训练直接使用train.py训练脚本 * 若要使用多GPU训练，使用`torchrun --nproc_per_node=8 train_multi_GPU.py`指令,`nproc_per_node`参数为使用GPU数量 * 如果想指定使用哪些GPU设备可在指令前加上`CUDA_VISIBLE_DEVICES=0,3`(例如我只要使用设备中的第1块和第4块GPU设备) * `CUDA_VISIBLE_DEVICES=0,3 torchrun --nproc_per_node=2 train_multi_GPU.py` ## 注意事项 1. 在使用训练脚本时，注意要将`--data-path`设置为自己存放数据集的**根目录**： ``` # 假设要使用COCO数据集，启用自定义数据集读取CocoDetection并将数据集解压到成/data/coco2017目录下 python train.py --data-path /data/coco2017 # 假设要使用Pascal VOC数据集，启用自定义数据集读取VOCInstances并数据集解压到成/data/VOCdevkit目录下 python train.py --data-path /data/VOCdevkit ``` 2. 如果倍增`batch_size`，建议学习率也跟着倍增。假设将`batch_size`从4设置成8，那么学习率`lr`从0.004设置成0.008 3. 如果使用Batch Normalization模块时，`batch_size`不能小于4，否则效果会变差。**如果显存不够，batch_size必须小于4时**，建议在创建`resnet50_fpn_backbone`时，将`norm_layer`设置成`FrozenBatchNorm2d`或将`trainable_layers`设置成0(即冻结整个`backbone`) 4. 训练过程中保存的`det_results.txt`(目标检测任务)以及`seg_results.txt`(实例分割任务)是每个epoch在验证集上的COCO指标，前12个值是COCO指标，后面两个值是训练平均损失以及学习率 5. 在使用预测脚本时，要将`weights_path`设置为你自己生成的权重路径。 6. 使用validation文件时，注意确保你的验证集或者测试集中必须包含每个类别的目标，并且使用时需要修改`--num-classes`、`--data-path`、`--weights-path`以及 `--label-json-path`（该参数是根据训练的数据集设置的）。其他代码尽量不要改动 ## 复现结果在COCO2017数据集上进行复现，训练过程中仅载入Resnet50的预训练权重，训练26个epochs。训练采用指令如下： ``` torchrun --nproc_per_node=8 train_multi_GPU.py --batch-size 8 --lr 0.08 --pretrain False --amp True ``` 训练得到权重下载地址： https://pan.baidu.com/s/1qpXUIsvnj8RHY-V05J-mnA 密码: 63d5 在COCO2017验证集上的mAP(目标检测任务)： ``` Average Precision (AP) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.381 Average Precision (AP) @[ IoU=0.50 | area= all | maxDets=100 ] = 0.588 Average Precision (AP) @[ IoU=0.75 | area= all | maxDets=100 ] = 0.411 Average Precision (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.215 Average Precision (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.420 Average Precision (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.492 Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 1 ] = 0.315 Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 10 ] = 0.499 Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.523 Aver

评论收藏

内容反馈