# coding=utf-8
#这篇博客里面提出了包括:
#1、全局语境界 推荐指数:¥¥
## 这一技巧在ResNet的工作[3]中提出,做法是把整张图片作为一个RoI,对其进行RoI Pooling并将得到的feature vector拼接于每个RoI的feature vector上,
## 作为一种辅助信息传入之后的R-CNN子网络。目前,也有把相邻尺度上的RoI互相作为context共同传入的做法。
#2、数据增强 推荐指数:¥¥¥¥
#3、多尺度训练/测试 推荐指数:¥¥¥¥¥
## 问题分析:基础网络部分通常会生成比原图小数十倍的特征图,
## 导致小物体的特征描述不容易被检测网络捕捉,通过输入更大更多尺度的图片进行训练,
## 能够在一定程度上提高检测模型对物体大小的鲁棒性。
## 多尺度训练:在训练阶段,预先定义几个固定的尺度,每个epoch随机选择一个尺度进行训练。
## 度尺度测试:在测试阶段,生成几个不同尺度的feature map,对每个Region Proposal,
## 在不同feature map上也有不同的尺度,我们选择最接近某一固定尺度的Region Proposal作为后续输入。
## 举例:YOLOv2中就有使用多尺度训练。作者在论文中说明,为了提升模型的鲁棒性,在训练的过程中每隔10个batches就随机的从{320,352,...,608},
## 步长为32的集合中选择一个新的图片分辨率。
## 参考:1) YOLOv2 ---> https://github.com/leetenki/YOLOv2
## yolov2_train.py:train_sizes = [320, 352, 384, 416, 448]
## 2) RefineNet:
## 3) py-faster-rcnn
#4、预测框投票、微调法(Box Refinement/Voting 预测框微调/投票法) 推荐指数:¥¥
#5、OHEM 在线难例挖掘 推荐指数:¥¥¥
## 解释:对与RCNN网络得到的候选框进行排序,这样可以保证高效率处理,
## 实际实现中维护了两个Fast-RCNN网络,一个用于产生候选框的预测,
## 另一个用于计算loss,并进行更新,并且进行权重复制以使得两个分支权重同步。
#6、NMS转化为soft NMS函数,可以取得更好的检测效果 推荐指数:¥¥¥
### 其他推荐
#1、更好的先验信息,例如YOLO v3中通过聚类方法得到更好的先验框
#2、更好的预训练模型
#3、更好的超参数(NMS中的IOU阈值,由0.3_~0.5)可以获得更高的mAP,暂无最佳配置~
#https://cloud.tencent.com/developer/article/1101003
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
人工智能-项目实践-数据增强-针对目标检测做的数据增强 这个项目主要是针对目标检测做的数据增强, 参考网上提供的多个数据增强方式, 包括在线数据增强和线下数据增强方式, 以及一些训练策略的讲解~
资源推荐
资源详情
资源评论
收起资源包目录
人工智能-项目实践-数据增强-针对目标检测做的数据增强.zip (15个子文件)
data_augmentation-master
目标检测重点.txt 979B
data_aug_yolov3.py 13KB
data_aug_std_offline.py 32KB
roi_implement_faster_rcnn.py 3KB
data_aug.py 5KB
next_batch.py 2KB
data_aug_ssd.py 12KB
bounding box regression.txt 69B
data_aug_std.py 17KB
data_aug_yolov2 9KB
训练策略.txt 2KB
test_rotate.py 4KB
data_aug_self.py 4KB
data_aug_tf(wo_lable).py 6KB
数据增强策略.txt 145B
共 15 条
- 1
资源评论
博士僧小星
- 粉丝: 1931
- 资源: 5897
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于C++及Qt5开发的图片自动矢量化软件+高分辨率图像去噪+自动矢量化为svg/shp矢量图+不限定颜色种类和数量(高分项目)
- 美国手语字母表图像分类数据集ASL Alphabet共8.7w张29类别完整版.7z
- chap5-example-17.py
- 基于python开发的生产从shp到pbf格式的矢量地图切片+源码(期末大作业)
- MAX6675K型热电偶模块温度传感器C51 STM32 单片机例程源码+文档资料+蓝牙温度计.apk文件.zip
- ethercat报文528
- 基于多种编程语言的卡拉音乐播放器设计源码
- Html+Css3实现新年快乐烟花动画特效,可以替换新年快乐文字
- 交互设计旅游界面设计首页及交互
- .6.jpg
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功