没有合适的资源?快使用搜索试试~ 我知道了~
虽然基于深度学习的目标检测器具有较高的检测精度,但是大多数检测器的检测速度不能满足实时性要求.此外,目前主流的实时检测算法如SSD(single shot multibox detector)和YOLO(you only look once),对小目标的检测精度不高.鉴于此,提出一种基于视觉特征区域建议的目标检测算法,能够综合平衡检测精度和检测速度.算法分为区域建议和网络分类,区域建议根据目标的特征信息提取候选区域ROI(region of interest);网络分类使用CNN(convolutional neural network)对区域建议中提取的ROI进行处理,计算每个ROI类别的置信度,置信度大于设定阈值的ROI即为目标检测结果.实验结果表明,所提出算法的检测精度明显高于Faster R-CNN、SSD和YOLO,并且具有接近SSD和YOLO的检测速度.
资源推荐
资源详情
资源评论
一种基于视觉特征区域建议的目标检测方法
李会军, 王瀚洋y, 李杨, 叶宾
引用本文:
李会军, 王瀚洋y, 李杨, 等. 一种基于视觉特征区域建议的目标检测方法[J]. 控制与决策, 2020, 35(6): 1323-1328.
在线阅读 View online: https://doi.org/10.13195/j.kzyjc.2018.1299
您可能感兴趣的其他文章
Articles you may be interested in
基于栈式卷积自编码的视觉SLAM闭环检测
Loop closure detection for visual SLAM based on stacked convolutional autoencoder
控制与决策. 2019, 34(5): 981-988 https://doi.org/10.13195/j.kzyjc.2017.1514
基于级联CNN的SAR图像舰船目标检测算法
A ship detection method based on cascade CNN in SAR images
控制与决策. 2019, 34(10): 2191-2197 https://doi.org/10.13195/j.kzyjc.2018.0168
基于时空渐进特征模型的抗遮挡多目标跟踪
Anti-occlusion multi-target tracking with progressive spatio-temporal feature model
控制与决策. 2019, 34(10): 2171-2177 https://doi.org/10.13195/j.kzyjc.2018.0156
基于声呐图像的水下目标检测、识别与跟踪研究综述
Review on underwater target detection, recognition and tracking based on sonar image
控制与决策. 2018, 33(5): 906-922 https://doi.org/10.13195/j.kzyjc.2017.1678
基于反卷积特征提取的深度卷积神经网络学习
Deep convolution neural network learning based on deconvolution feature extraction
控制与决策. 2018, 33(3): 447-454 https://doi.org/10.13195/j.kzyjc.2017.0048
第 35卷 第 6期 控 制 与 决 策 Vol.35 No.6
2020年 6月 Control and Decision Jun. 2020
文章编号: 1001-0920(2020)06-1323-06 DOI: 10.13195/j.kzyjc.2018.1299
一种基于视觉特征区域建议的目标检测方法
李会军, 王瀚洋
†
, 李 杨, 叶 宾
(中国矿业大学 信息与控制工程学院,江苏 徐州 221116)
摘 要: 虽然基于深度学习的目标检测器具有较高的检测精度, 但是大多数检测器的检测速度不能满足实时性要
求. 此外,目前主流的实时检测算法如 SSD (single shot multibox detector) 和 YOLO (you only look once), 对小目标的
检测精度不高. 鉴于此, 提出一种基于视觉特征区域建议的目标检测算法, 能够综合平衡检测精度和检测速度. 算
法分为区域建议和网络分类, 区域建议根据目标的特征信息提取候选区域 ROI (region of interest); 网络分类使用
CNN (convolutional neural network) 对区域建议中提取的 ROI 进行处理, 计算每个 ROI 类别的置信度, 置信度大于
设定阈值的ROI即为目标检测结果. 实验结果表明, 所提出算法的检测精度明显高于 Faster R-CNN、SSD和YOLO,
并且具有接近SSD和YOLO 的检测速度.
关键词: 目标检测;区域建议;卷积神经网络分类;视觉特征提取
中图分类号: TP399 文献标志码: A
An object detector based on visual feature region proposal
LI Hui-jun, WANG Han-yang
†
, LI Yang, YE Bin
(School of Information and Control Engineering,China University of Mining and Technology,Xuzhou 221116,China)
Abstract: Although the detector based on deep learning can achieve high detection accuracy, most of their speed
cannot meet the real-time requirements. For the moment, the accuracy of the popular real-time detectors, such as single
shot multibox detector (SSD) and you only look once (YOLO), is not high when detecting small objects. Therefore, a
detector based on visual features region proposal is proposed, which can balance the detection accuracy and speed. This
detector is divided into two parts: Region proposal and network classification. In the region proposal stage, the region
of interest (ROI) is exated according to the feature information of the objects, which is also called candidate region; in
the network classification stage, we use convolutional neural network (CNN) to process the ROI, then calculate class
confidence of each ROI, and get the final candidates whose confidence is greater than the threshold value. Experimental
results show that the detection accuracy of the proposed detector is significantly higher than that of the Faster R-CNN,
SSD and YOLO, and its speed is close to the speed of the SSD and YOLO.
Keywords: target detection;region proposal;convolution neural network classification;visual features extraction
0 引
随着研究的不断深入,深度学习已经成为目标检
测和分类的常用工具
[1-5]
. 目前,目标检测领域的深度
学习方法主要分为两类: 一类是基于回归的一阶检
测器,如YOLO、SSD和FPN(feature pyramid networks)
等
[6-8]
; 另一类是基于区域建议的二阶检测器, 如 R-
CNN(regions with CNN feature)、 SPP-Net(spatial
pyramid pooling networks)、Fast R-CNN 和 Faster R-
CNN 等
[9-12]
. 一阶检测器虽然检测速度较快, 但在模
型训练时会出现前景与背景类别不均衡现象
[13]
(如
YOLO、 SSD), 同时难以提取小目标特征信息 (如
YOLO), 从而导致目标检测效果不理想
[14]
. 二阶检
测器虽然检测精度较高,但由于较为原始的候选区域
生成方法(如R-CNN、Fast R-CNN) 和相对复杂的网络
结构 (如 Faster R-CNN), 导致检测速度难以满足特殊
场景中实时性要求
[15]
.
在应用场景中,如果需要快速准确地检测视觉特
征较强的小目标(如处理速度<40 ms),则现有的一阶
和二阶检测器均无法满足检测要求. 鉴于此, 本文提
出一种基于视觉特征区域建议的二阶检测器 RM R-
CNN(improved R-CNN in RoboMaster), 并已成功应用
收稿日期: 2018-09-24;修回日期: 2018-12-05.
基金项目: 徐州市应用基础研究项目 (KC18069);中国矿业大学研究生教育教学改革研究与实践课题项目.
†
通讯作者. E-mail: ts16060151a3@cumt.edu.cn.
剩余6页未读,继续阅读
资源评论
weixin_38731027
- 粉丝: 4
- 资源: 976
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功