没有合适的资源?快使用搜索试试~ 我知道了~
资源详情
资源评论
资源推荐
此时,凭速度之长,网格类检测异军突起,先有YOLO,继而SSD,更是摘实时检测之桂
冠,与区域推荐类二分天下。然准确率却时遭世人诟病。
遂有JR一鼓作气,并coco,推v2,增加输出类别,成就9000。此后一年,作者隐遁江
湖,逍遥twitter。偶获灵感,终推v3,横扫武林!。(很喜欢这段描述,引用自大神这
里,文采斐然,膜拜大佬)
本文主要讲YOLOv1-YOLOv3的进化历程,文章如有不对的地方,还望大佬告知。
YOLOv1
https://pjreddie.com/media/files/papers/yolo.pdf
1.基本思想
YOLOv1是典型的目标检测one stage方法,用回归的方法去做目标检测,执行速度快,达
到非常高效的检测,其背后的原理和思想也非常简单。YOLOv1的基本思想是把一副图
片,首先reshape成448x448大小(由于网络中使用了全连接层,所以图片的尺寸需固定
大小输入到CNN中),然后将划分成SxS个单元格(原文中S=7),以每个格子所在位置和
对应内容为基础,来预测:
1)
检
测
框
,
包
含
物
体
框
中
心
相
对
其
所
在
网
格
单
元
格
边
界
的
偏
移
(一般是相对于单元格
左上角坐标点的位置偏移,以下用x,y表示)和检测框真实宽高相对于整幅图像的比例
(注意这里w,h不是实际的边界框宽和高),每个格子预测B个检测框(原文中是2),如
下图;
2)
每
个
框
的
Confidence
,这个confidence代表了预测框含有目标的置信度和这个预测
框预测的有多准2重信息,公式和说明如下:
3)每个格子预测一共C个类别的概率分数,并且这个分数和物体框是不相关的,只是基
于这个格子。
注意(重要细节):
1. x,y,w,h,confidence都被限制在区间[0,1]。
2. 置信度confidence值只有2种情况,要么为0(边界框中不含目标,P(object)=0),
要么为预测框与标注框的IOU,因为P(Object)只有0或1,两种可能,有目标的中心落在
格子内,那么P(object)=1,否则为0,不存在(0,1)区间中的值。其他论文中置信度
的定义可能跟YOLOv1有些不同,一般置信度指的是预测框中是某类别目标的概率,在
[0,1]之间。
3. 每个格子预测C个类别的概率分数,而不是每个每个检测框都需要预测C个类别的概率
分数。
具体实现见图:
剩余13页未读,继续阅读
13572025090
- 粉丝: 45
- 资源: 313
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0