所以这9个框框,每个框框得到一个8维的向量,总共得到3*3*8的输出矩阵
由于YOLO是卷积实现,因此效率会很高,可以达到实时识别。
如何判断
YOLO
算法中的某个物体是否在某个框中呢?
我们定义一个框中的左上角为(0,0)右下角为(1,1)这样我们得到某个物体的中心点,
用(x,y), x,y∈[0,1]这样的表示方法来得到物体中心点的相对坐标值
这里面输出的
8
维向量的
bx by bh bw
就是物体的相对(
x
,
y
)坐标以及物体的高度和宽度。
3.6 交并比
使用交并比来评价对象检测算法。
交并比(intersection over union)顾名思义,就是相交的面积大小:并集的面积大小
使用交并比(
IoU
)来表现定位的准确与否
一般来说,这个
score > 0.5
就可以被认为一个较好的结果了。
以0.5为阈值,大于0.5即可被认为是正确的。
3.7 非极大值抑制
人脸检测的时候,可能会有检测出很多边框的情况,这个时候就要使用非极大值抑制使答案
每个被检测物体只输出一个框,如下面图:这个选出的框应该是分别两个物体各输出一个,
Non-Maximum Suppression就可以避免一个物体选出两个框。
具体过程