没有合适的资源?快使用搜索试试~ 我知道了~
YOLO论文节选——YOLOv1篇
资源推荐
资源详情
资源评论
YOLOv1 论文精读
YOLO 系 列 论 文 精 读 总 结 ——[YOLOv1
篇](https://download.csdn.net/download/AI_eNyu/85274569)
YOLOv1 概述
1. 推理阶段
2 训练阶段
2.1 网络结构:
2.2 损失函数:
后续版本
YOLO 系列论文精读总结——YOLOv1 篇
概述:本文为 YOLOv1 论文精度的记录,帮助理解 YOLOv1 整个训练以及预测过程。
Tips:
文章绿色部分为 YOLO 后续论文中优化更改的内容。
YOLOv1 论文精度资料,包括论文原文,推测部分经典 PPT, 本人精度论文中的标注,已经
上传至 CSDN,见链接,不方便下载可以给我留言。
资料
文章主要内容参考自 B 站 UP 主同济子豪兄的讲解,十分详细的论文精读视频!!
YOLOv1 概述
YOLOv1 相对与同期模型最大的特点是其为单阶段模型,所以 YOLO 的运行速度相对于其他
模型有显著提升。作者创新性的将目标检测问题看作回归问题,输入一张图片经过一个‘黑
盒子’便可直接输出预测结果。为了更好的理解 YOLO 目标检测的过程,我们先不看那个黑
盒子,而是聚焦于输出结果,即模型推理阶段。
1. 推理阶段
下 图 给 出 了 模 型 的 推 理 过 程 , YOLOV1 的 输 入 为 448 × 448 × 3
448 imes448 imes3448×448×3 图像,输出大小为 7 × 7 × 30 7 imes7 imes307×7×30 向
量,输出向量的含义是我们理解 YOLO 模型推理阶段的关键先生。我们将整张输入图片分成
S × S S imes SS×S 个网格(grid cell),每个网格中随机生成 B BB 个预测框,用来框出我们
待检测的物体。为了确定一个框在图像中的位置,我们采用四个变量,分别是:
x——框中心的横坐标
y——框中心的纵坐标
w——框的宽度
h——框的高度
经过黑盒子变换,我们最初随机生成的预测框的位置会发生变换,即模型会输出预测框新的
上述四个变量。**同时我们还给每一框定义了一个新的性质——置信度(confidence)用来
表征每个框包含物体的概率以及其与真实框的重合情况。**所以一个框将有五个变量输出分
别是 x , y , w , h , c x,y,w,h,cx,y,w,h,c。
在 YOLOV1 中 S = 7 , B = 2 S=7, B=2S=7,B=2 即将每个输入图片分成 7 × 7 7\times77×7 个
网格,每个网格将生成 2 22 个预测框,用来框出图片中的物体。 每个框会预测出 5 个变量
值,所以一个网格生成两个框,一个框带有 5 个属性,所以一个格就需要预测出 5 × 2 = 10
5\times2=105×2=10 个 变 量 值 。 回 到 我 们 模 型 的 输 出 为 7 × 7 × 30
7\times7\times307×7×30,所以 7 × 7 7\times77×7 即表示网格数量,在图中我们可以看到一
个网格后面跟着 30 个变量值,其中前 10 个就为该网格预测出的两个框的变量值。
我们在前面分析到,每一个预测框有一个 confidence 属性表征其包含物体的概率。但具其
体包含的是哪个物体,就需要计算出这个框包含每一类物体的概率。在 YOLOv1 中有 20 个
类别的物体,所以输出结果的后 20 个值就表示每一个小网格(grid cell)对应每一类物体的
概率,即由该网格生产的两个预测框对应每一类物体的概率。 由此,输出的 7 × 7 × 30
7\times7\times307×7×30 向量的每一项含义便清楚了。
但经过上面分析,一张图片一共生产 7 × 7 × 2 7\times7\times27×7×2 个框,但只有一部分
框我们认为是真正找到物体的,所以我们还需要使用一些后处理方法,去掉无用的框。根据
上面的分析,我们输出结果中有每个框包含物体的概率(confidence)以及每个框在包含物
体的情况下是每个类别的概率。将二者相乘就是每个框是每个类别物体的概率。我们通过这
个概率即可去掉无用的框,选出真正预测到物体的框。
见下图我们将所有框预测到的概率值按照每一行是一个概率列出来,并逐行处理。例如我们
剩余14页未读,继续阅读
资源评论
徐浪老师
- 粉丝: 6334
- 资源: 6880
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功