没有合适的资源?快使用搜索试试~ 我知道了~
深度学习的目标检测技术演进:R-CNN、FastR-CNN、FasterR-CNN
0 下载量 14 浏览量
2021-01-27
15:11:14
上传
评论
收藏 1.21MB PDF 举报
温馨提示
试读
12页
本文来自于个人微博,本文介绍基于region proposal的R-CNN系列目标检测方法是当前目标检测技术领域最主要的一个分支。objectdetection我的理解,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别。object detection要解决的问题就是物体在哪里,是什么这整个流程的问题。然而,这个问题可不是那么容易解决的,物体的尺寸变化范围很大,摆放物体的角度,姿态不定,而且可以出现在图片的任何地方,更何况物体还可以是多个类
资源详情
资源评论
资源推荐
深度学习的目标检测技术演进:深度学习的目标检测技术演进:R-CNN、、FastR-CNN、、
FasterR-CNN
object detection我的理解,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别。object detection要解决的问题
就是物体在哪里,是什么这整个流程的问题。然而,这个问题可不是那么容易解决的,物体的尺寸变化范围很大,摆放物体的
角度,姿态不定,而且可以出现在图片的任何地方,更何况物体还可以是多个类别。
object detection技术的演进: RCNN->SppNET->Fast-RCNN->Faster-RCNN
从图像识别的任务说起
这里有一个图像任务:
既要把图中的物体识别出来,又要用方框框出它的位置。
上面的任务用专业的说法就是:图像识别+定位
图像识别(classification):
输入:图片
输出:物体的类别
评估方法:准确率
定位(localization):
输入:图片 输出:方框在图片中的位置(x,y,w,h) 评估方法:检测评价函数 intersection-over-union ( IOU )
卷积神经网络CNN已经帮我们完成了图像识别(判定是猫还是狗)的任务了,我们只需要添加一些额外的功能来完成定位任
务即可。
定位的问题的解决思路有哪些?
思路一:看做回归问题 看做回归问题,我们需要预测出(x,y,w,h)四个参数的值,从而得出方框的位置。
步骤1:
1.先解决简单问题, 搭一个识别图像的神经网络
2.在AlexNet VGG GoogleLenet上fine-tuning一下
步骤2:
1.在上述神经网络的尾部展开(也就说CNN前面保持不变,我们对CNN的结尾处作出改进:加了两个头:“分类头”和“回归
头”)
2.成为classification + regression模式
步骤3:
1.Regression那个部分用欧氏距离损失
2.使用SGD训练
步骤4:
1.预测阶段把2个头部拼上
2.完成不同的功能
这里需要进行两次fine-tuning
第一次在ALexNet上做,第二次将头部改成regression head,前面不变,做一次fine-tuning
Regression的部分加在哪?
有两种处理方法:
1.加在最后一个卷积层后面(如VGG)
2.加在最后一个全连接层后面(如R-CNN)
regression太难做了,应想方设法转换为classification问题。 regression的训练参数收敛的时间要长得多,所以上面的网络采
取了用classification的网络来计算出网络共同部分的连接权值。
思路二:取图像窗口
1.还是刚才的classification + regression思路
2.咱们取不同的大小的“框”
3.让框出现在不同的位置,得出这个框的判定得分
4.取得分最高的那个框
左上角的黑框:得分0.5
右上角的黑框:得分0.75
左下角的黑框:得分0.6
剩余11页未读,继续阅读
weixin_38571544
- 粉丝: 3
- 资源: 895
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0