基于锚框的深度学习物体目标检测算法概览.docx
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
基于锚框的深度学习物体目标检测算法概览 在计算机视觉领域,目标检测算法是研究的重点之一。近年来,深度学习方法的兴起彻底改变了目标检测领域。基于锚框的深度学习物体目标检测算法是近年来研究的热点,该算法通过自适应的特征抽取和建模,替代了传统算法中计算人工特征和多形态混合建模的繁琐工作,检测性能也得到了突破性的提高。 目标检测算法理论上采用滑动窗口策略检测目标,实现的时候是采用一组离散化的预设锚框进行稀疏采样,既可以降低采样数目,又有助于正样本的筛选。采用锚框的检测系统可以分为两阶段实现和一阶段实现两种框架。两阶段框架包含一个边框提议阶段,筛选出一批候选区域作为提议,过滤掉那些包含目标概率很小的样本。第二阶段,再在这些提议上进行分类和定位。 RCNN、Fast RCNN到 Faster RCNN及其变种,都属于两阶段实现的目标检测算法。提议预搜索步骤缓解了检测样本中存在的正负样本极端不平衡的情况,因此检测结果的准确率一般都比较高,但因为存在大量图像特征的计算与存储,RCNN 算法运行速度依然很慢,不能满足视频分析实时处理的要求。 为了提高两阶段检测算法的运行效率,以 YOLO 和 SSD 算法为代表的一阶段检测框架问世了,它们的主要改进是引入了卷积特征层共享的思想,取消了图像特征重复计算和存储的代价,因此检测速度快,能达到实时视频处理的要求。YOLO 系列算法虽然提高了检测速度,在检测结果的准确率上与两阶段检测还是有一些差距。 2018 年由 Facebook AI 团队提出的 RetinaNet,它能保持与一阶段实现相当的运行效率,并取得比之前更好的检测准确率。RetinaNet 的一个重要贡献在于提出了著名的 Focal loss,可以根据候选区域包含潜在目标的概率对最终的训练 Loss 进行校正,从而有效地解决了一阶段检测算法中更加严重的类别不平衡问题。 之后,很多研究者也努力将一阶段实现速度优势与两阶段实现的准确率相结合,提出各种混合式新模型,如 RefineDet。实践中锚框的使用也带来很多局限。例如,锚框在处理物体旋转、纵横比极端,尺度分布不均匀等等问题时设计和实现都比较困难。基于对锚框的反思,又推动了一种无锚框的回归思想。例如 CornetNet 和 CenterNet,不依赖于检测边框的概念,直接对于关键点或中心点进行位置回归。 由于取消了锚框,目标的大小就不再受限,比较起锚框检测器更加灵活。在视觉领域有另外几个任务与物体目标检测相接近,包括目标跟踪、图像分类和实例分割等,这些工作虽然有时被混淆,还是有很大区别的。跟踪算法的启动使用的训练数据量很小,甚至只需要在第一帧手动标注出感兴趣的目标,然后依据时间序列特征的连续性,在邻近的图像帧中搜索目标最有可能出现的位置,并在线更新目标外观形态。 图像分类任务是对一幅图像按照它包含的内容进行分类。它不关心图像中包含的物体出现的位置以及数量。实例分割的输出是和输入图像有同样的分辨率的伪彩色分割模板,对应每一个像素做出是否属于目标类别 n 的颜色选择。同时,这几种视觉任务与目标检测也有密切的联系。当下,基于检测的视频跟踪算法已经成为主流。目前有 ROLO 等工作,在视频序列上使用 LSTM 对 YOLO 单帧检测结果联合建模实现跟踪任务。 利用 YOLO 自动上下文特征关联,也可以给细粒度的图像分类任务提供更丰富的环境相关性信息,进而提高细粒度图像分类的准确性。目标检测与实例分割可以是联合在一起的不同步骤,对实例的准确分割有助于边框的准确定位,而对边框的准确预设,也可提高分割的准确率。例如,Faster R-CNN 增加一个 FCN(Fully Convolutional Network)上采样层输出预测物体的 Mask 模板,就可以实现 Mask R-CNN。 同时深度学习的应用主要受到来自于数据和算力方面的限制。目前,随着计算机运算和存储部件的高速发展,采用深度学习的目标检测算法花费更大的代价,已经可以得到更好的目标检测系统了。目标检测应用系统也开始进入人们的日常生活。例如,交通流、人脸识别、物体追踪等领域都有广泛的应用前景。
剩余14页未读,继续阅读
- 粉丝: 4452
- 资源: 1万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- MySQL卸载文档,卸载不会有残留
- 工具变量-数字建设-大数据管理机构改革DID(2007-2023).xlsx
- SQL SERVER数据库设计期末复习代码.zip
- QMenuBar中item同时显示图标和文字
- 永磁同步电机末端振动抑制(输入整形)simulink仿真模型,包含ZV,ZVD,EI整形
- IMG_20241125_212210.jpg
- 本地安装GSVA,有很多选择,我选了相对最新的
- yolo算法-橡胶圈数据集-23984张图像带标签-机器人-橡胶圈.zip
- wordpress网址导航主题模板 自适应手机端+附整站源码
- yolo算法-手套-无手套-人数据集-14773张图像带标签-手套-无手套-人-无头盔-无口罩-没有安全鞋-无护耳器-无背心-护耳器-背心-安全鞋-无玻璃-头盔-面具-玻璃杯.zip