1. 研究背景
目标检测( Object Detecon )如 RCNN 系列或 YOLO 系列都是使
用滑动窗口的方式通过先验覆盖整幅图可能出现目标的部分来进
行先验框偏移量的预测从而找到目标。需要许多手动设计的模块,
比如 Anchor 和繁琐的 NMS 。而加入 Transformers 后,可以得到
序列之间的依赖关系确定整幅图的实例关系,从而使得模型有选
择地聚焦于输入的某些部分。无需去设计检测的方法,从输入到
输出实现更本质的目标检测,简化了目标检测的流程,直接预测
输出检测框和分类。在 COCO 数据集上, DETR 的准确性和检测速
度性能与 Faster R-CNN 相当。而且, DETR 可以很容易地推广到全
景分割。
评论0
最新资源