没有合适的资源?快使用搜索试试~ 我知道了~
基于立体像对数据集的非对称离焦数据集构建.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 80 浏览量
2023-02-23
20:47:33
上传
评论
收藏 1.59MB DOCX 举报
温馨提示
试读
14页
基于立体像对数据集的非对称离焦数据集构建.docx
资源推荐
资源详情
资源评论
摘要
左右图像非对称离焦模糊会导致双目立体视觉系统的立体匹配失败。为训练能够应对图像
模糊的神经网络,基于归一化模糊度(NBL)的分层景深叠加算法,以 FlyingThings-
Stereo 立体像对数据集为例,添加随景物深度变化的模糊,构建非对称离焦立体视觉数据
集。新建的数据集提供非对称离焦的立体像对,可用于训练去模糊网络或立体匹配网络。
在训练去模糊网络时,分别向网络的输入和输出端提供模糊和清晰的立体像对;在训练立
体匹配网络时,向网络的输入和输出端提供模糊的立体像对和视差真值。利用虚拟合成和
实景拍摄数据对训练后的网络进行验证,结果表明本数据集可以有效训练去模糊和立体匹
配神经网络,使其具备应对离焦模糊的能力,实现图像去模糊和基于模糊图像的立体匹
配。
Abstract
The unbalanced defocus blur of the left and right images leads to stereo matching failure
in a binocular stereo vision system. In order to train a neural network that can deal with
the image blur, this paper constructs an unbalanced defocus stereo vision dataset by
adding the blur varying with the depth using a normalized blur level (NBL) based layered
depth-of-field rendering algorithm and taking the FlyingThings-Stereo image pair dataset
as an example. The proposed dataset can provide the unbalanced defocus stereo
images and be used to train deblurring or stereo matching networks. When training the
deblurring network, the dataset provides blurry and clear stereo images to the network's
input and output ends. When training stereo matching network, fuzzy stereo pairs and
parallax truth values are provided to the input and output ends of the network. The
network is verified by synthetic and real-scene data after it is trained. Results show that
the proposed dataset can effectively train the deblurring and stereo matching neural
networks and enables their ability to cope with defocus blur, so as to achieve the image
deblurring and stereo matching based on blurry images.
1 引言
双目立体视觉技术在工业测量
[1]
、视觉导航
[2]
、自动驾驶
[3]
、航空遥感
[4]
等领域应用
广泛。立体匹配作为双目立体视觉技术的核心步骤,其前提条件是位于左、右图像的同名
点具有相似的图像特征。然而,左右相机对焦位置不一致时,可能存在非对称离焦模糊
[5]
,导致立体匹配失败。随着理论和硬件的发展,深度神经网络应用于立体视觉的研究已
成为当今的前沿热点
[6-10]
。数据集对网络的训练至关重要,而已有的立体视觉数据集很少
考虑非对称离焦问题。为了使神经网络具备应对图像模糊的能力,数据集中的立体像对需
要具备非对称离焦模糊的特点。
目前广泛使用的立体视觉数据集按照构建的方式主要分为实景数据集和合成数据集两类。
实景数据集一般利用结构光或激光雷达等主动三维测量技术,结合立体相机来同时获取立
体图像及其三维坐标。在自动驾驶领域,Geiger 等
[11]
使用高分辨率相机、全角度激光雷
达和定位系统组成的车载采集系统,采集了 389 组立体视觉图像对,建立了 KITTI 立体视
觉数据集和立体匹配算法排行榜;Cordts 等
[12]
采集了更大规模的立体驾驶视频数据,并
加入了场景的分类标注。针对室内场景,Scharstein 等
[13]
利用结构光三维技术建立了
Middlebury 数据集,得到高分辨率的立体图像以及高精度的视差图;Couprie 等
[14]
使用
Kinect 深度相机在室内拍摄了带有图像与深度信息的视频,并且对景物进行了分类标注。
Schöps 等
[15]
针对多视图立体视觉问题,用激光扫描仪、高分辨率单反相机、低分辨率视
频录像机采集了一系列室内和户外的图像,建立了 ETH3D 数据集与匹配算法排行榜。
Bao 等
[16]
为改进立体匹配网络在室内场景的效果,建立了含有 2050 个立体像对的
InStereo2K 数据集。建立实景数据集耗资巨大,因此数据规模往往受限。Cho 等
[17]
使用
手持双目相机拍摄了大量的立体像对,借助立体匹配算法生成视差的伪真值,训练用于单
目景深估计的网络。目前,规模有限的实景数据一般仅用于微调预训练的网络;而网络的
预训练则通常使用规模更大的合成数据集。
合成数据集使用计算机建模与图形渲染相结合的方法,计算生成虚拟的立体图像和完美的
视差图。Bulter 等
[18]
根据开源的三维渲染动画短片建立了 Sintel 光流数据集和光流算法
排行榜。Mayer 等
[19]
为了更好地训练光流和立体匹配网络,建立了具有大规模数据的
SceneFlow 数据集,它包括三个子数据集:以自由飞行的随机物体组成的 FlyingThings3D
数据集、以运动的卡通形象为主的 Monkaa 数据集和仿照驾驶环境的 Driving 数据集。其
中,FlyingThings3D 数据集的立体视觉子集 FlyingThings3D-Stereo 具有数据量大、景物
随机性好、视差图准确等优点,被广泛用于立体视觉网络的训练。然而,立体视觉数据集
中很少考虑到景深带来的图像模糊问题。针对单目图像中的模糊,D’Andres 等
[20]
使用
Lytro 光场相机建立了带有 22 幅离焦模糊图像的实景数据集;Lee 等
[21]
为了训练能够估
计模糊核尺寸的神经网络,根据像素深度对图像添加离焦模糊,建立了 SYNDOF 数据
集。这些离焦数据集的规模较小,并未考虑非对称离焦问题,因此建立大规模的离焦模糊
数据集具有重要意义。
本文以非对称离焦模糊原理为基础,采用分层叠加景深技术,以 FlyingThings3D-Stereo
大规模立体视觉数据集为例,添加了非对称离焦模糊,使用归一化模糊度(NBL)控制图
像的模糊程度,构建大规模的非对称离焦立体视觉数据集,以训练出能够应对离焦模糊的
神经网络。本文代码的网址是:
https://gitee.com/psyrocloud/unbalanced_defocus_stereo_dataset。
2 基本原理
2.1 离焦模糊的定量表达
模糊图像 IBIB 可以看作是将清晰图像 II 与模糊核 kk 进行卷积(⊗⊗)后叠加噪声 nn 形成
的
[22]
:
IB=k⊗I+nIB=k⊗I+n。(1)
不同类型的图像模糊对应不同类型的模糊核 kk,如运动模糊核一般为不规则的线状,离焦
模糊核则呈现二维高斯分布。对于离焦模糊,模糊核半径与景物到对焦平面的距离有关。
如图 1 所示,孔径为 DD,相机对焦到 SS 点,景物在传感器上成一个锐利点像 S'S',物距
为 Z0Z0,像距为 w0w0;对焦平面外一点 PP,将其清晰成像到 P'P'点,对应的物距为
ZZ,像距为 ww。根据高斯成像公式与相似三角形原理,有:
⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪1Z0+1w0=1f1Z+1w=1f2rB|w0−w|=Dw1Z0+1w0=1f1Z+1w=1f2rBw0-
w=Dw,(2)
式中:f 为镜头焦距;rBrB 为模糊核半径,可表示为
rB=∣∣A(Z0Z−1)∣∣rB=AZ0Z-1,(3)
式中:AA 是系统常数,可表示为
A=f D2(Z0−f)A=f D2Z0-f,(4)
此时式(1)可改写为
IB(u,v)=[k(rB)⊗I](u,v)+nIBu,v=krB⊗Iu,v+n,(5)
式中:k(rB)krB 是随图像坐标(u,v)u,v 变化的模糊核函数,其模糊核半径 rBrB 随
(u,v)u,v 处景物深度的变化而变化。从式(3)可以看出,当 Z=Z0Z=Z0 时,模糊核半径
rB=0rB=0;随着距离 ZZ 逐渐远离对焦距离 Z0Z0,模糊核的尺寸逐渐变大。与此同时,
对应的像素点处会随着模糊核尺寸的增大而变得更加模糊。
剩余13页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3691
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 三层独栋别墅图纸编号D066-三层-12.00&12.00米- 施工图.dwg
- 农村小别墅图纸编号D065-三层-14.40&18.55米-施工图.dwg
- 基于YOLOv8检测高铁吊弦缺陷实现的系统的Python源码+文档说明+训练源文件+模型.zip
- 三层农村小别墅图纸编号D064-三层-13.80&22.20米-施工图.dwg
- 三层别墅图纸编号D063-三层-13.57&17.40米- 施工图.dwg
- STC IAP15F2K61S2单片机i2c 接口PCF8591-ADC实验+DAC实验 KEIL例程源码+开发板硬件原理图
- Jlink-windows-v7967
- ADC直流分量影响分析
- 二层半独栋别墅结构水电施工图结构专家电.dwg
- 二层半独栋别墅结构水电施工图结构水暖图.dwg
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功