没有合适的资源?快使用搜索试试~ 我知道了~
基于拉普拉斯分布的双目视觉里程计.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 181 浏览量
2023-02-23
16:49:38
上传
评论
收藏 2.03MB DOCX 举报
温馨提示
试读
20页
基于拉普拉斯分布的双目视觉里程计.docx
资源推荐
资源详情
资源评论
视觉里程计(Visual odometry, VO)是在未知环境中只通过相机获得的图像信息来实现
机器人定位的技术. 近些年来, VO 广泛应用于机器人导航
[1]
、无人机
[2-3]
和虚拟现实/增强现
实
[4]
等领域.
视觉里程计使用单目或多目相机作为视觉传感器. 单目相机为主要传感器的 VO 系统
虽然成本较低, 但面临的主要问题是单目尺度的不确定性, 在计算过程中会发生尺度漂移
[5-
6]
. 该问题通常使用多传感器来解决, 例如雷达和多目相机. 相比于单目相机, 双目相机可以
直接测量三维空间点的位置, 避免了尺度的不确定性, 因此本文使用双目相机作为视觉传感
器.
VO 系统分为前端和后端
[7]
. 前端通过特征点匹配构造数据关联来为后端优化提供初始
位姿. 数据关联(Data association)是指在帧与帧之间的特征点、特征点与地图点以及地图点
与地图点之间构建 特征对应关系
[8]
. 数据关联错误是 VO 系统失败的主要原因之一. 基于
图像特征点的 VO 系统数据关联方式主要分为两种. 一种是通过计算特征点的描述子来构
建数据关联. 采用描述子匹配特征点的准确性与鲁棒性较高, 但是特征描述子的计算非常耗
时. Mur-Artal 等
[9]
测试尺度不变特征变换(Scale-invariant feature teansform, SIFT)
[10]
和加速健
壮特征(Speed-up robust feature, SURF)
[11]
提取耗时约为 300 ms, 像这类比较耗时的特征提取
算法会影响 VO 系统的实时性. 为了提高实时性, Mur-Artal 等在 ORB (Oriented fast and
rotated brief)-SLAM (Simultaneous localization and mapping)
[9]
中选择计算速度较快的 ORB 特
征点作为图像特征, 帧与帧之间特征点通过特征描述子匹配. Cvišić 等
[12]
在 SOFT (Stereo
odometry based on feature tracking)中提取 Corner 角点和 Blob 角点同时计算特征描述子, 并
通过在连续帧中追踪同一特征点, 如果该特征能被追踪到则使用初始的描述子来提高数据
关联的精确性. 由于相机帧率和图像分辨率越来越高, 导致特征提取的计算量越来越大, 即
使使用 ORB 这类速度较快的特征描述子也可能会影响 VO 系统的实时性. 另一种方式只提
取角点而不计算描述子, 角点之间的匹配关系通过稀疏的光流(Optical flow)跟踪来构建
[13-14]
.
稀疏的光流算法计算速度快, 但光流容易导致特征点误匹配从而使得数据关联错误, 因此本
文使用光流来构建数据关联的同时采用其他技术尽可能剔除错误的数据关联.
VO 系统的后端优化前端估计的相机初始位姿, 本文在后端只优化相机位姿而不维护
一个全局地图. 在优化过程中目标函数的设计影响着系统鲁棒性. 在经典的 Bundle
adjustment (BA)和扩展的卡尔曼滤波(Extended Kalman filter, EKF)算法中都假设误差服从高
斯分布, 优化过程中对噪声敏感, 因而导致位姿估计的误差较大. 与高斯分布相比, 拉普拉
斯分布对大噪声不敏感. 同时, 对于长尾数据(Long tail data)来说, 拉普拉斯分布比高斯分布
更适合对大幅噪音的似然描述
[15]
, 从而对异常点数据更加鲁棒.
本文在 VO 后端假设误差服从拉普拉斯分布, 进而构造优化问题的目标函数.
Casafranca 等
[16]
在此假设下构造因子图优化问题. Bustos 等
[17]
通过构造旋转的平均只优化相
机朝向, 在相机朝向已知的情况下得到全局最优的相机位置和三维空间点. 该方法优化相机
朝向时不受相机位置与三维空间点的影响因此更简单并且能够处理纯旋转的相机运动, 但
是该方法运算速度慢, 并且在求解相机位置时由于同时优化三维空间点和相机位置, 误差较
大的三维点会影响相机位置的求解. 与 Casafranca 等
[16]
和 Bustos 等
[17]
的方法不同, 本文在
后端分开优化求解相机朝向、三维空间点以及相机平移, 在此过程中假设相机位姿与三维
空间点的误差都服从拉普拉斯分布. SOFT 等多个不同的算法证实分开估计相机的朝向与位
置可以提高相机位姿估计的精确性.
近些年来, 基于直接法的双目视觉里程计越来越受研究者的欢迎, 例如, Stereo DSO
(Stereo direct sparse odometry)
[18]
、SVO2 (Semidirect visual odometry 2)
[19]
和 FMD stereo
SLAM (Fusing MVG (multiple view geometry) and direct SLAM)
[20]
. Stereo DSO 算法通过采用
梯度较大的稀疏像素, 使用 Bundle adjustment 优化来得到精度较高的相机位姿. 该算法速度
较快、鲁棒性好, 并且可以生成稠密的三维点云, 但是对于场景的光照变化比较敏感. SVO2
扩展了半稠密直接法单目视觉里程计 SVO
[13]
, SVO2 算法只对选择的关键帧提取特征点并且
采用稀疏图像对齐算法匹配特征点, 因此 SVO2 速度快适用于计算平台受限场合的定位.
SVO 采用深度滤波器估计深度, 由于初始深度估计具有较大误差在优化时可能无法收敛到
真实深度, 进而影响相机位姿估计. FMD stereo SLAM 方法融合了多视角几何和直接法, 在
前端采用直接法估计初始位姿而在后端采用多视角几何的方法来估计三维结构, 这种直接
法和多视角几何法融合的方法同时兼顾了速度与精度. 与以上几种方法相比, 本文算法采用
特征点法并且引入了误差服从拉普拉斯分布的假设来优化相机位姿.
本文的组织结构如下:第 1 节简要介绍本文算法的框架. 第 2 节中详细阐述特征点的
提取以及如何剔除错误的特征匹配并筛选稳定的特征点. 第 3 节为相机位姿的估计与优化.
第 4 节中通过实验验证了本文算法的有效性. 第 5 节为本文的结论.
1. 系统概述
本节主要从整体上概述本文提出的算法. 算法主要由数据关联和相机位姿优化估计两
部分组成. 数据关联是相机位姿估计的预处理过程. 在构造数据关联时, 特征点的选择与数
据关联的准确性影响着相机位姿估计的精度. 在兼顾速度与精度的情况下如何选择稳定的
特征点并剔除错误的关联是 VO 算法重要的一步. 位姿估计部分接收筛选的稳定特征点来
优化求解相机位姿并重建出稀疏的环境地图.
1.1 特征选择与数据关联
为了提高 VO 算法的实时性, 需要尽可能快地提取每帧图像的特征点, 因此本文选择
FAST (Features from accelerated segment test)
[21]
角点作为图像特征点. 数据关联主要通过稀
疏光流算法来构建. 虽然稀疏的光流计算速度快, 但是往往会导致特征点的误匹配, 因此本
文采用三个策略, 即平滑的运动约束、视差一致性检测以及环形匹配来尽可能剔除错误的
关联, 进而提高算法的鲁棒性, 并在此基础上选择稳定的特征点.
1.2 相机位姿优化
本文算法的主要流程如图 1 所示. 其中, ${\boldsymbol{P}}$表示三维空间点的位
置, ${\boldsymbol{p}}$表示三维空间点对应的在二维图像上的投影坐
标, ${\boldsymbol{R}},\;{\boldsymbol{t}}$分别表示相机的旋转和平移. 下标$ l,r,k $为左右
相机和图像帧的索引. 在相机位姿估计的过程中, 通常对于相机朝向的优化估计是比较困难
的, 因此本文首先去优化估计相机的朝向以及三维空间点, 然后固定已经求得的相机朝向和
三维空间点来优化求解相机平移. 在光流构建数据关联的过程中, 同一特征点可以连续地在
多帧中被跟踪. 本文基于特征点能被连续跟踪的帧数选择不同的参考帧从而获得当前帧相
机位姿的多个估计. 对于当前帧的多个相机位姿估计, 在相机位姿误差服从拉普拉斯分布的
假设下构造优化问题的目标函数, 进而得到位姿的最优估计.
剩余19页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3659
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功