没有合适的资源?快使用搜索试试~ 我知道了~
基于嵌入式并行处理的视觉惯导SLAM算法研究1
需积分: 0 1 下载量 127 浏览量
2022-08-03
21:44:49
上传
评论
收藏 4.27MB PDF 举报
温馨提示
试读
85页
摘要SLAM(simultaneous localization and mapping)称为即时定位与地图重建。随着机器人技术、计算机视觉等领域的快速发展,对
资源详情
资源评论
资源推荐
工学硕士学位论文
基于嵌入式并行处理的视觉惯导
SLAM 算法研究
VISUAL INERTIAL SLAM ALGORITHM
RESEARCH BASED ON EMBEDDED
PARALLEL PROCESSING
张建越
哈尔滨工业大学
2018 年 6 月
国内图书分类号:TP242.6 学校代码:10213
国际图书分类号:681.5 密级:公开
工学硕士学位论文
基于嵌入式并行处理的视觉惯导
SLAM 算法研究
硕 士 研 究 生
:
张建越
导师
:
李戈 副研究员
申请学位
:
工学硕士
学科
:
机械工程
所 在 单 位
:
机电工程学院
答 辩 日 期
:
2018 年 6 月
授予学位单位
:
哈尔滨工业大学
Classified Index: TP242.6
U.D.C: 681.5
Dissertation for the Master Degree in Engineering
VISUAL INERTIAL SLAM ALGORITHM
RESEARCH BASED ON EMBEDDED
PARALLEL PROCESSING
Candidate:
Zhang Jianyue
Supervisor:
Associate Prof.Li Ge
Academic Degree Applied for:
Master of Engineering
Speciality:
Mechanical Engineering
Affiliation:
School of Mechatronics Engineering
Date of Defense:
June, 2018
Degree-Conferring Institution:
Harbin Institute of Technology
哈尔滨工业大学工学硕士学位论文
- I -
摘 要
SLAM(simultaneous localization and mapping)称为即时定位与地图重建。随着
机器人技术、计算机视觉等领域的快速发展,对环境感知技术也提出了更高的要求。
SLAM 作为环境感知的重要组成部分,一直是机器人技术的研究热点。SLAM 领
域目前比较成熟的技术是激光雷达式,基于激光测距原理获取点云、位姿估计、建
图等。随着诸多领域对图像特征精度及算法实时和准确性要求越来越高,使得基于
视觉的 VSLAM 技术研究成为国内外研究的重点方向。本课题提出基于单目视觉、
IMU 数据紧耦合的 VI-SLAM 算法,并采用并行处理实现移植嵌入式设备实时运算
VI-SLAM 算法,实现移动机器人的运动定位和环境场景的三维地图重建。
为了解决单目视觉特征点少、容易丢帧、尺度漂移等问题,提出一种视觉信息
和 IMU 数据融合的方法。前端单目视觉采用光流法跟踪,特征点为可快速计算的
角点检测,匹配后采用八点法计算。IMU 采用预积分算法,获取陀螺仪和加速度
计输出角速度和加速度积分结果,解决了积分过程中偏差在世界坐标系中累计的
问题。后端采用非线性优化获取最优位姿估计。此外,全局姿态增加重定位和回环
检测功能,并优化移动机器人在全局地图中的位姿估计。
针对嵌入式运算实时性的要求,采用 GPU 并行处理多线程运算估计每帧图像
特征点的深度。对于关键帧中特征点,多线程对其不同深度进行采样,得到若干深
度值的虚拟平面,反投影后得到集成所有深度的代价块,通过优化全局能量函数估
计深度。局部深度图像使用 TSDF 进行融合,以提供直接用于轨迹规划的全局稠密
地图。采用 NVIDIA CUDA 并行处理运算框架,分配图像帧深度估计等运算量大
的任务,移植嵌入式设备 NVIDIA TX1 中运算 VI-SLAM 算法。
为了验证嵌入式并行处理 VI-SLAM 算法的性能,设计相关实验进行验证。在
嵌入式运算能力验证实验中,ORB-SLAM 在 NVIDIA TX1 中运算流畅,在
640 480
的图像中提取 500 个 ORB 特征点约用时 13ms 左右,小于 ORB-SLAM 要求的
33ms,满足实时性要求。在位姿估计实验中,与 OKVIS、MSCKF 等算法相比,
RMSE 均方根误差在简单场景数据集保持在 0.2m 以下,复杂场景下保持在
0.2~0.4m,普遍优于其他两种融合算法。此外,在基于并行处理的深度恢复实验中,
VI-SLAM 特征点云数量丰富,近景远景深度分割明显,可以获取深度图像及深度
优化网格地图。最终实现移动机器人运动定位和环境场景的三维重建工作。
关键词:单目视觉;惯性测量单元;预积分;紧融合;嵌入式
哈尔滨工业大学工学硕士学位论文
- II -
Abstract
SLAM (simultaneous localization and mapping) is called immediate positioning and
map reconstruction. With the rapid development of robotics, computer vision and other
fields, higher requirements have been put forward for environmental awareness
technologies. As an important component of environmental awareness, SLAM has always
been a research hotspot in robotics. The most mature technology in the field of SLAM is
laser radar. Based on the principle of laser ranging, it can obtain point clouds, position
and pose estimations, and map creation. With the increasing demand for image feature
accuracy and algorithm real-time and accuracy in many fields, the research of visual-
based VSLAM technology has become the focus of research at home and abroad. This
topic proposes a VI-SLAM algorithm based on monocular vision and inertial pre-
integration, and implements real-time VI-SLAM algorithm for transplanted embedded
devices using parallel processing.
In order to solve the problems of monocular visual feature points, frame loss, and
scale drift, a visual and IMU data fusion method is proposed. The monocular vision front
end is tracked by the optical flow method, and the feature points are simple corner
detections. After matching, the eight-point method is used for calculation. The IMU uses
the pre-integration algorithm to obtain the angular velocity and acceleration integration
results of the gyroscope and accelerometer output, and solves the problem of the
cumulative error in the world coordinate system during the integration process. The back-
end uses nonlinear optimization to obtain the optimal pose estimation, and the global map
adds relocation and loopback detection functions to optimize the pose estimation of the
mobile robot in the global map.
For the real-time requirements of embedded computing, GPU parallel processing
multi-thread operations are used to estimate the depth of image feature points in each
frame. For feature points in key frames, multi-threads sample different depths, obtain
virtual planes with several depth values, and then obtain the cost blocks integrating all
depths after back projection, and estimate the depth by optimizing the global energy
function. Local depth images are blended using TSDF to provide a global dense map that
is used directly for trajectory planning. Using the NVIDIA CUDA parallel processing
computing framework, assigning tasks such as image frame depth estimation to large
amounts of computation, and migrating embedded device NVIDIA TX1 operation VI-
SLAM algorithm.
In order to verify the performance of embedded parallel processing VI-SLAM
algorithm, relevant experiments were designed to verify. In the embedded computing
剩余84页未读,继续阅读
白绍伟
- 粉丝: 13
- 资源: 287
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0