杨森 等:摄像机位姿的加权线性算法
2477
解决 PnP 问题所需要的最少点对应数为 3(P3P),它最多有 4 个解
[10,11]
.Gao 等人
[12]
通过吴方法
[13]
给出了 P3P
的完全解分类.Quan 和 Lan 对于 P4P 和 P5P 问题给出了线性 SVD 算法
[2]
,他们把 PnP 问题转化为多个 P3P 问
题,根据 P3P 问题之间的关系线性求解 PnP, 其算法时间复杂度较高.在 n≥6 的情况下,经典的线性算法是
DLT(direct linear transformation)算法
[1]
,它忽略了旋转矩阵的正交约束,将投影矩阵 12 个变量看作独立变量而
得到线性约束.Fiore 在文献[3]中提出了一种时间复杂度为 O(n
2
)的线性算法,但是对噪声较为敏感
[5]
.最
近,Moreno 和 Lepetit 提出了一种高效、高精度线性算法 EPnP
[4]
,其基本思想是把空间点都通过 4 个虚拟的控
制点所建立的坐标系来表示,其中 4 个控制点的选取分别为空间点集的中心以及 3 个主方向上的单位点.然后
根据图像点的信息求解 4 个控制点的摄像机坐标系下的坐标,进而得到旋转矩阵和摄像机坐标.EPnP 被认为是
一种高效的线性算法,其时间复杂度为 O(n),但实验结果表明,当深度幅度变化较为剧烈时(即深度比较小
时),EPnP 算法难以获得较好的估计结果.
非线性迭代算法
[6−9]
是以最小化某种代价函数为目标,Lu 方法
[6]
是基于空间距离最小化的迭代算法,相比
较其他迭代算法,其速度较快,但在图像点噪声服从高斯分布下,其精度劣于重投影误差最小化算法
[9]
.如果图像
点噪声服从高斯分布,则重投影误差最小化方法在最大似然意义下是最优的.非线性迭代算法虽然能够达到很
高的精度,但对初值却非常依赖,其可能得到局部极小值,而非全局极小值,并且计算量大大高于线性算法.
Hartley 和 Kahl
[7]
最近提出一种利用无穷范数的全局优化算法.他们利用四元数
[14]
,以一个半径π的球为旋转参
数空间,并通过遍历旋转空间和分支定界算法寻找全局最优解.但是这种算法运算量巨大,并且实验结果表明,
在高斯噪声假设情况下,其精度低于重投影误差最小化方法的精度.
本文提出了一种新的线性算法,该算法除了继承 DLT 算法速度快的优点以外,与现有的其他线性算法相比
能够获得较高精度,并且对深度变化较为稳定,在深度变化幅度较大的情况下仍然可以获得较好的结果.本文算
法的主要思想是使用加权技术,使线性算法中的代数距离误差近似于重投影算法的几何距离误差,从而达到接
近最大似然算法的精度.
本文第 1 节给出加权求精算法的基本思想.第 2 节和第 3 节分别给出加权 DLT 算法(WDLT)和加权 EPnP
算法(WEPnP).第 4 节是模拟数据与真实图像的实验对比.第 5 节总结全文.
1 加权的基本思想
给定一组空间点与图像点对应 { ( ,1) ( ,1) | 1, 2,..., }
TT TT
ii ii
iN=↔= =
xx uu ,其中,x
i
表示空间点在世界坐标系
下的齐次坐标
,(,,)
T
iiii
yz=
x 是该空间点的非齐次坐标,u
i
表示图像点的齐次坐标,(,)
T
iii
uv=
u 是它的非齐次坐
标.记 P=(A,b)为投影矩阵,如果 R 为摄像机坐标系关于世界坐标系的旋转,并且摄像机中心在世界坐标系中的
齐次坐标为 (,1),
T
=
cc 则 ,==−
A KR b KRc .即,投影矩阵能够表示为 (, )
−
KR I c .其中:K 是摄影机内参数矩
阵
,
(, )−
Ic
是外参数矩阵,即摄像机的姿态.本文仅考虑摄像机姿态估计问题,即摄像机内参数是已知的,不失
一般性
,假定内参数 K=I.此时,投影矩阵则可以被表示为 (, )
−
RI c .空间点的齐次坐标 x
i
和图像点齐次坐标
u
i
在针孔模型下存在映射关系,其表示为投影方程:
( , ) , 1, 2,...,
ii i i
iN==− =
uPx RRcx (1.1)
姿态估计问题是根据图像点和空间点的对应信息估计旋转矩阵 R 和摄像机位置 c,使之尽可能地满足投影
方程
(1.1).
假定空间点 x
i
在摄像机坐标系下的非齐次坐标为 (,,,)
ccccT
iiii
xyz=
x 它在图像上的真值为
i
u
,u
i
是
i
u
的测量
点
.令
cc
iii
z=
′
xu
,则代数误差为
|| ||
cc
Aii
d
′′
=−
xx
,
因此,重投影算法的几何误差为(如图 1 所示)
3
()1
|| | || |
(
|
)
|
cc
i
Gii i ii
c
ii
d
z
−
′
=−=− = −
−
Rx c
uu u x x
Rx c
(1.2)
其中,R
3
为旋转矩阵 R 的第 3 行.不难看出,代数误差 d
A
与几何误差 d
G
成正比例关系,即 .
c
AiG
dzd=
假设图像点的噪声服从高斯分布,那么几何误差最小化估计在最大似然意义下是最优的.但在最小化过程
评论0
最新资源