如果已知一个3D空间点的位置p:(x,y,z),你拿着一个相机,站在某个看得到这个空间点p的地方,对着空间点p拍了一张照片。那么请问,你站在哪里拍这张照片呢?你手里拿的相机的朝向角度又是怎么样的呢?

相机就好比是移动机器人的眼睛,我们想知道移动机器人在哪里就需要求解相机现在的位置。抽象的说,现在我们已知n个3D点和n个2D点(这个3D空间点在图像中的像素位置(u,v),即在图像中的第v行,第u列),如何求2D成像点的实际位姿(位置和姿态)?对于这类问题我们统一可以抽象为一个3D-2D的PnP(Perspective-n-Point)问题。它描述了当我们知道n 个3D 空间点以及它们的投影位置时,如何估计相机所在的位姿。

对于这个问题,我们可以有多种求解方法,下面就给大家介绍几种常用、易懂的方法:

1.直接线性变换(DLT)

这种方法顾名思义,直接通过构建像素点(u,v)和空间点P:(X,Y,Z)的解析变换关系,求解出他们的解析解。使用这种方法时,我们需要6对匹配好的3D-2D的匹配点。当匹配点大于6对点时可以使用SVD(奇异值分解)等方法对超定方程求解出最小二乘解。

2.P3P

P3P至少需要3个点,利用给定的三个点的几何关系(相似关系)。如图(1)所示,记3D空间点为A,B,C。他们在相机成像平面分别为2D点:a,b,c。我们可以发现:?Oab ? ?OAB, ?Obc ? ?OBC, ?Oac ? ?OAC。求解投影点a, b, c 在相机坐标系下的3D 坐标,问题自然而然转换成一个3D 到3D 的位姿估计问题。

3.EPNP,UPNP

EPNP和UPNP是对P3P方法的改进它们利用更多的信息,主要是利用已知的3d点,通过PCA选择4个控制点,建立新的局部坐标系,从而将3d坐标用新的控制点表示出来。然后,利用相机投影模型和2d点,转换到相机坐标系中,再在相机坐标系中建立和世界坐标系同样关系(每个点在相机坐标系和世界坐标系下控制点处的坐标一致)的4个控制点,求解出相机坐标系下的四个控制点的坐标,进而利用ICP求解位姿。

4.光束平差法(Bundle Adjustment)

除了使用线性方法之外,我们可以把PnP问题构建成一个定义于李代数上的非线性最小二乘问题。这是一种近几年流行起来的非常通用的求解方式,我们可以用它对PnP  给出的结果进行优化。在PnP中,

BundleAdjustment 问题,总体来说是一个最小化重投影误差(Reprojection error)的问题。

对于最小化重投影误差理解如图二所示,对于空间点P(X,Y,Z),我们按照假定的R和t去做变换,我们把P点重新投影到图像上,可以得到投影点和实际p2点之间的误差e。目标就是通过不断的迭代计算调整R和t,使得误差e尽可能的小。

以上就是一些求解方法,那我们应该怎么用呢?


Opencv给我们提供了PnP的求解器:PNPSolver,它提供了3种求解方法:CV_P3P,CV_EPNP,CV_ITERATIVE。

CV_P3P 使用了非常经典的Gao方法求解,求解出4组可能解,再通过第四个点重投影,返回重投影误差最小的点。

CV_EPNP 使用了论文EPnP:Efficient Perspective-n-Point Camera Pose Estimate的求解方法。

CV_ITERATIVE 基于Levenberg-Marquardt优化方法迭代求解,实质是迭代求出重投影误差最小的解。


上一篇: AGV叉车用电池充电架
下一篇: AMR相比AGV已经有了“质”的改变