基于射线模型三维重构的图像定位方法以及装置的制造方法

文档序号:10489802阅读:743来源:国知局
基于射线模型三维重构的图像定位方法以及装置的制造方法
【专利摘要】本发明公开了一种基于射线模型三维重构的图像定位方法及装置,其中方法包括:预先采集多个场景的多个图像,并分别对这些图像进行特征提取以得到多个特征点集合;对该多个图像进行两两图像的特征匹配,并根据这些特征匹配生成对应的本征矩阵,并对其进行噪声处理;基于射线模型根据噪声处理后的特征匹配以及本征矩阵进行三维重构以生成三维特征点云以及重构的摄像机位姿集合;获取查询图像,并对其进行特征提取以得到对应的二维特征点集合;基于定位姿态图优化框架根据二维特征点集合、三维特征点云以及重构的摄像机位姿集合进行图像定位。该方法提高重构效果,降低重构过程的采集成本,提高计算速度,并在图像定位过程中,提高图像定位的精度。
【专利说明】
基于射线模型三维重构的图像定位方法以及装置
技术领域
[0001] 本发明涉及图像处理及模式识别技术领域,尤其涉及一种基于射线模型三维重构 的图像定位方法以及装置。
【背景技术】
[0002] 图像定位技术是通过一张或一组图像,计算得到自身的位姿。该项技术可以用于 机器人导航、路径规划、数字旅游、虚拟现实等,能够适用于GPS(Global Positioning System,全球定位系统)无法工作的区域,如室内和地下等。相比基于蓝牙、WiFi (Wireless Fidel ity,无线保真)的定位技术,图像定位技术不依赖于专业设备,实施成本低。
[0003] 相关技术中,基于图像定位的方法主要有两类:一类是基于图像检索的方法,此类 方法寻找查询图像在数据库中的近邻图像,以其位置作为自身位置;另一类是基于三维重 构结合图像-点云(2D-3D)匹配的方法,这类方法首先预先采集大量关于目标场景的平面图 像,离线进行三维重构,得到场景的三维特征点云,并当在线定位阶段时,提取查询图像特 征,并将其与三维特征点云进行2D-3D匹配,利用匹配结果估计目标摄像机的位姿。
[0004] 但是存在的问题是:针对上述图像检索方法,由于没有更充分的利用三维信息,只 能适用于查询图像与库图像姿态差异较小的情况,其定位精度不优于库图像本身的位置精 度和采样间隔;相比图像检索方法,上述第二类方法虽然能够得到精度更高的定位结果,但 是,其三维重构算法只能用于平面摄像机,受限于平面摄像机较小的视场,通常需要对同一 位置变换多个角度进行拍摄,得到数量较大的平面图像集合进行三维重建,重构代价较高, 如采集量大、计算量大等。

【发明内容】

[0005] 本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
[0006] 为此,本发明的第一个目的在于提出一种基于射线模型三维重构的图像定位方 法。该方法提高了重构效果,降低了重构过程的采集成本,提高了计算速度,并在图像定位 过程中,提高图像定位的精度。
[0007] 本发明的第二个目的在于提出一种基于射线模型三维重构的图像定位装置。
[0008] 为了实现上述目的,本发明第一方面实施例的基于射线模型三维重构的图像定位 方法,包括以下步骤:预先采集多个场景的多个图像,并分别对所述多个图像进行特征提取 以得到对应的多个特征点集合;对所述多个图像进行两两图像的特征匹配,并根据所述两 两图像的特征匹配生成对应的本征矩阵,并对所述本征矩阵进行噪声处理;基于射线模型 根据噪声处理后的所述特征匹配以及本征矩阵进行三维重构以生成三维特征点云以及重 构的摄像机位姿集合;获取查询图像,并对所述查询图像进行特征提取以得到对应的二维 特征点集合;以及基于定位姿态图优化框架根据所述二维特征点集合、所述三维特征点云 以及重构的摄像机位姿集合进行图像定位。
[0009] 根据本发明实施例的基于射线模型三维重构的图像定位方法,在基于射线模型的 三维重构过程中,通过使用三维射线描述二维像素坐标,射线模型能够无畸变地表达多种 摄像机模型(如全景、鱼眼、平面),即能够适用于多种类型的摄像机,并充分利用其内在的 几何性质,使得重构效果更好,且降低了采集成本,提高了计算速度,并且在图像定位过程 中,提出的基于姿态图优化的定位框架,融合了图像点云之间的2D-3D特征匹配和近邻摄像 机的位姿信息,提高了图像定位的精度。
[0010]为了实现上述目的,本发明第二方面实施例的基于射线模型三维重构的图像定位 装置,包括:第一获取模块,用于预先采集多个场景的多个图像,并分别对所述多个图像进 行特征提取以得到对应的多个特征点;生成模块,用于对所述多个图像进行两两图像的特 征匹配,并根据所述两两图像的特征匹配生成对应的本征矩阵,并对所述本征矩阵进行噪 声处理;重构模块,用于基于射线模型根据噪声处理后的所述本征矩阵进行三维重构以生 成三维特征点云以及重构的摄像机位姿集合;第二获取模块,用于获取查询图像,并对所述 查询图像进行特征提取以得到对应的二维特征点集合;以及图像定位模块,用于基于定位 姿态图优化框架根据所述二维特征点集合、所述三维特征点云以及重构的摄像机位姿集合 进行图像定位。
[0011]根据本发明实施例的基于射线模型三维重构的图像定位装置,在基于射线模型的 三维重构过程中,通过使用三维射线描述二维像素坐标,射线模型能够无畸变地表达多种 摄像机模型(如全景、鱼眼、平面),即能够适用于多种类型的摄像机,并充分利用其内在的 几何性质,使得重构效果更好,且降低了采集成本,提高了计算速度,并且在图像定位过程 中,提出的基于姿态图优化的定位框架,融合了图像点云之间的2D-3D特征匹配和近邻摄像 机的位姿信息,提高了图像定位的精度。
[0012] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0013] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得 明显和容易理解,其中,
[0014]图1是根据本发明一个实施例的基于射线模型三维重构的图像定位方法的流程 图;
[0015] 图2是根据本发明实施例的生成三维特征点云以及重构的摄像机位姿集合的流程 图;
[0016] 图3是根据本发明实施例的图像定位的具体实现过程的流程图;
[0017] 图4是根据本发明一个实施例的基于射线模型三维重构的图像定位方法的示例 图;
[0018] 图5是根据本发明一个实施例的基于射线模型三维重构的图像定位装置的结构框 图;
[0019] 图6是根据本发明一个实施例的重构模块的结构框图;
[0020]图7是根据本发明另一个实施例的重构模块的结构框图;以及
[0021]图8是根据本发明一个实施例的图像定位模块的结构框图。
【具体实施方式】
[0022] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附 图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0023] 下面参考附图描述根据本发明实施例的基于射线模型三维重构的图像定位方法 以及装置。
[0024] 图1是根据本发明一个实施例的基于射线模型三维重构的图像定位方法的流程 图。如图1所示,该基于射线模型三维重构的图像定位方法可以包括:
[0025] SlOl,预先采集多个场景的多个图像,并分别对多个图像进行特征提取以得到对 应的多个特征点集合。
[0026] 其中,在本发明的实施例中,术语"多个"可进行广义理解,即对应足够多的数量。 此外,在本发明的实施例中,图像的类型可包括但不限于全景类型、鱼眼类型和平面类型 等。
[0027] 具体地,可预先采集足够的场景图像作为本实施例所提到的图像,并分别对这些 图像提取SIFT (Scale-invariant feature transform,尺度不变特征变换)特征,得到每个 特征点的位置以及描述子集合,其中该描述子集合用于描述对应的特征点的周围区域信 息。
[0028] S102,对多个图像进行两两图像的特征匹配,并根据两两图像的特征匹配生成对 应的本征矩阵,并对本征矩阵进行噪声处理。
[0029] 具体而言,在本发明的实施例中,可先根据多个特征点集合对多个图像进行两两 匹配,并存储每个图像对的特征点匹配情况。之后,可基于匹配上的特征点集合估计本征矩 阵。
[0030] 更具体地,可根据特征点的描述子集合对所有图像进行两两匹配,并储存每个图 像对的特征点匹配情况,然后,可基于匹配上的特征点估计本征矩阵,并同时对该本征矩阵 进行过滤噪声。可以理解,在本发明的实施例中,若将上述两两匹配的特征点组织起来,则 可形成多条轨迹,其中,每条轨迹对应于将被重构的一个3D(三维)点。
[0031] S103,基于射线模型根据噪声处理后的特征匹配以及本征矩阵进行三维重构以生 成三维特征点云以及重构的摄像机位姿集合。
[0032] 可以理解,相较于传统的基于像素的平面模型,本发明通过射线模型能够适应不 同的摄像机类型(如全景类型、鱼眼类型、平面类型等),并将其统一起来。
[0033] 具体地,可先构建姿态图,其中,该姿态图可包含摄像机借点、三维(3D)点节点、摄 像机-摄像机连接边、摄像机-3D点连接边等,这些可共同用于描述摄像机集合与3D点集合 之间的可视性关系。之后,可基于射线模型的增量式重构,即:可先选择相对姿态估计质量 较高的一对摄像机作为初始种子,利用基于射线模型的三角测量(triangulation)寻找新 的样本3D点,之后可利用新的样本3D点基于射线模型寻找更多的摄像机,不断迭代并去噪 优化,直至寻找不到更多的摄像机或者3D点。
[0034]具体而言,在本发明的一个实施例中,如图2所示,基于射线模型根据噪声处理后 的特征匹配以及本征矩阵进行三维重构以生成三维特征点云以及摄像机位姿集合的具体 实现过程可包括以下步骤:
[0035] S201,对噪声处理后的本征矩阵进行分解以得到对应的多个摄像机之间的相对姿 ??τ O
[0036] S202,根据多个摄像机之间的相对姿态和多个特征点构建对应的姿态图。
[0037] 具体地,可通过预设的姿态图创建公式根据多个摄像机之间的相对姿态和多个特 征点构建对应的姿态图。其中,在本发明的实施例中,预设的姿态图创建公式可为:
[0038] G=(NP,NX,EP,EX) (1)
[0039] 其中,NP为摄像机节点,NX为特征点(即样本3D点)节点,EP为摄像机-摄像机连接 边,边上附有摄像机i和k之间的相对位置姿态属性,该属性可包括相对旋转R lk和相对平移 方向Cik,即EPreIpcise(Lk) = (RihCik);EX为摄像机-特征点连接边,该边上附有该摄像机观 测到的特征点坐标EXcjx = Xi j;根据该姿态图可以定义可视性函数Vi sX(Xj,Ps)和Vi sP (Pi, Xs),其中Vi sX (Xj,Ps) = {i : (i,j) e EX,i e Ps}意为给定特征点Xj和摄像机集合Ps的条件下, 返回Ps中观测到Xj的摄像机集合;Vi sP(Pi,Xs) = {j : (i,j) e EX,j e Xs}意为给定特征点集合 Xs和摄像机^的条件下,返回Xs中被P 1观测到的特征点集合。
[0040] S203,分别获取多个摄像机的模型,并分别根据多个摄像机的模型定义对应的射 线模型。
[0041] 具体地,可先获取摄像机的模型,如全景模型、鱼眼模型、平面模型等,之后可根据 不同的摄像机的模型分别定义对应的射线模型。需要说明的是,射线模型是基于每条射线r 可以用原点和单位球上的另一个点X (X,y,Z),x2+y2+z2 = 1所定义的,该射线与图像坐标u (u,v)通过映射函数--对应;映射函数k可定义为x = k(u,K) ,U = IT1(Xj),其中K为摄像机
的内参;对于不同的摄像机模型,其映射函数各自不同,其中,对于全景摄像机、鱼眼摄像 机、平面摄像机所对应的映射函数可分别由如下式(2 M 4)描沭:
[0042]
[0043]
[0044]
[0045]
[0046]
[0047]
[0048]
[0049]
[0050]
[0051]其中,式(2)-(4)中Uc为摄像机主点坐标,f为焦距,特别的对于全景摄像机
为绕y轴的旋转角度,t为绕X轴的俯仰角度,m、Vl、Φ、θ、 Γ均为临时变 量。
[0052] S204,基于对应的射线模型对姿态图进行增量式重构以生成三维特征点云以及重 构的摄像机位姿集合。
[0053] 具体地,可先选择多个摄像机之间的相对姿态估计质量较高的一对摄像机作为初 始种子,之后可利用基于对应的射线模型的三角测量(triangulation)寻找新的3D点,而后 利用新的3D点基于该射线模型寻找更多的摄像机,不断迭代,直至寻找不到更多的摄像机 或者3D点;其中,在该过程可不断实施非线性优化,以用于减小三维重构的误差;同时使用 质量评价函数剔除质量不高的摄像机和3D点。需要说明的是,在该过程中的距离度量、三角 测量、摄像机姿态估计、非线性优化、质量评价函数等模块都是针对射线模型所改进的,相 比传统的仅适用平面图像的重构算法,具有更广泛的普适性。
[0054]由此,在基于射线模型的三维重构算法中,通过使用三维射线描述二维像素坐标, 射线模型能够无畸变地表达多种摄像机模型(如全景、鱼眼、平面等),,即适用于多种类型 的摄像机,扩大了适用范围。
[0055]进一步地,在本发明的一个实施例中,在生成三维特征点云以及重构的摄像机位 姿集合之后,该图像定位方法还可包括:建立三维特征点云中每个三维特征点云的索引树, 并针对重构的摄像机位姿集合中多个摄像头建立空间位置的索引树。具体地,在三维重构 完成之后,可建立点云特征与摄像机位置索引树,其中可以理解,三维特征点云中的每个点 都附带若干特征,这些特征来自于观测到该点的图像;在后续在线定位阶段中,需要建立查 询图像的特征与该特征点云的匹配,以实现图像定位;为了加速匹配过程,本发明对特征点 云建立Kd-tree索引树,以加快检索速度;此外,由于在线定位阶段需要检索查询图像的空 间近邻,所以本发明又对重构出的摄像机建立空间位置的Kchtree索引树。
[0056]需要说明的是,在本发明的实施例中,上述步骤S101-S103均可为离线分析。也就 是说,通过上述步骤S101-S103可以预先建立图像库,并根据该图像库预先生成对应的三维 特征点云以及重构的摄像机位姿集合,并存储,以供后续在线图像定位阶段的使用。
[0057] S104,获取查询图像,并对查询图像进行特征提取以得到对应的二维特征点集合。
[0058]具体地,可对获取到的查询图像提取特征,得到该查询图像的二维特征点集合。需 要说明的是,每一个二维特征点对应一个特征描述子,而3D特征点云中每个3D点对应多个 特征描述子,这些描述子可由三维重构阶段多张图像所贡献。
[0059] S105,基于定位姿态图优化框架根据二维特征点集合、三维特征点云以及重构的 摄像机位姿集合进行图像定位。
[0060] 具体地,可将查询图像的特征与离线部分生成的3D点云的特征进行匹配(即2D-3D 匹配),依据足够数量的有效匹配,利用摄像机姿态估计算法估计查询图像的初始位姿,之 后,可根据该初始位姿查询近邻库摄像机(即近邻图像),并融合2D-3D匹配和与近邻图像之 间的相对姿态建立定位姿态图优化框架并进行优化以得到更高精度的定位结果。
[0061] 具体而言,在本发明的一个实施例中,如图3所示,基于定位姿态图优化框架根据 二维特征点集合、三维特征点云以及重构的摄像机位姿集合进行图像定位的具体实现过程 可包括以下步骤:
[0062] S301,根据多个三维特征点云的索引树将二维特征点集合与三维特征点云进行有 效匹配以得到双向2D-3D匹配集合。
[0063] 具体地,可先对某一个二维特征点Fi2%3D点云特征集合F3d中进行k近邻查询(如k = 5),如果k近邻中来自不同3D点的最近邻与次近邻的比值小于某一阈值thmatch,则认为二 维特征点与最近邻3D点之间构建了一个2D至3D的单向有效匹配,F 2d*所有此类匹配构成了 一个2D至3D的单向有效匹配集合M2p3D(F 2D,F3D);其次对M2p3D(F2D,F 3D)中的每个3D点,反向 在查询图像的特征集合F2d中查询近邻和次近邻.若最近邻与次近邻的比值小于阈值 th match,则认为得到了一个有效的3D至2D的单向匹配,这些匹配构成3D至2D的单项匹配集合 M20^3d ( F2d,F3d );这两单向匹配集合M^3d ( F2d,F3d )和M20^3d ( F2d,F3d )的交集即为双向2D-3D匹 配集合 M2D-3D(F2D,F3D)。
[0064] S302,通过摄像机姿态估计算法对双向2D-3D匹配集合进行估计以生成查询图像 的初始位姿。
[0065] 具体地,基于双向2D-3D匹配集合M2D_3D(F2D,F3D)通过摄像机姿态估计算法剔除不 满足摄像机几何约束的2D-3D匹配,得到内点集合I2D_3D,并估计出查询图像的初始位姿P q2D ^ = Rql3D[I I ,其中,PqI3D为查询摄像机的摄像机矩阵,由旋转矩阵R和该摄像机 矩阵的光心位置C构成。
[0066] S303,根据查询图像的初始位姿以及空间位置的索引树在重构的摄像机位姿集合 中进行查询以得到近邻图像。
[0067] 具体地,可先从查询图像的初始位姿中得到查询图像q的初始空间位置Cq2D_3D,之 后可根据该查询图像的初始空间位置以及空间位置的索引树,在3D特征点云对应的重构的 摄像机位姿集合中查询以得到k近邻(P 1J = I, ...,k},即近邻图像。
[0068] S304,将查询图像与近邻图像进行特征匹配以得到对应的多个有效匹配集合。
[0069]具体地,可将查询图像与近邻图像进行2D-2D的特征匹配得到两个图像之间的多 个有效匹配集合。
[0070] S305,根据多个有效匹配集合生成近邻图像之间的相对姿态。
[0071] 具体地,基于该有效匹配集合估计本征矩阵,并同时得到内点匹配,当匹配数量少 于某一阈值时,可认为该本征矩阵噪声较大,移除该近邻图像,并分解该本征矩阵以得到与 近邻图像间的相对姿态1^,(:1(1,其中相对姿态中的平移Clq只能提供方向,不能提供大小。 [0072] S306,融合双向2D-3D匹配集合和近邻图像之间的相对姿态建立定位姿态图优化 框架。
[0073]具体地,可定义关于查询图像q的姿态图Gq =( NP,NX,EP,EX ),其中,NP为摄像机节 点,包含查询图像的摄像机Pq和其近邻图像的摄像机{Pi,i = l,...,k},NX为3D点节点,对应 于2D-3D匹配得到的中的3D点;EP为查询图像的摄像机Pq与近邻图像的摄像机(P 1, i = 1,...,k}的连接边,边上附有i和q之间的相对位置姿态,包括相对旋转Riq和相对平移方向 C iq,即EPrel-1^(丨,9)=(心<1,(^)观为查询图像的摄像机? (1与30点乂」的连接边,边上附有查 询图像的摄像机Pq观测到的特征点射线坐标EXox = Xq j。
[0074] 之后,对反投影误差及相对姿态误差之和进行优化,基于该查询图像构建目标函 数(即上述的定位姿态图优化框架)如下:
[0075]
[0076] 兵甲,Pq = Kq L 1卜Cq」73符1 兀化的宜刘囹1冢的摄1冢机圯件,Kq,(Jq73该摄像机在世界 坐标系下的旋转和平移;{(xqj,Xj),j = I,. . .η}为输入的双向2D-3D匹配集合;{(Pi,Riq, Clq),i = l,...m}为查询图像的近邻图像以及相应的相对姿态集合;λ为两类代价的平衡因 子;drel 〇为相对姿态边上的代价函数,其定义如下:
[0077]
(6)
[0078] 其中,相对姿态的代价函数包含两项,分别为旋转的代价和平移方向的代价,二者 相互独立;旋转的代价定义为R1,Rq的相对欧拉角,
平移 方向的代价为观测出的平移方向Ri,Ciq与待优化的平移方向
U司的弦距离。
[0079] S307,根据定位姿态图优化框架对查询图像的初始位姿进行优化以实现图像定 位。
[0080] 具体地,采用2D-3D的定位结果(即上述的查询图像的初始位姿)Pq2D_3D作为初值, 根据定位姿态图优化框架通过Levenberg-Marquardt算法对该查询图像的初始位姿Pq 2D^3D 进行优化以得到更高精度的定位结果。
[0081] 由此,相比传统仅使用2D-3D匹配信息的定位方法,本发明通过使用图优化的方法 融合了 2D-3D的匹配信息和图像间的相对姿态信息,提高了最终定位结果的精确性。
[0082] 需要说明的是,上述步骤S104-S105为在线计算,即接收查询图像,然后根据该查 询图像查询预先生成的三维特征点云以及重构的摄像机位姿集合,以实现图像定位。
[0083] 下面将结合图4对本发明实施例的基于射线模型三维重构的图像定位方法进行描 述。
[0084]举例而言,如图4所示,可预先进行离线重构,以得到三维特征点云以及重构的摄 像机位姿集合,即可先离线采集足够场景的图像,并提取图像特征并对图像进行两两匹配, 之后,可构建姿态图,并基于射线模型的增量式进行三维重构,以得到三维特征点云以及重 构的摄像机位姿集合,并建立三维特征点云的索引树以及摄像头的空间位置索引树。当获 取到查询图像时,可进行在线定位,即可先对获取到的查询图像提取特征,并将提取到的特 征与三维特征点云进行2D-3D的有效匹配以得到双向2D-3D匹配集合,之后通过摄像机姿态 估计算法对该双向2D-3D匹配集合进行估计以生成查询图像的初始位姿,并检索近邻摄像 机并计算相对位姿,最后,通过建立定位姿态图融合二者信息得到更高精度的定位结果,即 目标摄像机位置与姿态。
[0085]根据本发明实施例的基于射线模型三维重构的图像定位方法,在基于射线模型的 三维重构过程中,通过使用三维射线描述二维像素坐标,射线模型能够无畸变地表达多种 摄像机模型(如全景、鱼眼、平面),即能够适用于多种类型的摄像机,并充分利用其内在的 几何性质,使得重构效果更好,且降低了采集成本,提高了计算速度,并且在图像定位过程 中,提出的基于姿态图优化的定位框架,融合了图像点云之间的2D-3D特征匹配和近邻摄像 机的位姿信息,提高了图像定位的精度。
[0086]为了实现上述实施例,本发明还提出了一种基于射线模型三维重构的图像定位装 置。
[0087] 图5是根据本发明一个实施例的基于射线模型三维重构的图像定位装置的结构框 图。如图5所示,该基于射线模型三维重构的图像定位装置可以包括:第一获取模块100、生 成模块200、重构模块300、第二获取模块400和图像定位模块500。
[0088] 具体地,第一获取模块100可用于预先采集多个场景的多个图像,并分别对多个图 像进行特征提取以得到对应的多个特征点集合。其中,在本发明的实施例中,术语"多个"可 进行广义理解,即对应足够多的数量。此外,在本发明的实施例中,图像的类型可包括但不 限于全景类型、鱼眼类型和平面类型等。
[0089] 更具体地,第一获取模块100可预先采集足够的场景图像作为本实施例提到的图 像,并分别对这些图像提取SIFT (Scale-invariant feature transform,尺度不变特征变 换)特征,得到每个特征点的位置以及描述子集合,其中该描述子集合用于描述对应的特征 点的周围区域信息。
[0090] 生成模块200可用于对多个图像进行两两图像的特征匹配,并根据两两图像的特 征匹配生成对应的本征矩阵,并对本征矩阵进行噪声处理。具体而言,在本发明的实施例 中,生成模块200可先根据多个特征点集合对多个图像进行两两匹配,并存储每个图像对的 特征点匹配情况,之后,可基于匹配上的特征点集合估计本征矩阵。
[0091] 更具体地,生成模块200可根据特征点的描述子集合对所有图像进行两两匹配,并 储存每个图像对的特征点匹配情况,然后,可基于匹配上的特征点估计本征矩阵,并同时对 该本征矩阵进行过滤噪声。可以理解,在本发明的实施例中,若将上述两两匹配的特征点组 织起来,则可形成多条轨迹,其中,每条轨迹对应于将被重构的一个3D(三维)点。
[0092]重构模块300可用于基于射线模型根据噪声处理后的本征矩阵进行三维重构以生 成三维特征点云以及重构的摄像机位姿集合。可以理解,相较于传统的基于像素的平面模 型,本发明通过射线模型能够适应不同的摄像机类型(如全景类型、鱼眼类型、平面类型 等),并将其统一起来。
[0093]更具体地,重构模块300可先构建姿态图,其中,该姿态图可包含摄像机借点、三维 (3D)点节点、摄像机-摄像机连接边、摄像机-3D点连接边等,这些可共同用于描述摄像机集 合与3D点集合之间的可视性关系,之后,可基于射线模型的增量式重构,即:可先选择相对 姿态估计质量较高的一对摄像机作为初始种子,利用基于射线模型的三角测量 (triangulation)寻找新的3D点,之后可利用新的3D点基于射线模型寻找更多的摄像机,不 断迭代并去噪优化,直至寻找不到更多的摄像机或者3D点。
[0094]具体而言,在本发明的实施例中,如图6所示,该重构模块300可包括:分解单元 310、构建单元320、定义单元330和重构单元340。更具体地,分解单元310可用于对噪声处理 后的本征矩阵进行分解以得到对应的多个摄像机之间的相对姿态。
[0095] 构建单元320可用于根据多个摄像机之间的相对姿态和多个特征点构建对应的姿 态图。更具体地,可通过预设的姿态图创建公式根据多个摄像机之间的相对姿态和多个特 征点构建对应的姿态图。其中,在本发明的实施例中,预设的姿态图创建公式可为上述式 ⑴。
[0096] 定义单元330可用于分别获取多个摄像机的模型,并分别根据多个摄像机的模型 定义对应的射线模型。更具体地,定义单元330可先获取摄像机的模型,如全景模型、鱼眼模 型、平面模型等,之后可根据不同的摄像机的模型分别定义对应的射线模型。需要说明的 是,射线模型是基于每条射线r可以用原点和单位球上的另一个点x(x,y,z),x2+y2+z 2 = l所 定义的,该射线与图像坐标u(u,V)通过映射函数--对应;映射函数k可定义为x = k(u,K), U = ITi(X1K),其中K为摄像机的内参;对于不同的摄像机模型,其映射函数各自不同,其中, 对于全景摄像机、鱼眼摄像机、平面摄像机所对应的映射函数可分别由上述式(2)-(4)描 述。
[0097]重构单元340可用于基于对应的射线模型对姿态图进行增量式重构以生成三维特 征点云以及重构的摄像机位姿集合。更具体地,重构单元340可先选择多个摄像机之间的相 对姿态估计质量较高的一对摄像机作为初始种子,之后可利用基于对应的射线模型的三角 测量(triangulation)寻找新的3D点,而后利用新的3D点基于该射线模型寻找更多的摄像 机,不断迭代,直至寻找不到更多的摄像机或者3D点;其中,在该过程可不断实施非线性优 化,以用于减小三维重构的误差;同时使用质量评价函数剔除质量不高的摄像机和3D点。需 要说明的是,在该过程中的距离度量、三角测量、摄像机姿态估计、非线性优化、质量评价函 数等模块都是针对射线模型所改进的,相比传统的仅适用平面图像的重构算法,具有更广 泛的普适性。
[0098]由此,在基于射线模型的三维重构算法中,通过使用三维射线描述二维像素坐标, 射线模型能够无畸变地表达多种摄像机模型(如全景、鱼眼、平面等),,即适用于多种类型 的摄像机,扩大了适用范围。
[0099]进一步地,在本发明的一个实施例中,如图7所示,该重构模块300还可包括:建立 单元350,建立单元350可用于在重构单元340生成三维特征点云以及重构的摄像机位姿集 合之后,建立三维特征点云中每个三维特征点云的索引树,并针对重构的摄像机位姿集合 中多个摄像头建立空间位置的索引树。具体地,建立单元350在重构单元340三维重构完成 之后,可建立点云特征与摄像机位置索引树,其中可以理解,三维特征点云中的每个点都附 带若干特征,这些特征来自于观测到该点的图像;在后续在线定位阶段中,需要建立查询图 像的特征与该特征点云的匹配,以实现图像定位;为了加速匹配过程,本发明对特征点云建 立Kchtree索引树,以加快检索速度;此外,由于在线定位阶段需要检索查询图像的空间近 邻,所以本发明又对重构出的摄像机建立空间位置的Kchtree索引树。
[0100]第二获取模块400可用于获取查询图像,并对查询图像进行特征提取以得到对应 的二维特征点集合。更具体地,第二获取模块400可对获取到的查询图像提取特征,得到该 查询图像的二维特征点集合。需要说明的是,每一个二维特征点对应一个特征描述子,而3D 特征点云中每个3D点对应多个特征描述子,这些描述子可由三维重构阶段多张图像所贡 献。
[0101]图像定位模块500可用于基于定位姿态图优化框架根据二维特征点集合、三维特 征点云以及重构的摄像机位姿集合进行图像定位。更具体地,图像定位模块500可将查询图 像的特征与离线部分生成的3D点云的特征进行匹配(即2D-3D匹配),依据足够数量的有效 匹配,利用摄像机姿态估计算法估计查询图像的初始位姿,之后,可根据该初始位姿查询近 邻库摄像机(即近邻图像),并融合2D-3D匹配和与近邻图像之间的相对姿态建立定位姿态 图优化框架并进行优化以得到更高精度的定位结果。
[0102]具体而言,在本发明的实施例中,如图8所示,该图像定位模块500可包括:第一匹 配单元510、第一生成单元520、查询单元530、第二匹配单元540、第二生成单元550、建立单 元560和图像定位单元570。
[0103]具体地,第一匹配单元510可用于根据多个三维特征点云的索引树将二维特征点 集合与三维特征点云进行有效匹配以得到双向2D-3D匹配集合。
[0104] 更具体地,第一匹配单元510可先对某一个二维特征点?,在30点云特征集合F3d* 进行k近邻查询(如k = 5),如果k近邻中来自不同3D点的最近邻与次近邻的比值小于某一阈 值thmatch,则认为二维特征点与最近邻3D点之间构建了一个2D至3D的单向有效匹配,F 2d* 所有此类匹配构成了一个2D至3D的单向有效匹配集合M^3D(F2D,F 3D);其次对M^3D(F2D, F3D)中的每个3D点,反向在查询图像的特征集合F 2d中查询近邻和次近邻.若最近邻与次近 邻的比值小于阈值thmatch,则认为得到了一个有效的3D至2D的单向匹配,这些匹配构成3D至 2D的单项匹配集合M 20^3d (F2D,F3d);这两单向匹配集合M^3d (F2D,F3d)和M20^3d (F2D,F3d)的交 集即为双向2D-3D匹配集合M2D- 3D(F2D,F3D)。
[0105] 第一生成单元520可用于通过摄像机姿态估计算法对双向2D-3D匹配集合进行估 计以生成查询图像的初始位姿。更具体地,第一生成单元520可基于双向2D-3D匹配集合M 2d _3D(F2D,F3D)通过摄像机姿态估计算法剔除不满足摄像机几何约束的2D-3D匹配,得到内点 集合1 2D_3D,并估计出查询图像的初始位姿Pq2D_ 3D = Rq2D_3D [ 11-C严3D],其中,P严%为查询摄 像机的摄像机矩阵,由旋转矩阵R和该摄像机矩阵的光心位置C构成。
[0106] 查询单元530可用于根据查询图像的初始位姿以及空间位置的索引树在重构的摄 像机位姿集合中进行查询以得到近邻图像。更具体地,查询单元530可先从查询图像的初始 位姿中得到查询图像q的初始空间位置(:严 3°,之后可根据该查询图像的初始空间位置以及 空间位置的索引树,在3D特征点云对应的重构的摄像机位姿集合中查询以得到k近邻(P 1, i = l,...,k},即近邻图像。
[0107] 第二匹配单元540可用于将查询图像与近邻图像进行特征匹配以得到对应的多个 有效匹配集合。更具体地,第二匹配单元540可将查询图像与近邻图像进行2D-2D的特征匹 配得到两个图像之间的多个有效匹配集合。
[0108] 第二生成单元550可用于根据多个有效匹配集合生成近邻图像之间的相对姿态。 更具体地,第二生成单元550可基于该有效匹配集合估计本征矩阵,并同时得到内点匹配, 当匹配数量少于某一阈值时,可认为该本征矩阵噪声较大,移除该近邻图像,并分解该本征 矩阵以得到与近邻图像间的相对姿态1^,(: 1(1,其中相对姿态中的平移Clq只能提供方向,不 能提供大小。
[0109] 建立单元560可用于融合双向2D-3D匹配集合和近邻图像之间的相对姿态建立定 位姿态图优化框架。更具体地,建立单元560可定义关于查询图像q的姿态图G q= (NP,NX, EP,EX),其中,NP为摄像机节点,包含查询图像的摄像机Pq和其近邻图像的摄像机{Pi,i = 1,...,k},NX为3D点节点,对应于2D-3D匹配得到的中的3D点;EP为查询图像的摄像机 近邻图像的摄像机(P 1J = I, ...,k}的连接边,边上附有i和q之间的相对位置姿态,包括相 对旋转Riq和相对平移方向Ciq,即EPrei- pcise (i,q) = (Riq,Ciq); EX为查询图像的摄像机Pq与3D 点心的连接边,边上附有查询图像的摄像机Pq观测到的特征点射线坐标EX cix = Xtu,之后,对 反投影误差及相对姿态误差之和进行优化,基于该查询图像构建目标函数(即上述的定位 姿态图优化框架)如上述式(5)。
[0110]图像定位单元570可用于根据定位姿态图优化框架对查询图像的初始位姿进行优 化以实现图像定位。更具体地,图像定位单元570可采用2D-3D的定位结果(即上述的查询图 像的初始位姿)Pq2IK3D作为初值,根据定位姿态图优化框架通过Levenberg-Marquardt算法 对该查询图像的初始位姿P qi3D进行优化以得到更高精度的定位结果。
[0111] 由此,相比传统仅使用2D-3D匹配信息的定位方法,本发明通过使用图优化的方法 融合了 2D-3D的匹配信息和图像间的相对姿态信息,提高了最终定位结果的精确性。
[0112] 根据本发明实施例的基于射线模型三维重构的图像定位装置,在基于射线模型的 三维重构过程中,通过使用三维射线描述二维像素坐标,射线模型能够无畸变地表达多种 摄像机模型(如全景、鱼眼、平面),即能够适用于多种类型的摄像机,并充分利用其内在的 几何性质,使得重构效果更好,且降低了采集成本,提高了计算速度,并且在图像定位过程 中,提出的基于姿态图优化的定位框架,融合了图像点云之间的2D-3D特征匹配和近邻摄像 机的位姿信息,提高了图像定位的精度。
[0113] 在本发明的描述中,需要理解的是,术语"第一"、"第二"仅用于描述目的,而不能 理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有"第 一"、"第二"的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,"多个" 的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0114] 在本说明书的描述中,参考术语"一个实施例"、"一些实施例"、"示例"、"具体示 例"、或"一些示例"等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特 点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不 必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任 一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技 术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结 合和组合。
[0115] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例 性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述 实施例进行变化、修改、替换和变型。
【主权项】
1. 一种基于射线模型三维重构的图像定位方法,其特征在于,包括以下步骤: 预先采集多个场景的多个图像,并分别对所述多个图像进行特征提取以得到对应的多 个特征点集合; 对所述多个图像进行两两图像的特征匹配,并根据所述两两图像的特征匹配生成对应 的本征矩阵,并对所述本征矩阵进行噪声处理; 基于射线模型根据噪声处理后的所述特征匹配以及本征矩阵进行三维重构以生成三 维特征点云以及重构的摄像机位姿集合; 获取查询图像,并对所述查询图像进行特征提取以得到对应的二维特征点集合;以及 基于定位姿态图优化框架根据所述二维特征点集合、所述三维特征点云以及重构的摄 像机位姿集合进行图像定位。2. 如权利要求1所述的基于射线模型三维重构的图像定位方法,其特征在于,所述对所 述多个图像进行两两图像的特征匹配,并根据所述两两图像的特征匹配生成对应的本征矩 阵,具体包括: 根据所述多个特征点集合对所述多个图像进行两两匹配,并存储每个图像对的特征点 匹配情况;以及 基于匹配上的特征点集合估计本征矩阵。3. 如权利要求1所述的基于射线模型三维重构的图像定位方法,其特征在于,基于射线 模型根据噪声处理后的所述特征匹配以及本征矩阵进行三位重构以生成样本三维特征点 云以及重构的摄像机位姿集合,具体包括: 对所述噪声处理后的本征矩阵进行分解以得到对应的多个摄像机之间的相对姿态; 根据所述多个摄像机之间的相对姿态和多个特征点构建对应的姿态图; 分别获取所述多个摄像机的模型,并分别根据所述多个摄像机的模型定义对应的射线 丰旲型; 基于所述对应的射线模型对所述姿态图进行增量式重构以生成三维特征点云以及重 构的摄像机位姿集合。4. 如权利要求3所述的基于射线模型三维重构的图像定位方法,其特征在于,在生成三 维特征点云以及重构的摄像机位姿集合之后,所述方法还包括: 建立所述三维特征点云中多个三维特征点云的索引树,并针对所述重构的摄像机位姿 集合中多个摄像头建立空间位置的索引树。5. 如权利要求4所述的基于射线模型三维重构的图像定位方法,其特征在于,基于定位 姿态图优化框架根据所述二维特征点集合、所述三维特征点云以及重构的摄像机位姿集合 进行图像定位,具体包括: 根据所述多个三维特征点云的索引树将所述二维特征点集合与所述三维特征点云进 行有效匹配以得到双向2D-3D匹配集合; 通过摄像机姿态估计算法对所述双向2D-3D匹配集合进行估计以生成所述查询图像的 初始位姿; 根据所述查询图像的初始位姿以及所述空间位置的索引树在所述重构的摄像机位姿 集合中进行查询以得到近邻图像; 将所述查询图像与所述近邻图像进行特征匹配以得到对应的多个有效匹配集合; 根据所述多个有效匹配集合生成所述近邻图像之间的相对姿态; 融合所述双向2D-3D匹配集合和所述近邻图像之间的相对姿态建立所述定位姿态图优 化框架;以及 根据所述定位姿态图优化框架对所述查询图像的初始位姿进行优化以实现图像定位。6. -种基于射线模型三维重构的图像定位装置,其特征在于,包括: 第一获取模块,用于预先采集多个场景的多个图像,并分别对所述多个图像进行特征 提取以得到对应的多个特征点集合; 生成模块,用于对所述多个图像进行两两图像的特征匹配,并根据所述两两图像的特 征匹配生成对应的本征矩阵,并对所述本征矩阵进行噪声处理; 重构模块,用于基于射线模型根据噪声处理后的所述本征矩阵进行三维重构以生成三 维特征点云以及重构的摄像机位姿集合; 第二获取模块,用于获取查询图像,并对所述查询图像进行特征提取以得到对应的二 维特征点集合;以及 图像定位模块,用于基于定位姿态图优化框架根据所述二维特征点集合、所述三维特 征点云以及重构的摄像机位姿集合进行图像定位。7. 如权利要求6所述的基于射线模型三维重构的图像定位装置,其特征在于,所述生成 模块具体用于: 根据所述多个特征点集合对所述多个图像进行两两匹配,并存储每个图像对的特征点 匹配情况;以及 基于匹配上的特征点集合估计本征矩阵。8. 如权利要求6所述的基于射线模型三维重构的图像定位装置,其特征在于,所述重构 丰吴块包括: 分解单元,用于对所述噪声处理后的本征矩阵进行分解以得到对应的多个摄像机之间 的相对姿态; 构建单元,用于根据所述多个摄像机之间的相对姿态和多个特征点构建对应的姿态 图; 定义单元,用于分别获取所述多个摄像机的模型,并分别根据所述多个摄像机的模型 定义对应的射线模型; 重构单元,用于基于所述对应的射线模型对所述姿态图进行增量式重构以生成三维特 征点云以及重构的摄像机位姿集合。9. 如权利要求8所述的基于射线模型三维重构的图像定位装置,其特征在于,还包括: 建立单元,用于在所述重构单元生成三维特征点云以及重构的摄像机位姿集合之后, 建立所述三维特征点云中多个三维特征点云的索引树,并针对所述重构的摄像机位姿集合 中多个摄像头建立空间位置的索引树。10. 如权利要求9所述的基于射线模型三维重构的图像定位装置,其特征在于,所述图 像定位模块包括: 第一匹配单元,用于根据所述多个三维特征点云的索引树将所述二维特征点集合与所 述三维特征点云进行有效匹配以得到双向2D-3D匹配集合; 第一生成单元,用于通过摄像机姿态估计算法对所述双向2D-3D匹配集合进行估计以 生成所述查询图像的初始位姿; 查询单元,用于根据所述查询图像的初始位姿以及所述空间位置的索引树在所述重构 的摄像机位姿集合中进行查询以得到近邻图像; 第二匹配单元,用于将所述查询图像与所述近邻图像进行特征匹配以得到对应的多个 有效匹配集合; 第二生成单元,用于根据所述多个有效匹配集合生成所述近邻图像之间的相对姿态; 建立单元,用于融合所述双向2D-3D匹配集合和所述近邻图像之间的相对姿态建立所 述定位姿态图优化框架;以及 图像定位单元,用于根据所述定位姿态图优化框架对所述查询图像的初始位姿进行优 化以实现图像定位。
【文档编号】G06T17/00GK105844696SQ201511026787
【公开日】2016年8月10日
【申请日】2015年12月31日
【发明人】周杰, 邓磊, 段岳圻
【申请人】清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1