一种基于惯性和深度视觉的实时三维场景重构系统及方法

文档序号：10688096阅读：281来源：国知局

一种基于惯性和深度视觉的实时三维场景重构系统及方法
【专利摘要】本发明公开了一种基于惯性和深度视觉的实时三维场景重构系统及方法，利用IMU传感器在短时间内通过积分计算所得的相对位移和相对姿态变化相对准确的特点，将IMU的ΔPIMU可以作为一个近似真实值与ΔPRGB和ΔPD比较。如果ΔPRGB与ΔPIMU相差超过一定的阈值，则可认为RGB相机通过跟踪连续帧上的特征所计算的相对位置和姿态变化不够精确，同理，如果ΔPD与ΔPIMU相差超过一定的阈值，则可认为通过ICP算法对对连续帧的点云匹配所求得的相对位置和姿态变化不够精确，再根据比较结果进行数据融合，实时估计设备的相对位置和姿态变化，从而提高三维场景重构的精确度，提高设备的容错性。
【专利说明】
一种基于惯性和深度视觉的实时三维场景重构系统及方法
技术领域
[0001]本发明涉及计算机视觉和多传感器融合导航绘图领域，具体地，涉及一种基于惯性传感器和深度视觉传感器的实时三维场景重构的系统及方法。
【背景技术】
[0002]在2010年前后，以色列PrimeSense公司在基于结构光的深度传感器的小型化和模组化技术上取得了突破，并与微软公司合作开发了 Kienct传感器。Kienect传感器上集成了一个彩色RGB相机和一个深度D相机，可以快速获得周围0.5米到4米内物体表面的点云数据，是一种用于捕捉游戏者动作变化的体感设备。该技术一推向市场，就引起了工业界和学术界的注意。在过去几年里，陆续有类似的传感器推出，比如美国Occipital公司的Structure Sensor，Intel公司的RealSense传感器，Google公司的Tango项目等。所有这些设备都可以简称为RGB-D传感器，一种深度视觉传感器系统。
[0003]在过去几年里，随着计算机视觉和机器人领域的快速发展，尤其是同时绘图并导航技术(SLAM—Simultaneous Localizat1n And Mapping)的发展，学术界的研究热点是如何通过移动RGB相机实时重建三维场景。基于单目相机，双目相机和全景相机的实时三维场景重构系统都被广泛研究。目前，学术界主流的看法是基于双目相机系统，并采用视觉里程计技术(Visual Odometry)，实时重构三维场景的稳定性和效果是最好的。然而，当拍摄光线不好和周围物体表面缺乏纹理的情况下，无论哪种相机系统都无法正常工作。与之相比较，RGB-D传感器，可以同时获取周围环境的彩色影像和深度信息。深度信息是不依赖于拍摄时的光线条件和物体表面纹理的。这就使得RGB-D传感器与相机系统相比有了明显的优势。自然地，工业界和学术界开始关注如何使用RGB-D传感器来实时重构三维环境。一个典型的RGB-D实时三维绘图系统应该包括三个步骤，
[0004]1.基于连续帧影像的特征匹配来计算相机的相对运动，即相机跟踪。
[0005]2.基于第一步计算所得的相对位置和姿态，正确显示深度D传感所获得的点云数据，产生周围环境的三维场景。
[0006]3.实时检测闭环，并通过基于图的闭合算法来纠正累积的误差。
[0007]这类算法是否成功的关键就在于是否能够精确地估计出RGB-D传感器的相对运动，这是在上述的第一步和第二步中完成的。第一步是基于视觉里程计技术来估计RGB-D的相对运动，这会受到光线和物体表面纹理的影响。第二步是用第一步提供的相对位置和姿态作为初始条件来做点云的形状匹配，比如ICP算法(已知算法)，从而提高RGB-D的相对运动估计。如果周围物体的形状变化过多也会导致算法的失败。
[0008]当前，基于RGB-D的实时三维环境重建系统在周围环境特征信息丰富的情况下，基于视觉里程计技术和ICP技术，可以达到较好的三维重建效果，然而，在周围环境条件变化时，比如光线变化，周围环境特征变化等，RGB-D的实时三维环境重建就会遇到困难。一旦实时三维环境重构由于周围环境条件变化而中断，就很难再继续工作，使整个系统的鲁棒性降低。
[0009]惯性传感器，可以高频率地(比如10Hz)测量三个方向的加速度和三个方向的角速度，通过加速度的积分可以获得速度变化，通过对速度的积分可以获得相对位移；同样的，对角速度积分可以获得姿态的相对变化。这类传感器在短时间内可以提供较高精度的相对位移和姿态变化，而且完全不受环境条件的影响。

【发明内容】

[0010]为了克服现有技术中基于RGB-D传感器的实时三维环境重建的缺点，本发明提供一种基于惯性和深度视觉的实时三维场景重构系统及方法，利用IMU传感器在短时间内通过积分计算所得的相对位移和相对姿态变化相对准确的特点，通过頂U传感器与RGB-D传感器进行数据融合，实时估计设备的相对位置和姿态变化，从而提高三维场景重构的精确度，提高设备的容错性。
[0011]本发明为解决上述技术问题所采用的技术方案是:
[0012]一种基于惯性和深度视觉的实时三维场景重构系统，包括惯性传感器算法子模块，RGB相机算法子模块，深度D相机算法子模块，比较及数据融合模块和三维点云生成模块;所述惯性传感器算法子模块、RGB相机算法子模块、深度D相机算法子模块分别与比较及数据融合模块电连接，所述比较及数据融合模块与三维点云生成模块电连接；
[0013]所述惯性传感器算法子模块、RGB相机算法子模块、深度D相机算法子模块分别用于采集k及k+Ι时刻系统的相对位置及姿态，并发送给比较及数据融合模块；
[0014]所述比较及数据融合模块用于进行惯性传感器算法子模块与RGB相机算法子模块、惯性传感器算法子模块与深度D相机算法子模块所采集相对位置及姿态同预设阈值的比较，并根据比较结果进行数据融合，校正系统相对位置及姿态的偏差并发送给三维点云生成模块；
[0015]所述三维点云生成模块用于根据比较及数据融合模块得到的系统相对位置及姿态信息，利用Kinect Fus1n算法生成三维点云，进行实时三维环境重建。
[0016]为了提高运算的实时性，算法实现采用了模块化设计，可以同时支持多个模块的并行运算。MU惯性传感器算法子模块是基于I OOHz的加速度和角速度数据，计算出頂U传感器的相对位置和姿态变化，记作△ PimuAGB相机算法子模块采用特征跟踪的视觉里程计技术按30帧/秒的频率计算RGB传感器的相对位置和姿态变化，记作APrgb。深度D相机算法子模块，采用ICP算法(已知算法)，以30帧/秒的频率计算D传感器的相对位置和姿态变化，记作APd。三个传感器之间的几何关系都是已知的，因此可以把它们各自的相对位置变化和姿态变化转换到同一个坐标系下，比如都转换到深度D相机坐标系下。
[0017]一种基于惯性和深度视觉的实时三维场景重构方法，该算法包括以下步骤:
[0018]步骤1:对设备进行初始化，标定IMU传感器、深度D相机和RGB相机的相对位置关系；同时在设备完全静止状态下，设定设备的初始位置和初始姿态PO;初始位置默认为局部三维坐标系的原点；
[0019]步骤2:计算当前时刻与上一时刻相比，頂U传感器的位置和姿态变化值ΔPimu与深度D相机的位置和姿态变化值APd的差值，并与预设阈值进行比较;若差值小于预设阈值，则进行IMU传感器与深度D相机的数据融合，并将融合数据作为下一时刻頂U的位置和姿态；若差值大于预设阈值，则表示数据融合失败，执行步骤3;
[0020]步骤3:计算当前时刻与上一时刻相比，IMU传感器的位置和姿态变化值ΔPim^RGB相机的位置和姿态变化值APReB的差值，并与预设阈值进行比较;若差值小于预设阈值，进行頂U传感器与RGB相机的数据融合，并将融合数据作为下一时刻頂U的位置和姿态;若差值大于预设阈值，则表示数据融合失败，通过MU的速度和角速度积分求得下一时刻的位置与姿态；
[0021]步骤4:将设备位置与姿态数据带入KinectFus1n算法，实时产生周围环境的三维点云。
[0022]作为优选，还包括步骤5:若连续出现多次通过MU的速度和角速度积分求得下一时刻的位置与姿态的情况则表示设备出现严重错误，需对设备进行重新初始化。
[0023]作为优选，步骤2包括以下具体步骤:
[0024]步骤201:分别采集k和k+Ι时刻MU传感器的位置和姿态Pk、P’k+i，由此得到IMU传感器的相对位置和姿态变化值A PIMU;
[0025]步骤202:利用ICP算法根据深度D相机产生的k和k+Ι时刻的点云对，计算深度D相机相对位置和姿态变化值Δ Pd ；
[0026]步骤203:计算APimlU^APd的差值，并与预设阈值进行比较，若差值小于阈值则执行步骤204，否则进行頂U传感器与深度D相机的数据融合；
[0027]步骤204:计算k+1时刻頂U的位置和姿态:Pk+i = Pk+ Δ P0 ；
[0028]步骤205:将步骤204中计算得到的k+Ι时刻的位置和姿态作为扩展卡尔曼滤波中的外部观测值引入基于IMU导航微分方程建立的观测方程中，从而精确估计出IMU的状态向量。
[0029]作为优选，步骤3包括以下具体步骤:
[0030]步骤301:分别采集k和k+Ι时刻MU传感器的位置和姿态Pk、P’k+i，由此得到IMU传感器的相对位置和姿态变化值A PIMU;
[0031 ] 步骤302:采集RGB相机从k至k+Ι时刻的连续影像，根据视觉历程计技术，计算RGB相机的相对位置和姿态变化值A PReB;
[0032]步骤303:计算ΔPim^ Δ P.的差值，并与预设阈值进行比较，若差值小于阈值则执行步骤304，否则k+Ι时刻頂U传感器的位置和姿态Pk+i = Pk+ Δ Pimu；
[0033]步骤304:计算k+Ι时亥丨jMJ的位置和姿态:Pk+i = Pk+A Prgb;
[0034]步骤305:将步骤304中计算得到的k+Ι时刻的位置和姿态作为扩展卡尔曼滤波中的外部观测值引入基于IMU导航微分方程建立的观测方程中，从而精确估计出IMU的状态向量。
[0035]本发明的有益效果是:
[0036]MU传感器在短时间内通过积分计算所得的相对位移和相对姿态变化是很准确的，因此MU的Δ Pimu可以作为一个近似真实值与Δ Prgb和Δ Pd比较。如果Δ Prgb与Δ Pimu相差超过一定的阈值，则可认为RGB相机通过跟踪连续帧上的特征所计算的相对位置和姿态变化不够精确，这往往与拍摄的光线条件和环境里特征贫乏有关。同理，如果A ?°与△ ?1_相差超过一定的阈值，则可认为通过ICP算法对对连续帧的点云匹配所求得的相对位置和姿态变化不够精确，这往往是由于连续帧的点云数据在形状上相似度不够造成的。
[0037]本发明的创新之处在于扩展了仅基于深度D传感器的Kienct Fus1n算法(已知算法)。本发明仅保留了Kinect Fus1n算法中连续帧点云逐步叠加的三维场景重构的算法。在新的设计下，IMU传感器，RGB相机和深度D相机的数据都被用于实时估计设备的相对位置和姿态变化。这比Kinect Fus1n算法仅通过单一的深度相机数据来估计相对运动，要精确很多。
[0038]为了提高实现实时三维场景重构的鲁棒性，算法上采用了递进处理的方式。对每一时刻，首先比较APim^ APd，如果差别在阈值以内，则采用深度D相机计算的相对位置和姿态，并通过松耦合的卡尔曼滤波对IMU传感器的误差项加以纠正。如果差别较大，则放弃当前时刻深度D传感器的相对运动估计结果。再比较Δ Pimu与Δ PReB，如果差别在阈值以内，则采用RGB相机子模块的相对运动估计，并通过松耦合的卡尔曼滤波对頂U的误差项加以纠正。如果差别依然超出阈值，则采用頂U传感器子模块的相对运动估计。
[0039]当设备的相对运动确定之后，就可以直接采用KinectFus1n算法来完成点云数据的累积匹配，实时产生周围环境的三维点云。
[0040]本发明扩展了Kinect Fus1n算法，通过IMU传感器，RGB相机和深度D相机的传感器组合技术大大提高了设备相对运动估计的精度，从而进一步提高了三维场景重构的效率。引入了 MU传感器，也大大提高了整个实时三维重建系统的应用范围，鲁棒性高，容错性强。
【附图说明】
[0041]图1为本发明提供的基于惯性和深度视觉的实时三维场景重构系统结构图
[0042]图2为本发明提供的基于惯性和深度视觉的实时三维场景重构方法流程图
[0043]图3为頂U传感器和深度D相机的组合算法流程图
[0044]图4为頂U传感器和RGB相机的组合算法流程图
【具体实施方式】
[0045]下面结合附图及实施例对本发明作进一步说明。以下的实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出，本发明所涉及的传感器组合仅只是本发明的一种特例，本发明不局限于頂U，RGB和深度D传感器。基于本发明的构思，还可以做若干变形和改进，比如改用双目视觉系统取代单目相机，又比如采用精度更高的惯导设备MU等。计算机视觉和多传感器融合领域的技术人员在本发明的算法思路的启发下，还可以做出改进，比如用更好的特征跟踪算法来加强视觉里程计估计相对运动的精度等。这些基于本发明的改进，扩展和提高都属于本发明的保护范围。
[0046]如图1所示，一种基于惯性和深度视觉的实时三维场景重构系统，包括IMU惯性传感器算法子模块I，RGB相机算法子模块2，深度D相机算法子模块3，比较及数据融合模块4和三维点云生成模块5;所述頂U惯性传感器算法子模块1、RGB相机算法子模块2、深度D相机算法子模块3分别与比较及数据融合模块4电连接，所述比较及数据融合模块4与三维点云生成模块5电连接；
[0047]所述MU惯性传感器算法子模块1、RGB相机算法子模块2、深度D相机算法子模块3分别用于采集k及k+Ι时刻系统的相对位置及姿态，并发送给比较及数据融合模块4;
[0048]所述比较及数据融合模块4用于进行MU惯性传感器算法子模块I与RGB相机算法子模块2、MU惯性传感器算法子模块I与深度D相机算法子模块3所采集相对位置及姿态同预设阈值的比较，并根据比较结果进行数据融合，校正系统相对位置及姿态的偏差并发送给三维点云生成模块5 ；
[0049]所述三维点云生成模块5用于根据比较及数据融合模块4得到的系统相对位置及姿态信息，利用Kinect Fus1n算法生成三维点云，进行实时三维环境重建。
[0050]图2给出了本发明算法上的总体流程。在使用设备实时三维场景重建之前，设备需要在完全静止的状态下完成初始化。初始化的主要目的是设定设备的初始位置和姿态。初始位置默认为局部三维坐标系的原点，即(0，0，0)。初始姿态，用基于頂U的ZUPT算法(已知算法)来计算IMU传感器的初始姿态(滚动角和翻滚角)。
[0051 ]接下来，执行頂U传感器和深度相机D做数据融合，如图3所示，算法的输入是k时刻的位置和姿态Pk。通过对IMU的测量值积分，可以得到k时刻到k+Ι时刻，设备的位置和姿态的相对变化，并记作A Pimu。深度D相机计算模块会对k时刻和k+Ι时刻的点云对进行ICP匹配。ICP算法是点云匹配的经典算法，目的是求出两个点云坐标系间的变换矩阵，一般采用放射变换，比例尺因子一般为I，即两个点云坐标系之间的旋转和平移关系。ICP算法通过多次迭代不断逼近最佳的变换矩阵，一般当两个点云间所有匹配点对距离都小于一个阈值的时候，停止迭代，并获得最佳的变换矩阵。这样，通过ICP算法就求得了 k到k+Ι时刻的位置和姿态的相对变化A Pd。如果△ ?_与△ Pd的差异在给定的阈值以内，说明ICP算法得到了比较精确的相对运动估计，从而计算出k+Ι时刻的位置和姿态，即Pk+1 = Pk+ Δ Pd。
[0052]基于頂U传感器的加速度和角速度测量值，可以建立导航微分方程。本实例中JMU的状态向量包含了位置向量，速度向量，旋转四元数向量(quatern1n)，加速度计偏置误差(accelerometer bias)和角速度计偏置误差(gyro bias)。当IMU传感器和深度D相机融合成功时，k+Ι时刻的位置和姿态可以作为扩展卡尔曼滤波中的外部观测值引入基于頂U导航微分方程建立的观测方程中，从而精确估计出MU的状态向量。
[0053]如果IMU和深度D相机的数据融合失败，则转向IMU和RGB相机的数据融合。
[0054]图4所示的是頂U和RGB相机的数据融合算法。
[0055]頂U的处理方法一样。对RGB相机k到k+Ι时刻连续帧上的特征跟踪，视觉里程计技术，计算出相机的位置和姿态的相对变化。同样，比较APiml^ APReB的差异，如果在给定的阈值以内，则说明通过视觉里程计技术所求得的相对运动估计比较精确，可以直接计算出Pk+1 = Pk+APrgb。同样的道理，这个Pk+1可以被用作扩展卡尔曼滤波里的外部观测值引入基于頂U的观测方程中，去精确估计頂U的状态向量。
[0056]如果頂U和RGB相机的数据融合失败，则k+Ι时刻的位置和姿态是Pk+1= Pk+APIMU。当深度D相机和彩色RGB相机工作正常的情况下，k+Ι时刻的位置和姿态一般都是精确的，同时MU的偏置误差也能得到很好的纠正，从而保证MU计算出的位置和姿态也保持精确。当深度D相机和RGB相机偶尔无法正常工作的情况下，MU的位置和姿态也可以维持精度一小段时间。当深度D相机和RGB相机重新工作的时候，则又回归到正常的工作模式。
[0057]通过上述步骤得到每个时刻相对精确的设备位置和姿态，在采用KinectFus1n算法进行实时三维环境重建时的效率和精度都会大大提高。
[0058]当頂U传感器和RGB相机及深度D相机的数据融合连续多次出现失败时，即连续出现多次通过MU的速度和角速度积分求得下一时刻的位置与姿态的情况，则表示设备出现严重错误，需对设备进行重新初始化。
[0059]说明书中未阐述的部分均为现有技术或公知常识。本实施例仅用于说明该发明，而不用于限制本发明的范围，本领域技术人员对于本发明所做的等价置换等修改均认为是落入该发明权利要求书所保护范围内。
【主权项】
1.一种基于惯性和深度视觉的实时三维场景重构系统，其特征在于:包括IMU惯性传感器算法子模块(I)，RGB相机算法子模块(2)，深度D相机算法子模块(3)，比较及数据融合模块(4)和三维点云生成模块(5);所述IMU惯性传感器算法子模块(I)、RGB相机算法子模块(2)、深度D相机算法子模块(3)分别与比较及数据融合模块(4)电连接，所述比较及数据融合模块(4)与三维点云生成模块(5)电连接；所述IMU惯性传感器算法子模块(I)、RGB相机算法子模块(2)、深度D相机算法子模块(3)分别用于采集k及k+Ι时刻系统的相对位置及姿态，并发送给比较及数据融合模块(4);所述比较及数据融合模块(4)用于进行IMU惯性传感器算法子模块(I)与RGB相机算法子模块(2)、頂U惯性传感器算法子模块(I)与深度D相机算法子模块(3)所采集相对位置及姿态同预设阈值的比较，并根据比较结果进行数据融合，校正系统相对位置及姿态的偏差并发送给三维点云生成模块(5); 所述三维点云生成模块(5)用于根据比较及数据融合模块(4)得到的系统相对位置及姿态信息，利用Kinect Fus1n算法生成三维点云，进行实时三维环境重建。2.—种基于惯性和深度视觉的实时三维场景重构方法，其特征在于:该算法包括以下步骤: 步骤1:对设备进行初始化，标定IMU传感器、深度D相机和RGB相机的相对位置关系；同时在设备完全静止状态下，设定设备的初始位置和初始姿态PO;初始位置默认为局部三维坐标系的原点；步骤2:计算当前时刻与上一时刻相比，MU传感器的位置和姿态变化值△ Pimu与深度D相机的位置和姿态变化值A Pd的差值，并与预设阈值进行比较;若差值小于预设阈值，则进行IMU传感器与深度D相机的数据融合，并将融合数据作为下一时刻IMU的位置和姿态;若差值大于预设阈值，则表示数据融合失败，执行步骤3; 步骤3:计算当前时刻与上一时刻相比，頂U传感器的位置和姿态变化值Δ相机的位置和姿态变化值A PReB的差值，并与预设阈值进行比较;若差值小于预设阈值，进行IMU传感器与RGB相机的数据融合，并将融合数据作为下一时刻頂U的位置和姿态;若差值大于预设阈值，则表示数据融合失败，通过MU的速度和角速度积分求得下一时刻的位置与姿态；步骤4:将设备位置与姿态数据带入Kinect Fus1n算法，实时产生周围环境的三维点云。3.根据权利要求2所述的一种基于惯性和深度视觉的实时三维场景重构方法，其特征在于:步骤2包括以下具体步骤: 步骤201:分别采集k和k+Ι时亥IjMJ传感器的位置和姿态Pk、P’k+1，由此得到MJ传感器的相对位置和姿态变化值A Pimu; 步骤202:利用ICP算法根据深度D相机产生的k和k+Ι时刻的点云对，计算深度D相机相对位置和姿态变化值APd; 步骤203:计算APd的差值，并与预设阈值进行比较，若差值小于阈值则执行步骤204，否则进行頂U传感器与深度D相机的数据融合；步骤204:计算k+Ι时亥Ij頂U的位置和姿态:Pk+i = Pk+ Δ Pd ；步骤205:将步骤204中计算得到的k+Ι时刻的位置和姿态作为扩展卡尔曼滤波中的外部观测值引入基于IMU导航微分方程建立的观测方程中，从而精确估计出IMU的状态向量。4.根据权利要求2所述的一种基于惯性和深度视觉的实时三维场景重构方法，其特征在于:步骤3包括以下具体步骤: 步骤301:分别采集k和k+Ι时亥IjMJ传感器的位置和姿态Pk、P’k+1，由此得到MJ传感器的相对位置和姿态变化值A Pimu; 步骤302:采集RGB相机从k至k+Ι时刻的连续影像，根据视觉历程计技术，计算RGB相机的相对位置和姿态变化值A PReB; 步骤303:计算ΔΡΙΜυ与Δ PReB的差值，并与预设阈值进行比较，若差值小于阈值则执行步骤304，否则k+Ι时刻頂U传感器的位置和姿态Pk+i = Pk+ Δ Pimu；步骤304:计算k+Ι时亥Ij頂U的位置和姿态:Pk+i = Pk+ Δ Prgb ；步骤305:将步骤304中计算得到的k+Ι时刻的位置和姿态作为扩展卡尔曼滤波中的外部观测值引入基于IMU导航微分方程建立的观测方程中，从而精确估计出IMU的状态向量。5.根据权利要求2所述的一种基于惯性和深度视觉的实时三维场景重构方法，其特征在于:还包括步骤5:若连续出现多次通过IMU的速度和角速度积分求得下一时刻的位置与姿态的情况则表示设备出现严重错误，需对设备进行重新初始化。
【文档编号】G06T17/00GK106056664SQ201610343415
【公开日】2016年10月26日
【申请日】2016年5月23日
【发明人】巨辉, 杨斌, 曹顺
【申请人】武汉盈力科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：巨辉;杨斌;曹顺;
技术所有人：武汉盈力科技有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。