一种基于Kinect相机的多视点深度视频复原方法

文档序号:10688054阅读:346来源:国知局
一种基于Kinect相机的多视点深度视频复原方法
【专利摘要】本发明公开了一种基于Kinect相机的多视点深度视频复原方法,属于图像处理和计算机视觉领域。搭建多视点Kinect相机成像系统进行多视点深度视频采集,建立深度计算重建模型,并构建高性能求解算法以获得高质量多视点深度视频。系统容易构建,用Kinect相机即可完成多视点深度视频的复原;程序简单,易于实现;利用采集到的彩色纹理图像、多视点图像、和视频帧间信息建立多视点深度视频计算重建模型,使得恢复结果更加精确;利用求导的方式推导出定点迭代滤波算法,避免了采用最小二乘求解大规模矩阵求逆的问题,算法运行速度快,迭代次数少。
【专利说明】
一种基于K i nect相机的多视点深度视频复原方法
技术领域
[0001] 本发明属于图像处理和计算机视觉领域,涉及采用多视点空域-时域信息对 Kinect深度相机的深度图建模,并推导定点迭代滤波优化算法。具体涉及一种基于Kinect 相机的多视点深度视频复原方法。
【背景技术】
[0002] 现阶段,利用二维(2D)图像来表达场景已经不能满足人们的视觉要求,而具有"真 实感"和"沉浸感"的三维电视技术(3DTV)已经成为新的发展方向。3DTV技术大多以多路不 同视点的视频为输入,需要多视点视频的采集、处理、压缩、传输等一系列技术作为支撑。为 获得舒适的视觉效果,不仅要求每一路视点的视频具有较高的空时分辨率,同时也要求视 点的分布比较稠密。多摄像机系统采集与表示方式所需传输和存储的庞大数据量成3DTV系 统推向应用的主要瓶颈。针对上述问题,目前国内外均采用双路视频加深度信息的表示方 式,即除普通彩色视频之外还配以相应视点的深度图序列,从而可以由少数几个视点的视 频通过虚拟视点绘制方法合成稠密的多视点视频。这种表示方式避免了多视点视频固有的 庞大数据量的问题。所以,深度图的获取方式,以及得到的深度的完整性和准确性成为了 3DTV技术的关键。目前,微软研发的第二代Kinect深度相机是市面上深度精度最高的设备。 但是,它的深度成像质量还难以满足应用需求= Kinect深度相机的深度分辨率低于主流工 业相机的空间分辨率,且在深度跳跃区域(例如物体的边缘与轮廓)产生很多空洞。这些深 度成像的缺陷给实际应用带来了很大的障碍。
[0003] 现有方法通常采用联合纹理深度滤波的方式来提高深度质量。该方法利用彩色纹 理图和深度图的结构相关性进行空间滤波权重预测,并利用光流估计和图像块相似度匹配 寻找时域帧间像素的匹配并计算出时域滤波权重,最后在低分辨率的深度视频上进行三维 (空域+时域)滤波。此方法可以在保证深度恢复质量同时,消除了深度视频在时域的闪烁问 题(Min,D·,Lu,J·,Do,M.:Depth video enhancement based on joint global mode filtering. IEEE TIP 21(3) ,2012,1176-1190);但是,局部的滤波方式没有利用图像的全 局信息,使得系数预测变得困难,而且采用简单的光流和块匹配方法不能保证视频中运动 区域的物体在深度边缘处维持锋利。一些研究人员利用自回归模型对深度图进行全局建 模,采用非局部相关性进行系数预测,并利用最小二乘求解得到深度单帧图像复原结果 (J. Yang,X.Ye,K.Li ,C.Hou,and Y.Wang,"Color-guided depthrecovery from rgb-d data using an adaptive autoregressive model /' IEEETIP,vol.23,no .8,pp.3443-3458,2014);但是,算法速度慢,对于多视点深度视频的复原并没有给出相应的解决方案。

【发明内容】

[0004] 本发明旨在克服现有技术的不足,提供了一种基于Kinect相机的多视点深度视频 复原方法,即搭建多视点Kinect相机成像系统进行多视点深度视频采集,建立深度计算重 建模型,并构建高性能求解算法以获得高质量多视点深度视频。
[0005]本发明的具体技术方案为,一种基于Kinect相机的多视点深度视频复原方法,包 括下列步骤:
[0000] 1)标定每个Kinect相机的内部参数和外部参数;内部参数包括焦距、光心;外部参 数包括旋转、平移;将多视点的低分辨率深度视频扭转到同一相机的彩色视角下,得到多视 点的初始低质量深度视频;
[0007] 2)构建数据项:以概率方式融合多视点的初始低质量深度视频的深度信息构建数 据项;
[0008] 3)构建平滑项:应用步骤1)中当前相机的高分辨率彩色视频,得到相邻帧间像素 的时域对应关系,并计算帧内像素间的空域相似度,以概率方式融合初始低质量深度视频 的时域和空域信息构建平滑项;
[0009] 4)联合数据项和平滑项建立能量方程,应用定点迭代滤波算法进行求解,得到高 质量多视点深度视频。
[0010] 数据项的建立,具体包括以下步骤:
[0011] 2-1)对于第i个Kinect相机K1采集并扭转视角得到的初始低质量深度图0 1,计算 每个像素 P对应的融合权重Ixj3,公式如下:
[0012]
[0013]式中,exp( ·)为指数函数,d为相邻相机彩色摄像头光心间的距离,〇为指数函数 的调控参数,取值范围为4.0~6.0; 为像素 ρ的深度值;
[0014] 2-2)结合2-1)中得到的融合权重Iii,以概率方式融合采集的初始低质量深度图 ^建立数据项,公式如下:
[0015]
[0016]式中,Edata( ·)为数据项的能量函数,D为待求的当前深度帧,Dp为当前深度帧D在P 点的像素值。
[0017] 平滑项的建立,具体包括以下步骤:
[0018] 3-1)利用彩色图像I,对其中的每一点像素 p,采用LK光流算法粗略寻找相邻帧中 的对应像素 ft,LK为Lucas-Kanade的字头缩写。
[0019] 3-2)采用AKNN结构在像素 ft周围邻域内寻找最优的匹配像素点pt,邻域大小为ω
X ω ;ΑΚΝΝ为Approximate K-Nearest Neighbors的字头缩写。匹配相似 的计 算方式如下公式所示:
[0020]
[0021 ]其中,Pp为以像素 p为中心的图像块,Ppt为以像素 Pt为中心的图像块,q和qt分别为 P和Pt邻域N(p)和N(Pt)中的像素,图像块大小和邻域大小均为ω : X ω :; Iq和Itk为像素 q和 qt对应的彩色值。
[0022] 3-3)利用求得的匹配相似度 t算时域相似权重top,pt,公式如下:
[0023]
[0024] 其中,N为归一化因子,σρ为指数函数的调控参数。
[0025] 3-4)利用当前帧的彩色图,采用非均值局部滤波的方式计算帧内像素间的相似度 权重ω Ρ? Ch
[0026] 3-5)结合3-3)和3-4)中得到的时域、空域权重ωρ,ρ#Ρiup t qt '以概率方式融合视 频相邻的深度帧信息构建平滑项,公式如下:
[0027]
[0028] 其中,Ε_4( ·)为平滑项的能量函数,t为当前帧的相邻帧,D^t为第t帧在像素 qt 上的深度值;N(pt)为像素 Pt的邻域,大小为ω 2 X ω 2。
[0029] 能量方程创建和定点迭代滤波算法的推导,具体包括以下步骤:
[0030] 4-1)引入平衡因子λ将数据项和平滑项结合为如下能量方程:
[0031]
[0032]其中min为求取能量方程的最小值。
[0033] 4-2)对4-1)中的能量方程进行求导并置零来求得最优的深度值,方程如下:
[0034]
[0035] 其中,rt为像素 Pt邻域内的像素。fx^rt,Pt为像素 rt和Pt间的空域权重、为像素 rt和qt间的空域权重、Dtrt为第t帧在像素 rt上的深度值。
[0036] 4-3)利用4-2)中求导的结果构建定点迭代滤波算法对当前的低质量深度帧进行 滤波提高质量,并得到最终的高质量深度帧。算法流程如下:
[00371
[0038]其中,为迭代前的深度图初始化结果,为第k+Ι次迭代求得的结果,k+ 1为迭代的次数。算法在第k次的迭代结果的基础上滤波得到第k+Ι次结果。
[0039] 本发明的有益效果是:
[0040] 本发明构建了多路视频加深度信息为表示方式的3DTV原型系统;在此基础上,建 立多视点深度视频计算重建模型,并应用定点迭代滤波算法求解模型,具有以下特点:
[0041] 1、系统容易构建,用Kinect相机即可完成多视点深度视频的复原;
[0042] 2、程序简单,易于实现;
[0043] 3、利用采集到的彩色纹理图像、多视点图像、和视频帧间信息建立多视点深度视 频计算重建模型,使得恢复结果更加精确;
[0044] 4、利用求导的方式推导出定点迭代滤波算法,避免了采用最小二乘求解大规模矩 阵求逆的问题,算法运行速度快,迭代次数少。
[0045] 本发明充分的利用了彩色纹理、多视点和时域信息,使得深度视频恢复效果更精 确;所提的方法具有很好的可扩展性,通过简单的加入更多地深度相机或采用更好帧率的 相机来获得空域-时域分辨率更高的多视点深度视频。
[0046]【附图说明】(附图为灰度图)
[0047]图1是实际搭设的系统和采集的数据。图1中(a)双视点Kinect系统(b)左右视点采 集的数据,包括低分辨率深度视频,高分辨率彩色视频和扭转视角后的初始低质量深度图。 [0048]图2是实际实施流程图。
[0049] 图3是算法的收敛速度示意图。图3中(a)相邻两次迭代间平均绝对误差随着迭代 次数增加的变化(b)初始深度帧(c)第二次迭代结果(d)第六次迭代结果。
[0050] 图4是深度视频的修复结果对比。图4中(a)不同的彩色帧(b)本发明方法的结果 (c)其他方法结果。
【具体实施方式】
[0051] 本发明提出了一种基于Kinect相机的多视点深度视频复原方法,结合附图及实施 例详细说明如下:
[0052]本发明以水平摆放的双视点Kinect相机为成像系统进行多视点深度视频采集,其 中K1S左视点(主视点)相机,心为右视点相机;每个Kinect中的彩色相机分辨率为1920 X 1080,深度相机分辨率为512 X 414,视频帧率均为30帧/每秒,如图1所示。在此基础上,建立 深度计算重建模型,并设计高性能求解算法以获得高质量多视点深度视频。所述方法包括 下列步骤;
[0053] 1)系统标定及数据采集;
[0054] 1-1)用OpenCV标定工具箱对相机进行标定,得到每个Kinect相机的包括焦距、光 心的内部参数和包括旋转、平移的外部参数;
[0055] 1-2)将Kinect相机分别连在两台电脑上,并用一个路由器控制进行数据同步采 集。对于每一个相机,采集到的数据包括低分辨率的深度视频和不同视角的高分辨率彩色 视频。
[0056] 1-3)根据得到相机的内部、外部参数,将获取的左、右视点的低分辨率深度视频扭 转到主视点心彩色相机的视角,得到高分辨率网格下的深度散点构成的初始低质量深度视 频;对于K 1相机的低质量深度帧,利用已知的K1视点高分辨率彩色图、相邻帧深度信息、另一 视点扭转后的深度信息对当前帧进行建模和优化;整个方法的实施流程如图2所示。
[0057] 2)构建深度计算重建模型中的数据项:以概率方式融合主视点的初始低质量深度 视频和另一视点扭转后的初始低质量深度视频构建数据项;
[0058] 2-1)对于第i个Kinect相机K1采集并扭转视角得到的初始深度图岱,计算每个像 素 P对应的融合权重^4,公式如下:,
[0059]
[0060]其中,exp( ·)为指数函数,d为俩相机彩色摄像头光心间的距离,〇为指数函数的 调控参数,取值范围为4.0~6.0,以中间值为佳;Dj3为像素 ρ的深度值。当Dj3 = 0时,1^相 应的为零;当@矣0时,的取值和d成指数关系反比增长。
[0061 ] 2-2)结合2-1)中得到的融合权重Iii,以概率方式融合采集的初始深度图没,建立 数据项,公式如下:
[0062]
[0063]其中,Edata( ·)为数据项的能量函数,D为待求的当前深度帧,Dp为当前深度帧D在P 点的像素值。
[0064] 3)构建深度计算重建模型中的平滑项:应用K1相机的高分辨率彩色视频,得到相 邻帧间像素的时域对应关系,并计算帧内像素间的空域相似度,以概率方式融合初始低质 量深度视频的时域和空域信息构建平滑项;
[0065] 3-1)利用彩色图像I,对其中的每一点像素 p,采用LK光流算法(B.D. Lucas, T.Kanade et al.,"An iterative image registration techniquewith an application to stereo vision." in IJCAI,vol .81,1981,pp.674_679.)粗略寻找相邻帧中的对应像素 Pt-LK为Lucas-Kanade的字头缩写D
[0066] 3-2)米用AKNN结构(C · Liu and W · T · Freeman,"A high-qual i ty Video denoising algorithmbased on reliable motion estimation,',in Proc.ECCV. Springer,2010, pp. 706-719)在像素拓周围邻域内寻找最优的匹配像素点pt, 邻域大小为11 X 11,AKNN为Approximate K-Nearest Neighbors的字头缩写D匹配相似度 Pp J的计算方式如下公式所示:
[0067]
[0068] 其中,Pp为以像素 p为中心的图像块,Ppt为以像素 Pt为中心的图像块,q和qt分别为 P和Pt邻域N(p)和n(pt)中的像素,图像块大小和邻域大小均为为5 X 5。Iq和Iqt为像素 q和qt 对应的彩色值。
[0069] 3-3)利用求得的匹配相似度S(Pp, Pptj计算时域相似权重<%Pt,公式如下:
[0070]
[0071] 其中,N为归一化因子,等于邻域权重之和。〇[)为指数函数的调控参数,取值为3.5。
[0072] 3-4)利用当前帧的彩色图,采用非均值局部滤波的方式计算空域帧内像素间的相 似度权重 toPtAt。
[0073] 3-5)结合3-3)和3-4)中得到的时域、空域权重wp,pt和^^%\ qt '以概率方式融合视 频相邻的深度帧信息构建平滑项,公式如下:
[0074]
[0075] 其中,Ε_4( ·)为平滑项的能量函数,t为当前帧的相邻帧,Dgt为第t帧在像素 qt 上的深度值,N(pt)为像素 Pt的邻域,大小为9 X 9。
[0076] 4)联合上述两项建立最终的能量方程,应用定点迭代滤波算法进行求解。
[0077] 4_n印λ平衡田早λ抱撒抿I苗和平猾项结合为如下能量方程:
[0078]
[0079] 其中min为求取能量方程的最小值。平衡因子λ取值为0.1。
[0080] 4-2)对4-1)中的能量方程进行求导并置零,方程如下:
[0081]
[0082] 利用求导来求得最优的深度值结果:
[0083]
[0084] 其中,rt为像素 Pt邻域内的像素。为像素 rt和Pt间的空域权重、为像素 rt和qt间的空域权重、D|t为第t帧在像素 rt上的深度值。
[0085] 4-3)利用4-2)中求导的结果构建定点迭代滤波算法对当前的低质量深度帧进行 滤波提高质量,并得到最终的高质量深度帧。算法流程如下:
[0086]
[0087]其中,Df为迭代前的深度图初始化结果,为第k+Ι次迭代求得的结果,k+1 为迭代的次数。算法在第k次的迭代结果的基础上滤波得到第k+1次结果。算法重复以上过 程直至收敛得到最终结果。算法的收敛性和收敛结果如图3所示:算法在第六次迭代的时候 已经收敛,深度恢复结果也为最佳,故实验中设置迭代次数k = 6。
[0088] 对深度视频中的每帧依次重复上述2)-4)步骤,直到恢复完毕整个深度视频。
[0089] 本实施例对两组数据的最终恢复结果及与其他方法的比较如图4所示,其中(a)图 为两组数据中挑选出来的不同彩色帧,(b)图为采用本发明方法得到的插值帧结果;(C)图 为采用基于加权模式滤波方法(Min,D. ,Lu,J.,Do,M. :Depth video enhancement based on joint global mode filtering. IEEE TIP 21(3) ,2012,1176-1190)得到的恢复帧结 果。
【主权项】
1. 一种基于Kinect相机的多视点深度视频复原方法,其特征在于,包括下列步骤: 1) 标定每个Kinect相机的内部参数和外部参数;将多视点的低分辨率深度视频扭转到 同一相机的彩色视角下,得到多视点的初始低质量深度视频; 2) 构建数据项:以概率方式融合多视点的初始低质量深度视频的深度信息构建数据 项; 3) 构建平滑项:应用步骤1)中当前相机的高分辨率彩色视频,得到相邻帧间像素的时 域对应关系,并计算帧内像素间的空域相似度,以概率方式融合初始低质量深度视频的时 域和空域信息构建平滑项; 4) 联合数据项和平滑项建立能量方程,应用定点迭代滤波算法进行求解,得到高质量 多视点深度视频。2. 根据权利要求1所述的一种基于Kinect相机的多视点深度视频复原方法,其特征在 于,步骤2)中数据项的建立,具体包括以下步骤: 2-1)对于第i个Kinect相机I采集并扭转视角得到的初始低质量深度图β'计算每个像 素 P对应的融合权重:?,公式如下:式中,exp( ·)为指数函数,d为相邻相机彩色摄像头光心间的距离,σ为指数函数的调 控参数,取值范围为4.0~6.0; 为像素 ρ的深度值; 2- 2)结合2-1)中得到的融合权重V,以概率方式融合采集的初始低质量深度图扠,建立 数据项,公式如下:式中,Edata( ·)为数据项的能量函数,D为待求的当前深度帧,DP为当前深度帧D在p点的 像素值。3. 根据权利要求2所述的一种基于Kinect相机的多视点深度视频复原方法,其特征在 于,步骤3)中平滑项的建立,具体包括以下步骤: 3- 1)利用彩色图像I,对其中的每一点像素 p,采用Lucas-Kanade光流算法粗略寻找相 邻帧中的对应像素 ft;: 3-2)采用Approximate K-Nearest Neighbors结构在像素两周围邻域内寻找最优的匹 配像素点Pt,邻域大小为ω X ω ;匹配相似度S(Pp,Ppj的计算方式如下公式所示:式中,Pp为以像素 P为中心的图像块,ΡΡιΛ以像素 Pt为中心的图像块,q和qt分别为p和Pt 邻域N(p)和N(pt)中的像素,图像块大小和邻域大小均为ω : X ω :; Iq和Iqt为像素 q和qt对应 的彩色值; 3-3)利用求得的匹配相似度S(Pp, Ppt;)计算时域相似度权重C〇P,Pt,公式如下:式中,N为归一化因子,等于邻域权重之和;〇P为指数函数的调控参数; 3-4)利用当前帧的彩色图,采用非均值局部滤波的方式计算空域相似度权重Wpt,qt; 3- 5)结合3-3)和3-4)中得到的时域相似度权重%,pt、空域相似度权重ωρΛ,以概率 方式融合视频相邻的深度帧信息构建平滑项,公式如下:式中,Es_th( ·)为平滑项的能量函数,t为当前帧的相邻帧,D&为第t帧在像素 qt上的 深度值,N(pt)为像素 pt的邻域,大小为ω2Χ ω2。4.根据权利要求3所述的一种基于Kinect相机的多视点深度视频复原方法,其特征在 于,步骤4)具体包括以下步骤: 4- 1)引入平衡因子λ将数据项和平滑项结合为如下能量方程:式中,min为求取能量方程的最小值; 4-2)对4-1)中的能量方程进行求导并置零,方程如下:利用求导来求得最优的深度值结果:式中,rt为像素 pt邻域内的像素为像素 rt和pt间的空域权重、为像素 rt和 qt间的空域权重、Di-t为第t帧在像素 rt上的深度值。 4-3)利用4-2)中求导的结果构建定点迭代滤波算法对当前的低质量深度帧进行滤波, 得到高质量深度帧,算法流程如下:其中,为迭代前的深度图初始化结果,Df+1)为第k+Ι次迭代求得的结果,k+Ι为迭 代的次数;算法在第k次的迭代结果的基础上滤波得到第k+1次结果。
【文档编号】G06T7/00GK106056622SQ201610680651
【公开日】2016年10月26日
【申请日】2016年8月17日
【发明人】叶昕辰, 李豪杰, 樊鑫, 罗钟铉
【申请人】大连理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1