一种基于场景分类和几何标注的单视点视频深度获取方法

文档序号：9380941阅读：362来源：国知局

一种基于场景分类和几何标注的单视点视频深度获取方法
【技术领域】
[0001] 本发明涉及一种基于场景分类和几何标注的单视点视频深度获取方法，属于计算机图像处理技术领域。
【背景技术】
[0002] 目前立体图像技术应用范围很广，分布在科研、军事、教育和医疗各个领域。相比于2D图像，立体图像带给我们更逼真更震撼的视觉享受。目前3D片源的获取主要有几种方式：深度摄像机、2D转3D技术。但是，深度摄像机非常昂贵，并且只能得到新拍摄视频的3D 内容，在3DTV系统中不实用，解决这个问题的一种有效的途径就是2D转3D技术，因为目前存在大量的2D视频，2D转3D技术有非常好的发展前景。2D转3D技术是指将普通的2D图像，通过图像或图像之间的相关信息，获得3D左右眼的深度图像。原图像和深度图像通过基于深度图的虚拟绘制技术（DIBR)生成左视图图像和右视图图像，因为人眼存在的视差，当左视图和右视图分别进入到人的左右眼时，便生成了立体图像。
[0003] 2D视频场景根据场景中目标和相机运动情况不同可分成四种情况：相机运动、物体静止，相机静止、物体运动，相机静止、物体静止，相机运动、物体运动。对于这些场景可以采用运动、聚焦、散焦、线性透视、大气透视、纹理信息等深度线索或深度线索的结合得到对应的深度图，但是，这些方法有的只是适用于某一种场景，当场景变换时，该方法便不再适用。

【发明内容】

[0004] 针对现有技术的不足，本发明公开了一种基于场景分类和几何标注的单视点视频深度获取方法；
[0005] 本发明针对相机静止物体运动、相机运动物体静止和相机运动物体运动这三种情况下的视频都能得到对应的深度图像，将现有的2D视频转换成立体视频。
[0006] 本发明得到能适应多种场景变换，精度较高并且计算量适中的深度图像，从而进一步生成质量较好的3D视频。
[0007] 本发明的技术方案为：
[0008] 术语解释
[0009] 1、光流法，是一种简单实用的图像运动的表达方式，通常定义为一个图像序列中的图像亮度模式的表观运动，即空间物体表面上的点的运动速度在视觉传感器的成像平面上的表达；
[0010] 2、全局运动补偿，为了弥补由于摄像机移动造成的背景全局性的运动对图像中运动目标检测造成的影响，常采用基于全局运动补偿思想的检测方法。该方法的思路是先对由摄像机移动引起的背景运动进行运动补偿，使得补偿后的图像序列可以近似认为是静态背景图像序列，然后再利用静态背景中运动目标的检测方法进行检测。
[0011] 3、深度图，场景中各点相对于摄像机的距离可以用深度图来表示，即深度图中每一个像素值表示场景中某一点到摄像机的距离。深度图中像素的值越大，场景中的物体离摄像机越近，像素值越小，场景中的物体离摄像机越远。
[0012] -种基于场景分类和几何标注的单视点视频深度获取方法，具体步骤包括：
[0013] (1)读取视频序列，采用光流法对视频序列中相邻帧图像进行运动估计，得到光流运动矢量结果，根据光流运动矢量结果判断当前帧图像属于相机静止物体运动场景还是属于相机运动场景，所述相机运动场景包括相机运动物体静止场景和相机运动物体运动场景；
[0014] (2)判断是否需要估计当前帧图像的初始深度图，如果需要，进入步骤（3)，否则，当前帧图像的初始深度图默认为当前帧图像的前一帧图像的初始深度图，直接进入步骤 ⑷；
[0015] (3)根据当前帧图像的几何标注结果求出当前帧图像的初始深度图；
[0016] (4)如果当前帧图像属于相机静止物体运动场景，采用光流法得到当前帧图像的运动深度图，与当前帧图像的初始深度图融合；如果当前帧图像属于相机运动场景，首先进行全局运动补偿，然后利用光流法对全局运动补偿后的相邻帧图像进行运动估计，得到运动估计量级图，根据运动估计量级图中非零像素所占的比例来判断场景中是否存在运动物体，如果存在运动物体，将全局运动补偿后的运动估计量级图线性变换得到的运动深度图，运动深度图与初始深度图融合得到最终深度图，如果不存在运动物体，将全局运动补偿前的运动估计量图线性变换得到的运动深度图作为最终深度图。
[0017] 根据本发明优选的，所述步骤（1)中，读取视频序列，采用光流法对视频序列中相邻帧图像进行运动估计，得到光流运动矢量结果，根据光流运动矢量结果判断当前帧图像属于相机静止物体运动场景还是属于相机运动场景；具体步骤包括：
[0018] a、读取视频序列，获取所有的图像，求相邻帧图像之间的光流运动矢量结果，然后将当前帧图像的前（N-I)帧图像的光流运动矢量结果聚集，在原像素（x，y)处当前帧图像的光流运动矢量结果MVS (x，y)的计算公式如式（I )所示：原像素（x，y)在第（1-1)个光流运动后的坐标（X1^1)的计算公式如式（II )所示；
[0021] 式（I )中，MV()表示相邻帧图像之间的光流运动矢量结果，N表示连续的帧图像数，N帧图像共发生（N-I)次光流运动；1 = 1，2, ...，（N-I)，分别表示第1，2, ...，（N-I) 个光流运动，（Xby1)表示的是原像素（x，y)在第（1-1)个光流运动后的坐标；
[0022] 式（II )中，Round {}算子是对光流运动矢量结果的所有元素取整，q = 1，2,. . .，（1-1)，分别表示的是第1，2,. . .，（1-1)个光流运动，（xq，yq)表示原像素（X，y)在第（q-Ι)个光流运动后的坐标；
[0023] b、根据步骤a求取的当前帧图像的光流运动矢量结果的水平运动分量MVSu和垂直运动分量MVSJ+算出运动累积量级图M ^jmjliciticin，计算公式如式（III)所示：
[0025] 设定阈值Thwelght, 2彡Thwelght彡10,统计运动累积量级图中大于阈值Th welght的像
素的数目Ν'，Ν'在所有像素中所占的百分比作为当前帧图像运动区域的权值Wni，计算公式如式（IV )所示：
[0027] 式（IV )中，H和W分别为当前帧图像的高和宽；
[0028] c、设定相机运动阈值 Theaniera nmtlcin, 0· 6 彡 TheaiierajrotlcinS 0· 85,根据步骤 b 求取的当前帧图像运动区域的权值Wni与相机运动阈值Th关系判断当前帧图像是局部运动还是全局运动，如果当前帧图像运动区域的权值Wm小于相机运动阈值Th _____，则当前帧图像是局部运动，即当前帧图像属于相机静止物体运动场景，否则，当前帧图像是全局运动，即当前帧图像属于相机运动场景。
[0029] 根据本发明优选的，所述阈值Thirelght= 5。
[0030] 根据本发明优选的，所述相机运动阈值Th_CTaJrotlcin= 0. 8。
[0031] 根据本发明优选的，所述步骤（2)中，判断是否需要估计当前帧图像的初始深度图，具体步骤包括：如果当前帧图像是局部运动，即当前帧图像属于相机静止物体运动场景，根据步骤（1)判断当前帧图像的前一帧图像是否为局部运动，如果当前帧图像的前一帧图像是局部运动，当前帧图像的初始深度图默认为当前帧图像的前一帧图像的初始深度图，不需要估计当前帧图像的初始深度图；如果当前帧图像的前一帧图像不是局部运动，则需要求当前帧图像的初始深度图；如果当前帧图像是全局运动，则需要求出当前帧图像的初始

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：江铭炎;徐慧慧;
技术所有人：山东大学;
我是此专利的发明人

上一篇：一种三维图像处理方法及装置的制造方法
上一篇：立体源图像校准方法和设备的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。