一种基于彩色视频运动矢量的深度图序列分形编码方法

文档序号：7772252阅读：162来源：国知局

一种基于彩色视频运动矢量的深度图序列分形编码方法
【专利摘要】本发明提出了一种基于彩色视频运动矢量的深度图序列分形编码方法。首先使用分形视频压缩方法编码彩色视频，然后用分形视频解压缩方法解码彩色视频，以获得彩色视频各宏块及小块的运动矢量。深度图序列的I帧编码，在H.264帧内预测编码方法基础上定义了平滑块，平滑块直接复制相邻参考像素值，而无需遍历各种预测方向；深度图序列的P帧进行块运动估计/补偿分形编码，利用深度图序列帧宏块与相应彩色视频宏块运动矢量相关性，进行深度图序列帧宏块运动矢量预测，并设计增强型非均匀多层次六边形搜索模板代替原非对称十字型多层次六边形格点搜索算法（UMHexagonS）中的非均匀多层次六边形搜索模板，利用改进的UMHexagonS算法搜索最相似匹配块，记录分形参数。最后利用熵编码CABAC压缩I帧和P帧的残差帧和P帧的分形参数。
【专利说明】一种基于彩色视频运动矢量的深度图序列分形编码方法
【技术领域】:
[0001]本发明属于三维视频压缩编码领域，涉及深度图序列的压缩编码，为三维立体视频编码的实时性应用奠定了基础，进一步提高了基于深度图的立体视频压缩编码的性能。
【背景技术】:
[0002]深度图所代表的是场景到摄像机成像平面的距离信息，它将实际深度值量化到[0，255],以获得代表深度信息的灰度图(参见Tanimoto M, Fujii T, Suzuki K, etal.Mult1-view depth map of Rena and Akko&Kayo[C], ISO/IEC JTC1/SC29/WG11, MPEG-M14888, China:Shenzhen, 2007.)。
[0003]深度图压缩是三维视频系统中的核心技术。目前，对深度图序列压缩的方法，主要是基于H.264/AVC标准。如杨旭等针对三维视频编码复杂度较高的问题，提出一种快速深度图像帧内编码方法，该方法基于视频图像与深度图像的相关性，利用视频图像的最优帧内预测模式信息，优化深度图像帧内编码预测模式的选择范围，减少率失真代价函数的计算量，从而降低深度图像帧内编码复杂度(参见杨旭，常义，林霍等.一种三维视频深度图像快速帧内编码方法[J].西安电子科技大学学报(自然科学版)，2012，39(3):7-13.)。Byung Tae Oh等定义了一个深度失真函数(参见Byung Tae Oh, Jaejoon Lee，Du_sik Park.Depth map coding based on synthesized view distortion function[J].1EEE Journalof Selected Topics in Signal Processing.2011，5 (7): 1344-1352.XD.V.S.X.De Silva等提出了新的模式选择方法(参见 D.V.S.X.De Silva, ff.A.C.Fernando, S.T.Worral1.1ntra mode selection method for depth maps of3D video based on renderingdistortion modeling[J].1EEE Transactions on Consumer Electronics, 2010，56(4): 2735-2740.)。
[0004]近年来分形理论也被应用到视频序列的压缩上，其基本思想是在视频编码过程中将每视频帧(首帧除外)上的子块从前一帧而不是同一帧找相匹配的父块。其中最为经典和影口向较大的参见(C.S.Kim, R.C.Kim, S.U.Lee.Fractal coding of video sequence usingcircular prediction mapping and noncontractive inter frame mapping[J].1EEETransactions on Image Processing, 1998，7 (4): 601-605.)。该方法米用类似于标准视频编码方法所采用的运动估计/补偿技术，利用了相邻帧之间的时间强相关性，对视频序列压缩取得了较好的效果。Koji Ohse与Masahiro Nakagawa提出将视频序列变换到频率域,再应用分形视频压缩方法将不同分量的序列压缩编码(参见Koji Ohse, Masahiro Nakagawa.Fractal video coding with the orthogonal transformation[J], Electronics andCommunications in Japan, 2007, 90 (3): 36-47),此方法提供了在确定压缩比的情况下，实现对视频较好的压缩。张喻平与丰洪才提出了一种利用遗传算法提高视频分形压缩编码搜索速度的算法。(参见张喻平，丰洪才.利用遗传算法提高视频分形压缩编码搜索速度[J].计算机与数字工程，2007，35(1):28-30.)这种基于遗传算法的视频分形压缩编码改进了遗传算法中搜索空间的构造机理，结合运用合适的迭代函数系统和仿射变换，从而缩短了压缩编码时间，并且视频的恢复质量略优于全搜索算法和传统的分形压缩算法。
[0005]为了解决目前基于深度图的三维视频编码复杂度高的问题，本发明方法通过改进
H.264帧内预测编码方法，实现深度图序列I帧编码；通过利用深度图序列帧宏块与相应彩色视频宏块运动矢量相关性，进行深度图序列帧宏块运动矢量预测，并设计增强型非均匀多层次六边形搜索模板代替原非对称十字型多层次六边形格点搜索算法(UMHexagonS)中的非均匀多层次六边形搜索模板，实现深度图序列P帧分形编码。实验证明，本发明方法实现了深度图序列压缩编码，并且编码时间及编码码率明显减少。

【发明内容】
:
[0006]本发明提出了一种基于彩色视频运动矢量的深度图序列分形编码方法。首先使用分形视频压缩方法编码彩色视频，然后用分形视频解压缩方法解码彩色视频，以获得彩色视频各宏块及小块的运动矢量。深度图序列的I帧编码，在H.264帧内预测编码方法基础上定义了平滑块，平滑块直接复制相邻参考像素值，而无需遍历各种预测方向；深度图序列的P帧进行块运动估计/补偿分形编码，利用深度图序列帧宏块与相应彩色视频宏块运动矢量相关性，进行深度图序列帧宏块运动矢量预测，并设计增强型非均匀多层次六边形搜索模板代替原非对称十字型多层次六边形格点搜索算法(UMHexagonS)中的非均匀多层次六边形搜索模板，利用改进的UMHexagonS算法搜索最相似匹配块,记录分形参数。最后利用熵编码CABAC压缩I帧和P帧的残差帧和P帧的分形参数。
[0007]—种基于彩色视频运动矢量的深度图序列分形编码方法，其特征在于实现步骤如下:
[0008]步骤一:使用基于分形的视频压缩方法编码彩色视频；
[0009]步骤二:使用基于分形的视频解压缩方法解码彩色视频，获得彩色视频各宏块及小块编码运动矢量，作为相应深度图序列帧宏块或小块的候选预测运动矢量；
[0010]步骤三:若为深度图序列的I帧(第一帧必须为I帧，其它帧可以设置是否为I帧)，使用改进的H.264帧内预测编码方法预测I帧。通过原始帧和预测帧之差得到编码端残差帧。转入步骤五编码残差；若为深度图序列的P帧，转到步骤四；
[0011]步骤四:若为深度图序列的P帧，依次对当前帧的所有宏块进行运动估计/补偿分形编码。在参考帧中的搜索窗内对当前宏块进行块匹配，父块的大小与子块的大小相同。利用改进的非对称十字型多层次六边形格点搜索算法(UMHexagonS)，搜索出匹配误差MSE最小的点。如果匹配误差MSE小于开始设定的阈值，保存当前的迭代函数系统系数即IFS系数，转入步骤六得到本块的重建块；否则，依次按照树状结构对该块进行划分，并对各个划分得到的小块，利用改进的UMHexagonS算法,分别计算最小匹配误差MSE，如果最小匹配误差MSE小于设定阈值，停止划分并记录该小块IFS系数，转入步骤六得到本块的重建块；否则继续划分，直到将当前块划分为预先设定的最小块4X 4块，记录IFS系数，转入步骤六得到本块的重建块。如果当前帧所有的宏块都已编码完毕，所有的重建块组成重建图像(即下一帧的参考帧)，通过原始图像与重建图像之差得到编码端残差图像，转到步骤五编码残差。所述搜索窗为在参考帧中的矩形搜索区域；所述IFS系数包括父块与子块的位置偏移，即运动矢量(X，y)和比例因子S、偏移因子ο ;
[0012]步骤五:残差图像的数据经过DCT、量化之后的系数一方面进行Zig-Zag扫描，然后用熵编码CABAC进行编码写入码流；另一方面经过反量化、反DCT变换后得到解码端残差帧。由预测帧和解码端残差帧之和得到重建帧(即下一帧的参考帧)。如果是P帧则还要对所有IFS系数进行有符号指数哥伦布编码。判断当前帧是否为最后一帧，如果是最后一帧结束编码；否则，返回步骤三继续处理下一帧图像；
[0013]步骤六:通过保存的IFS系数代入解码方程计算得到预测值，由原始块和预测块之差得到编码端残差块，编码端残差块经过DCT变换、量化、反量化和反DCT变换得到解码端残差块，再由预测块和解码端残差块之和得到重建块。转入步骤四编码深度图序列P帧下一宏块。
[0014]所述一种基于彩色视频运动矢量的深度图序列分形编码方法，处理的彩色视频与深度图序列均为YUV格式。
[0015]所述步骤一中基于分形的视频压缩方法包括以下四个步骤:
[0016]I)如果是I帧(第一帧必须为I帧，其它帧可以设置是否为I帧)，采用H.264帧内编码方式，对于每个当前块在各种可能的预测方式中选择具有最小代价的预测模式，完成所有块的预测后可以得到I帧的预测帧。通过原始帧和预测帧之差得到编码端残差帧。转入步骤3)编码残差；如果是P帧，转到步骤2)；
[0017]2)如果是P帧。依次对当前帧的所有宏块进行编码。在参考帧中的搜索窗内对当前宏块进行块匹配；在进行子块与父块的匹配过程中，子块的位置作为父块的起始搜索点，父块的大小与子块的大小相同；对每个宏块进行树状结构分块，即分块从大到小可分为16X16、16X8、8X16、8X8，8X8往下(亚宏块分割)可以分为8X4，4X8，4X4。帧间编码时，首先对编码宏块的各种块划分尺寸的帧间预测模式进行运动估计，确定迭代函数系统系数即IFS系数；然后比较所有模式的率失真代价；最后将率失真代价最小的模式作为最优帧间预测模式。
[0018]IFS系数由如下的率失真优化函数确定:
[0019]
【权利要求】
1.一种基于彩色视频运动矢量的深度图序列分形编码方法，其特征在于如下步骤: 步骤一:使用基于分形的视频压缩方法编码彩色视频；步骤二:使用基于分形的视频解压缩方法解码彩色视频，获得彩色视频各宏块及小块编码运动矢量，作为相应深度图序列帧宏块或小块的候选预测运动矢量；步骤三:若为深度图序列的I帧(第一帧必须为I帧，其它帧可以设置是否为I帧)，使用改进的H.264帧内预测编码方法预测I帧。通过原始帧和预测帧之差得到编码端残差帧。转入步骤五编码残差；若为深度图序列的P帧，转到步骤四；步骤四:若为深度图序列的P帧，依次对当前帧的所有宏块进行运动估计/补偿分形编码。在参考帧中的搜索窗内对当前宏块进行块匹配，父块的大小与子块的大小相同。利用改进的非对称十字型多层次六边形格点搜索算法(UMHexagonS),搜索出匹配误差MSE最小的点。如果匹配误差MSE小于开始设定的阈值，保存当前的迭代函数系统系数即IFS系数，转入步骤六得到本块的重建块；否则，依次按照树状结构对该块进行划分，并对各个划分得到的小块，利用改进的UMHexagonS算法,分别计算最小匹配误差MSE，如果最小匹配误差MSE小于设定阈值，停止划分并记录该小块IFS系数，转入步骤六得到本块的重建块；否则继续划分，直到将当前块划分为预先设定的最小块4X 4 ±夹，记录IFS系数，转入步骤六得到本块的重建块。如果当前帧所有的宏块都已编码完毕，所有的重建块组成重建图像(即下一帧的参考帧)，通过原始图像与重建图像之差得到编码端残差图像，转到步骤五编码残差。所述搜索窗为在参考帧中的矩形搜索区域；所述IFS系数包括父块与子块的位置偏移，即运动矢量(X，y)和比例因子S、偏移因子ο ; 步骤五:残差图像的数据经过DCT、量化之后的系数一方面进行Zig-Zag扫描，然后用熵编码CABAC进行编码写入码流；另一方面经过反量化、反DCT变换后得到解码端残差帧。由预测帧和解码端残差帧之和得到重建帧(即下一帧的参考帧)。如果是P帧则还要对所有IFS系数进行有符号指数哥伦布编码。判断当前帧是否为最后一帧，如果是最后一帧结束编码；否则，返回步骤三继续处理下一帧图像；步骤六:通过保存的IFS系数代入解码方程计算得到预测值，由原始块和预测块之差得到编码端残差块，编码端残差块经过DCT变换、量化、反量化和反DCT变换得到解码端残差块，再由预测块和解码端残差块之和得到重建块。转入步骤四编码深度图序列P帧下一宏块。
2.根据权利要求1所述一种基于彩色视频运动矢量的深度图序列分形编码方法，其特征在于:处理的彩色视频与深度图序列均为YUV格式。
3.根据权利要求1所述一种基于彩色视频运动矢量的深度图序列分形编码方法，其特征在于:所述步骤一中基于分形的视频压缩方法包括以下四个步骤: 1)如果是I帧(第一帧必须为I帧，其它帧可以设置是否为I帧)，采用H.264帧内编码方式，对于每个当前块在各种可能的预测方式中选择具有最小代价的预测模式，完成所有块的预测后可以得到I帧的预测帧。通过原始帧和预测帧之差得到编码端残差帧。转入步骤3)编码残差；如果是P帧，转到步骤2)； 2)如果是P帧。依次对当前帧的所有宏块进行编码。在参考帧中的搜索窗内对当前宏块进行块匹配；在进行子块与父块的匹配过程中，子块的位置作为父块的起始搜索点，父块的大小与子块的大小相同；对每个宏块进行树状结构分块，即分块从大到小可分为16父16、16\8、8\16、8\8，8父8往下(亚宏块分割)可以分为8X4，4X8，4X4。帧间编码时，首先对编码宏块的各种块划分尺寸的帧间预测模式进行运动估计，确定迭代函数系统系数即IFS系数；然后比较所有模式的率失真代价；最后将率失真代价最小的模式作为最优帧间预测模式。 IFS系数由如下的率失真优化函数确定:
Jmotion-MSE (S，O, X, y, ref) + λ motion*R (s，ref) (I) 其中IFS系数包括父块位置(x，y)和比例因子S、偏移因子O，s和ο的计算公式如下:
4.根据权利要求1所述一种基于彩色视频运动矢量的深度图序列分形编码方法，其特征在于:所述步骤二中基于分形的视频解压缩方法包括以下五个步骤: 1)解码端获得压缩的码流。码流中数据元素首先进行熵解码和重排序，获得一系列量化系数，这些系数经过反量化和反变换得到解码端残差数据； 2)判断解码帧是否为I帧，若是I帧转入步骤3)，否则转入步骤4)； 3)对于I帧，首先由H.264帧内预测方式得到预测帧，预测帧与解码端残差帧进行相加之后得到重建帧，帧数加I转入步骤5)； 4)对于P帧，首先从码流中读入该帧所有宏块的划分方式、每一个小块的迭代函数系统系数与运动矢量，由各迭代函数系统系数和运动矢量分别计算出解码端的预测块形成解码端的预测帧，预测帧与残差帧相加得到重建帧。帧数加I转到步骤5)；5)判断此时所有帧是否都已解码，若都解码完毕，结束解码过程，否则转入步骤2)。
5.根据权利要求1所述一种基于彩色视频运动矢量的深度图序列分形编码方法，其特征在于:所述步骤三中改进的H.264帧内预测编码方法，相比于原H.264帧内预测编码方法，本方法节省了预测时间与编码码率。原H.264帧内预测编码方法，需要在各种可能的预测方向中，利用拉格朗日率失真优化准则选择率失真代价最小的预测模式。若最终预测模式为16X16，则需依次将MBtype, Predy, CBP, Preduv, QP, Coeff写入码流；若最终预测模式为4X4，则需依次将MBtype, T8, 16 (Predy), CBP, Preduv, QP, Coeff 写入码流。其中 Predy 代表亮度预测方向，Preduv代表色度预测方向，QP代表量化参数，CBP代表编码块模式，Coeff代表变换系数，T8代表8X8分块标志位。相比于原H.264帧内预测编码方法，本方法的改进主要体现在以下三点: 1)首先定义“平滑块”的概念。统计发现，在深度图中除了包含尖锐的对象边缘的块外，大部分块中包含的各像素亮度值相等，基于此定义“平滑块”:若当前块不包含对象边缘，且其各相邻参考像素值相等，则定义当前块为“平滑块”。其中16 X 16宏块的相邻参考像素位于该宏块左方与上方，4X4块的相邻参考像素位于该4X4块左方、上方与右上方； 2)若当前编码宏块模式为16X16，且为平滑块，则无需选择预测方向，预测块像素值直接复制该块相邻参考像素的值，且无需将语法元素Predy写入码流；若为非平滑块，则按照传统H.264帧内预测编码方法编码宏块； 3)若当前编码宏块模式为4X4，且宏块包含有N个4X4平滑块，则每个4X4平滑块预测像素值直接复制该4X4块相邻参考像素的值，相应预测方向Predy无需写入码流；非平滑块按照传统H.264帧内预测编码方法在9种可能的预测方向中选择率失真代价最小的预测方向。则此时码流中共有16-N个PredJg法元素，为了在解码时知道正确的Predy的个数，需要对语法元素重排序，并且本发明方法不使用8 X 8块，将语法元素T8移去，则最终码流中语法元素依次为:MBtype，Preduv, Predy, CBP, QP, Coeff, (l6_N)Predy。
6.根据权利要求1所述一种基于彩色视频运动矢量的深度图序列分形编码方法，其特征在于:所述步骤四中改进的UMHexagonS算法相比于H.264中的UMHexagonS算法,本方法的改进主要体现在以下两点: 1)起始点预测: 深度图序列帧宏块的运动矢量与相应彩色视频宏块运动矢量具有相关性，且基于分形的深度图序列编码算法没有涉及到多参考帧，故利用四种方式进行起始点预测: a)空域中值预测:取当前子块的左、上、右相邻块的运动矢量中间值为预测运动矢量； b)相应彩色视频宏块运动矢量预测:根据深度图序列帧宏块与相应彩色视频宏块运动矢量的相关性，取相应彩色视频宏块的运动矢量为当前编码深度图序列帧宏块的预测运动矢量； c)原点预测:令预测运动矢量为(0，0)； d)相邻参考帧预测:利用前一参考帧中对应位置块的运动矢量作为当前块的预测运动矢量。 2)用增强型非均匀多层次六边形搜索模板代替原非均匀多层次六边形搜索模板: UMHexagonS算法采用了多种搜索模板，但搜索过程中并不记录前一步骤已搜索区域内的检测点，造成多个检测点重复搜索。因此设计了增强型非均匀多层次六边形搜索模板，既避免了运动矢量密集区域重复搜索现象，又兼顾了自然深度图序列的运动规律，使分布在水平方向±45°区域的搜索点数多于在垂直方向±45°区域的搜索点数，取代原非均匀多层次六边形搜索模板。本发明方法中增强型非均匀多层次六边形搜索模板由内至外，在第I至第4层上分布的搜索点数分别为8、12、16、16，其中第1、2层减少了原非均匀多层次六边形搜索模板第1、2层垂直方向的搜索点数，仅保留了垂直方向最上、最下与中间的检测点，第I层斜边中点的检测点也未保留，第3、4层与原非均匀多层次六边形搜索模板第3、4层相应检测点相同。
【文档编号】H04N13/00GK103581647SQ201310453270
【公开日】2014年2月12日申请日期:2013年9月29日优先权日:2013年9月29日
【发明者】祝世平, 赵冬玉申请人:北京航空航天大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：祝世平;赵冬玉
技术所有人：北京航空航天大学
我是此专利的发明人

上一篇：基于用户位置进行域名解析服务的方法与系统的制作方法
上一篇：一种快速深度图序列帧间模式选择分形编码方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。