基于运动矢量分布预测的快速运动估计视频编码方法

文档序号：7554058阅读：414来源：国知局

专利名称：基于运动矢量分布预测的快速运动估计视频编码方法
技术领域：
本发明属于视频压缩编码领域，涉及一种基于运动矢量分布预测的视频快速运动估计编码方法。
背景技术：
在2003年由国际电信联盟(ITU-T)和国际标准化组织(IS0/IEC)联合颁布提出了新一代视频编码标准H.264/AVC。H.264优异的压缩性能和视频质量使得它在现实生活中被广泛应用，包括数字电视广播、多媒体短信、网络视频流媒体传递和视频实时通信等等。相比于之前的编码标准，H.264在以下几个方面进行了改进:采用1/4像素精度运动估计；支持16X16、16X8、8X16、8X8、8X4、4X8、4X4共7种尺寸块的预测方式；支持多帧参考；采用4X4整数变换代替8X8的DCT变换；可选2种熵编码方式:基于上下文自适应变长编码(context Adaptive Variable Length Coding,简称 CAVLC)和基于上下文自适应二进制算术编码(Context Adaptive Binary Arithmetic Coding,简称 CABAC);米用率失真优化技术，编码过程中综合考虑编码性能和码率并进行权衡。虽然H.264在编码性能方面有了很大的改善，但却是以牺牲编码复杂度为代价换取的。H.264的高复杂度计算使得编码耗时长，严重影响了其实时性能，所以对于提升H.264编码速度方面的研究至关重要。相关研究表明，H.264编码耗时大多来自于帧间预测编码，其中运动估计(MotionEstimation,简称ME)过程占了编码总时间的60% —80%,是增加运算复杂度和影响编码性能的关键部分。近年来，研究者们一直致力于对运动估计过程进行优化，在保证编码性能的同时，尽量缩短运动估计时间。H.264中对于运动估计采用块匹配运动估计算法，其原理如

图1所示。首先将视频一帧分割成若干的MXN块，假设块中所有像素都做相同的平移运动。设前一帧搜索区为(M+2ffx, N+2ffy)，当前帧块与前一帧块的位移为d(i，j)，在搜索区中如果能找到与当前帧块匹配的前一帧块，该d(i，j)即为所需要的运动矢量MV(Motion vector)。在块匹配方法中，通常采用绝对差值和SAD (Sum of Absolute Difference)作为相关函数来衡量当前块与预测块之间的相关程度，SAD值越小，则表示相关性越强，二者越匹配。在现有的块匹配运动估计算法中，搜索精度最高的是全搜索算法(FS)。由于FS算法计算复杂度过高，不利于实时应用，为此研究人员相继提出了三步法(TSS)、四步法(FSS)和六边形法(HEXBS)等新的搜索算法，但它们依旧存在搜索点数多，易陷入局部最优的不足。随着研究的深入，针对时空相关性和人眼视觉特性所提出的新算法有了很大发展，典型的有非对称十字多层六边形搜索算法(Unsymmetrical-Cross Mult1-HexagonSearch,简称UMHexagonS)。相比于全搜索算法,该算法能降低90%的运动估计时间，峰值信噪比平均下降小于0.05dB，且能维持码率基本不变。申请号为CN201010140709.3的专利公开了一种基于宏块运动矢量特征分类的快速运动估计视频编码方法，称为NUMHexagonS (New-UMHexagonS)算法,其运动估计搜索方案如图2所示。该算法针对UMHexagonS算法有了很大改进，但仍然存在未能充分利用运动矢量分布特征进行搜索策略制定、对于大型搜索模板搜索区域划分不够精细和忽略了运动矢量为O时的搜索特点等不足。

发明内容
针对现有技术中存在的上述问题，本发明提出了一种新的运动估计搜索算法，在保持低码率和高质量的前提下，通过减少运动估计过程中搜索点数达到缩短视频编码时间，提闻编码效率目的。本发明采用的技术方案为:基于运动矢量分布预测的快速运动估计视频编码方法，针对大范围搜索模板存在搜索点数浪费的缺点，对非对称十字形搜索模板和非均匀六边形网格搜索模板进行了重新设计，并在非对称十字形搜索和非均匀六边形网格搜索之前分别进行运动矢量分布预测，自适应地选择相应的搜索区域，在搜索期间判断运动矢量是否为0，加入提前终止准则，进而实现对帧间宏块的快速运动估计视频编码，其特征在于具体包括下述步骤:步骤一，从当前视频帧中提取当前被预测宏块的亮度信息作为编码对象；步骤二，确定双重运动估计搜索模板，进行搜索点数分配，方法如下:(I)非对称十字形搜索模板:由4个搜索区域组成，垂直上下分别分配4个搜索点数，水平左右分别分配8个搜索点数；(2)非均匀六边形网格搜索模板:由4层和8个方向共同构成32个搜索区域，每个区域进行非均匀点数分配，随着搜索半径的增加，搜索范围的扩大，由内至外分配搜索点数递增，在水平方向±45°区域内共有搜索点数62个，在垂直方向±45°区域内共有搜索点数22个；步骤三，确定高准确的初始搜索点:由拉格朗日率失真优化(RDO-RateDistortion Optimizati on)函数作为运动估计判决依据,选择率失真意义上最佳匹配预测块和最优运动矢量，使得运动矢量和残差编码的比特分配最小。利用拉格朗日率失真准则选择最优运动矢量问题可描述为:Jmotion (mv, ref λ motion) = SAD [s, r (ref, mv) ] + λ motion[R(mv-pred)+R(ref)]其中，Jmotion为当前预测的运动矢量的率失真代价值().s为当前宏块像素值，mv为当前运动矢量，pred为预测运动矢量，ref为参考巾贞，r (ref, mv)为参考宏块的像素值，R是运动矢量进行差分编码消耗的比特数，包括运动矢量与其预测值的差值编码比特数和参考巾贞的编码比特数；λ m(rtim为拉格朗日乘子,SAD (Sum of Absolute Difference)为当前块与参考块像素间的绝对误差和:
h B2(ref, /mv)] = | s(x, y) — r(x — mx, n — mv) |
λ.1.r I其中，B1和B2分别表示块的水平像素和垂直像素，根据不同的帧间预测模式，其取值可为16，8，4;S(x，y)为当前宏块像素值；r(x，y)为参考宏块的像素值，mx和my分别表示水平和垂直方向的位移量。利用拉格朗日率失真准则选择最优模式的问题可表述为:Jmode (s，c，MODE | λ mode) = SSD (s, c, MODE | QP) + λ mode X R (s, c, MODE | QP) (I)
其中，MODE表示当前宏块的一种帧间编码模式Jmtxle (s，c，MODE I λ mode)表示MODE
模式下的率失真代价值(體 ,,s为原始的视频信号；c为采用MODE模式编码后的重
构视频信号；XnrodeS拉格朗日乘子；R(s，c，M0DE|QP)是与MODE和量化参数有关的包括宏块头信息、运动矢量和所有DCT块信息的总的二进制位数，它是通过对块进行实际的编码后获得的，所以其运算量较大；QP是编码量化步长；SSD(s，c，MODE I QP) (Sum of SquareDifference)为原始信号与重构信号之间的平方差之和，即:
权利要求
1.一种基于运动矢量分布预测的视频快速运动估计编码方法，其特征在于该方法根据当前宏块运动矢量分布预测自适应地选择模板搜索区域，在大范围模板搜索之前对运动矢量是否为O进行预测，加入提前终止准则，进而实现对帧间宏块的快速运动估计视频编码，具体包括以下步骤: 步骤一，从当前视频帧中提取当前被预测宏块的亮度信息作为编码对象；步骤二，确定双重运动估计搜索模板，进行搜索点数分配；步骤三，确定高准确的初始搜索点: 由拉格朗日率失真优化(RDO-Rate Distortion Optimization)函数作为运动估计判决依据，选择率失真意义上最佳匹配预测块和最优运动矢量，使得运动矢量和残差编码的比特分配最小；利用拉格朗日率失真准则选择最优运动矢量问题可描述为:
2.根据权利要求1所述的基于运动矢量分布预测的视频快速运动估计编码方法，其特征在于，步骤二确定运动估计模板分配搜索点数的方法如下: (O非对称十字形搜索模板:由4个搜索区域组成，垂直上下分别分配4个搜索点数，水平左右分别分配8个搜索点数； (2)非均匀六边形网格搜索模板:由4层和8个方向共同构成32个搜索区域，每个区域进行非均匀点数分配，随着搜索半径的增加，搜索范围的扩大，由内至外分配搜索点数递增，在水平方向±45°区域内共有搜索点数62个，在垂直方向±45°区域内共有搜索点数22个。
3.根据权利要求1所述的基于运动矢量分布预测的视频快速运动估计编码方法，其特征在于，步骤五预测当前宏块进行运动矢量方向的方法包括以下步骤: (1)根据当前宏块运动矢量位置计算方向参数: 当前宏块运动矢量坐标(MVX，MVy)，运动矢量方向用其方向向量MV= (MVX，MVy)表示，计算
4.根据权利要求1所述的基于运动矢量分布预测的视频快速运动估计编码方法，其特征在于，步骤七判断当前宏块运动矢量大小的方法如下: (1)根据初始搜索点的预测方式确定Predminrast和RDminrast的值: 若在步骤三中采用时间预测方式，则:predminMSt = ref_predmincost ；若在步骤三中采用空间预测方式，则:predminMSt = space_predminc0St ；若在步骤三中采用上层块预测方式，则:predminMSt = uplayer_predmincost ； RDminrast为由公式(I)中计算当前预测宏块在MODE模式下的最小率失真代价值； (2)计算预测运动矢量参数: 预测运动矢量下限阈值为: (1+Y ) Predmincost 预测运动矢量上限阈值为: (1+ δ ) predmincost 预测运动矢量因子为:
5.根据权利要求1所述的基于运动矢量分布预测的视频快速运动估计编码方法，其特征在于，步骤九预测运动矢量方向的方法如下: (1)根据当前宏块运动矢量位置计算方向参数:同步骤五(I)，计算得到运动矢量方向参数k的值； (2)判断当前预测宏块运动矢量分布方向:当k < 0.25时，根据MVx取值进行判断:当MVx > O时，判定当前宏块运动矢量方向为(-22.5°，22.5° ];当MVx < O时，判定当前宏块运动矢量方向为(157.5°，202.5° ]；当k > 1.5或MVx = O时，根据MVy取值进行判断:当MVy > O时，判定当前宏块运动矢量方向为(67.5° ,112.5° ] ;iMVy < O时，判定当前宏块运动矢量方向为(-112.5。, -67.5° ]；当0.25彡k彡1.5时，根据MVx和MVy取值进行判断:当MVx > O且MVy > O时，判定当前宏块运动矢量方向为(22.5° ,67.5° ];当MVx < O且MVy < O时，判定当前宏块运动矢量方向为(-157.5°，-112.5° ];当MVx < O且MVy > O时判定当前宏块运动矢量方向为(112.5°，157.5° ];当MVx > O且MVy < O时，判定当前宏块运动矢量方向为(-67.5° , -22.5° ] ο
全文摘要
本发明属于视频压缩编码领域，公开了一种基于运动矢量分布预测的快速运动估计视频编码方法。该方法首先从原始视频数据中提取当前宏块的亮度信息，针对整像素运动矢量分布特征搜索设计简洁的运动估计搜索模板，合理分配搜索点数。然后对运动矢量分布进行预测，根据预测结果自适应地选择在搜索模板相应区域内小范围搜索。在运动估计搜索过程中对运动矢量是否为0进行判断，作为跳过模板搜索的判据。本发明方法与视频编码标准H.264中采用的运动估计搜索算法及其它改进算法相比较，能有效地加速运动估计搜索过程，减少运动估计耗时，严格控制了码率增加，保证了较好的重构图像质量，实现了快速运动估计编码。
文档编号H04N7/36GK103188496SQ20131009821
公开日2013年7月3日申请日期2013年3月26日优先权日2013年3月26日
发明者高原, 刘鹏宇, 贾克斌申请人:北京工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高原;刘鹏宇;贾克斌
技术所有人：北京工业大学
我是此专利的发明人

上一篇：一种基于数字家庭网络中的设备注册的方法
上一篇：Dsp嵌入式视频人脸采集网络服务器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。