一种基于h.264的视频压缩方法

文档序号：7740356阅读：171来源：国知局

专利名称：一种基于h.264的视频压缩方法
技术领域：
本发明涉及一种视频压缩算法。尤其涉及一种基于H. 264的视频压缩方法。
背景技术：
H. 264是由联合视频组(JVT)近年来致力开发研究的最新视频压缩国际标准，与以前的国际标准如H. 263和MPEG-4相比，最大的优势体现在以下四个方面1.将每个视频帧分离成由像素组成的块，因此视频帧的编码处理的过程可以达到块的级别。2.采用空间冗余的方法，对视频帧的一些原始块进行空间预测、转换、优化和熵编码(可变长编码)。3.对连续帧的不同块采用临时存放的方法，这样，只需对连续帧中有改变的部分进行编码。该算法采用运动预测和运动补偿来完成。对某些特定的块，在一个或多个已经进行了编码的帧执行搜索来决定块的运动向量，并由此在后面的编码和解码中预测主块。4.采用剩余空间冗余技术，对视频帧里的残留块进行编码。例如对于源块和相应预测块的不同，再次采用转换、优化和熵编码。标准的H. 264编码组分图如图1所示，其包括如下步骤(1)采用帧内预测或者运动估计决定所采用的最佳预测模式。(2)将实际像素值减去预测值，得到残差。(3)对残差进行变换和量化。(4)变长编码和算术编码，并对量化的数据进行反量化和反变换，重构得到的图像滤波后作为其它帧的参考帧。然而，H. 264编码过程中，由于采用了多帧和高精度运动估计以及率失真优化等技术使得编码复杂度大幅增加，对硬件电路的设计和运算速度都提高了要求，另外，采用基于块的离散余弦变换与量化相结合的混合编码技术。其在低码率的情况下，重构的图像中会出现严重的块效应现象，且比特率越低时块效应越严重，图像的视觉效果也就越差。由于带宽的限制，现今低码率视频传输仍占有相当大的比重，且作为视频终端的接受者，人们更加注重图像的主观感受。在低码率的情况下，低码率和块效应之间存在着比较突出的矛盾。

发明内容
本发明的目的在于提供一种基于H.沈4的视频压缩方法，其占用较低码率的同时，减少图像块效应。一种视频压缩方法，包括如下步骤1、采用基于结构相似度的快速运动估计决定所采用的最佳预测模式；2.将实际像素值减去预测值，得到残差；3.对残差进行变换和量化；4.对量化的数据变长编码，并对量化的数据进行反量化和反变换，重构得到
的图像采用多模式的快速环路滤波后作为其它帧的参考帧。本发明采用基于结构相似度的快速运动估计选择最佳预测模式，简化了复杂的搜索模式，达到了减小运动估计复杂度、改善压缩性能、有效的节约编码时间和降低码率；基于多模式的快速环路滤波，其针对不同的模式特点采用相应的滤波技术，其有效的降低滤波过程的复杂度，在保持图像客观质量的同时更好的降低了块效应。

图1为现有技术中基于H. 264视频压缩方法流程示意图；图2为本发明基于H. 264的视频压缩方法流程示意图；图3为基于结构相似度快速运动估计方法流程示意图；图4为环路滤波去块算法流程示意图；图5为增强前向纠错算法流程示意图；图6为基于速率兼容的收缩卷积码(RCPC)信道编码的非平等保护流程示意图；图7为可变宏块排序(FMO)码率失真优化调度流程示意图。
具体实施例方式下面结合附图，对本发明作进一步的说明。如图1，为现有技术中H. 264编码标准的功能模块图，输入的视频进入编码器，由编码器对输入的信号进行帧分析，采用帧内预测或者运动估计决定所采用的最佳预测模式。然后用实际像素值减去预测值，得到残差值后对其进行变换和量化，然后对其变长编码，并对量化的数据进行反量化和反变换，重构得到的图像滤波后作为其它帧的参考帧。H. 264编码标准提高了图像传输效率的同时，随之而产生的由于多帧和高精度运动估计以及率失真优化等技术使得编码复杂度大幅增加，对硬件电路的设计和运算速度都提高了要求。如图2，本发明的一种基于H. 264的视频压缩方法，包括如下步骤1、采用基于结构相似度的快速运动估计决定所采用的最佳预测模式；2、将实际像素值减去预测值，得到残差；3、对残差进行变换和量化；4、变长编码和算术编码，并对量化的数据进行反量化和反变换，重构得到的图像采用多模式的快速环路滤波后作为其它帧的参考帧。采用基于结构相似度的快速运动估计选择最佳预测模式，简化了复杂的搜索模式，达到了减小运动估计复杂度、改善压缩性能、有效的节约编码时间和降低码率；基于多模式的快速环路滤波，其针对不同的模式特点采用相应的滤波技术，其有效的降低滤波过程的复杂度，在保持图像客观质量的同时更好的降低了块效应。如图3，上述步骤1所述的基于结构相似度的快速运动估计算法包括如下步骤1)、初始化运动估计的率失真代价值MrosT，取值为范围为0 < Mcost ( 1，本实施例取值0. 99，也可以取0. 9或0. 95或0. 8等。2)、计算当前位置编码块与搜索位置候选块的结构相似度SSIM值，并利用公式=Mcost (s, c) = Kl(l-SSIM(s, c))+M0TI0Nb ( Δ计算当前搜索位置的运动矢量编码代价，如果该值大于当前MrosT，舍弃当前搜索位置，继续下一个搜索位置，否则更新当前位置为最佳匹配位置，更新当前运动矢量编码代价值为最小Mkbt ；上式中s为当前编码块；c为候选匹配块；K1是一个和编码块的大小相关的自适应参数，Kl的取值范围为block_xXblock_y 彡 block_xXblock_yX4，本实施例取值 K1 的取值 block_ xXblock_yX3 ；M0TI0N为运动估计的拉格朗日乘子；Amv是预测运动矢量和实际运动矢量的差值；b ( Δ 表示用来编码Δ Μ所用的比特数；3)、计算前搜索位置的结构相似度SSIM值并和预先设定的阈值T比较，阈值T取值范围为0 < T < M。。st，本实施例取值0. 75。如果SSIM比阈值T小，继续下一个搜索位置，返回步骤2，否则结束搜索过程，当前搜索位置被选为最佳匹配位置，停止搜索过程，保存最小M。。st和匹配位置矢量；4)、利用公式J (s，c，MODE I Qp) = K2 (I-SSIM(s, c)) +M0DER(s, c, MODE | Qp)计算每种预测模式最佳匹配块率失真代价，具有最小率失真代价的预测模式被选为当前编码块的最佳预测模式，上式中MODE是预测模式；K2为自适应参数，取值范围为85000 ^ K2 ^ 490000，本实施例取值沈0000 ；s为当前编码块；c为候选匹配块；Qp为量化参数，取值范围为10 < QP < 30，本实施例取为20 ；R(s，C, MODElQp)是用来编码残差部分所需的比特数。如果当前编码模块INTER 8X8模式被选为最佳模式，对其子模式INTER 8X4、 INTER 4X8、INTER 4X4作为当前位置码块返回步骤1分别寻找最佳预测模式。K1是一个和编码块的大小相关的自适应参数，K1取值与预测模式相关，对于较大编码块的模式K1取值较大，而对于INTER 8 X 8模式及其子模式编码块K1取值较小。这样可以增加大块的预测精度，减少残差信号编码的率失真代价，因而大编码块模式倾向于被选为最佳预测模式，要合理避免8X8模式及其子模式。只有那些具有剧烈复杂运动的宏块才会使用复杂的子模式选择。该方法对于那些具有较小运动或者没有运动的序列非常有效。在运动估计中使用固定的SSIM阈值作为提前结束条件，如果当前编码块和在搜索区域中候选块的SSIM值已经大于设定的阈值，跳过其他的搜索点，结束搜索过程，在保证压缩质量不下降的前提下，减少了因进一步搜索所造成的时间消耗。上述步骤所述多模式快速滤波方法包括如下步骤a)根据图像编码宏块的模式和条件进行边界分析，利用图像的空间相关性对边界强度进行划分；b)针对不同的边界模式采用不同的滤波策略，并且根据模式划分自适应地选择编码器的偏移量。
如图4，首先对P块和Q块是否为帧内码进行判断，若为帧内码，进一步判断其边缘是否为宏块边缘，若是宏块边缘则划分为边缘强度(Boundary Strength)BS = 4的模式，若不为宏块边缘，进一步判断P块或Q块是否采用16X16帧内预测，或是则划分为BS = 5的模式，若不是刚划分为BS = 3的模式；若P块或Q块不为帧内编码，则进一步判断P块或Q块的残差变换系数是否为零，若不为零，则判断P块或Q块的非零系数所占的百分数是否大于 50%，则划分为BS = 6的模式，此块的边缘不需要滤波；若小于50%则划分为BS = 2的模式，若P块或Q块的残差变换系数为零，刚判断P块或Q块的参考帧不同或运动适量差值是否大于1，若大于1，则判断P块或Q块是否采用8X8帧间编码预测，或是则此块的边缘不需要滤波，不是则划分为BS = 1的模式，或P块或Q块的参考帧不同或运动适量差值小于1，则不需要对其进行滤波。上述不同边缘强度值对应不同滤波方法。其具体实施过程在《计算机科学》杂志第2008年07期中“基于H. 264的多模式自适应环路滤波算法”一文中已得到公开。基于多模式的快速滤波方法根据图像编码宏块的模式和条件分析并划分模式，对不同的模式采用不同的滤波方法，其有效的降低了滤波过程的复杂度，在保持图像客观质量不变或略有提高除了更多的块效应现象，大大提高了图像的主观质量。如图5，本发明在变长编码后还包括对数据进行增强前向纠错编码(EFEC)，以支持其在无线网络中的传输，并提高H. 264视频业务的传输质量，其具体实施过程在《计算机应用》杂志第2008年09期“无线网络中支持H. 264的增强前向纠错算法” 一文已得到公开。如图6，本发明在变长编码后还包括基于速率兼容的收缩卷积码(RCPC)信道编码的非平等保护，对输入与输出的数据进行错误估算比较，得到传输的误码率，通过调整传输以改善了视频在无线信道系统中的传输性能，保证了视频图像序列的可靠传输，提高了传输效率，其具体实施过程在《吉林大学学报(信息科学版)》第2008年04期“基于H. 264的 RCPC信道编码非平等误码保护” 一文中已公开。如图7，本发明还包括在视频数据编码后对可变宏块排序(FMO)码率失真优化调度，该算法根据当前信道的参数信道容量估算值和分组丢失率与之前估算的分组丢失率进行比较，信道变化调整传输参数，以保证编码视频获得更优越的传输性能，其具体实施过程在《华南理工大学学报自然科学版》第2008年第36卷第9期已得到公开。
权利要求
1.一种基于H. 264的视频压缩方法，其特征在于包括如下步骤(1)采用基于结构相似度的快速运动估计决定所采用的最佳预测模式；(2)将实际像素值减去预测值，得到残差；(3)对残差进行变换和量化；(4)对量化后的变长编码，并对量化的数据进行反量化和反变换，重构得到的图像采用多模式的快速环路滤波后作为其它帧的参考帧。
2.根据权利要求1所述的基于H.264的视频压缩方法，其特征在于，步骤(1)所述的基于结构相似度的快速运动估计算法包括如下步骤1)、初始化运动估计的率失真代价值Mkbt；2)、计算当前位置编码块与搜索位置候选块的结构相似度SSIM值，并利用公式=Mcost (s, c) zKid-SSIMk，c))+M0TI0Nb (Amv)计算当前搜索位置的运动矢量编码代价，如果该值大于当前Mkbt，舍弃当前搜索位置，继续下一个搜索位置，否则更新当前位置为最佳匹配位置，更新当前运动矢量编码代价值为最小Mkbt ；上式中 s为当前编码块； c为候选匹配块；K1是一个和编码块的大小相关的自适应参数； motion为运动估计的拉格朗日乘子； Amv是预测运动矢量和实际运动矢量的差值； b(AMV)表示用来编码Δ■所用的比特数；3)、计算前搜索位置的结构相似度SSIM值并和预先设定的阈值T比较，如果SSIM比阈值T小，继续下一个搜索位置，返回步骤2，否则结束搜索过程，当前搜索位置被选为最佳匹配位置，停止搜索过程，保存最小M。。st和匹配位置矢量；4)、利用公式J(s，c, MODE I Qp) = K2(1-SSIM(s, c))+M0DER(s, c, MODE | Qp)计算每种预测模式最佳匹配块率失真代价，具有最小率失真代价的预测模式被选为当前编码块的最佳预测模式，上式中MODE是预测模式； K2为自适应参数； s为当前编码块； c为候选匹配块； Qp为量化参数；R(s, c, MODE I Qp)是用来编码残差部分所需的比特数；5)判断最佳匹配宏模式是否为8X8模式，若不是，则结束运动估计搜索，若是8X8模式，则返回步骤1)分别对其子模式8X4，4X8，4X4再进行最佳预测模式搜索。
3.根据权利要求2所述的基于H.264的视频压缩方法，其特征在于，步骤1)所述率失真代价值M。。st的取值为范围为0 < Mcost ^ 1。
4.根据权利要求2所述的基于H.264的视频压缩方法，其特征在于，所述率失真代价值 Mcost 的值为 0. 8 或 0. 9 或 0. 95 或 0. 99。
5.根据权利要求2所述的基于H.264的视频压缩方法，其特征在于，所述阈值T的取值范围为0 < T < Mcosto
6.根据权利要求2所述的基于H.264的视频压缩方法，其特征在于，所述量化参数％取值范围为10彡％彡30，K1的取值范围为block_xXblock_y ^ Qp ^ block_xXblock_yX4, K2 的取值范围为85000 ^ K2 ^ 490000。
7.根据权利要求2所述的基于结构相似度的H.264快速运动估计方法，其特征在于，所述量化参数A取值20,1的取值范围为block_xXblock_yX3，K2的取值为沈0000。
8.根据权利要求1所述的基于H.264的视频压缩方法，其特征在于，步骤(4)所述多模式快速滤波方法包括如下步骤a)根据图像编码宏块的模式和条件进行边界分析，利用图像的空间相关性对边界强度进行划分；b)针对不同的边界模式采用不同的滤波策略，并且根据模式划分自适应地选择编码器的偏移量。
9.根据权利要求1所述的基于H.264的视频压缩方法，其特征在于，在变长编码后还包括对数据进行增强前向纠错编码。
10.根据权利要求1或4所述的基于H.264的视频压缩方法，其特征在于，在变长编码后还包括基于速率兼容的收缩卷积码(RCPC)信道编码的非平等保护。
11.根据权利要求1所述的基于H.264的视频压缩方法，其特征在于，还包括在视频数据编码后对可变宏块排序(FMO)码率失真优化调度。
全文摘要
一种基于H.264的视频压缩方法，采用基于结构相似度的快速运动估计选择最佳预测模式，由实际像素值与预测值相减得到残差值进行变换和量化，将所得数据采用变长编码，并对量化的数据进行反量化和反变换，重构得到的图像采用多模式的快速环路滤波后作为其它帧的参考帧。结合结构相似度进行快速运动估算，简化了复杂的搜索模式，节约编码时间和降低码率，而基于多模式的快速环路滤波，其针对不同的模式特点采用相应的滤波技术，其有效的降低滤波过程的复杂度，在保持图像客观质量的同时更好的降低了块效应。
文档编号H04N7/50GK102413323SQ20101001932
公开日2012年4月11日申请日期2010年1月13日优先权日2010年1月13日
发明者冯所前, 张志平, 李海健, 林淼, 胡伟, 邱浩然, 雷常青, 顾学伟申请人:中国移动通信集团广东有限公司中山分公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡伟;林淼;顾学伟;张志平;邱浩然;李海健;冯所前;雷常青
技术所有人：中国移动通信集团广东有限公司中山分公司
我是此专利的发明人

上一篇：一种基于结构相似度的h.264快速运动估算方法
上一篇：一种广域数据采集的通信处理方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。