基于宏块分类的分布式残差视频编译码方法与流程

文档序号：11961272阅读：226来源：国知局

本发明涉及一种分布式残差视频编译码方法，尤其是一种基于宏块分类的分布式残差视频编译码方法，属于视频编译码
技术领域：
。
背景技术：
：分布式残差视频编码(DistributedResidualVideoCoding,DRVC)是继像素域编码(pixel-domaindistributedvideocoding，PDDVC)、变换域编码(transform-domaindistributedvideocodingTDDVC)后的一种分布式视频编码方案。为了提高系统的RD特性，在编码端对宏块进行分类(blockmodedecision,BMD)是一种有效的办法；当前对BMD的研究多集中在PDDVC和TDDVC框架内，以TDDVC系统为主，对DRVC系统研究很少。在PDDVC和TDDVC系统中，宏块分类算法都涉及比较复杂的计算，比如需要计算当前宏块和前、后帧对应宏块之间的“绝对差和”(sumofabsolutedifferences，SAD)；计算当前宏块内像素的方差；计算由发送码率和失真函数组成的代价函数等……。这些计算都不简单，当把它们放在编码端进行时，无疑会增加编码端的计算负担。而且在进行宏块分类时，还要预先设置阀值，但是怎样设置这些阀值在论文中都没有提及。另外如果想要进行更加准确的宏块分类，编码端通常要产生一个边信息(sideinformation)SI’。由于编码端资源有限，不能使用运动补偿内插(motioncompensatedframeinterpolation，MCFI)这样复杂度高的算法来产生SI’，只能用平均内插(AverageInterpolation，AI)或者快速运动补偿(FastMotionCompensationInterpolation，FMCI)这样复杂度低的算法来产生简单SI’，尽管如此，还是不可避免的增加了编码端的复杂度。上述这些缺点使得BMD在实际应用的时候受到了限制，而目前国内专利申请的内容主要是TDDVC系统中的宏块分类技术，如下：中国专利申请号为CN103347188A的发明专利文献，公开了一种分布式视频编码非关键帧压缩感知编解码方法，该方法根据需要的测量数目将图像块划分为不同的类型，依据图像块的类型选择不同编码方式。中国专利申请号为CN102137263A的发明专利文献，公开了一种基于相关性模型(correlationnoisemodel,CNM)关键帧分类的分布式视频编码及解码方法，该方法将编码序列分为高速运动序列块、中速运动序列块和低速运动序列块并分别采用帧内模式编码、反向运动矢量估计模式编码和跳帧模式编码。技术实现要素：本发明的目的是为了解决上述现有技术的缺陷，提供了一种基于宏块分类的分布式残差视频编译码方法，该方法简单有效，在编码端对残差帧进行宏块分类时不仅计算量小，阀值设计简单方便，而且还不需要产生边信息，保证了分布式视频编码在编码端具有低复杂度的特性。本发明的目的可以通过采取如下技术方案达到：基于宏块分类的分布式残差视频编译码方法，包括以下步骤：S1、将整个视频按照GOP＝2划分为KEY帧和WZ帧；S2、编码端将WZ帧减去参考帧，得到编码端残差帧，将编码端残差帧按照4×4的大小分块，根据宏块分类方案分出Intra块、Skip块和WZ块；S3、编码端对Intra块进行编码，包括DCT变换、均匀量化和熵编码；Skip块不进行传输；而WZ块按照非均匀量化方案进行量化，得到量化序号，然后进行低密度奇偶校验码编码；S4、编码端采用变长码编码将Intra块、Skip块、WZ块的分类信息传送到译码端；S5、译码端通过变长码译码得到分类信息，根据分类信息对Intra块、WZ块、Skip块进行相应的处理；S6、译码端将Intra块、WZ块、Skip块的处理结果拼成残差帧，将该残差帧加上参考帧得到WZ帧的译码图像；S7、将KEY帧译码图像和WZ帧译码图像合并成译码后的视频。作为一种实施方案，步骤S2中，所述根据宏块分类方案分出Intra块和Skip块，剩下的为WZ块，具体为：1)Intra块：是指Rblock和R′block之间相关性差的块，定义至少有6个pi满足|pi|>30的Rblock；其中，Rblock是指编码端宏块，R′block是指译码端宏块，pi是指编码端宏块Rblock中的残差像素；2)Skip块：是指Rblock和R′block之间相关性好的块，定义全部pi满足|pi|≤10的Rblock；3)WZ块：既不属于Intra块也不属于Skip块的宏块。作为一种实施方案，步骤S3中，所述WZ块按照死区量化方案进行量化，得到量化序号，具体为：1)残差信号的量化范围为[-255,-31]时，量化序号为-1；2)残差信号的量化范围为[-30,30]时，量化序号为0；3)残差信号的量化范围为[31,255]时，量化序号为1。作为一种实施方案，步骤S5中，根据分类信息对Intra块进行相应的处理，具体为：根据Intra块的分类信息对Intra块进行Intra译码，得到译码结果，该译码即为Intra块的处理结果作为一种实施方案，步骤S5中，根据分类信息对WZ块进行相应的处理，具体为：通过运动补偿办法得到WZ帧的边信息，则译码端残差帧为WZ帧的边信息减去参考帧，根据分类信息得到WZ块在译码端残差帧中的对应块，并按照步骤S3中的非均匀量化方案进行量化，然后结合编码端传过来的校验位进行信道译码，当译码不成功时，通过反馈信道向编码端申请更多的校验位，译码成功后经过反量化得到WZ块的处理结果作为一种实施方案，步骤S5中，根据分类信息对Skip块进行相应的处理，具体为：根据分类信息得到Skip块在译码端残差帧中的对应块，并采用下面公式对其进行改善：pi′=10pi′>10-10pi′<-10pi′|pi′|≤10,pi′∈Rblock′]]>其中，p′i是指译码端宏块R′block中的残差像素，改进后的边信息块中所有残差像素的取值都满足|p′i|≤10；采用改善后的边信息块代替Skip块得到Skip块的处理结果作为一种实施方案，所述参考帧采用以下公式计算：其中，和分别是前、后KEY帧Intra译码的结果。作为一种实施方案，所述KEY帧采用H.264/AVCIntra编码传输和译码。本发明相对于现有技术具有如下的有益效果：1、本发明方法在宏块分类时的阀值为30，阀值设置简单且固定；分类方案仅仅根据编码端残差像素的取值来决定宏块的类型，计算量非常小，没有增加编码端的计算负担，而且无需产生边信息，减轻了编码端的复杂度，从而维持了编码端的低复杂度，具有良好的实用性。2、本发明方法的仿真结果表明，宏块分类准确，简单有效，与其它方案(如DISCOVER方案、解码端宏块分类方案(DBMD)、编码端帧分类方案(EFMD)等)相比较，具有良好的RD性能。附图说明图1为本发明实施例1的基于宏块分类的分布式残差视频编译码方法原理框图。图2为本发明实施例2的宏块比例示意图。图3为本发明实施例2的宏块峰值信噪比平均值示意图。图4为本发明实施例2的Skip边信息块改善前后峰值信噪比对比图。图5a～5d为按照本发明方案(BMD-DRVC)、DISCOVER、解码端宏块分类(DBMD)和编码端帧分类方案(EFMD)方案得到的RD特性对比图。具体实施方式下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。本领域技术人员应当理解，这些描述仅仅列举了本发明的一些具体实施例，对本发明及其保护范围无任何限制。实施例1：在分布式视频编码系统中，编码端宏块分类是一种能提高系统率失真性能的有效方法。现有的编码端宏块分类方案中，分类算法通常要预先设置阀值，但是怎样设置阀值并没有给出明确的说明；同时还要进行较复杂的计算，这增加了编码端的计算负担；为了更加准确得对宏块进行分类，编码端需要产生一个边信息，这增加了编码端的复杂度；以上这些缺点限制了分类方案的实用性。本实施例的基于宏块分类的分布式残差视频编译码方法先给出一些基本定义：A、视频序列按照GOP＝2的大小分成WZ帧和KEY帧，其中X2k为WZ帧，X2k-1、X2k+1分别为前、后KEY帧。B、参考帧为其中和是前、后KEY帧Intra译码的结果。C、编码端(又称发端)残差帧为R＝X2k-Xre；译码端(又称编码端、收端)残差帧为R′＝Y2k-Xre，其中Y2k是译码端获得的X2k的边信息。D、设宏块的大小为4×4，编码端、译码端的宏块分别表示为Rblock和R′block，PSNR(Rblock,R′block)是宏块的峰值信噪比。E、编码端、译码端的Rblock和R′block中残差像素分别表示为pi和p′i，pi,p′i∈[-255,255]，i＝1,2,3,...,16.。如图1所示，本实施例的基于宏块分类的分布式残差视频编译码方法，包括以下步骤：S1、将整个视频按照GOP(GroupofPictures，画面组)＝2划分为KEY帧X2k-1、X2k+1和WZ帧X2k；其中，所述KEY帧X2k-1、X2k+1采用H.264/AVCIntra编码传输和译码，WZ帧X2k按照步骤S2～S6进行处理；S2、编码端将WZ帧X2k减去参考帧Xre，得到编码端残差帧R(如定义C)，将编码端残差帧R按照4×4的大小分块，根据宏块分类方案分出Intra块、Skip块和WZ块，具体为：1)Intra块：是指Rblock和R′block之间相关性差的块，对这种宏块用Intra编码要比用Wyner-Ziv编码更有效，定义至少有6个pi满足|pi|>30的Rblock；其中，Rblock是指编码端宏块，R′block是指译码端宏块，pi是指编码端宏块Rblock中的残差像素；2)Skip块：是指Rblock和R′block之间相关性好的块，为了获得更高的PSNR(Rblock,R′block)，定义全部pi满足|pi|≤10的Rblock；3)WZ块：既不属于Intra块也不属于Skip块的宏块。S3、编码端对Intra块进行Intra编码，包括DCT变换、均匀量化和熵编码；Skip块不进行传输；而WZ块按照下表1的非均匀量化方案进行量化，得到量化序号Rq，然后进行低密度奇偶校验码(LowDensityParityCheckCode，LDPC)编码；表1非均匀量化方案S4、设Intra块、Skip块、WZ块的分类信息分别为10、00、01，编码端采用变长码编码将Intra块、Skip块、WZ块的分类信息传送到译码端；S5、译码端通过变长码译码得到分类信息，根据分类信息对Intra块、WZ块、Skip块进行相应的处理，具体为：1)Intra块的译码根据Intra块的分类信息对Intra块进行Intra译码，得到译码结果，该译码即为Intra块的处理结果2)WZ块的译码通过运动补偿办法得到WZ帧X2k的边信息Y2k，则译码端残差帧为WZ帧的边信息减去参考帧，即R′＝Y2k-Xre；根据分类信息得到WZ块在译码端残差帧中的对应块，并按照上述步骤S3中的非均匀量化方案进行量化，然后结合编码端传过来的校验位进行信道译码，当译码不成功时，通过反馈信道向编码端申请更多的校验位，译码成功后经过反量化得到WZ块的处理结果3)Skip块的改善根据分类信息得到Skip块在译码端残差帧中的对应块，并采用下面公式对其进行改善：pi′=10pi′>10-10pi′<-10pi′|pi′|≤10,pi′∈Rblock′]]>其中，p′i是指译码端宏块R′block中的残差像素。改进后的边信息块中所有残差像素的取值都满足|p′i|≤10。采用改善后的边信息块代替Skip块得到Skip块的处理结果S6、译码端将上述拼成将加上参考帧Xre得到WZ帧X2k的译码图像；S7、将KEY帧译码图像和WZ帧译码图像合并成译码后的视频。本发明将以上编码端的处理部分称为基于宏块分类的分布式残差视频编码算法(BlockModeDecisionofTheDistributedResidualVideoCoding，BMD-DRVC)，它简单有效，在编码端不仅计算量小，阀值设置简单固定，而且还不需要产生边信息，要点包括：1、对译码端残差视频信号R′的统计特性进行分析和总结，得到一个有用的假设：R′的量化序号R′q＝0占100％。因为：R′＝Y2k-Xre其中，和是前、后KEY帧Intra译码的结果，mv＝(mvx,mvy)是对和进行双向运动估计得到的运动矢量。R′＝Y2k-Xre可以看成是运动补偿误差。在视频序列中，前后相邻帧和之间大部分背景和前景改变不大，因此R′＝Y2k-Xre≈0占绝大多数。针对R′的这种概率统计特性，对它们进行步骤S3中的非均匀量化，由于R′＝Y2k-Xre≈0占绝大多数，因此残差像素落在R′q＝0的比例都在97％以上，最高达到99％。在此，我们可以假设R′q＝0占100％。2、在R′q＝0占100％的假设下提出了基于宏块分类的分布式残差视频编码算法(BlockModeDecisionofTheDistributedResidualVideoCoding，BMD-DRVC)，它仅依靠残差像素的取值将宏块分成Intra块、Skip块和WZ块。Intra块是指Rblock和R′block之间相关性差的块，在R′q＝0的条件下，|Rq|＝1认为两者相关性差别大。Skip块是指Rblock和R′block之间相关性好的块。在R′q＝0的条件下，Rq＝0才有可能成为Skip块。所以Intra块和Skip块的判决规则如前面步骤S2所述。3、译码端对Skip块对应的边信息块进行检查和改进。由于Intra块和Skip块的判决是在假设R′q＝0占100％的条件下提出来的。实际中，会出现R′q≠0的情况，只是这种情况占绝少数。当R′q≠0时按照步骤S2对宏块进行判决时，有些块会判错。当被错判为Intra块时，宏块经过Intra编译码后还能进行正确重建。当错判为Skip块时，这时Rq＝0，但R′q≠0，因此不能直接用边信息代替。为了解决这个问题，可以利用步骤S5中的公式对Skip块的边信息块进行检查和改进，改进后的边信息块中所有残差像素的取值都满足|pi|≤10。综上所述，本发明方法的阀值设置简单且固定，计算量非常小，没有增加编码端的计算负担，而且无需产生边信息，减轻了编码端的复杂度，从而维持了编码端的低复杂度，具有良好的实用性。实施例2：本实施例是具体的实验方案，采用QCIF格式且帧率为15帧/秒的HallMonitor,ForemanCoastguard,Soccer四个运动性逐渐增强的测试视频。GOP为2，奇数帧为KEY帧，采用H.264/AVCIntra编码，QP分别设为14、16、18、20、24、27、30、32；偶数帧为WZ帧，LDPCA码长为396。一、宏块分类效果及Skip块边信息改善结果图2给出了四个视频序列所有R帧按照BMD-DRVC分类后每种宏块所占的比例。图3是对图2的四个视频序列的每种宏块分别计算PSNR(Rblock,R′block)并求其平均值(APSNR)，从图3中可以看出Intra块的APSNR多在14dB～17dB左右，这说明Intra块与对应边信息块之间的差别大，对这种宏块用Intra编码要比用Wyner-Ziv编码更有效；Skip块的APSNR最高能达到43.26，通常都在39以上，这说明Skip块的边信息块平均质量都很高，可以用来代替原来Skip块；WZ块的APSNR通常在29db左右，这说明WZ块对应的边信息块质量尚可，适合用Wyner-Ziv编码；图3的仿真结果表明EBMD-RVF能适应运动程度不同的视频序列，并且效果良好。图4给出了对质量不高的Skip边信息块进行改善前后的对比图，从图中可以看出，运动变化不大的Hall、Foreman视频改善后APSNR大约提高2dB左右，运动变化大的Coastguard和Soccer改善后APSNR分别提高1.2db和1.4dB。二、RD性能比较图5a～5d给出了四个视频序列只取灰度分量按照本发明方案(BMD-DRVC)、DISCOVER、解码端宏块分类(DBMD)[1]，编码端帧分类方案(EFMD)[2]方案得到的RD特性对比图。其中DISCOVER是目前RD性能较好的分布式视频系统，它经常作为衡量其它分布式视频系统RD性能的标杆。文中DISCOVER的仿真结果来自于[3]。DBMD[1]属于解码端宏块分类方案，EFMD[2]属于编码端帧分类方案。DBMD[1]、EFMD[2]与BMD-DRVC的区别在于：前两种方案处理的对象是WZ帧，而BMD-DRVC处理的对象是残差帧，三者的分类算法不同。除此之外，其它的仿真条件一样。与DISCOVER比：DISCOVER是目前RD性能较好的TDDVC系统，它在码率控制、相关噪声模型、边信息等方面作了优化改进，因此系统也相对复杂[3]。BMD-DRVC在系统上要比DISCOVER简单的多，它没有做任何上述优化。它在编码端只是增加了一个宏块分类模块，而且分类算法简单，计算量小。从图5a～5d中可以看出：Hall视频的RD曲线在DISCOVER曲线之上(平均高出约1.4dB左右)；Coastguard视频和DISCOVER曲线几乎重合；Foreman和Soccer视频与DISCOVER曲线之间差大约0.4～1dB。仿真结果表明：和对于Hall这样运动程度不剧烈的视频，BMD-DRVC的效果要优于DISCOVER；其它视频中，DISCOVER性能略胜。BMD-DRVC以简单的系统结构获得了较好的RD特性，有较强的实用性。与EFMD[2]比：在EFMD[2]中，编码端通过计算当前块与前后块之间的SAD值和当前块与周围块SAD值分别得到宏块被判为WZ块和Intra块的概率，然后把WZ帧所有块的这两种概率分别相加，哪种概率大，就用哪种编码模式对整个WZ帧进行处理。仿真结果表明：四个视频RD曲线都在BMD-DRVC之下。其中Hall视频两者之间差3～5dB；Foreman视频两者之间差1dB～2.5dB；Coastguard视频两者之间差1～2dB；Soccer视频两者之间差1.5～2dB。BMD-DRVC效果好的原因有两个：一是BMD-DRVC中定义了Skip块，它无需传送，节省了传送的数据量；同时收端对Skip块边信息进行检查和改善，这保证了Skip块的重建质量，提高系统的RD特性。二是BMD-DRVC算法中宏块分类准确，简单有效。EFMD[2]与BMD-DRVC都是在编码端进行编码模式分类的算法，但EFMD[2]涉及较复杂的概率计算，而BMD-DRVC的计算量很小。与DBMD[1]比：在DBMD[1]中，译码端通过计算前后运动补偿块之间的SAD(绝对差和)和边信息中当前像素块的方差把宏块分成两类：Intra块和WZ块。仿真结果表明：四个视频RD曲线都在BMD-DRVC之下。DBMD[1]虽然没有增加编码端的复杂度，但需要将宏块分类信息从译码端传送到编码端，增加了系统的延迟，而BMD-DRVC没有这个延迟。上述RD特性比较时所用参考文献如下：[1]TagliasacchiM.,TrapaneseA.,TubaroS.,etal.Intramodedecisionbasedonspatio-temporalcuesinpixeldomainWyner-Zivvideocoding[A].TomasN.IEEEInternationalConferenceonAcoustics,Speech,andSignalProcessing[C].Toulouse,France:IEEE,2006:57-60[2]XiemHoangVan,ByeungwooJeon.FlexibleComplexityControlSolutionforTransformDomainWyner-ZivVideoCoding(J).Broadcasting,IEEETransactionson2012,58(2):209–220.[3]http://www.img.lx.it.pt/～discover/rd_qcif_15_gop2.html以上所述，仅为本发明专利较佳的实施例，但本发明专利的保护范围并不局限于此，任何熟悉本
技术领域：
的技术人员在本发明所公开的范围内，根据本发明专利的技术方案及其发明构思加以等同替换或改变，都属于本发明专利的保护范围。当前第1页1 2 3

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡春筠;俞龙;蔡坤;
技术所有人：华南农业大学;
我是此专利的发明人

上一篇：一种智能化JPEG图像编解码系统及方法与流程
上一篇：对包含表示触觉效果的数据的包编码/解码的方法和设备与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。