用于hevc的自适应快速帧内预测模式决策的制作方法

文档序号:7895044阅读:487来源:国知局

专利名称::用于hevc的自适应快速帧内预测模式决策的制作方法
技术领域
:本发明涉及图像处理领域,更具体而言,涉及用于高效视频编码(HEVC)中帧内预测模式选择的自适应快速帧内预测模式决策方法。
背景技术
:2010年4月,两大国际视频编码标准组织VCEG和MPEG成立视频压缩联合小组JCT-VC(JointcollaborativeTeamonVideoCoding),一同开发HEVC标准,其也称为H.265。HEVC标准主要目标是与上一代标准H.264/AVC实现大幅度的编码效率的提高,尤其是针对高分辨率视频序列。其目标是在相同视频质量(PSNR)下码率降为H.264标准的50%。就目前阶段,HEVC依然沿用H.264就开始采用的混合编码框架。帧间和帧内预测编码消除时间域和空间域的相关性。变换编码对残差进行变换编码以消除空间相关性。熵编码消除统计上的冗余度。ffiVC将在混合编码框架内,着力研究新的编码工具或技术,提闻视频压缩效率。目前,JCT-VC组织的讨论中已经提出的许多编码的新特性,有可能会加入HEVC标准中,各次讨论的具体文献可以从http://wftp3.itu.int获得。编码块的大小将最大可达64x64,这主要是为了高清视频压缩编码的应用。DCT变换编码将突破8x8,最大能够达到32x32。对于帧内预测,预测的方向更佳细化,多达35种中贞内预测(intrapredication)模式,其中对于大小为4x4,8x8,16x16,32x32和64x64的预测块(predicationunit),分别有17,35,35,35和5种预测模式可用,其中,图2示出了35种帧内预测模式的情况,这将使帧内预测更佳精确,更高效地减少冗余。帧间预测在插值时采用了更多抽头的滤波器,以及1/4像素精度,来提高帧间预测的精度。在熵编码方面,使用了适应性更强的CABAC以及低复杂度的LCEC。在帧内预测方面,由于使用了多达35种帧内预测模式,因此,在进行帧内编码时,如果直接针对35种巾贞内预测模式使用率失真优化(Rate-Distortionoptimization,RD0)来判断最佳预测模式,则编码器将不能承受将所有预测方向进行RDO的运算量。为了降低编码器进行RDO运算时的运算量,HM4.0(HEVCtestmodel4.0)采用了Hadamard变换的方法,通过一种粗略模式决策(RoughModeDecision,RMD)选出若干个较佳的候选模式。随后,在针对由这若干个较佳候选模式进行RDO运算来获得最佳模式。在JCT-VC已经采纳的JCTVC-C207提案中将残差信号哈达玛变换系数绝对和(minimumabsolutesumofHadamardTransformedcoefficientsofresidualsignal,HSAD)与模式比特数计算过程加入粗略模式决策(RMD)算法。提案JCTVC-D283中,将联合方向巾贞内预测算法简化,并加入了提取最高概率模式(mostprobablemode,MPM)算法,即在RMD之后应用MPM算法,从而保证在进行RDO运算的候选模式集合中始终包含MPM0提案JCTVC-C218简化CU分成PU的冗余过程,这些简化算法降低了帧内预测的复杂度,但是这些方案都是最基本的解决方案而没有考虑块的性质。本申请中主要参考以下技术文献来实现,这些文献皆是JCT-VC,并且可直接从http://wftp3.itu.int获得[I]J.H.MinZiUnificationofthedirectionalintrapredictionmethodsinTMuC,”JCTVC-B100,July,2010.[2]K.McCannet.al.,“Samsung,sresponsetothecallforproposalsonvideocompressiontechnology,,,JCTVC-A124,April,2010.[3]K.Ugur,K.R.AnderssonandA.Fuldseth,“DescriptionofvideocodingtechnologyproposalbyTandberg,Nokia,Ericsson,,,JCTVC-A119,April,2010.[4]Y.Piao,J.H.Min,J.Chen,“Encoderimprovementofunifiedintraprediction,”JCTVC-C207,Oct.,2010.[5]L.Zhao,et.al,‘‘FurtherEncoderImprovementofintramodedecision,”JCTVC-D283,Jan.,2011.[6]J.Kim,Y.Jeon,B.Jeon,uEncodingcomplexityreductionforintrapredictionbydisablingNxNpartition,”JCTVC-C218,Oct.,2010.[7]B.Bross,W.J.Han,J.R.Ohm,G.J.Sullivan,T.Wiegand,“WD4WorkingDraft4ofHigh-EfficiencyVideoCoding,”JCTVC-F803,July,2011.[8]JCT-VC,HEVCreferencesoftware“HM-4.0”[online]http://hevc.hhi.fraunhofer.de/svn/svn—HEVCSoftware/tages[9]Y.H.Tan,C.Yeo,H.LTan,Z.Li,“RQTdepthselection,JCTVC-E104,Mar.,2011.[10]K.Panusopone,K.Chono,Y.H.Tan,M.Zhou,“EvaluationofRQTinHMandrelatedTUrepresentation,”JCTVC-E365,Mar.,2011.[11]K.McCann,S.Sekiguci,B.Bross,W.J.Han,“HM4:HEVCTestModel4EncoderDescription,”JCTVC-F802,July,2011.[12]B.Bross,uCommontestconditionsandsoftwarereferenceconfigurations,”JCTVC-F900,July,2011.在帧内预测方面,虽然已经提出了若干种候选模式选择算法,来降低最终进行RDO的模式数量同时满足BD-rate(BD-率)(Bj0ntegaard-Delta)。但是候选模式的数量仍然有下降的空间。
发明内容根据一个方面,提供了一种用于高效视频编码(HEVC)的自适应帧内(Intra)预测模式决策方法,其中,所述方法是针对当前帧中的每个预测块(PU)执行预测模式决策的,该方法包括(I)使用粗略模式决策(RMD)确定一候选模式集合,在所述候选模式集合中包含了模式集合中具有最小代价的N个候选模式,并且所述N个候选模式已经按照代价进行了升序排序,其中,对于大小4*4和8*8的预测块,N=8,对于大小16*16和32*32的预测块,N=3;(2)当所使用的预测块大小为4*4或8*8时,判断所述集合中前2个角度模式是否相邻如果相邻,则保留前2个角度模式以及所述集合中其他角度模式中与第I个角度模式最近邻的角度模式,如果不相邻,则仅保留前两个角度模式;判断所述集合中前4个模式中是否存在DC模式或Planar模式,如果存在,则在所述集合中保留DC模式和所述Planar模式;或者当所使用的预测块大小为16*16和32*32时,判断所述集合中的第I个模式是否为DC模式或Planar模式,如果是,则在所述集合中保留DC模式和所述Planar模式,并直接进行到步骤(4);(3)使用最高概率模式(MPM)算法,其中,将两个最高概率模式加入所述集合中;(4)对所述集合中的各个模式应用率失真优化(RDO)来获得最佳帧内预测模式。根据另一方面,提供了一种用于高效视频编码(HEVC)的视频编码器,其包括帧内预测模式决策器,其确定最佳帧内预测模式,并将所述最佳帧内预测模式输入帧内预测器;以及帧内预测器,其基于所述最佳帧内预测模式,执行帧内预测,其中,所述帧内预测器是针对当前帧中的每个预测块(PU)执行预测模式决策的,其中,所述帧内预测模式决策器被配置为(I)使用粗略模式决策(RMD)确定一候选模式集合,在所述候选模式集合中包含了模式集合中具有最小代价的N个候选模式,并且所述N个候选模式已经按照代价进行了升序排序,其中,对于大小4*4和8*8的预测块,N=8,对于大小16*16和32*32的预测块,N=3;(2)当所使用的预测块大小为4*4或8*8时,判断所述集合中前2个角度模式是否相邻如果相邻,则保留前2个角度模式以及所述集合中其他角度模式中与第I个角度模式最近邻的角度模式,如果不相邻,则仅保留前两个角度模式;判断所述集合中前4个模式中是否存在DC模式或Planar模式,如果存在,则在所述集合中保留DC模式和所述Planar模式;或者当所使用的预测块大小为16*16和32*32时,判断所述集合中的第I个模式是否为DC模式或Planar模式,如果是,则在所述集合中保留DC模式和所述Planar模式,并直接进行到步骤(4);(3)使用最高概率模式(MPM)算法,其中,将两个最高概率模式加入所述集合中;(4)对所述集合中的各个模式应用率失真优化(RDO)来获得所述最佳帧内预测模式。还公开了与上述方法相对应的装置以及用来执行上述方法的视频编码器。图I示出了HEVC的编码器框图的一个实施例。图2示出了HEVC中使用的多达35种预测模式。图3示出了根据本发明的一个实施例的帧内预测模式选择流程图。具体实施例方式现在参考附图来描述各种方案。在以下描述中,为了进行解释,阐述了多个具体细节以便提供对一个或多个方案的透彻理解。然而,显然,在没有这些具体细节的情况下也能够实现这些方案。如在本申请中所使用的,术语“组件”、“模块”、“系统”等等旨在指代与计算机相关的实体,例如但不限于,硬件、固件、硬件和软件的组合、软件,或者是执行中的软件。例如,组件可以是但不限于在处理器上运行的进程、处理器、对象、可执行体(executable)、执行线程、程序、和/或计算机。举例而言,运行在计算设备上的应用程序和该计算设备都可以是组件。一个或多个组件可以位于执行进程和/或者执行线程内,并且组件可以位于一台计算机上和/或者分布在两台或更多台计算机上。另外,这些组件可以从具有存储在其上的各种数据结构的各种计算机可读介质执行。组件可以借助于本地和/或远程进程进行通信,例如根据具有一个或多个数据分组的信号,例如,来自于借助于信号与本地系统、分布式系统中的另一组件交互和/或者与在诸如因特网之类的网络上借助于信号与其他系统交互的一个组件的数据。图I示出了高效视频编码(HEVC)所实现的视频编码器的大致结构图。HEVC的编码器架构与札264所使用的编码器架构大致相同,主要是针对各个模块中所使用的算法进行了进一步的研究、改进,尤其是针对高分辨率视频序列,其改进的目标是在相同视频质量(PSNR)下码率降为H.264标准的50%。由于HEVC的编码器架构与H.264所使用的编码器架构大致相同,因此不混淆本发明,本申请中不对图I中的整体架构进行描述,而仅关注于用于HEVC的帧内预测模式选择和帧内预测。帧内预测是H.264/AVC视频编码标准中首先采用的一种的新的帧内编码方式,目的是去除当前块与临近块之间的空间冗余。在帧内预测中,预测块P是由当前片(slice)中先前编码和重建之后的块形成的。当前块减去这个预测块P,产生残差块,残差块经过块变换、量化后产生一种量化后的变换系数X,再经过熵编码,与解码器侧所需的其他信息(例如,预测模式量化参数、运动矢量等等)一起组成压缩比特流供传输和解码使用。在H.264/AVC视频编码标准中,针对4*4的块,有包括直流(DC)在内的9种预测模式,针对8*8和16*16的块,有包含DC和平面(planar)在内的4种模式。在进行帧内预测模式选择时,从所支持的预测模式中选取与当前块具有最佳匹配(例如,具有最小率失真(RD))的模式。在HEVC中,尤其是HM4.0(HEVCtestmodel4.0)中(参考文献[11]),针对帧内预测采用了大小分别为4*4,8*8,16*16,32*32和64*64的预测块(predicationunit),并且根据预测块的大小所支持的帧内预测模式数量为表1,并且可能的预测模式为图2所示。如图2所示,最多达35种的预测模式包括33种角度帧内预测模式方向,以及DC(直流)模式和Planar(平面)模式。权利要求1.一种用于高效视频编码01EVC)的自适应帧内(Intra)预测模式决策方法,其中,所述方法是针对当前帧中的每个预测块(PU)执行预测模式决策的,该方法包括(1)使用粗略模式决策(RMD)确定一候选模式集合,在所述候选模式集合中包含了模式集合中具有最小代价的N个候选模式,并且所述N个候选模式已经按照代价进行了升序排序,其中,对于大小4*4和8*8的预测块,N=8,对于大小16*16和32*32的预测块,N=3;(2)当所使用的预测块大小为4*4或8*8时,判断所述集合中前2个角度模式是否相邻如果相邻,则保留前2个角度模式以及所述集合中其他角度模式中与第1个角度模式最近邻的角度模式,如果不相邻,则仅保留前两个角度模式;判断所述集合中前4个模式中是否存在DC模式或Planar模式,如果存在,则在所述集合中保留DC模式和所述Planar模式;或者当所使用的预测块大小为16*16和32*32时,判断所述集合中的第1个模式是否为DC模式或Planar模式,如果是,则在所述集合中保留DC模式和所述Planar模式,并直接进行到步骤(4);(3)使用最高概率模式(MPM)算法,其中,将两个最高概率模式加入所述集合中;(4)对所述集合中的各个模式应用率失真优化(RDO)来获得最佳帧内预测模式。2.如权利要求1所述的方法,其中,如果预测块的大小为64*64,则直接对与64*64大小的预测块相关联的3种预测模式执行步骤(4),而不执行步骤(1)_(3)。3.如权利要求1所述的方法,其中,所述代价基于以下J=HSAD(Resmode)+ABmode,其中,m0de为ffiVC规定的最多具有35种的所有帧内预测模式,HSAD(Resmode)表示残差信号哈达玛变换系数绝对和,表示模式比特数的消耗值,\表示拉格朗日常量。4.一种用于高效视频编码(HEVC)的视频编码器,其包括帧内预测模式决策器,其确定最佳帧内预测模式,并将所述最佳帧内预测模式输入帧内预测器;以及帧内预测器,其基于所述最佳帧内预测模式,执行帧内预测,其中,所述帧内预测器是针对当前帧中的每个预测块(PU)执行预测模式决策的,其中,所述帧内预测模式决策器被配置为(1)使用粗略模式决策(RMD)确定一候选模式集合,在所述候选模式集合中包含了模式集合中具有最小代价的N个候选模式,并且所述N个候选模式已经按照代价进行了升序排序,其中,对于大小4*4和8*8的预测块,N=8,对于大小16*16和32*32的预测块,N=3;(2)当所使用的预测块大小为4*4或8*8时,判断所述集合中前2个角度模式是否相邻如果相邻,则保留前2个角度模式以及所述集合中其他角度模式中与第1个角度模式最近邻的角度模式,如果不相邻,则仅保留前两个角度模式;判断所述集合中前4个模式中是否存在DC模式或Planar模式,如果存在,则在所述集合中保留DC模式和所述Planar模式;或者当所使用的预测块大小为16*16和32*32时,判断所述集合中的第1个模式是否为DC模式或Planar模式,如果是,则在所述集合中保留DC模式和所述Planar模式,并直接进行到步骤(4);(3)使用最高概率模式(MPM)算法,其中,将两个最高概率模式加入所述集合中;(4)对所述集合中的各个模式应用率失真优化(RDO)来获得所述最佳帧内预测模式。5.如权利要求4所述的帧内预测模式决策器,其中,如果预测块的大小为64*64,则直接对与64*64大小的预测块相关联的3种预测模式执行步骤(4),而不执行步骤(1)-(3)。6.如权利要求4所述的帧内预测模式决策器,其中,所述代价基于以下J=HSAD(Resmode)+ABmode,其中,m0de为ffiVC规定的最多具有35种的所有帧内预测模式,HSAD(Resmode)表示残差信号哈达玛变换系数绝对和,表示模式比特数的消耗值,\表示拉格朗日常量。7.一种用于高效视频编码(HEVC)的自适应帧内(Intra)预测模式决策装置,所述装置是针对当前帧中的每个预测块(PU)执行预测模式决策的,该装置包括模块(1),使用粗略模式决策(RMD)确定一候选模式集合,在所述候选模式集合中包含了模式集合中具有最小代价的N个候选模式,并且所述N个候选模式已经按照代价进行了升序排序,其中,对于大小4*4和8*8的预测块,N=8,对于大小16*16和32*32的预测块,N=3;模块(2),当所使用的预测块大小为4*4或8*8时,判断所述集合中前2个角度模式是否相邻如果相邻,则保留前2个角度模式以及所述集合中其他角度模式中与第1个角度模式最近邻的角度模式,如果不相邻,则仅保留前两个角度模式;判断所述集合中前4个模式中是否存在DC模式或Planar模式,如果存在,则在所述集合中保留DC模式和所述Planar模式;或者当所使用的预测块大小为16*16和32*32时,判断所述集合中的第1个模式是否为DC模式或Planar模式,如果是,则在所述集合中保留DC模式和所述Planar模式,并直接进行到模块(4);模块(3)使用最高概率模式(MPM)算法,其中,将两个最高概率模式加入所述集合中;模块(4)对所述集合中的各个模式应用率失真优化(RDO)来获得最佳帧内预测模式。8.如权利要求7所述的装置,其中,如果预测块的大小为64*64,则直接对与64*64大小的预测块相关联的3种预测模式执行步骤(4),而不执行步骤(1)_(3)。9.如权利要求7所述的帧内预测模式决策器,其中,所述代价基于以下J=HSAD(Resmode)+ABmode,其中,m0de为ffiVC规定的最多具有35种的所有帧内预测模式,HSAD(Resmode)表示残差信号哈达玛变换系数绝对和,表示模式比特数的消耗值,\表示拉格朗日常量。10.一种用于执行权利要求1-3所述的方法的视频编码器。全文摘要一种用于高效视频编码(HEVC)的自适应帧内(Intra)预测模式决策方法。本方法在使用了HEVC中的RMD、MPM和RDO最佳模式选择方法的同时,在实施RMD之后加入了基于纹理的附加模式选择过程,从而针对4×4和8×8尺寸的预测块,将候选模式数量减小为2-5个,而针对16×16和32×32尺寸的预测块则将将候选模式数量减小为2-5个,从而明显地减少了参与RDO模式选择的候选模式的数量。文档编号H04N7/32GK102665079SQ20121013881公开日2012年9月12日申请日期2012年5月8日优先权日2012年5月8日发明者张萌萌,白慧慧,赵川申请人:北方工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1