一种提高图像帧内编码速率的方法

文档序号:7693212阅读:208来源:国知局

专利名称::一种提高图像帧内编码速率的方法
技术领域
:本发明涉及视频压缩编码技术,具体涉及一种提高基于H.264图像桢内编码速率的方法。
背景技术
:枧频/图像编码的方法多种多样,其应用涉及方方面面,为了使不同厂商生产的终端能互相交换信息,或从一个公共的信号源接收信息,20世纪80年代末期,一些国际组织开始致力于视频/图像编码的标准化工作。同时,各大厂商对此产生浓厚的兴趣,并直接推动了视频/图像编码标准化的研究进程。最终于1988年国际电话与电报顾问委员会(CCITT,JntemationalTelephoneandTelegr^hConsultativeCommittee,于1992年更名为UU-T,InternationalTelecommunicationUnionTelecommunicationStandardizationSector)制定第一个视频编码标准——H.26i,从衝成为视频编码史上的里程碑。随后ISOMPEG(MovingPictureExpertsGroup)和而-TVCEG(VideoCodingExpertsGroup)根据不同应用环境和需求进行整合,以H.261为基础和核心,相继制定了一系列视頻编码标准。ITU-T专注于实时视頻通信应用领域,发布了H.26x系列标准(如R26KH.262、H.263和H-264等),ISOMPEG则主要面向视频存鍺媒体、电枧广播和多媒体邇信应用,制定了MPEGx系列标准(如MPEG-l、MPEG-2和MPEG-4等)。图1所示为视频编码标准的发展历程,下面简要介绍国际视频编码标准的发展过程。1985年CCITT组织了第15专家组,进一步研究会议电视的标准化,并于1988年制定了针对64kbit/s电电话/会议应用的H.26i标准P气在H.261标准中定义了帧内(I帧,Intraframe)编码和帧间(P帧,Predictiveframe)编码,并采用帧间预溯、DCT变换、Huffinan编码等技术。为了增强灵活性,H.261仅对与兼容性有关的码流语法、码流复用、解码过程等作了严格的限制性规定,而对诸如量化级的自适应控制、运动估计、码率控制等对重构图像质量指标有重要影响但不影响兼容性的部分不作限制性规定,给开发者、厂商和用户提供了很大的活动空间。R261标准的成功推出,各大厂商、国际标准组织和科研院所等受到极大鼓舞,掀起了视频压缩编码的研究和应用高991年ISOMPEG开始制定MPEG-1标准,主要目标是要建立一个适用于数字存储、媒体存储和检索的活动图像,相关声音及其组合编码的标准,并于1993年11月成为国际标准。MPEG-1标准以R261为基本框架,引入了双向预测帧(B鲮,Bi-directionalpredictionframe)、半像素精度运动估计,以及图像组(GOP,GroupOfPicture)的概念,实行了随机读取、快速进退搜索和反向重放等功能。随后ISOMPEG联合ITU-TVCEG启动了MPEG-2草案的制定[321(在ITU-T标准系列中又称为H.262),并于1994年确定威为标准。MPEG-2以MPEG-1为基础,作了重要扩晨。针对隔行扫描的常规电視图像专门设置了"按帧编码"和"按场编码"方法;创立了二元码流结賴节目流(programstream)和传送流(transportstream),传送流的运行环境有可能出现严重的差错,而节目流的运行环境頻裉少出现差错;按照编码技术的复杂度,首次引入了档次(Profile)和级别(Level)的概念,巧妙地解决了比特流的可交换性和国际性。此外,还增加了可分级性(scalability)概念,允许从一个编码数据流中得到不同质量等缀或不同时空分辨率的视频信号,可分缓性包括空间域、信噪比、时间域等。MPEG-2是一个非常成功的标难,已经广泛融入到了人们的生活和工作中。随着网络技术的发展和普及,网络带宽日益成为阻碍人们应用禊频/图像的一个瓶颈。为了缓解这个问题,ITU-TVCEG于1995年提出针对低码率应用的H.263编码标准。它以H.261为基础,并吸引了MPEG1/2等建议中有效合理的技术,同时提供了四种可选的编码算法,即无约束运动矢量算法、基于语法的算法编码、高级预测法和PB桢算法,进一步提髙编码效率。此外,R263扩展了图像格式,支持包括QCIF、Sub-QCIF、CIF、4CIF和16C[F等多种格式的图像。此外,标准中没有限定每秒中帧数,因此可以通过减少每秒帧数来限制最大速率。在H.263标准的基础上,ITU-TVCEG提出了两个工作计划一个是所谓短期(ShortTerm)计划5即在R263基础上添加一些新的功能选项,进一步提高压缩效率和扩展一些功能,同时开始一个所谓的长期(LongTerm)计划以发展一个适应于低码率视频通信的新国际标准。在短期计划中,相继推出H.263+和11263++新版本。长期计划预计生成的标准称之为IL263L,但在1998年改名为R26L。1998年ISOMPEG又提出了MPEG4标准,它综合了数字电视、交互式图形学和Inteniet等领域的技术和功能,在H.263、MPEG-1和MPEG-2基础上进一步进行扩展和补充。MPEG4的编码码率揽括了从低至5kbit/s到高于2Mbit/s的一个很大的范围,提出了与以往图像编码标准完全不同的编码概念,它吸取了基于对象的编码方法的思想,它的编码方案建立在任意形状的对象模型之上,在对图像的描述上,比传统编码标准增加了形状信息。MPEG4不再是一个标准化的固定算法,而是建立一个可扩展的编码工具集,由工具集构造各种算法。在不作解码的情况下,它支持基于内容的处理和码流的编辑,支持人工图像/声音与自然图像/声音的合成,支持基于内容的随机存取等等,同时在不同应用环境下都具有较好的鲁棒性,支持基于内容的可分级编码。与此同时,ISOMPEG还制定了MPEG-7和MPEG-21等标准,为各类多媒体信息提供一种标准化的描述,以及一种高效、透明和可互搡作的媒体框架。为了进一步提高视频编码效率,2001年12月ISO与ITU-T正式成立联合视频小组(JointVideoTeam,JVT),开始致力于H.264/MPEG-4part10(AVC,AdvancedVideoCoding)的标准化(本论文中统一简称为H.264),于2003年5月正式确定为国际标准。它以R26L为基础,扩展了从低码率到髙码率的应用。H.264除继承以往标准的优点外,还引入了许多新技术,从而使得在相同解码质量条件下,编码效率比H.263和MPEG-4高近50%。此外,值得关注的是我国信息产业部于2002年6月开始制定拥有自主知识产权的音视频编码标准(简称AVS,AudioVideocodingStendard)。AVS的目标是制订数字音视频的编解码、处理和表示等共性技术标准,为数字音视频设备与系统提供高效经济的编解码技术,主要针对HDTV、HD-DVD、无线宽带多媒体通讯、互联网宽带流媒体等重大信息产业应用。与以往视频编码标准相同,R264系统也采用MC-DCT结构,即运动补偿加变换编码的混合(hybrid)结抅,其编码技术框架如图2所示。H.264编码主要由帧内预測、帧间蔑測(运动估计与补偿)、整数变换、量化和熵编码等构成。H.264采用帧内(Intra)和帧间(Inter)两种编码模式。支持的镜频源格式包括(YUV)4:2:0、4:2:2和4:4:4,同时支持逐行扫描和簡行扫描的视频序列,对于隔行扫描的视频楨,H.264支持将奇偶场独立编码,也支持将奇偶场一起编码的方式.对于I(帧内编码帧)帧图像,采用帧内模式编码;对于P帧(前向预测帧)和B帧(双向预测帧)图像,则采用帧间模式编码,但在宏块层,也可以选择帧内模式编码。编码以互不重叠的宏块(MB,Macro-Block)为单位进行,宏块一般定义为16x16个像素块。对于I帧图像,首先进行帧内预测,然后对预测残差信号(原始值与预测值之差)进行整数变换和量化,再对量化系数进行变长编码或算术编码,生成压缩码流,同时经反变换、反量化等过程重构图像,以用作后续帧编码时的参考。对于P桢图像,首先进行多模式多参考帧的高精度运动估计和帧内预测,并根据率失真优化(RDO,Rate-DistortionOptimization)选择帧间、帧内编码模式和相应的分块模式,然后对残差信号进行变换、量化和熵编码,生成压縮码流,同时经反变换、反量化重构图像。对于B帧图像,与P帧固像相似,首先采用双向预测技术进行多模式多参考帧的运动估计和帧内预测,并根据率失优化选择最佳编码模式,然后对残差信号进行变换、量化和熵编码,生成压缩码流。此外,R264还定义了SI、SP帧。为了提高编码的网络适应能力,H.264采用视频编码层(VCL,VideoCodingLayer)与网络抽象层(NAL,NetworkAbstractionLayer)相分离的编码结构,如图3所示,VCL完成对视频图像的高效压缩,NAL负责以网络所要求的恰当的方式对数凝进行打包和传送。H.264实现了视频的更高压缩比、更好的图像质量和良好的网络适应性,因此,R264的应用场合相当广泛,包括可视电话(固定或移动)、实时视频会议系统、视频监控系统、因特网视频传输以及多媒体信息存储等。为了符合广泛应用的特点,H.264只对比特流、语法元素和解码过程作了规定,没有对编码器做限制,使得H.264编码器的实现非常灵活。IL264的帧内预瀕在H.264中,4x4块的9种可选预賴模式集为{mode0、modei、...、mode8),即垂直预测方向是mode0,水平预测方向是mode1,以此类推。16xl6块的4种可选预测模式集(mode0、model.....mode3},即对应垂直、水平、DC和平面预测方向。8x8色度预测模式与16x16的预賴方式相同。除DC预测模式外,每一种預測模式都有相应的预测方向和预测权重,DC预测方式是采用相邻边界像素的平均值作预测,即预测块的所有像素值等于相邻边界像素的平均值。宏块的帧内预测基本过程如下(1)判断当前宏块周围可用宏块信息,包括上边、左边和右上边宏块是否可用。(2)将亮度宏块划分为16个4x4小块,采用9种不同的预测模式,依次计算每个4x4小块的率失真代价,率失真代价由拉格朗曰函数定义J(《,c,modcI^尸,义咖咖)=然Z)(、v,c,model2尸)+义孤^'7"c,modt,1(尸)其中,s是原像素块信号,c是重构块信号,^是宏块的量化参数,义"为拉格朗日乘数,4,ode=0.85-2GTO,/^,c,model(尸)是在相应附Ofife和^P下的编码码率,包括头信息、预测模式和所有DCT系数的编码比特数。SSD(.)是4x4原像素块与重构块之间的平方误差和依次完成所有4x4的帧内预测模式选择,并得到所有4x4块的率失真代价和。(3)采用16x16块模式,从4种不同的预测模式中逸择最佳预测模式,方法是计算所有模式下的SATD(SumofAbsoluteTransformedDifference)值,选取最小值的模式作为最佳16x16预灤模式。SATD值作为16x16块的率失真(RD)代价,是残差值分成16个4x4块并分别经Hardamard变换后的绝对值和的一半,如式下所示,D欲7yi',》是Hardamard变换系数。(4)比较l2)和(3)得到率失真代价,从中选择一个最佳褒測模式作为宏块的编码模式。色度块的计算与16x16块相同。一个宏块中亮度块和色度块一共有JVSx^^x/6+JV/^种模式组合m,厕、W和iV7(5分别表示色度块、4x4和16x16亮度块的预测模式数量。也就是说,一个宏块要得到最佳RDO模式,一共要计算592次不同的RDO计算。由此可见,帧内预賴模式选择的计算复杂度是非常高的,影响H.264的编码速度。为了降低桢内预测的复杂度,许多学者进行了广泛的研究。如FengPan在.文献(F.Pan,X.Lin.FastModeDecisionforIntraPrediction.ISO/正CJTC1/SC29/WG11andITU-TSG16JVT-G013.doc,JVT7thMeetingPattayaII,Thailand,7-14,March2003.,下面简称FengPan法)中提出帧内预测快速模式选择算法,基本思想是首先采用Sobel算子作边缘检测,得到图像块中物体的边缘走向,再根据边缘方向确定相应的候选预测模式;ChangsungKim在文献[C.Kim.Feature-basedintra-predictionmodedecisionforh.264.正EE.,2004,pp:769-772.]中提出基于特征的帧内预测快速算法,采用SAD和SATD两个因素表征特征,通过复杂的计算与比较,得到最终编码模式。这些方法在一定程度上提高了帧内编码速度,但是同时引入了复杂的前期计算,因此存在局限性,其中FengPan提出的算法是众多算法中公认最好,并已经被JVT组织所采纳。
发明内容本发明的目的在于在保持良好的图像质量基础上,提高图像编码速率。为实现本发明的目的,本发明思想是通过减少械内预瀏模式集中的侯选模式数量来提高编码速率。本发明方法根据图像的紋理方向,筛选出沿紋理方向的预测模式,再进行RDO计算。上述图像的紋理方向通过如下方法获得首先,将相邻边界像素扩展为两行,再根据标准中提出的9预測方向,定义4个紋理方向0°、45°、卯。和135。;接着计算相邻两行像素的在紋理方向上的平均灰度差,并分别记为ZVDW#A",然后取ZVZ^和D^中最小值所对应的方向作为边缘的紋理方向,并令然后取£>必、D卯和D^中最小值D^所对应的方向作为边缘的紋理方向。具体地说,ZVDw、D卯和Dw的值可分别通过如下公式计算获得:<formula>formulaseeoriginaldocumentpage5</formula>其中,/",力是像素在6c,y乂坐标处的灰度值,"。,力J为预测块的左上角像素坐标,AT是编码块的大小。本发明中,所述AT的值优选为4、8或16。当.V值为8或16时,取ZVD必和Aw中最小值A^所对应的方向作为边缘的紋理方向。沿紋理方向的预测模式可按照如下方式进行令4x4块的9种预测模式侯选集为F4x4=!mode0,modeU...,mode8},16x16块的4种预褒f模式侯选集为F16xl6={mode0,mode1,…,mode3},8x8块的4种预测模式侯选集为F8x8=《mode0,mode1,...,mode3},则通过如下方法餘选出沿紋理方向的预测模式(1)判断当前宏块周围可用宏块信息,包括上边、左边和右上边宏块;(2)如果上边、左边宏块都采用16x16预测模式,则判断当前宏块的帧内复杂性,如果当前宏块复杂性小于规定阀值,则跳转到步骤(4);当前宏块的复杂性可通过下述公式计算<formula>formulaseeoriginaldocumentpage5</formula>其中,M是宏块大小。(3)4x4块预测模式选择将宏块分成4x4块,预测模式候选集的选择采取以下策略1)如果A附/i:Aw,候选集F4X4=(mode0,mode7,mode5,mode2};2)如果£)卵=/)0,候选集F4x4={mode1,mode8,mode6,mode2);3)如果/)附//7=/^5,候选集F4x4={mode4,mode5,mode6,mode2);4)如.果Z)所,"侯选集F4x4={mode3,mode7,mode8,mode2〗;经过以上计算后,候选预测模式由原来的9种降为4种。编码器采用侯选集中的预测模式进行RDO计算,求得最佳模式,并计算所有块的率失真代价和;(4)16x16亮度块和8x8色度块预测模式逸择将宏块采用16x16块进行预测,预测模式侯选集的选择采取以下策略1)如果D,她-Aw,候选集F版i6^mode0,mode2};2)如果D'附扭-A;,候选集F16xl6={mode1,mode2〗;3)如果D,股,D必,候式集F版tdmode3,mode2};8xg色度块采用与16x16块相同的预薰模式。经过以上计算后,预澜模式由原来的4种降为2种。编码器采用侯逸集中的豫测模式进行RDO计算,求得最佳模式;(5)比较(3)和(4)的率失真代价,逸择最小代价模式作为最终编码模式。通过上述方法能减少RDO计算,有效地提高图像的帧内编码速度,面图像质量和码率变化很少。图l是国际标准发展历程;图2是H.264编码框架示意图;图3是H.264分层设计示意图;图4是Foreman(QCIF)序列第一帧图像;图5是图4中第69个宏块(16x16宏块);图6是图5的第12个4x4小块;图7是4x4小块相邻边界扩展两行的示意图;图8是紋理定义方向;图9是Foreman序列PSNR比较;图10是Stefan序列PSNR比较;图11是Carphone序列PSNR比较;图12是Tempete序列PSNR比较。具体实施方式下面结合附图进一步说明本发明。应当理解,以下实施例仅用于说明本发萌,而不能作为本发明的限制,在不背离本发明精神和实质的前提下,进行的修改或替换,均属于本发萌的范围。实施铜11.紋理方向估计众所周知,自然图像具有很强的空间賴关性,相邻宏块之间的紋理走向也是非常相似的,特别对于4x4小块,相关性则更强。如图4显示的是Foreman(QCIF)序列第一帧图像,图5是图像中第69个宏块,图6中白色框内显示的是第69个宏块的第12个4x4小块。从图中可以看出,相邻宏块(或块)之间的紋理走向非常相似。下面分别对44亮度、16x16亮度和8x8色度块进行紋理方向估计。U)4x4块紋理方向估计首先将相邻边界像素扩展为两行,如ffl7所示。再根据标准中提出的9预测方向,定义4个紋理方向0°、45°、90°和135°,如图8所示。接着计算相邻两行像素的在紋理方向上的平均灰度差,并分别记为ZV£>必>Z),斧Z)w5。方法如下1=]^/(JC0—2,-V。+0——"+'ID45=:^7(宏l"Jfo+M'_y0-2)—/(jfa十"一1)|+-2,Jo+/—!)-/"-l,_y0+,)))Ac=;Z!17(、+"-2)-A;+/,h-UAM=T^F('£V(A+'+U。-2)—+,—+-2,je+/)-/"-lj。+/+邻其中,/^,w是像素在",y入坐标处的灰度值,"ft》)为预测块的左上角像素坐标,#是编码块的大小,在4x4块中A^4。然后取A*D必.£>卯和/)/35中最小值所对应的方向作为边缘的紋理方向,并令16x16亮度块与8x8色度块紋理方向估计对于16x16亮度块与8x8色度块,只有垂直、水平和平面预测方向,再加上DC预滅模式。因此只需要定义3个紋理方向(f、45°和9(f。按照与4x4块同样的方法,分别求得最小的D;和D^,并将此方向作为边缘的紋理方向。通过以上计算,初步确定了编码块的紋理方向。2.帧内模式选择算法令4x4块的9种预测模式侯选集为F4x4={mode0,mode1,...,mode8},16x16块的4种预测模式候选集为F16xl6={mode0,mode1,...,mode4},8x8块的4种预測模式候逸集为F8x8=〖mode0,mode1,...,mode4}。算法描述如下(1)判断当前宏块周围可用宏块信息,包括上边、左边和右上边宏块;(2)如果上边、左边宏块都采用16x16预测模式,则计算当前宏块的帧内复杂性户o、AlM"o>其中,M是宏块大小,在本文中等于16。如果&小于一阈值T(由实验测试获得,本例中等于256),则直接跳到(4),采用16x16宏块进行预测。(3)4x4块预测模式选择将宏块分成4x4块,预测模式候选集的选择采取以下策略1)如果Z^":D邻,候选集F4X4={mode0,mode7,mode5,mode2};2)如果候选集F4x4={inode1,mode8,mode6,mode2〗;3)如果/)斑纽=/>/5,候选集F4x4={mode4,mode5,mode6,mode2〗;4)如果/)附扭=1)/35,候选集F4x4={mode3,mode7,mode8,mode2};经过以上计算后,候选预测模式由原来的9种降为4种。编码器采用候选集中的预测模式进行RDO计算,求得最佳模式,并计算所有块的率失真代价和。(4)16x16亮度块和8x8色度块预测模式选择将宏块采用16x16块进行预测,预溯模式候选集的选择釆取以下策略1)如果D,鹏切-Z)90,候选集Fl6x^={mode0,mode2};2)如果D'卵fD。,候选集F16xl6={mode1,mode2};3)如果/)'她=/^5,候式集F,6x!6-(mode3,mode2};色度块釆取相同的方法进行选择。经过以上计算后,预测模式由原来的4种降为2种。编码器采用候选集中的预测模式进行RDO计算,求得最佳模式。(5)比较(3)和(4)的率失真代价,选择最小代价模式作为最终编码模式。实验结果与分析为了验证算法的有效性,实验采用H.264的参考模型JM7.5(H.S.Malvarand夂Hallapuro.Low-complexitytransformandquantizationinH264/AVC.IEEETrans.CSVT.,vol.13(7),pp:5邻402,2003,)作为平台,在其中实现本方法。实验方法是采用CAVLC熵编码、参考帧为2、搜索范围为32、釆用Hardmard变换、使用率失真优化(RDO)、序列结构采用IPPP和全I格式,量化参数选择2g和32,对多个标准视频序列进行瀏试。本方法实验结果与全模式算法计算结果、FengPan算法计算结果进行比较,全模式算法就是穷尽搜索计算所有预测模式的方法。由于算法的运行速度跟硬件平台有很大关系,因此在相同的硬件平台上实驗上面的三个算法,对测试结果的比值进行比较,从而可以排除硬件环境对算法的干扰,即对测试序列的编码码率变化(B_CHG)、编码时间变化(T—CHG)和图像质量变化(PSNR—CHG)进行比较,计算方法如下g—o/g=朋s-a//xl00%r一c恥="鹏_""膨—薩xl00%尸纖OfG二尸S湖画一尸纖"//其中Bits—ours和Bits_all分别为使用本发明方法和全模式算法产生的比特数,Time—ours和Time—all分别为使用本发明方法和全模式算法的编码时间,PSNR_ours和PSNR—all分别为使用本发明方法和全模式算法的图像质量。FengPan算法的计算方法与之相同。1.IPPP结构,编码120帧,帧率-30^s,GOP=15,编码结果比较如下表1QCIF标准序列实验结果(QP=28)<table>tableseeoriginaldocumentpage18</column></row><table>表2CIF标准序列实验结果(QP=32)测试序列FengPan算法本发明方法<table>tableseeoriginaldocumentpage18</column></row><table>由表1和表2可以看出,对于IPPP结抅,本方法在编码速度方面较全模式方法平均将提高21.5%,而图像质量下降只有0.026dB,码率平均增加0.593%左右。同时可以看出,本方法与文献[7]算法相比,两者较全模式算法的码率增加和图像质量下降相当,但本方法平均有2%的提髙。主要原因是FengPan算法中使用Sobd算法估计边缘的计算量比较大。下面图9和图10分别是是Foreman(QCIF)和Stefan(CIF)序列的亮度PSNR对照图,虛线是全模式算法下的图像质量,实线是本方法下的图像质量,P帧图像的质量下降是由于用于预测的I帧图像质量下降造成的。2.全I帧结构,编码120帧,帧率-3(^s,编码结果比较如下表3QCIF标准序列实验结果(QP-28)<table>tableseeoriginaldocumentpage19</column></row><table>表4CIF标准序列实验结果(Q^32)<table>tableseeoriginaldocumentpage19</column></row><table>Tempetc3.8738.26■01293.5443.66-0.125Stefan4.1237.64,984.7739.48■0.084Mobile4.3633.630.1354.5137.89-O.J39平均4.0738.180.1174:1842.36-0:120由表3和表4可以看出,对于全I帧结构,本方法性能表现更明显,在编码速度方面较全模式方法平均将提髙43%,而图像质量下降只有0.12dB,码率平均增加4.0%左右。同样本方法也优于文献[7]算法,两者的码率增加和图像质量下降相差不多,而本方法平均有近4%的提高。下面图11和图12分别是是Carphone(QCIF)和Tempete(CIF)序列的亮度PSNR比较图,虛线是全模式算法下的图像质量,实线是本方法下的图像质量。由以上实验结果表明,本方法能有效地提高图像的帧内编码速度,而图像质量和码率变化很少。权利要求1、基于H.264标准提高图像帧内编码速率的方法,该方法根据图像的纹理方向,筛选出沿纹理方向的预测模式,再进行RDO计算。2、如权利要求l所述的方法,其特征在于,所述图像的紋理方向通过如下方法获得首先,将相邻边界像素扩展为两行,再根据标准中提出的9预测方向,定义4个紋理方向0°、45°、90°和135°;接着计算相邻两行像素的在紋理方向上的平均灰度差,并分别记为IVZ)45,然后取A),Aw和A"中最小值所对应的方向作为边缘的紋理方向,并令然后取z^、d45>A^和d^中最小值ru所对应的方向作为边缘的紋理方向。3、如权利要求2所述的方法,其特征在于,所述A,、D必.Dw和Dm的值通过如下方法计算获得<formula>formulaseeoriginaldocumentpage2</formula>其中,/f3c,力是像素在6r,:F7坐标处的灰度值,"。,y"为预测块的左上角像素坐标,AT是编码块的大小。4、如权利要求3所述的方法,其特征在于,所述#值为4、8或16。5、如权利要求4所述的方法,其特征在于,当W值为8或16时,取ZVZ^-和A^中最小值Z)^所对应的方向作为边缘的紋理方向。6、如权利要求15任一项所述的方法,其特征在于,令44块的9种预测模式候选集为F4x4={mode0,mode1,...,mode8},16x16块的4种预测模式候选集为F16xi6={mode0,mode1,...,mode3},8x8块的4种预测模式候选集为F8x8={mode0,mode1,...,mode3},则通过如下方法筛选出沿紋理方向的预测模式(1)判断当前宏块周围可用宏块信息,包括上边、左边和右上边宏块;(2)如果上边、左边宏块都采用16x16预测模式,则判断当前宏块的鳞内复杂性,如果当前宏块复杂性小于规定阀值,则跳转到步骤(4);(3)4x4块预测模式选择将宏块分成44块,预测模式候选集的选择采取以下策略1)如果Dm^=Z)w,i"矣选集F4x4={mode0,mode7,mode5,mode2);2)如果/\^=1)0,候选集F4x4={mode〗,mode8,mode6,mode2);3)如果Z)OT,-=D45,候选集F4x4={mode4,mode5,mode6,mode2);4)如果D撤,Z),候选集F4x4;(mode3,mode7,mode8,mode2》;编码器采用候选集中的预测模式进行RDO计算,求得最佳模式,并计算所有块的率失真代价和;(4)16x16亮度块和8x8色度块预测模式选择将宏块采用16x16块进行预测,预测模式侯选集的选择采取以下策略1)如果D'冊,A^,候选集Fi6xt6^modeO,mode2};2)如果";;^Aj,候选集F16xl6={mode1,mode2};3)如果£>'她=/)必,候式集F,6x!6-(mode3,mode2);8x8色度块釆用与16x16块相同的预测模式,编码器采用候选集中的预测模式进行RDO计算,求得最佳模式;(5)比较(3)和(4)的率失真代价,选择最小代价模式作为最终编码模式。7、如权利要求6所述的方法,其特征在于,当前宏块的复杂性邇过下述公式计算v=0tM)、MM"其中,M是宏块大小。全文摘要本发明公开了一种基于H.264标准提高图像帧内编码速率的方法,该方法根据图像的纹理方向,筛选出沿纹理方向的预测模式,再进行RDO计算,从而大幅减少了RDO的计算次数。本发明方法在保持良好的图像质量基础上,有效提高了图像编码速率。文档编号H04N7/50GK101247525SQ20081010251公开日2008年8月20日申请日期2008年3月24日优先权日2008年3月24日发明者段大高,邓中亮申请人:北京邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1