编码视频序列变换装置和编码视频序列变换方法

文档序号:7951559阅读:190来源:国知局
专利名称:编码视频序列变换装置和编码视频序列变换方法
技术领域
本发明涉及编码视频序列变换装置和编码视频序列变换方法。
背景技术
当将第一视频编码视频序列变换为比特率和编码方式不同于所述第一视频编码视频序列的第二视频编码视频序列时,相关技术中的编码视频序列变换装置提取包含在所述第一视频编码视频序列中的编码参数,并自适应地选择和使用适于对所述第二视频编码视频序列进行重新编码的编码参数,从而减少重新编码所需要的计算量,如在JP-A-2003-009158中所公开的。
用于视频图像压缩编码的编码方式包括MPEG-2(运动图像专家组2)视频系统,MPEG-4视觉系统,作为ITU-T(国际电信同盟-电信标准化部门)中的国际标准的H.264等。在这些编码方式中,一幅图像被划分为称为宏块的处理单元,所述宏块具有定义的尺寸,并且为每个宏块设置运动向量的编码参数以及编码模式。
为根据上述编码方式对隔行扫描的输入信号进行编码,如何处理所述信号将随编码方式而改变。例如,在MPEG-2视频系统中,为对每幅图像或每个宏块进行编码,编码结构可在场结构和帧结构之间切换。
另一方面,在H.264系统中,为了在图像单元中切换编码结构,如同MPEG-2一样进行编码;然而,为了在宏块单元中切换所述编码结构,采用一种称为MB-AFF(宏块自适应帧场编码)的编码方法。
在称为MB-AFF的编码方法中,一种由两个宏块从上到下垂直排列而成的称为宏块对的处理单元被用来进行管理,并且所述编码结构在宏块对单元中在场结构和帧结构之间切换。因而,出现了几个限制条件以使得包含在每一个宏块对中的上宏块和下宏块在编码结构上匹配,并且使得必须为上宏块和下宏块分开管理前场(top field)和后场(bottom field)的编码参数。
因而,为了将隔行扫描的输入信号从以MPEG-2压缩编码的视频编码视频序列变换到H.264编码格式的视频编码视频序列,在相关技术中,为每个宏块设置宏块编码参数,并因此在满足宏块对上的限制条件的同时不可能有效地设置宏块对的编码参数。
如上所述,在常规的编码变换系统中,无法执行从所述第一视频编码视频序列中的宏块编码参数到所述第二视频编码视频序列中的宏块对的编码参数的有效变换。

发明内容
本发明涉及视频编码视频序列变换装置和视频编码视频序列变换方法,其中当确定了第二视频编码视频序列中的每个宏块对的编码参数集,检测与所述宏块对相对应的第一视频编码视频序列中的多个宏块,以及在使用所述相应的宏块的编码参数集时设置所述宏块对的所述编码参数集;由此,所述第一视频编码视频序列上的信息被用于对所述第二视频编码视频序列进行更有效的编码以能够实现高编码效率。
根据本发明的第一方面,提供了一种编码视频序列变换装置,其用于将通过在宏块单元中对隔行扫描的视频信号进行压缩编码而提供的第一比特流变换到基于在宏块单元中受到压缩编码的编码方式的第二比特流。编码视频序列变换装置包括解码部分,其对第一代码串(code string)进行解码以提供解码图像和第一编码参数集;编码参数集变换部分,其对于与在所述解码图像的垂直方向上彼此相邻的所述第二比特流相关的宏块的每一对,将相应宏块的每一个的所述第一编码参数集进行变换以找到变换编码参数集,所述宏块涉及相应于所述解码图像上各对的所述第一比特流;编码参数集选择部分,其选择相对于所述对找到的所述变换编码参数集作为所述对的所述宏块的每一个的第二编码参数集;以及编码部分,其利用由所述编码参数集选择部分选择的所述第二编码参数集进行对所述解码图像的压缩编码以产生所述第二比特流。
根据本发明的第二方面,提供了一种编码视频序列变换方法,用于将通过在宏块单元中对隔行扫描的视频信号进行压缩编码而提供的第一比特流变换到基于在宏块单元中受到压缩编码的编码方式的第二比特流。所述方法包括解码步骤,对所述第一代码串进行解码以提供解码图像和第一编码参数集;编码参数集变换步骤,对于在所述解码图像垂直方向上彼此相邻的所述第二比特流的宏块的对,对与所述解码图像上的所述对相对应的所述第一比特流的相应宏块的每一个的所述第一编码参数集进行变换以找到变换编码参数集;编码参数集选择步骤,选择相对于所述对找到的所述变换编码参数集作为所述对的所述宏块的每一个的第二编码参数集;以及编码步骤,使用在所述编码参数集选择步骤中选择的所述第二编码参数集对所述解码图像的进行压缩编码以产生所述第二比特流。


在附图中图1是框图,其示出了依据第一实施例的视频编码视频序列变换装置;图2是流程图,其示出了依据所述第一实施例的视频编码视频序列变换装置的操作;图3是流程图,其示出了所述第一实施例中的编码参数集变换部分的处理;图4是示图,其示出了所述第一实施例中在宏块对和与其对应的宏块之间的关系;图5是流程图,其示出了所述第一实施例中的宏块的编码结构设置处理;图6是流程图,其示出了所述第一实施例中的宏块对的编码结构设置处理;
图7是流程图,其示出了所述第一实施例中对应于宏块对的宏块的参数变换处理;图8是示图,其示出了所述第一实施例中当宏块与宏块对的编码结构不同时的变换例(帧结构到场结构);图9是示图,其示出了所述第一实施例中宏块对的编码结构为帧结构时的运动向量和运动补偿块形状的变换;图10是示图,其示出了所述第一实施例中宏块对的编码结构为场结构时的运动向量和运动补偿块形状的变换;图11是流程图,其示出了所述第一实施例中的编码参数集选择部分的处理流程;图12是框图,其示出了依据第二实施例的视频编码视频序列变换装置;图13是示图,其示出了所述第二实施例中在一个宏块对和与其对应的宏块之间的关系;图14是流程图,其示出了所述第二实施例中宏块对的编码结构设置处理的流程;图15是框图,其示出了依据第三实施例的视频编码视频序列变换装置;图16是示图,其示出了依据所述第三实施例的图像编码类型的变换例;图17是示图,其示出了依据所述第三实施例的图像编码类型的另一个变换例;图18是示图,其示出了与所述第二实施例的宏块对相对应的宏块中的对应比(correspondence ratio)的例子;图19是流程图,其示出了所述第二实施例中的宏块对的编码结构设置处理的另一个流程;图20是流程图,其示出了所述第二实施例中的宏块对的编码结构设置处理的另一个流程;
图21是示意图,其示出了所述第二实施例中的宏块对的编码结构设置处理的另一个流程。
具体实施例现在参照附图,示出本发明的优选实施例。
第一实施例图1是框图,其示出了依据第一实施例的视频编码视频序列变换装置。
依据所述第一实施例的视频编码视频序列变换装置包括解码部分110,用于解码输入的第一视频编码视频序列100并产生解码图像101以及提取编码参数集102;编码参数集变换部分111,用于分析编码参数集102并遵照第二视频编码视频序列的编码格式变换编码参数集;编码参数集生成部分113,用于利用解码图像101和已编码的第二视频编码视频序列103生成编码参数候选集104;编码参数集选择部分112,用于从由编码参数集变换部分111提供的编码参数集105和由编码参数集生成部分113生成的编码参数候选集104中选出最终用于编码的编码参数集106;以及编码部分114,用于利用由编码参数集选择部分112选择的编码参数集106生成第二视频编码视频序列。
在该实例中具体地采用了通过利用MPEG-2编码方式对隔行扫描的视频图像信号进行编码而提供的第一视频编码视频序列。后面将讨论以MPEG-4 AVC用作为第二视频图像编码信号的情况。
接下来,将结合图1和图2讨论依据所述第一实施例的视频编码视频序列变换装置的工作。图2是流程图,其示出了依据所述第一实施例的视频编码视频序列变换装置的工作。
第一视频编码视频序列100被输入到解码部分110(步骤S100)。
解码部分110对第一视频编码视频序列100进行解码并产生编码参数集102和解码图像101(步骤S101)。
编码参数集变换部分111将第一视频编码视频序列100的编码参数集102变换为第二编码参数集105(步骤S102)。
编码参数集生成部分113利用第一视频编码视频序列中的解码图像101和已编码的第二视频编码视频序列103生成编码参数候选集104(步骤S103)。
编码参数集选择部分112评估由编码参数集变换部分111提供的编码参数集105和由编码参数集生成部分113生成的编码参数候选集104,并且选择最终用于编码的编码参数集106(步骤S104)。
编码部分114利用由编码参数集选择部分112选择的编码参数集106将第一视频编码视频序列的解码图像101编码为第二视频编码视频序列103(步骤S105),并且输出第二视频编码视频序列103(步骤S106)。
当编码参数集变换部分111变换从第一视频编码视频序列100中提取的编码参数集时提供的编码信息107可被输入到编码参数集生成部分113,用作为生成编码参数集的参考数据。
下面将详细讨论图1中的处理部分。
解码部分110对输入的视频编码视频序列100进行解码,并且提取包含在第一视频编码视频序列100中的编码参数集102以及解码图像101。
在第一视频编码视频序列100为MPEG-2的情况下,提取的编码参数集102包含的信息包括分辨率信息,其表示包含于比特流中的解码图像在宽度和高度上的尺寸;逐行信息,其指示是否整个比特流逐行扫描;图像的图像类型((帧内编码(I图像),帧间编码(P图像,B图像));图像的编码结构(帧,场);宏块的编码模式(帧内编码,帧间编码);运动向量,其指示宏块的运动预测中的参考部分;在宏块运动补偿时的块形状;DCT类型,如果宏块为帧内编码则存在;
预测类型,如果宏块为帧间编码则存在;以及场选择,其指示宏块的运动向量参考哪一个场。
本实施例的解码部分110提取上面所列信息作为编码参数集102。
图3示出了编码参数集变换部分111的处理流程。
编码参数集变换部分111找到对应于宏块对的宏块(步骤S110)。
编码参数集变换部分111确定宏块和宏块对的编码结构,即,基于相应宏块确定帧结构编码或场结构编码(步骤S111和步骤S112)。
编码参数集变换部分111比较宏块对和相应宏块的已确定的编码结构(步骤S113)。如果存在对立的参数或缺少的参数,则变换或产生参数(步骤S114)。
编码参数集变换部分111遵照第二视频编码视频序列的编码方式变换相应宏块的编码参数(步骤S115),并且输出所提供的参数作为生成第二视频编码视频序列中的编码参数候选集。
下面将详细讨论图3中的处理。
S110检测相应的宏块找到对应于宏块对的宏块。在该实施例中不涉及分辨率变换处理,第一视频编码视频序列的分辨率与第二视频编码视频序列的分辨率相同,并且第一和第二视频编码视频序列的编码方式在宏块尺寸上匹配,因而第一视频编码视频序列的将被变换的两个宏块201和202对应于将变换到第二视频编码视频序列中的宏块对200。
S111设置相应宏块的编码结构找到相应宏块的编码结构。在本发明中,编码结构被定义为场结构或帧结构。
图5示出了一种具体的编码结构确定方法。首先,分析每个宏块的编码模式(步骤S120),确定编码模式是帧内编码(Intra)还是帧间编码(NonIntra)(步骤S121)。
在编码模式为帧间编码的情况下,分析包含在宏块中的预测类型信息(步骤S123和步骤S125)。在预测类型为场预测的情况下,设置为场结构(步骤S127);在预测类型为帧预测的情况下,设置为帧结构(步骤S126)。
在宏块的编码模式为帧内编码的情况下,分析宏块的DCT类型信息(步骤S122和步骤S124)。在DCT类型为场DCT的情况下,设置为场结构(步骤S127);在DCT类型为帧DCT的情况下,设置为帧结构(步骤S126)。
S112确定宏块对的编码结构在确定了相应宏块的编码结构后,基于相应宏块的编码结构确定宏块对的编码结构。
图6示出了具体的处理流程。
在相应宏块的编码结构间进行比较(步骤S130和步骤S131)。
如果两个宏块的编码结构相同(在步骤S131为“是”),则原样采用该编码结构作为宏块对的编码结构。即,如果两个宏块的编码结构均为场结构,则设置宏块对的编码结构为场结构(步骤S133);如果该编码结构为帧结构,设置所述编码结构为帧结构(步骤S134)。
如果一个宏块的编码结构为帧结构而另一个宏块的编码结构为场结构(在步骤S131为“否”),设置宏块对的编码结构为场结构(步骤S133)。
如果将被变换的图像的图像类型为帧内编码,则设置宏块对的编码模式为帧内编码,并且终止编码参数变换处理。如果将被变换的图像的编码模式为帧间编码,则如下变换用于预测编码的编码参数集S114遵照宏块对的编码结构,变换相应宏块的编码参数根据第一视频编码视频序列的编码方式变换对应于宏块对的宏块的编码参数,使之与宏块对的编码结构相一致。
图7示出了从帧间编码向帧内编码变换的具体处理流程。首先,如果相关宏块的每一个的编码模式为帧内编码(在步骤S141为“是”),变换编码模式为帧内编码模式,并且还基于宏块的编码结构产生基本上不存在的运动向量和预测类型(步骤S142)。
具体地,当帧内编码的DCT类型为场结构时,设置预测类型为场预测;当DCT类型为帧结构时,设置预测类型为帧预测。对于运动向量,设置标记以使编码部分基于向量预测生成运动向量。进行这样的处理的原因在于,在本实施例的编码参数变换中,如果将被变换的图像的图像类型为帧内编码,作为变换结果输出的编码参数被全部用来制成帧间编码的那些参数。
接下来,在相关宏块的每一个的编码结构和将变换成的宏块对的编码结构之间进行比较(步骤S143)。如果编码结构不同(在步骤S143为“是”),则将相应宏块的编码结构、运动向量和预测类型变换为与宏块对的结构相符合(步骤S144)。
具体地,如果相应宏块800的编码结构为帧结构,宏块对801的编码结构为场结构,则将相应宏块800的预测类型变换为场预测,并将帧预测运动向量变换为场预测运动向量,如图8所示。此时,帧预测的运动向量MV2的垂直分量被二等分以生成两个具有相同值的场预测MV2′(上MV2′和下MV2′)。
如果相应宏块的编码结构为场结构,且宏块对的编码结构为帧结构,则从包含在相应宏块中的场预测运动向量生成帧预测运动块(frameprediction motion block)。重复上述变换处理直至相应宏块的编码结构都与宏块对的编码结构相匹配(步骤S145)。
如果相应宏块的编码结构与宏块对的编码结构相匹配,变换最后的运动向量和运动补偿块形状。
图9和图10示出了编码格式变换的具体变换方法。
图9示出了当宏块对的编码结构为帧结构时的运动补偿块900和901的形状。如果宏块对的编码结构为帧结构,上部和下部的运动补偿块的形状被设置为16×16,且运动向量被变换为那些指示相同参考位置的向量来作为帧预测运动向量,其中所述相同参考位置考虑了像素精度,如图9所示。
图10示出了运动补偿块1000、1001、1002和1003的形状以及当宏块对的编码结构为场结构时运动向量的分配。
另一方面,如果宏块对的编码结构为场结构,运动补偿块形状被设置为16×8,如图10所示。对运动向量而言,上部场所涉及的两个运动向量上部MV1和上部MV2被分配给宏块对中的上宏块,而下部场所涉及的两个运动向量下部MV1和下部MV2被分配给宏块对中的下宏块。
对于运动块形状,也可设置关于上述块形状集以外的任何其它块形状的参数。
例如,当编码结构为场结构时,可从两个16×8的块形状设置16×16的块形状。在这种情况下,可利用残留信号大小的估计值等来选择两个16×8块形状的运动向量中的一个。
另外,可从16×16的块形状生成两个16×8的块形状。在这种情况下,16×16块形状的运动向量可被分配给所述两个块形状,或者,可预先设置对运动向量预测的运用并且在后面阶段的编码参数生成部分可计算运动向量。
编码参数集变换部分111从第一视频编码视频序列100的编码参数集102生成编码参数集105;编码参数集生成部分113利用第一视频编码视频序列的解码图像101和已编码的第二视频编码视频序列103生成用于第二视频编码视频序列的编码参数集。
例如,如果第一视频编码视频序列的图像类型为帧间编码,编码参数集部分主要生成用于帧间编码的编码参数,因而编码参数集生成部分生成不能由编码参数集变换部分生成的帧内编码参数集、跳跃(skip)以及直接预测数据。
对于帧间编码参数集,编码参数集生成部分进行运动向量预测并生成运动向量,该运动向量用于为利用编码参数集变换部分中的预测运动向量而设置了标记的部分。
图11示出了编码参数集选择部分112的处理流程。
编码参数集选择部分112从编码参数集变换部分111和编码参数集生成部分113获取用于变换的编码参数候选集105和104。具体地,编码参数集选择部分112获取由编码参数集变换部分111生成的帧间预测编码参数集105和由编码参数集生成部分113生成的帧间预测编码参数及其它编码参数104。
对编码参数候选的编码效率进行了评估。具体地,如果评估运动向量,则可采用SAD(绝对差别的总和)、R-D(速率失真),等等。
最后,提供最佳编码效率的编码参数集被选择作为应用于实际编码的参数集。
编码部分利用由编码参数集选择部分112选择的参数集对解码图像进行编码,生成第二视频编码视频序列,并输出该第二视频编码视频序列。
因而,依据第一实施例的视频编码视频序列变换装置基于相应宏块的编码参数,共同地设置作为用于宏块对的参数集的编码参数,以使编码参数可有效地重复使用而可以满足宏块对中编码参数上的限制条件,并且使得提高编码效率以及抑制图像质量劣化成为可能。
第二实施例图12是框图,其示出了第二实施例的视频编码视频序列变换装置。
依据第二实施例的视频编码视频序列变换装置与前面参照图1所述的依据第一实施例的视频编码视频序列变换装置的不同点在于,在解码部分110之后设置了分辨率变换部分120,其用于变换解码图像101的分辨率并且然后重新编码所述图像。
在第二实施例中,假定分辨率变换部分120将输入图像变换到更低分辨率。
在第二实施例中的编码参数集变换部分111中,与一个宏块对相对应的宏块的数目变为大于二。图13示出了在一个宏块对和与其对应的宏块之间的关系的具体实例。在图13的例子中,相应宏块301和302占据与宏块对300相对应的解码图像101的24个宏块。
为了确定地选择场结构作为宏块对的编码结构,编码参数集选择部分112可配置为当至少一个具有场结构的宏块被包括在相应宏块(MNUM>0)时,选择场结构作为宏块对的编码结构。
在第二实施例中,与第一实施例中图6中的处理不同,宏块对的编码结构是基于相应宏块的编码结构的数目确定的。图14示出了具体处理流程。
首先,提取对应于如图13所示的第二视频编码视频序列的宏块对300的第一视频编码视频序列的多个宏块(包含在由301和302所指示的区域内的多个相应宏块)并掌握宏块的编码结构(步骤S170)。
其次,对于相应宏块的编码结构,计算设置为场结构的宏块的数目MNUM1以及设置为帧结构的宏块的数目MNUM2(步骤S171)。
其次,比较设置为场结构的宏块的数目MNUM1和设置为帧结构的宏块的数目MNUM2(步骤S172)。如果设置为帧结构的宏块的数目MNUM2大于设置为场结构的宏块的数目MNUM1,则通过利用帧结构重新编码生成第二视频编码视频序列(步骤S173);如果设置为帧结构的宏块的数目MNUM2小于设置为场结构的宏块的数目MNUM1,则通过利用场结构重新编码生成第二视频编码视频序列(步骤S174)。
如果MNUM1与MNUM2相等,则通过利用场结构重新编码生成第二视频编码视频序列(步骤S174)。
如果MNUM1与MNUM2相等,对于每个宏块,可设置基于编码参数集的估计值,并且可以利用编码结构的估计值的总和来确定编码结构。每个宏块的代码量、代码量的乘积以及量化值等等均可用作为所述估计值。
上面描述了一种通过简单地比较设置为场结构的宏块的数目MNUM1和设置为帧结构的宏块的数目MNUM2来确定用于生成第二视频编码视频序列的编码结构的技术。
然而,可用这样的技术取代上述技术,在该技术中进行计算具有编码结构的每一个且对应于第二视频编码视频序列的宏块的相应面积;依照所述相应面积的每一个的比例设置估计值;以及确定宏块对的编码结构。如此实现的技术将在下面详细描述。
在此描述在水平(宽度)方向上进行图像变换的情形。
在如下描述中,如图18所示,4个宏块以a∶b的比例对应到一个宏块对。
在进行图像变换时,通过式(1)和式(2)得到关于场结构的估计值Vfield和关于帧结构的估计值Vframe。估计值Vfield和Vframe之间的比指示了宏块对中具有帧结构的宏块的面积与宏块对中具有场结构的宏块的面积之间的比。
Vfield=a·(Tfield(MB0)+Tfield(MB2))+b·(Tfield(MB1)+Tfield(MB3)) ...(1)Vframe=a·(Tframe(MB0)+Tframe(MB2))+b·(Tframe(MB1)+Tframe(MB3)) ...(2)在式(1)和式(2)中,MB0、MB1、MB2、MB3中的每一个表示图18所示的4个宏块的每一个的面积。式(1)和式(2)中的Tfield和Tframe为指示所述宏块的每一个的编码结构是否为场结构或帧结构的函数,由如下式(3)和式(4)定义Tfield(MBi)=1if MBi=fieldMB0else---(3)]]>Tframe(MBi)=1if MBi=frameMB0else---(4)]]>根据所述技术选择编码结构的处理如图19所示。
首先,提取对应于第二视频编码视频序列的宏块对的第一视频编码视频序列的多个宏块并且掌握该宏块的编码结构,如图19所示(步骤S180)。
其次,通过式(1)和式(2)得到关于场结构的估计值Vfield和关于帧结构的估计值Vframe(步骤S181)。
再次,比较通过式(1)和式(2)得到的Vfield和Vframe的值(步骤S182)。并且,在Vfield<Vframe成立的情况,通过利用帧结构重新编码来生成第二视频编码视频序列(步骤S183);在Vfield≥Vframe成立的情况,通过利用场结构重新编码来生成第二视频编码视频序列(步骤S184)。
当确定使用场结构还是帧结构时,为了选择使用场结构,可对Vfield的值进行加权。根据所述技术选择编码结构的处理如图20所示。
首先,如图20所示,提取对应于第二视频编码视频序列的宏块对的第一视频编码视频序列的多个宏块并且掌握所述宏块的编码结构(步骤S190)。
其次,通过式(1)和式(2)得到关于场结构的估计值Vfield和关于帧结构的估计值Vframe(步骤S191)。
再次,设置加权因子w的值(步骤S192),并且比较Vframe和由因子w加权的Vfield的值(步骤S193)。并且,在w·Vfield<Vframe成立的情况,通过利用帧结构重新编码来生成第二视频编码视频序列(步骤S194);遵在w·Vfield≥Vframe成立的情况,通过利用场结构重新编码来生成第二视频编码视频序列(步骤S195)。
为将被变换的视频编码视频序列的每一个设置加权因子w。可以为所述视频编码视频序列的每一个设置加权因子w的值为常数,或使之随视频编码视频序列自适应变化。
当自适应地变化加权因子w时,可以配置为基于图像分辨率的变换比例确定加权因子w,或者可以配置为基于在第一视频编码视频序列的比特率和第二视频编码视频序列的比特率之间的比来确定加权因子w。加权因子w的值可依照图像分辨率的变换比例为视频编码视频序列的每一个唯一设置,或依照关于相应宏块的信息(指示例如尺寸、分散以及代码量等的信息)以及关于图像的信息(指示例如图像类型和代码量的信息)自适应地改变。
第一种方法使用定值在此将描述设置加权因子w的第一种方法。
在第一种方法中,加权因子w被设置为定值,从而使得当对应于宏块对并具有场结构的宏块的比例超过预定比例α(其中0≤α≤1)时,选择场结构。加权因子w由下式(5)计算得到w=(1-α)/α ...(5)使用由式(5)得到的加权因子w,当对应于宏块对并具有场结构的宏块的比例超过预定比例α时,选择场结构。
第二种方法利用运动向量的距离接下来将描述设置加权因子w的第二种方法。在第二种方法中,基于用于场预测的运动向量中的对应于上部场的运动向量和对应于下部场的运动向量之间的差来确定加权因子w。
这里假定在对应于宏块对的宏块中存在具有场结构的宏块。
在场预测的宏块中,包括了对应于上部场的运动向量和对应于下部场的运动向量。并且,当在宏块中的两个向量之间的距离很大时,假定两个彼此具有相差的场存在于对应宏块中的可能性很大。这里可用欧氏距离来确定两个向量间的距离。
因此,通过依照在包含于相应宏块中的两个场预测的运动向量之间的距离自适应地改变加权值w,可为诸如MPEG-2的格式中的第一视频编码视频序列的状况适当地确定将要采用的编码结构。
在这种情况下,优选地计算构成整个图像的场结构的宏块的两个运动向量间的差,并基于计算的统计量为图像单元的每一个改变加权值w。
第三种方法利用比特率接下来将描述设置加权因子的第三种方法。在第三种方法中,基于比特率确定加权因子w。
当考虑MPEG-2中的帧预测和场预测时,可通过进行两个16×8的块的场预测来实现由16×16的块进行的帧预测所实现的运动补偿。
在这样做时,由于运动向量的增加,可能导致代码量增加。然而,优选地在变换后的比特率足够大以至于忽略运动向量的代码量的增加的情况下,确实地进行场预测,这是因为MPEG-2的第一视频编码视频序列的运动向量可得到有效使用。
然而,在变换后比特率很小并且宏块的头部中的代码量在比特流中的比例很大的情况下,运动向量的代码量可能对整个图像质量造成影响。
因此,通过依照在将要变换的第一视频编码视频序列的比特率和变换后得到的第二视频编码视频序列的比特率之间的比来改变用于场结构的加权因子w,可以提高图像质量。
可以为第一视频编码视频序列的流唯一设置加权因子w。对具有变化的比特率的流而言,可以为每个GOP(图像组)可变地设置加权因子w,或者依照每幅图像的代码量可变地设置加权因子w。
第四种方法利用活动性接下来将描述设置加权因子的第四种方法。在第四种方法中,基于视频编码视频序列的活动性确定加权因子w。
这里的“活动性”是指示将被编码的视频图像的信息量的数值。在视频图像变换中,活动性按照如下方式计算。
通过将宏块的代码量乘以量化步长值来计算每个宏块的活动性。通过将图像的平均量化步长值乘以图像的代码量来计算每个图像单元的活动性。
在第四种方法中,利用通过上述计算得到的活动性可变地设置加权因子w。在这样做时,依照与前述估计值Vfield和Vframe相同的面积的比例将场结构和帧结构的宏块的每一个的活动性的计算值求和,并且依照两个活动性值的比例设置加权因子w。
在估计值Vfield和Vframe彼此非常接近的情况下,可配置为,基于场结构的活动性和帧结构的活动性中大的一个来确定宏块对的编码结构。可依照每个图像单元的活动性为每个图像单元自适应地设置加权因子w。
可将视频编码视频序列变换装置配置为执行所述设置加权因子的方法中的任意一种,或者将其配置为执行多种方法的结合。
加权因子w可作为偏移量加到估计值Vfield,以取代前述的加权因子w与估计值Vfield的线性结合。例如,可配置为当Vframe>w+Vfield成立时选择帧结构,当Vframe≤w+Vfield成立时选择场结构。根据所述技术选择编码结构的处理如图21所示。
首先,如图21所示,提取对应于第二视频编码视频序列的宏块对的第一视频编码视频序列的多个宏块并且掌握该宏块的编码结构(步骤S200)。
其次,通过式(1)和式(2)得到关于场结构的估计值Vfield和关于帧结构的估计值Vframe(步骤S201)。
再次,设置加权因子w的值(步骤S202),比较Vframe和通过所述因子w加权的Vfield的值(步骤S203)。并且,在Vframe>w+Vfield成立的情况下,通过利用帧结构重新编码来生成第二视频编码视频序列(步骤S204);在Vframe≤w+Vfield成立的情况下,通过利用场结构重新编码来生成第二视频编码视频序列(步骤S205)。可以为每个视频编码视频序列将加权因子w的值设置为常数,或使之随视频编码视频序列自适应地变化,正如上面所详述的那样。
以上描述了图像分辨率被在水平(宽度)方向上变换以及4个宏块对应于一个宏块对的情况,如图18所示。然而,在图像分辨率在垂直(高度)方向或同时在水平和垂直两个方向上变换的情况下以及在多于4个宏块对应于一个宏块对的情况下,可通过获取具有帧结构或场结构的宏块的每一个的相应比例以及通过依照相应比例展开所述式(1)和式(2)来确定生成第二视频编码视频序列所用的编码结构。
接下来解释运动向量的变换。
当运动向量被变换时,在涉及分辨率变换的变换中存在多个运动向量候选,从而利用用于选择最佳运动向量的估计值来确定哪个运动向量适合。
例如,每个宏块的预测残差代码量、量化值、运动向量大小、预测残差与代码量的乘积都可作为估计值。
将运动向量缩放到与分辨率变换比率相一致。当运动向量被缩放后,可以利用第二视频编码视频序列的编码方式所支持的精度进行分段处理(fraction processing)。具体地,在缩放时发现所述的值具有1/4像素的精度,这是因为虽然MPEG-2中的运动向量精度为1/2像素,但H.264中的运动向量精度是1/4像素。
在第二实施例中,不同于第一实施例,在某些情况下不能以一一对应的方式变换运动补偿块的形状。由于伴随着分辨率变换,对应于宏块对的第一视频编码视频序列的宏块的尺寸变得相对较小,如果使用相应宏块中任意一个的块形状,则块形状变得过小并可能出现编码效率降低的情形。
然后,基于宏块对的编码结构预先确定运动补偿块形状。具体地,如果采用帧结构,则使用16×16的块形状;而如果采用场结构,则使用16×8的块形状。
所生成的块形状的数目不像第一实施例中那样限定为1。例如,可利用帧结构生成所述16×8的块形状,或者利用场结构生成所述16×16的块形状。
在最终变换中,遵照宏块对的结构为每一个相应的宏块如图2所示生成参数,并将其变换到用于第二视频编码视频序列的编码参数集,如第一解码部分、编码参数选择部分以及编码部分的处理如第一实施例中所述进行。
因而,依据第二实施例的视频编码视频序列变换装置基于相应宏块的编码参数,在包括了分辨率变换的变换中,整体地设置编码参数作为用于宏块对的参数集,从而使得编码参数可被有效地重复使用同时满足了宏块对中编码参数上的限制条件,以及有望进一步减小代码量。
第三实施例下面结合图15到图17讨论依据第三实施例的视频编码视频序列变换装置的配置和操作。图15是框图,其示出了依据所述第三实施例的视频编码视频序列变换装置。
在根据所述第三实施例的视频编码视频序列变换装置中,输入以MPEG2编码的第一视频编码视频序列500,并输出以H.264再次编码的第二视频编码视频序列503。
MPEG2解码器510对第一视频编码视频序列500进行解码,输出解码图像501,并且还输出每个解码图像的编码参数集(502的上段),其包括图像类型(I图像、P图像或B图像之一)、用于指示代码序列是否仅为逐行图像的编码(逐行序列)或包含隔行图像的编码数据的标记、图像结构(逐行帧图像、隔行帧图像、场图像),等等。图像类型设置部分522在进行H.264重新编码时确定在图像层次的编码结构。
图16示出了依据所述第三实施例的图像类型设置部分522的操作实例。如果MPEG2编码数据被编码为逐行序列,那么对应的每一帧被再次编码为H.264中的逐行帧图像。
如果MPEG2编码数据不是逐行序列,那么MPEG2帧图像被再编码为H.264MB-AFF帧图像,且MPEG2场图像被再编码为H.264场图像。MPEG2中编码图像类型为I图像的图像被再编码为仅由H.264中I片(slice)形成的参考图像;MPEG2中编码图像类型为B图像的图像被再编码为仅由H.264中B片形成的非参考图像。
进一步,如果MPEG2 P图像包含在MPEG2中规定的双主(dual-prime)预测(从两个前向场的参考图像中割出预测图像块并以作为预测图像的平均值进行图像间预测编码的模式),则该MPEG2 P图像被再编码为仅由H.264中的B片形成的参考图像。
如果MPEG2 P图像不包含双主预测,其被再编码为仅由H.264中的P片形成的参考图像。提供了上述的图像层次对应关系,由此,将很容易提供在MPEG2中宏块单元中的帧间预测结构与H.264中宏块单元中的帧间预测结构之间的对应关系,改进宏块单元中运动向量的可复用性、预测模式,等等,并且使得显著减小在H.264重新编码时的计算成本(计算量或硬件成本)成为可能。
图17示出了图像类型设置部分522的另一个例子。在图17的例子中,与图16中的例子的不同之处在于,每幅MPEG2 P图像被再编码为仅由H.264中的P片形成的参考图像而无论MPEG2 P图像是否包含双主预测。在MPEG2P图像中,仅当在P图像与其参考图像之间的再现次序中不包含B图像时,双主预测才可用,而且,除非检测了图像中所有宏块的预测模式,否则不能确定MPEG2的P图像是否包含双主预测。
因此,在从MPEG2到H.264的重新编码中,至少一帧的延迟是必需的,这导致该延迟所需的缓冲内存的增加以及与重新编码相伴的时滞。
另一方面,双主预测是为了进行过去两个场的平均预测,因而在H.264的P片中就不可能进行类似的图像间预测。如果MPEG2中的所有P图像均被再编码为H.264的B片,则用于表示H.264的B片的预测块单元中的预测模式的编码数据的管理费用(overhead)等增加,导致编码效率降低。
为解决这些问题,在利用MPEG2中的双主预测的宏块中,采用过去两个场的参考图像的仅利用在时间上靠近将被编码的图像的参考场的简单预测,并且在H.264中进行重新编码,由此使得重复使用运动向量信息在H.264的P片中对MPEG2 P图像的所有宏块进行重新编码成为可能。因此,在重新编码时间上的延迟问题和预测结构的可复用性问题均可得到解决,亦可抑制在H.264重新编码时间上的计算成本的增加,而且,还可能阻止重新编码中编码效率的降低。
接下来,将讨论图15中视频编码视频序列变换装置在宏块单元中的操作。
从第一视频编码视频序列500的宏块单元的编码参数集提取量化标度值和宏块单元(502的中段)的代码量,并将其输入到速率控制部分523,在H.264重新编码中的宏块单元中的产生的代码量也被反馈到速率控制部分523并被用于控制在H.264重新编码时的代码量。
为了控制在重新编码时的代码量,并非必须输入第一视频编码视频序列500中的编码信息;然而,利用MPEG2编码数据中的信息,可以使得预先记住宏块单元中的编码特性以及以较小的图像质量劣化实现有效的速率控制成为可能。
运动向量的信息,如MPEG2标准中定义的运动补偿模式(帧预测、场预测、双主预测,等等)、DCT类型(帧DTC或场DTC),等等,被从第一视频编码视频序列500的宏块单元的编码参数集中提取出来并被输入到编码参数变换部分520。如果编码参数直接兼容于H.264,可以在重新编码时对其完整地重复使用。
例如,如果在MPEG2中编码为逐行序列,在H.264中的运动补偿块尺寸就被设置为16×16像素,由此MPEG2运动向量即可被完整地使用。
如果在MPEG2中编码为场图像,运动向量可完整地以MPEG2中的16×16场预测模式用作H.264中的16×16预测,同样可完整地以MPEG2中的16×8场预测模式用作H.264中的16×8图像间预测。
对于MPEG2中的双主预测,为了重新编码为上述的H.264中的B片,运动向量可被完整地重复使用;为了重新编码为H.264中的P片,仅采用来自靠近将被编码的图片的参考场的简单预测,由此使得重复使用运动向量成为可能。
如果MPEG2编码参数与H.264在MB-AFF对类型等中并不直接兼容,如在第一或第二实施例中所述,编码参数变换部分520对MPEG2编码参数进行适当地变换,进一步,在帧/场设置部分521中设置在H.264重新编码时的宏块对单元的编码结构为帧结构或是场结构,以用于在H.264重新编码中的重复使用。
更具体地,MPEG2中的I图像被再编码为H.264中仅由I片组成的图像,并且如果帧DTC和场DCT在MPEG2的I图像中混合存在,则重新编码为MB-AFF帧。
如果与H.264宏块对相对应的MPEG2宏块集被编码为相同的DTC类型,则根据该类型确定宏块对类型(帧对或场对)。如果帧DTC和场DCT混和,宏块对类型被确定为帧对。
根据已确定的宏块对类型,帧内预测编码部分525为每个宏块从帧内预测模式(帧内4×4预测(最多9个模式)、帧内8×8预测(最多9个模式)、帧内16×16预测(最多4个模式))中选出最佳预测模式集并进行重新编码。
所述最佳预测模式可由利用预测误差信号的绝对差的总和的估计值的确定来确定,或者由基于速率失真优化技术的模式确定来确定,所述速率失真优化技术利用了每个模式中的生成的代码量或其估计值以及编码失真或其估计值。
仅从前述MPEG2编码信息预先确定MB-AFF对类型,由此,不再需要在H.264重新编码中再次确定最佳对类型的处理,这也使得显著减小重新编码时的计算成本(计算量或硬件成本)成为可能。
对于MPEG2中的P图像或B图像,对于使用了图像间预测编码的宏块而言,运动向量再搜索部分524按照需要在以从MPEG2编码数据中提取并按照需要被适当地变换的运动向量为中心的小范围内再次搜索运动向量。
在MPEG2中,通常采用具有1/2象素精度的运动向量;在H.264中,通常采用具有1/4精度的运动向量。因此,在本实施例中,运动向量再搜索部分所再次搜索的运动向量至少在搜索中心±0.25的邻近范围内。
为了提高重新编码时的编码效率,具有1/2像素精度的搜索中心被取到整数像素位置,并且搜索在搜索中心±1.75的邻近范围内进行,由此可能确定更合适的运动向量。
由于用于MPEG2中的小数像素位置预测的补偿滤波器与小数像素补偿滤波器在特性上不同,从MPEG2中具有1/2像素精度的运动向量得到的搜索中心并不必然是最佳位置。被取为整数像素位置的运动向量搜索中心相对于具有整数精度的运动向量的最佳值有±1个像素的误差,并且进一步,补偿滤波器的效应在±0.75像素的范围内波动,并且因此,搜索在距离被取为整数像素位置的搜索中心±1.75像素的范围内进行,由此可能找到合适的运动向量。因此,可能在±1.75像素的小区域的重新搜索中检测出用于能够给出高编码效率的H.264重新编码的运动向量,并且也可能同时减小重新编码的成本以及提高编码效率。
进一步,提供了运动向量重新搜索的结果,并且帧内预测编码部分525为每个宏块从帧内预测模式(帧内4×4预测(最多9个模式)、帧内8×8预测(最多9个模式)、帧内16×16预测(最多4个模式))中选出最佳预测模式集;并且跳跃/直接编码部分526进行H.264图像间预测模式中的预测编码,即P片中的H.264 P_Skip(P跳跃)模式或B片中的H.264直接模式,从而无需对任何运动向量进行编码便可提供高编码效率。从其中,宏块编码模式确定部分512为每个宏块选择能够提供最高编码效率的编码模式。
对于MPEG2中P图像或B图像中的帧内编码宏块,图像间预测部分527利用H.264规定的运动向量预测编码中的预测向量或者以预测向量为搜索中心进行重新搜索找到的运动向量来进行预测编码。其输出被用作为图像间编码模式候选。
根据已述的结构,可以从提供高编码效率具有大量预测模式的H.264帧内编码、提供高编码效率的图像间预测的P_Skip或直接预测,以及运动向量重新搜索的结果中选择所述最佳模式,该结果是在适当范围内利用MPEG2运动向量而无论宏块编码模式是MPEG2中P图像或B图像的帧内编码还是图像间预测编码而得到的,由此,在抑制计算成本的同时能够显著提高重新编码时的编码效率。
为了减小编码模式确定的处理成本,当从H.264帧内预测模式中或在运动向量重新搜索时选择最佳模式时,根据诸如预测残留信号的绝对差的总和等的具有小计算量的估计值来进行模式确定,并且在最后阶段的宏块层次的模式确定时,根据基于生成的代码量和编码失真的速率失真优化成本的估计值或基于估计的生成的代码量和估计的编码失真的编码成本来进行高度精确的模式确定,由此,可能在抑制计算量增加的同时选择更优的编码模式并提高编码效率。
最后,H.264 CABAC(基于上下文的自适应二进制算术编码)编码部分528利用选择的编码模式生成H.264比特流。
也可利用例如通用计算机作为基本硬件来实现视频编码视频序列变换装置。
即,解码部分、编码参数变换部分、编码参数选择部分和编码部分可以作为安装在计算机中以执行程序的处理器来实现。此时,视频编码视频序列变换装置可被实现为预先安装在计算机中的程序,或者被实现为存储在诸如CD-ROM的存储介质上或通过网络分发以及在必要时可安装在计算机中的程序。解码部分、编码参数变换部分、编码参数选择部分和编码部分可利用存储器、硬盘或诸如CD-R、CD-RW、DVD-RAM或DVD-R的安装在计算机内部或外部的任何其它存储介质来适当地实现。
可以理解的是本发明并不限于上述的具体实施例,在不背离本发明的精神和范围的情况下,亦可通过组成部分的变型来实施本发明。根据公开于上述实施例中的组成部分的适当组合,本发明可被实施为不同的形式。例如,某些组成部分可从实施例中所示的所有组成部分中删除。此外,不同实施例中的组成部分可适当地组合使用。
依据本发明第一方面的视频编码视频序列变换方法可表述为具有任何如下结构或特征的那些方法(1)一种编码视频序列变换装置,其用于将通过在宏块单元中对隔行扫描的视频信号进行压缩编码而提供的第一比特流变换为基于在所述宏块单元中受到压缩编码的编码方式的第二比特流,所述编码视频序列变换装置包括解码部分,其对第一代码串进行解码以提供解码图像和第一编码参数集;编码参数集变换部分,其对于与在所述解码图像的垂直方向上彼此相邻的所述第二比特流相关的宏块的每一对,将相应宏块的每一个的所述第一编码参数集进行变换以找到变换编码参数集,所述宏块涉及相应于所述解码图像上各对的所述第一比特流;编码参数集选择部分,其选择相对于所述对找到的所述变换编码参数集作为所述对的所述宏块的每一个的第二编码参数集;以及编码部分,其利用由所述编码参数集选择部分选择的所述第二编码参数集进行对所述解码图像的压缩编码以产生所述第二比特流。
(2)根据(1)所述的编码视频序列变换装置,进一步包括编码参数集生成部分,其利用所述解码图像或所述已产生的第二比特流生成编码参数候选集,其中,所述编码参数集选择部分从所述编码参数候选集和所述变换编码参数集中选择所述对的所述宏块的每一个的所述第二编码参数集。
(3)根据(1)所述的编码视频序列变换装置,其中,所述第一编码参数集包括以下至少之一编码结构信息,其指示所述宏块的编码结构为场结构和帧结构中的哪一个;预测类型信息,其指示所述宏块的预测类型;以及DCT类型信息,其指示所述宏块的DCT类型,其中,所述第二编码参数集和所述变换编码参数集包含指示所述宏块的所述DCT类型的DCT类型信息,以及其中,所述编码参数集变换部分基于以下至少之一设置所述变换编码参数集的所述编码结构信息所述相应宏块的编码结构信息;所述相应宏块的预测类型信息;以及所述相应宏块的DCT类型信息。
(4)根据(3)所述的编码视频序列变换装置,其中,所述编码参数集变换部分包括提取部分,其提取对应于各所述对的每个所述相应宏块的所述第一编码参数集的所述编码结构信息;比较部分,关于由所述提取部分提取的各所述对的所述编码结构信息,比较具有指示场结构的值的所述相应宏块的数目与具有指示帧结构的值的所述相应宏块的数目;以及设置部分,当所述比较部分的比较结果为所述数目相等时,在所述对的每个宏块的所述编码结构信息中设置指示所述场结构的值;当具有指示场结构的值的所述相应宏块的数目大于具有指示帧结构的值的所述相应宏块的数目时,在所述对的每个宏块的所述编码结构信息中设置指示所述场结构的值;以及,当具有指示帧结构的值的所述相应宏块的数目大于具有指示场结构的值的所述相应宏块的数目时,在所述对的每个宏块的所述编码结构信息中设置指示所述帧结构的值。
(5)根据(3)所述的编码视频序列变换装置,其中,所述编码参数集变换部分包括提取部分,其提取对应于各所述对的每个所述相应宏块的所述第一编码参数集的所述编码结构信息;确定部分,关于由所述提取部分提取的各所述对的所述编码结构信息,确定是否存在具有指示场结构的值的所述相应宏块;以及设置部分,当具有指示所述场结构的值的所述相应宏块存在时,在所述对的每个所述相应宏块的所述编码结构信息中设置指示所述场结构的值;当所有所述相应宏块均具有指示所述帧结构的值时,在所述对的每个所述宏块的所述编码结构信息中设置指示所述帧结构的值。
(6)根据(3)所述的编码视频序列变换装置,其中,所述编码参数集变换部分包括提取部分,其提取对应于各所述对的每个所述相应宏块的所述第一编码参数集的所述编码结构信息;估计值计算部分,其根据所述第一编码参数集的所述编码结构信息的值对对应于各所述对的所述相应宏块进行分类,并且利用属于所述分类的所述相应宏块的所述第一编码参数集找到各分类的估计值;以及设置部分,其响应于所述估计值,设置各所述对的各所述宏块的所述编码结构信息。
(7)根据(6)所述的编码视频序列变换装置,其中,所述编码参数集变换部分进一步包括比较部分,关于由所述提取部分提取的各所述对的所述编码结构信息,比较具有指示场结构的值的所述相应宏块的数目和具有指示帧结构的值的所述相应宏块的数目,其中,所述编码参数集变换部分的所述设置部分,在所述比较部分的比较结果为所述数目相等时,在所述对的各所述宏块的所述编码结构信息中设置指示所述场结构的值;在所述数目不同时,在所述对的各所述宏块的所述编码结构信息中设置指示更高估计值的所述宏块的所述编码结构的值。
(8)根据(6)所述的编码视频序列变换装置,其中,所述编码参数集变换部分中的所述估计值计算部分进行计算具有所述场结构和所述帧结构并且对应于所述第二视频编码视频序列的所述宏块的相应面积;以及依照所述计算的相应面积计算具有所述场结构和所述帧结构的每个所述宏块的估计值。
(9)根据(6)所述的编码视频序列变换装置,其中,所述编码参数集变换部分的所述设置部分,当具有场结构的所述相应宏块的所述估计值不小于具有帧结构的所述相应宏块的所述估计值时,在所述对的各所述宏块的所述编码结构信息中设置指示所述场结构的值;否则,在所述对的各所述宏块的所述编码结构信息中设置指示所述帧结构的值。
(10)根据(6)所述的编码视频序列变换装置,其中,所述编码参数集变换部分的所述设置部分,当通过利用预定的加权因子对具有场结构的所述相应宏块的所述估计值进行调整而得到的值不小于具有帧结构的所述相应宏块的所述估计值时,在各所述对的各所述宏块的所述编码结构信息中设置指示所述场结构的值;否则,在所述对的各所述宏块的所述编码结构信息中设置指示所述帧结构的值。
(11)根据(10)所述的编码视频序列变换装置,其中,所述编码参数集变换部分的所述设置部分唯一地调整所述加权值,或者依照包含在将被变换的所述第一比特流中的编码信息和已变换的比特流的编码信息自适应地调整所述加权值。
(12)根据(1)所述的编码视频序列变换装置,其中,所述第一编码参数集、所述第二编码参数集和所述变换编码参数集包含指示所述宏块的编码结构为场结构和帧结构中的哪一个的编码结构信息,其中,所述编码参数集变换部分包括编码结构信息比较部分,其比较所述对的各所述宏块的所述编码结构信息和每个所述相应宏块的所述编码结构信息;以及编码结构信息变换部分,对相对于所述对所述编码结构信息不同的所述相应宏块中包含的所述第一编码参数集进行变换,使之与所述对的各所述宏块的所述编码结构一致。
(13)根据(12)所述的编码视频序列变换装置,其中,所述编码结构信息变换部分执行变换以对相对于所述对所述编码结构信息不同的所述相应宏块中包含的运动向量进行缩放,使之在时间轴上一致。
(14)根据(2)所述的编码视频序列变换装置,其中,所述编码参数集生成部分生成的所述编码参数候选集包括关于帧间编码的信息;关于宏块跳跃的信息;以及关于直接预测编码的信息。
(15)根据(2)所述的编码视频序列变换装置,其中,所述第一编码参数集包括在所述第一比特流中指示每个所述相应宏块被帧间编码或被帧内编码的预测类型信息,其中,所述编码参数集生成部分包括计算单元,关于所述相应宏块的帧内编码的宏块,在所述第二比特流的所述宏块周围,从已受到压缩编码的所述第二比特流的所述宏块的运动向量信息计算运动向量预测值;以及设置单元,其将关于所述相应宏块的所述帧内编码的宏块的所述计算的运动向量预测值设置为所述宏块的编码参数候选。
(16)根据(2)所述的编码视频序列变换装置,其中,所述编码参数集选择部分基于利用所述编码参数候选集和所述变换编码参数集生成的预测误差信号的绝对差的总和来选择编码参数集。
(17)根据(2)所述的编码视频序列变换装置,其中,所述编码参数集选择部分基于当利用所述编码参数候选集和所述变换编码参数集进行压缩编码时的速率失真特性来选择编码参数集。
(18)根据(2)所述的编码视频序列变换装置,其中,所述编码参数集选择部分基于当利用所述编码参数候选集和所述变换编码参数集进行压缩编码时的生成的代码量来选择编码参数集。
(19)根据(1)所述的编码视频序列变换装置进一步包括分辨率变换部分,其对包含在所述第一比特流中的图像的分辨率进行变换。
(20)一种编码视频序列变换方法,用于将通过在宏块单元中对隔行扫描的视频信号进行压缩编码而提供的第一比特流变换到基于在所述宏块单元中受到压缩编码的编码方式的第二比特流,所述方法包括解码步骤,对第一代码串进行解码以提供解码图像和第一编码参数集;编码参数集变换步骤,对于在所述解码图像垂直方向上彼此相邻的所述第二比特流的宏块的对,对与所述解码图像上的所述对相对应的所述第一比特流的相应宏块的每一个的所述第一编码参数集进行变换以找到变换编码参数集;编码参数集选择步骤,选择相对于所述对找到的所述变换编码参数集作为所述对的所述宏块的每一个的第二编码参数集;以及编码步骤,利用在所述编码参数集选择步骤选择的所述第二编码参数集进行对所述解码图像的压缩编码以产生所述第二比特流。
(21)根据(20)所述的编码视频序列变换方法,进一步包括编码参数集生成步骤,利用所述解码图像和所述已生成的第二比特流生成编码参数候选集,其中,在所述编码参数集选择步骤,从所述编码参数候选集和所述变换编码参数集中选择所述对的所述宏块的每一个的所述第二编码参数集。
正如上面参照实施例所描述的,根据本发明,基于第一视频编码视频序列中的相应宏块的编码参数集将编码参数完整地设置为第二视频编码视频序列中的宏块对的集,由此,可以在满足宏块对中的编码参数上的限制条件的同时,有效地重复使用编码参数,并且也可以提高编码效率和抑制图像质量劣化。
为了说明和描述的需要,前面已进行了对实施例的叙述。但其并不意味着已将本发明表述无遗,也不表示本发明限于已公开的确切形式,并且根据上述技术内容能够得到修改和变型,这种修改和变型亦可由本发明的实践获得。前面已选择和描述了实施例,其目的是为了解释本发明的原理和实际应用程序,以使本领于技术人员能在不同的实施例中运用本发明,并可以进行适合预期的特定应用的各种修改。需要明确的是,本发明的范围由所附权利要求及其等效内容所定义。
权利要求
1.一种编码视频序列变换装置,其用于将通过在宏块单元中对隔行扫描的视频信号进行压缩编码而提供的第一比特流变换为基于在所述宏块单元中受到压缩编码的编码方式的第二比特流,所述编码视频序列变换装置包括解码部分,其对第一代码串进行解码以提供解码图像和第一编码参数集;编码参数集变换部分,其对于与在所述解码图像的垂直方向上彼此相邻的所述第二比特流相关的宏块的每一对,将相应宏块的每一个的所述第一编码参数集进行变换以找到变换编码参数集,所述宏块涉及相应于所述解码图像上各对的所述第一比特流;编码参数集选择部分,其选择相对于所述对找到的所述变换编码参数集作为所述对的所述宏块的每一个的第二编码参数集;以及编码部分,其利用由所述编码参数集选择部分选择的所述第二编码参数集进行对所述解码图像的压缩编码以产生所述第二比特流。
2.根据权利要求1所述的编码视频序列变换装置,进一步包括编码参数集生成部分,其利用所述解码图像或所述已产生的第二比特流生成编码参数候选集,其中,所述编码参数集选择部分从所述编码参数候选集和所述变换编码参数集中选择所述对的所述宏块的每一个的所述第二编码参数集。
3.根据权利要求1所述的编码视频序列变换装置,其中,所述第一编码参数集包括以下至少之一编码结构信息,其指示所述宏块的编码结构为场结构和帧结构中的哪一个;预测类型信息,其指示所述宏块的预测类型;以及DCT类型信息,其指示所述宏块的DCT类型,其中,所述第二编码参数集和所述变换编码参数集包含指示所述宏块的所述DCT类型的DCT类型信息,以及其中,所述编码参数集变换部分基于以下至少之一设置所述变换编码参数集的所述编码结构信息所述相应宏块的编码结构信息;所述相应宏块的预测类型信息;以及所述相应宏块的DCT类型信息。
4.根据权利要求3所述的编码视频序列变换装置,其中,所述编码参数集变换部分包括提取部分,其提取对应于各所述对的每个所述相应宏块的所述第一编码参数集的所述编码结构信息;比较部分,关于由所述提取部分提取的各所述对的所述编码结构信息,比较具有指示场结构的值的所述相应宏块的数目与具有指示帧结构的值的所述相应宏块的数目;以及设置部分,当所述比较部分的比较结果为所述数目相等时,在所述对的每个宏块的所述编码结构信息中设置指示所述场结构的值;当具有指示场结构的值的所述相应宏块的数目大于具有指示帧结构的值的所述相应宏块的数目时,在所述对的每个宏块的所述编码结构信息中设置指示所述场结构的值;以及,当具有指示帧结构的值的所述相应宏块的数目大于具有指示场结构的值的所述相应宏块的数目时,在所述对的每个宏块的所述编码结构信息中设置指示所述帧结构的值。
5.根据权利要求3所述的编码视频序列变换装置,其中,所述编码参数集变换部分包括提取部分,其提取对应于各所述对的每个所述相应宏块的所述第一编码参数集的所述编码结构信息;确定部分,关于由所述提取部分提取的各所述对的所述编码结构信息,确定是否存在具有指示场结构的值的所述相应宏块;以及设置部分,当具有指示所述场结构的值的所述相应宏块存在时,在所述对的每个所述相应宏块的所述编码结构信息中设置指示所述场结构的值;当所有所述相应宏块均具有指示所述帧结构的值时,在所述对的每个所述宏块的所述编码结构信息中设置指示所述帧结构的值。
6.根据权利要求3所述的编码视频序列变换装置,其中,所述编码参数集变换部分包括提取部分,其提取对应于各所述对的每个所述相应宏块的所述第一编码参数集的所述编码结构信息;估计值计算部分,其根据所述第一编码参数集的所述编码结构信息的值对对应于各所述对的所述相应宏块进行分类,并且利用属于所述分类的所述相应宏块的所述第一编码参数集找到各分类的估计值;以及设置部分,其响应于所述估计值,设置各所述对的各所述宏块的所述编码结构信息。
7.根据权利要求6所述的编码视频序列变换装置,其中,所述编码参数集变换部分进一步包括比较部分,关于由所述提取部分提取的各所述对的所述编码结构信息,比较具有指示场结构的值的所述相应宏块的数目和具有指示帧结构的值的所述相应宏块的数目,其中,所述编码参数集变换部分的所述设置部分,在所述比较部分的比较结果为所述数目相等时,在所述对的各所述宏块的所述编码结构信息中设置指示所述场结构的值;在所述数目不同时,在所述对的各所述宏块的所述编码结构信息中设置指示更高估计值的所述宏块的所述编码结构的值。
8.根据权利要求6所述的编码视频序列变换装置,其中,所述编码参数集变换部分中的所述估计值计算部分进行计算具有所述场结构和所述帧结构并且对应于所述第二视频编码视频序列的所述宏块的相应面积;以及依照所述计算的相应面积计算具有所述场结构和所述帧结构的每个所述宏块的估计值。
9.根据权利要求6所述的编码视频序列变换装置,其中,所述编码参数集变换部分的所述设置部分,当具有场结构的所述相应宏块的所述估计值不小于具有帧结构的所述相应宏块的所述估计值时,在所述对的各所述宏块的所述编码结构信息中设置指示所述场结构的值;否则,在所述对的各所述宏块的所述编码结构信息中设置指示所述帧结构的值。
10.根据权利要求6所述的编码视频序列变换装置,其中,所述编码参数集变换部分的所述设置部分,当通过利用预定的加权因子对具有场结构的所述相应宏块的所述估计值进行调整而得到的值不小于具有帧结构的所述相应宏块的所述估计值时,在各所述对的各所述宏块的所述编码结构信息中设置指示所述场结构的值;否则,在所述对的各所述宏块的所述编码结构信息中设置指示所述帧结构的值。
11.根据权利要求10所述的编码视频序列变换装置,其中,所述编码参数集变换部分的所述设置部分唯一地调整所述加权值,或者依照包含在将被变换的所述第一比特流中的编码信息和已变换的比特流的编码信息自适应地调整所述加权值。
12.根据权利要求1所述的编码视频序列变换装置,其中,所述第一编码参数集、所述第二编码参数集和所述变换编码参数集包含指示所述宏块的编码结构为场结构和帧结构中的哪一个的编码结构信息,其中,所述编码参数集变换部分包括编码结构信息比较部分,其比较所述对的各所述宏块的所述编码结构信息和每个所述相应宏块的所述编码结构信息;以及编码结构信息变换部分,对相对于所述对所述编码结构信息不同的所述相应宏块中包含的所述第一编码参数集进行变换,使之与所述对的各所述宏块的所述编码结构一致。
13.根据权利要求12所述的编码视频序列变换装置,其中,所述编码结构信息变换部分执行变换以对相对于所述对所述编码结构信息不同的所述相应宏块中包含的运动向量进行缩放,使之在时间轴上一致。
14.根据权利要求2所述的编码视频序列变换装置,其中,所述编码参数集生成部分生成的所述编码参数候选集包括关于帧间编码的信息;关于宏块跳跃的信息;以及关于直接预测编码的信息。
15.根据权利要求2所述的编码视频序列变换装置,其中,所述第一编码参数集包括在所述第一比特流中指示每个所述相应宏块被帧间编码或被帧内编码的预测类型信息,其中,所述编码参数集生成部分包括计算单元,关于所述相应宏块的帧内编码的宏块,在所述第二比特流的所述宏块周围,从已受到压缩编码的所述第二比特流的所述宏块的运动向量信息计算运动向量预测值;以及设置单元,其将关于所述相应宏块的所述帧内编码的宏块的所述计算的运动向量预测值设置为所述宏块的编码参数候选。
16.根据权利要求2所述的编码视频序列变换装置,其中,所述编码参数集选择部分基于利用所述编码参数候选集和所述变换编码参数集生成的预测误差信号的绝对差的总和来选择编码参数集。
17.根据权利要求2所述的编码视频序列变换装置,其中,所述编码参数集选择部分基于当利用所述编码参数候选集和所述变换编码参数集进行压缩编码时的速率失真特性来选择编码参数集。
18.根据权利要求2所述的编码视频序列变换装置,其中,所述编码参数集选择部分基于当利用所述编码参数候选集和所述变换编码参数集进行压缩编码时的生成的代码量来选择编码参数集。
19.根据权利要求1所述的编码视频序列变换装置进一步包括分辨率变换部分,其对包含在所述第一比特流中的图像的分辨率进行变换。
20.一种编码视频序列变换方法,用于将通过在宏块单元中对隔行扫描的视频信号进行压缩编码而提供的第一比特流变换到基于在所述宏块单元中受到压缩编码的编码方式的第二比特流,所述方法包括解码步骤,对第一代码串进行解码以提供解码图像和第一编码参数集;编码参数集变换步骤,对于在所述解码图像垂直方向上彼此相邻的所述第二比特流的宏块的对,对与所述解码图像上的所述对相对应的所述第一比特流的相应宏块的每一个的所述第一编码参数集进行变换以找到变换编码参数集;编码参数集选择步骤,选择相对于所述对找到的所述变换编码参数集作为所述对的所述宏块的每一个的第二编码参数集;以及编码步骤,利用在所述编码参数集选择步骤选择的所述第二编码参数集进行对所述解码图像的压缩编码以产生所述第二比特流。
21.根据权利要求20所述的编码视频序列变换方法,进一步包括编码参数集生成步骤,利用所述解码图像和所述已生成的第二比特流生成编码参数候选集,其中,在所述编码参数集选择步骤,从所述编码参数候选集和所述变换编码参数集中选择所述对的所述宏块的每一个的所述第二编码参数集。
全文摘要
解码部分从第一视频编码视频序列产生解码图像和编码参数集。编码参数集变换部分首先基于相应宏块的编码结构为上宏块和下宏块的对设置编码结构,并且基于所述编码结构变换诸如运动向量的剩余参数。编码参数集生成部分生成帧内编码参数等的编码参数,编码参数集选择部分选出最佳参数集,以及编码部分进行重新编码处理。
文档编号H04N7/32GK1801945SQ20061000051
公开日2006年7月12日 申请日期2006年1月9日 优先权日2005年1月7日
发明者岩田达明, 古藤晋一郎, 浅野涉, 儿玉知也 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1