用于降低分辨率划分的方法和装置的制作方法

文档序号:7678547阅读:137来源:国知局

专利名称::用于降低分辨率划分的方法和装置的制作方法
技术领域
:本发明总体上涉及视频编码和解码,更具体地,涉及用于降低分辨率戈廿分(reducedresolutionpartitioning)白勺方法禾口装置。
背景技术
:现有技术的视频编码器采用自适应块划分(adaptiveblockpartitioning),以最佳地分类可视化信号(visualdata)用于高效编码。为达到此目的,大多数编码算法在给定尺寸的均匀网格的多个块(宏块)上对每帧进行划分,然后基于视频数据,这些算法进一步将每个块划分为更小的划分以最佳地适应于视频数据。这种方法的固有局限性是,在现有标准(例如国际标准化组织/国际电工委员会(ISO/IEC)的运动图像专家组(MPEG-4)第十部分高级视频编码(AVC)标准/国际电信联盟远程通信标准化组(ITU-T)的H.264(下文称为"MPEG-4AVC标准"))中,来q初始网格的块的尺寸固定并且独立于编码的内容的类型。根据内容,即视频分辨率和/或所需压縮,初始网格预定的块尺寸可能是适当的。但是,在大多数情况下,有许多情形是此初始网格预定块尺寸将限制最大的可能获得的效率。事实上,大于初始网格块尺寸的信号结构(例如具有相似或相同运动的区域)不能被识别并联合编码。通常,这种将较大区域用于编码的方法n了能对于以低和/或中速率编码高分辨率内容有利。事实上,人们希望找到用于尽可能大的区域的最佳的失真编码成本优化的压縮方法,以尽可能地减小可能的信号冗余性。作为一种可能的解决方案,人们可能决定只是简单地在需要时对于用于初始化树型帧划分的初始块设置较大的尺寸。因此,如之前在MPEG-4AVC标准中提议的那样,这将等同于最终加倍了块模式的尺寸。但是,这意味着最小的块尺寸被丢失,并因此降低了对于非常小的细节的自适应能力被降低。除了加倍块模式的尺寸之外(下文称作"第一情况"),另外一种可能性是也增加"编码树"的深度(下文称作"第二情况")。在上述两种情况的任何一个中,产生的一个主要问题是编码和解码体系需要随着主要变换一起变化以使其能够适应新的初始块尺寸。因此,当需要不同族的块尺寸时,这将要求编码/解码系统的完全重新设计。另外,在第二情况中,小尺寸块编码模式也许在信息成本方而处于劣势,在不能受益于最大引入划分的低分辨率层序(resolutionsequence)中具有负面影响。事实上,在用于大范围的分辨率的"通用"编码器中,人们感兴趣的是,在需要时能够使用另外的帧划分类型,而在不需要时不用考虑以节省比特。这需要一种灵活的方式来允许和禁止某种帧划分尺寸。不同块划分尺寸的使用已经被逐渐引入视频编码方法中以获得高效率的压縮。首先,视频标准和/或推荐性标准,例如国际电信联盟远程通信标准化组(ITU-T)的H.263推荐性标准(下文称为"H.263推荐性标准")之前的视频标准和/或推荐性标准,大多数使用基于单一尺寸的帧划分(即,通常釆用16x16的块尺寸)。H.263推荐性标准中引入了自适应帧划分以增加压縮效率(除了16xl6的块之外还可以考虑8X8的块)。基于划分的树结构组来引入划分。自适应的、基于树结构的帧划分在MPEG-4AVC标准中通过大量可能的划分组16x16、16x8、8x16、8x8、8x4、4x8、4x4而得到巩同。在某些情况下,需要使用比16xl6更大的块以按照-种更冇效率的方式"打包"和编码信息。一种实现此目的的方法采用了第.种现有技术的方法,其中根据需要通过加倍所有可能的划分的尺寸最终使用帧的减小分辨率划分。例如,根据第一种现有技术的方法,MPEG-4AVC中的全部16x16和8x8模式将被修改从而使其分别以32x32和16xl6模式工作。这种方法具有两个主要的问题。第一个问题是编码器和解码器的实现通常需要重新设计以应对这种结构改变。第二个问题是,划分分辨率(partitionresolution)中产生了损耗。从原始的基于树结构的划分(例如通过MPEG-4AVC产生的划分)产生任意形状划分的更通用的方式在第二种现有技术的方法中被采用。根据第二种现有技术的方法,对于每个块和子块发送附加语法数据以指出该块是否与邻居联合编码或者单独编码(最终,被选择用来联合编码的邻居也被指出)。这种方法虽然很灵活,但具有下列主要的缺点/不利。一个这种缺点/不利是,第二种现有技术试图通过块合并(blocingmergint)来产生任意形状的区域。因此,对于具有至少一个将合并的邻居的帧内的每个块或子块,都需要传输附加数据。这将使得信令更复杂,并且在某些应用中,这样数量的划分的可能性有可能是非常庞大的。这也将引入不必要的总开销。另外--个这种缺点/不利是,第二现有技术的方法在合并之后失去了划分的J3次结构并且不处理"超宏块型"的划分。再一个这种缺点/不利是,第二现有技术的方法需要编码每个宏块类型模式,因为其不对划分采用层次结构。直接预测模式可以被视为将来自单一块的运动信息的使用扩展至更人的区域的一种方式,如同块包含被编码在一起的更大区域。但是,运动信息不是对于编码器侧的全部区域都是最优的。并且,基于直接预测模式的直接预测的区域的外形和结构是不可控的。事实上,不同块或者宏块之间的关系取决于通常使用的运动中值预测器而不需要保持层次结构。请参^附图1,能够根据MPEG-4AVC标准进行视频编码的视频编码器由附图标记100表示。视频编码器100包括帧排序缓存器(frameorderingbuffer)110,帧排序缓存器110的输出与合(combiner)185的同相输入(non-invertingi叩ut)相连以能够进行信号通信。合路器185的输出与变换器和量化器125的第一输入相连以能够进行信号通信。变换器和量化器125的输出与熵编码器145的第一输入和反变换器和反量化器150的第一输入相连以能够进行信《通信。熵编码器145的输出与合路器190的同相输入相连以能够进行信;J-通信。合路器190的输出与输出缓存器135的第一输入相连以能够进行信号通信。编码器控制器105的第一输出与帧排序缓存器110的第二输入、反变换器和反量化器150的第二输入、图像类型判断模块115的输入、宏块类型(MB-类型)判断模块120的输入、帧内预测模块160的第二输入、去块滤波器(deblockingfilter)165的第二输入、运动补偿器170的第一输入、运动估计器175的第-'输入和参考图像缓存器180的第二输入相连以能够进行信号通信。编码器控制器105的第二输出与补充增强信息(SEI)插入器130的第一输入、变换器和量化器125的第二输入、熵编码器145的第二输入、输出缓存器135的第二输入、序列参数集(SPS)和图像参数集(PPS)插入器140的输入相连以能够进行信号通信。图像类型判断模块115的第一输出与帧排序缓存器110的第三输入相连以能够进行信号通信。图像类型判断模块115的第二输出与宏块类型判断模块120的第二输入相连以能够进行信号通信。-序列参数集(SPS)和图像参数集(PPS)插入器140的输出与合路器190的第三同相输入相连以能够进行信号通信。反变换器和反量化器150的输出与合路器119的第一同相输入相连以能够进行信号通信。合路器119的输出与帧内预测模块160的第一输入和去块滤波器165的第一输入相连以能够进行信号通信。去块滤波器165的输出与参考图像缓存器180的第一输入相连以能够进行信号通信。参考图像缓存器180的输出与运动估计器175的第二输入相连以能够进行信号通信。运动估计器175的第一输出与运动补偿器170的第二输入相连以能够进行信号通信。运动估计器175的第二输出与熵编码器145的第三输入相连以能够进行信号通信。运动补偿器170的输出与开关197的第一输入相连以能够进行信号通信。帧内预测模块160的输出与开关197的第二输入相连以能够进行信号通信。宏块类型判断模块120的输出与开关197的第三输入相连以能够进行信号通信。开关197的第三输入决定开关的"数据"输入(与控制输入相比较而言,即第三输入)是否由运动补偿器170或帧内预测模块160提供。开关197的输出与合路器119的第二同相输入和合路器185的反相输入相连以能够进行信号通信。帧排序缓存器110和编码器控制器105的输入可用作编码器100的输入,用于接收输入图像101。并且,补充增强信息(SEI)插入器130的输入W'以作为编码器100的输入,用于接收元数据。输出缓存器135的输出可以作为编码器100的输出,用于输出比特流。请参看图2,能够根据MPEG-4AVC标准进行视频解码的视频解码器由附图标记200表示。视频解码器200包括输入缓存器210,输入缓存器210的输出与熵解码器245的第一输入相连以能够进行信号通信。熵解码器245的第一输出与反变换器和反量化器250的第一输入相连以能够进行信号通信。反变换器和反量化器250的输出与合路器225的第二同相输入相连以能够进行信号通信。合路器225的输出与去块滤波器器265的第二输入和帧内预测器模块260的第一输入相连以能够进行信号通信。去块滤波器器265的第二输出与参考图像缓存器280的第一输入相连以能够进行信号通信。参考图像缓存器280的输出与运动补偿器270的第二输入相连以能够进行信号通信。熵解码器245的第二输出与运动补偿器270的第三输入和去块滤波器器265的第一输入相连以能够进行信号通信。熵解码器245的第三输出与解码器控制器205的输入相连以能够进行信号通信。解码器控制器205的第一输出与熵解码器245的第二输入相连以能够进行信号通信。解码器控制器205的第二输出与反变换器和反量化器250的第二输入相连以能够进行信号通信。解码器控制器205的第三输出与去块滤波器器265的第三输入相连以能够进行信号通信。解码器控制器205的第四输出与帧内预测模块260的第二输入、运动补偿器270的第一输入和参考图像缓存器280的第二输入相连以能够进行信号通信。运动补偿器270的输出与开关297的第一输入相连以能够进行信号通信。帧内预测模块260的输出与开关297的第二输入相连以能够进行信号通信。开关297的输出与合路器225的第一同相输入相连以能够进行信号通信。输入缓存器210的输入可以作为解码器200的输入以接收输入比特流。去块滤波器器265的第一输出可以作为解码器200的输出,用于输出一输出图像
发明内容本发明的原理提供了一种用于降低的分辨率划分的方法和装置,其能够解决上述现有技术的缺点或者不利。根据本发明的一个方面,提供了一种装置。该装置包括编码器,该编码器用于使用自适应的基于树的帧划分(adaptivetree-basedframepartitioning)编码视频数据,其中由自顶向下树划分(top-downtreepartitioning)和自底向上的树连接(bottom-uptreejoining)的结合获得划分。根据本发明的另一个方面,提供了一种方法。该方法包括使用自适应的基于树的帧划分编码视频数据,其中由自顶向下树划分和自底向上的树连接的结合获得划分。根据本发明的另一个方面,提供了一种装置。该装置包括解码器,该解码器用于使用自适应的基于树的帧划分解码视频数据,其中由自顶向下树划分和向底向上的树连接的结合获得划分。根据本发明的另一个方面,提供了一种方法。该方法包括使用自适应的基于树的帧划分解码视频数据,其中由自顶向下树划分和自底向上的树连接的结合获得划分。通过下面结合附图对本发明的实施方式进行的详细说明,本发明的上述和其他方面以及特征和优点将变得显而易见。结合下而的附图,本发明的原理将得到更好的理解。图1示r能够根据MPEG-4AVC标准进行视频编码的视频编码器的框图2显示了能够根据MPEG-4AVC标准进行视频解码的视频解码器的框图3显示了根据本发明的实施方式的使用本发明的原理修改和/或扩展的能够根据MPEG-4AVC标准进行视频编码的视频编码器的框图;和图4显示了根据本发明的实施方式的使用本发明的原理修改和/或扩展的能够根据MPEG-4AVC标准进行视频解码的视频解码器的框图5A显示了根据本发明实施方式的用于示例性的初始宏块划分的图示以及相应的自顶向下和自底向上的实施;图5B显示了根据本发明实施方式的用于图5A所示的宏块划分的组合超块和子块基于树的划分;图6显示了根据本发明实施方式的由宏块的联合形成的超宏块的实施例的图示;图7显示了根据本发明的实施方式的根据方法A的编码宏块的示例性方法的流程图;图8显示了根据本发明的实施方式的根据方法A的解码宏块的方法的流程图;图9显示了根据本发明的实施方式的根据方法B的编码宏块的示例性方法的流程图;图10显示了根据本发明的实施方式的根据方法B的解码宏块的方法的流程图;图11显示了根据本发明实施方式的使用二次编码器编码视频数据的示例性方法的流程图;和图12显示了根据本发明实施方式的用于解码视频数据的示例性方法的流程图。具体实施方式本发明的原理涉及-1巾用于降低分辨率划分的方法和装置。本说明书描述了本发明的原理。但根据本发明的实施方式并根据本发明的原理,本领域普通技术人员可以设计出本说明书中未明确说明的各种其他方案。说明书中的全部实施例和条件性的语言都是为了说明本发明以使阅读者理解本发明,但本发明并不局限于这些特定的实施例和条件。并且,说明书中对本发明的原理、各个方面以及实施方式的说明都包括等同的结构和功能。另外,这些等同的结构和功能既包括目前已知的也包括将来开发出来的等同的结构和功能(即开发用来执行相同功能的结构n丁能不同的元件)。因此,例如,本领域普通技术人员可以理解,说明书中的框图表示实施本发明原理的说明性电路的概念性图示。类似地,可以理解,任何流程图、流程框图、状态转换图、伪随机码等表示能由计算机可读介质代表并因而能由计算机或者处理器执行的各种过程,而不论这种计算机或者处理器是否明确示出。附图中所示各种元件的功能可以与适当的软件联合通过使用专用硬件以及能够执行软件的硬件来提供。当通过处理器提供时,该功能可以通.过单个专用处理器、单个共享处理器或者多个处理器(某些可以共享)来提供。并且,术语"处理器"或者"控制器"的明确使用不应当被理解为专指能够执行软件的硬件,还可以非限制性地包括数字信号处理器(DSP)、川—卩存储软件的只读存储器(ROM)、随机访问存储器(RAM)以及非易失性存储器。其他普通和/或定制硬件也可以包括进来。类似地,图中所示的任何开关都是概念性的。其功能可以通过程序逻辑、专用逻辑、程序控制和专用逻辑的相互作用甚至手动操作来执行,实施者可以根据应用环境选择特定的技术。在权利要求中,任何被表达为用于执行特定功能的元件都包括执行该功能的仟何方式,例如a)执行该功能的电路元件的组合;b)任何形式的软件,包括同件、微代码等,与适当的电路结合以执行该软件从而执行该功能。这些权利要求限定的本发明的原理基于的事实是,各个引用的装置所提供的功能型以权利要求要求的方式结合在一起。因此可以认为任何能够提供这些功能性的装置都等同于所述装置。说明书中所提到的本发明原理的"一个实施方式"或"实施方式"表/K特定结合该实施方式描述的特征、结构、要素包括在本发明原理的至少--个实施方式中。因此,说明书各个地方出现的表述"在一个实施方式中"或"在实施方式中"不一定指同一实施方式。可以理解,术语"和/或",例如"A禾P/或B",目的是包括选择列出的第一选项(A)、列出的第二选项(B)或者选择两个选项(A和B)。作为进一歩的例子,在"A、B和/或C"的情况下,这种措辞目的是包括选择列出的第-选项(A)、列出的第二选项(B)、列出的第三选项(C)、第-和第二选项(A和B)、第一和第三选项(A和C)、第二和第三选项(B禾nc)、或者选择全部三个选项(A禾nB禾BC)。对于列举的许多项目,本领域和相关领域普通技术人员可以清楚地理解。在说明书中,"高级语法(highlevelsyntax)"指位于在层次结构中宏块J2之上的比特流中的语法。例如,说明书中所用的高级语法可能但不局限于指的是在片标题(sliceheader)级、补充增强信息(SEI)级、图像参数集级、序列参数集级和NAL(网络抽象层)单元标题级的语法。并且,虽然结合MPEG-4AVC标准对本发明一个或多个实施方式进行了说明,但是本发明并不局限于此标准,而是在本发明原理范围内能够应用于其他视频编码标准、推荐性标准及其扩展,包括MPEG-4AVC的扩展。另外,本说明书中,"直接模式"指利用至少一个预定义的推导或运动预测规则从空间和/或时间相邻块直接推断得出运动信息的块模式。如果使用现冇或可用的几个规则,任何级的某些语法都可以被使用来选择特定的推导/预测运动规则。用于直接模式的预测规则的块和/或宏块自适应选择也指"预测自适应直接模式"。SKIP模式是直接模式的一种特殊类型,Jt中没有残差被编码。另外,术语"相邻"可以指超块之内或之外的块。例如,当超块信息分布在四块超块之内的情况下(例如下文中说明的超块方法B的情况),相邻块将位于超块之内。事实上,例如,四块超块中的位置(1,1)的块的运动、超块状态等通常从该超块的(0,0)、(0,1)禾P(1,0)块内的相邻块情景获得的。在下文所述方法B的情况下,当2xl或1x2尺寸的超块被使用时,可以使用来自超块外部的块的数据,或者在下文所述方法A的情况下使用,这种情况中全部信息位于(0,0)块,但是第二超块2xl或1x2对此方面不具有明确的语法。短语"自适应基于树的帧划分(adaptivetree-basedframepartitioning)"指使用--族可能的划分进行的帧划分,其中划分尺寸和空间支持具有父子关系,并且最佳划分尺寸基于帧中的位置选择。例如,利用给定数量的可能尺寸和外形考虑-'组nj能的划分。较大的可能划分可以由--组更小尺寸的划分的结合得出。同时,第二尺寸的划分可以由更小尺寸的一组划分。不同尺寸的划分之间的关系可以在一组可能划分的全部可能尺寸中重复。因此,对于给定区域选择自适应的基于树的帧划分以将该给定区域用一个"单一划分"(例如一组可能划分中的最大可用划分)进行划分,或者用划分的集合(其结合是相同尺寸并且形状为"单一划分")进行划分。因此,"自适应基于树的帧划分"可以进一步确定每个较小的划分是否可以作为单-划分或者被进一步分为划分的集合(其结合是与较小单一划分尺、上和外形相同的划分)。划分的每个可能尺寸被分为划分树的等级。短语"自顶向下树划分"指由划分的递归基于树的划分产生的基于树的帧划分。短语"自底向上的树连接"指划分的基于树的连接,其中给定树层级的划分被连接以产生上部树层级的划分。短语"中等尺寸图像块组"指块形式的图像的一组划分,其中划分的尺、j—处于图像尺寸自身与象素尺寸之间。另夕卜,"中等尺寸图像块组"中的块的尺寸被理解为在图像以这种块规则划分的情况下至少一个以上的完整块可以嵌入在该划分中。请参看图3,根据本发明的实施方式的使用本发明的原理修改和/或扩展的能够根据MPEG-4AVC标准进行视频编码的视频编码器由附图标记300表示。视频编码器300包括帧排序缓存器310,帧排序缓存器310的输入与合路器385的同相输入相连以能够进行信号通信。合路器385的输出与具有超宏块(super-macroblock)扩展的变换器和量化器325的第一输入相连以能够进行信号通信。具有超宏块扩展的变换器和量化器325的输出与具冇超宏块扩展的熵编码器345的第一输入和具有超宏块扩展的反变换器和反量化器350的第--输入相连以能够进行信号通信。具有超宏块扩展的熵编码器345的输出与合路器390的第一同相输入相连以能够进行信号通信。合路器390的输出与输出缓存器335的第一输入相连以能够进行信号通信。具有超宏块扩展的编码器控制器305的第一输出与帧排序缓存器310的第二输入、具有超宏块扩展的反变换器和反量化器350的第二输入、图像类咽判断模块315的输入、宏块类型(MB-类型)判断模块320的输入、帧内预测模块360的第二输入、去块滤波器365的第二输入、运动补偿器370的第一输入、具有超宏块扩展的运动估计器375的第一输入和参考图像缓存器380的第二输入相连以能够进行信号通信。具有超宏块扩展的编码器控制器305的第二输出与补充增强信息(SEI)插入器330的第一输入、具有超宏块扩展的变换器和量化器325的第二输入、具有超宏块扩展的熵编码器345的第二输入、输出缓存器335的第二输入、序列参数集(SPS)和图像参数集(PPS)插入器340的输入相连以能够进行信号通信。图像类型判断模块315的第一输出与帧排序缓存器310的第三输入相连以能够进行信号通信。图像类型判断模块315的第二输出与宏块类型判断模块320的第二输入相连以能够进行信号通信。序列参数集(SPS)和图像参数集(PPS)插入器340的输出与合路器390的第三同相输入相连以能够进行信号通信。具有超宏块扩展的反变换器和反量化器350的输出与合路器319的第-同相输入相连以能够进行信号通信。合路器319的输出与帧内预测模块160的第-1俞入和去块滤波器365的第一输入相连以能够进行信号通信。去块滤波器365的输出与参考图像缓存器380的第一-输入相连以能够进行信号通信。参考图像缓存器380的输出与具有超宏块扩展的运动估计器375的第二输入相连以能够进行信号通信。具有超宏块扩展的运动估计器375的第一输出与运动补偿器370的第二输入相连以能够进行信号通信。Jl有超宏块扩展的运动估计器375的第二输出与具有超宏块扩展的熵编码器345的第三输入相连以能够进行信号通信。运动补偿器370的输出与开关397的第--输入相连以能够进行信号通信。A冇超宏块扩展的帧内预测模块360的输出与开关397的第二输入相连以能够进行信号通信。具有超宏块扩展的宏块类型判断模块320的输出与开关397的第三输入相连以能够进行信号通信。开关397的第三输入决定开关的"数据"输入(与控制输入相比较而言,即第三输入)是否由运动补偿器370或帧内预测模块360提供。开关397的输出与合路器319的第二同相输入和合路器385的反相输入相连以能够进行信号通信。帧排序缓存器310和编码器控制器305的输入可用作为编码器300的输入,用于接收输入图像301。并且,补充增强信息(SEI)插入器330的输入可以作为编码器300的输入,用于接收元数据。输出缓存器335的输出可以作为编码器300的输出,用于输出比特流。请参看图4,根据本发明的实施方式的使用本发明的原理修改和/或扩展的能够根据MPEG-4AVC标准进行视频解码的视频解码器由附图标记400表示。视频解码器400包括输入缓存器410,输入缓存器410的输出与具有超宏块扩展的熵解码器445的第一输入相连以能够进行信号通信。具有超宏块扩展的熵解码器445的第一输出与具有超宏块扩展的反变换器和反量化器450的第一输入相连以能够进行信号通信。具有超宏块扩展的反变换器和反量化器450的输出与合路器425的第二同相输入相连以能够进行信'4通信。合路器425的输出与去块滤波器器465的第二输入和帧内预测器模块460的第一输入相连以能够进行信号通信。去块滤波器器465的第二输出与参考图像缓存器480的第一输入相连以能够进行信号通信。参考图像缓存器480的输出与运动补偿器470的第二输入相连以能够进行信号通信。具有超宏块扩展的熵解码器445的第二输出与运动补偿器470的第三输入和去块滤波器器465的第一输入相连以能够进行信号通信。具有超宏块扩展的熵解码器445的第三输出与具有超宏块扩展的解码器控制器405的输入相连以能够进行信号通信。具有超宏块扩展的解码器控制器405的第一输出与具有超宏块扩展的熵解码器445的第二输入相连以能够进行信号通信。具有超宏块扩展的解码器控制器405的第二输出与具有超宏块扩展的反变换器和反量化器450的第二输入相连以能够进行信号通信。具有超宏块扩展的解码器控制器405的第三输出与去块滤波器器465的第三输入相连以能够进行信号通信。具有超宏块扩展的解码器控制器405的第四输出与帧内预测模块460的第二输入、运动补偿器470的第一输入和参考图像缓存器480的第二输入相连以能够进行信号通信。运动补偿器470的输山与开关497的第一输入相连以能够进行信号通信。帧内预测模块460的输出与开关497的第二输入相连以能够进行信号通信。开关497的输出与合路器425的第一同相输入相连以能够进行信号通信。输入缓存器410的输入可以作为解码器400的输入以接收输入比特流。去块滤波器器465的第一输出可以作为解码器400的输出,用于输出输出图像。如上所述,本发明的原理涉及用于降低分辨率划分的方法和系统。如h.所述,现有技术视频编码器使用视频帧的自适应块划分以最好地分类视频数据用于更有效地编码。为了此目的,大多数编码算法最初在给定尺寸的块的均匀网格上划分每个帧。然后,这些算法根据视频数据将每个块划分为较小的划分以使其最好地自适应。根据本发明原理的各个实施方式,现有技术的此方面(将块划分和子划分为更小划分的能力)被保留,但是与现有技术不同,本发明同时具有通过将来自初始均匀网格的块合并为可能帧划分组中将块自适应地合并或者分组为"超宏块"的能力,不需要对解码器的结构、体系和编码表进行大的修改。在一个实施方式中,通过只将某些小附加语法信令插入压缩码流(codedstream)中,较大宏块被定义在视频编码器/解码器中。作为根据本发明实施方式的一个特征,解码器结构使用这样一种语法,其允许这种结构保持基于视频帧的原始的初始块划分网格,同时受益于超宏块的使用。这使得现有视频编码策略(例如MPEG-4AVC标准)很容易被扩展以引入超宏块的使用(例如,MPEG-4AVC标准中的32x32块,以获得可能的划分32x32、16x32、32x16、16x16、16x8、8x16、8x8、8x4、4x8、4x4)。可以理解,本说明书中术语"超宏块"指大于16x16块尺寸(或宏块)的块,16x16块尺寸是MPEG-4AVC标准中目前最大的块尺寸,这种较大的块尺寸例如是32x32、32x16或16x32并且通过形成块的层次结构结合而产生。实际上,这种产生超宏块可以是矩形和/或正方形。因此,在一个实施方式中,采用一种基于语法的方法,通过在编码语法屮引入相对较小的变化以能够自适应地使用较大帧划分,不需要对信息和解码器结构进行较大的改变。根据此实施方式,在编码器侧,图像最初被划分为一组中等尺寸的(mid-sized)图像块。某些中等尺寸图像块然后可以根据需要进--步划分,同时其他中等尺寸图像块可以被分组或者合并为较大的块。这种自适应方法与现有技术系统中相比能够获得更高的编码效率。将中等尺寸块分组或合并为较大块的概念可以被认为是产生超宏块。这使得在需要时使用块尺寸在至少一个块侧大于为初始帧划分网格所定义的块尺寸的帧划分。在一个实施方式中,这通过在所选宏块中发送某些附加比特来实现。在涉及MPEG-4AVC标准的实施方式中,尺寸小于16x16的块模式未修改。并且,没有附加划分模式被加入到现有划分模式中。只有某些初始网格块可以携带某些附加信息以标示(signal)更大划分(例如32x32、16x32、32x16等)的信号。这种在解码器侧的信令被解释为选择数据用于指示块模式类型和/或运动如何(或是否)显式(explicitly)或隐式(implicitly)预测以进行编码,使得解码器的结构能够基于现有技术,同时具有自适应帧划分的能力。因此,本发明的实施方式引入了超宏块的使用(宏块的层次结构结合)以增大可能的基于树的帧划分的集来进行有效视频编码。本发明的原理能够使用基于宏块的帧划分使得任何视频编码方法能够以有效的方式产生原始宏块之外的更大的正方形和/或矩形划分。本发明的实施方式提出了一种途径,用于管理基于树的帧划分(例如按照MPEG-4AVC标准的风格),但是其中基于宏块的初始帧划分网格不对应于树中的最大划分。因此,某^划分(子宏块划分)通过进一步划分每个宏块以自顶向下方式产生。而某些划分通过连接或合并某些初始宏块划分以自底向上方式产生。请参看图5A,示例性初始宏块划分、相应的自顶向下和自底向上实施分别通过附图标记510、520和530表示。请参看图5B,用于图5A所述的宏块划分的组合超块和子块的基于树的划分由附图标记550表示。在图5B中,帧的最终基于树的划分通过超块(和/或超宏块)、宏块和子块(和/或子宏块)的联合集形成。本发明原理的实施方式在压縮码流中引入很少量的辅助信息(sideinformation),从而能使解码器知道那些块已经被编码在一起以产生超块。通过将某些语法信息插入到所选择的块中(最终某些高语法级别)中,解码器能够理解某些相邻块(将被以后解码)继承从所选择的块解码的部分或全部信息。这"虚拟地"允许使用超块划分。在编码器侧,这种附加语法信息将被确定以将其用于高效编码的目的。本发明原理的一个实施方式涉及对直接预测模式的使用进行修改以能够产生"虚拟"超块划分,同时使对于利用这种预测模式的任何编码策略结构的影响最小化。直接预测模式是基于运动补偿的预测模式,其中运动信息未显式编码,而是利用某些基于滤波的运动预测从相邻的已经编码的划分继承或者隐式推导出,例如从相邻块的运动矢量中值滤波。在涉及MPEG-4AVC标准的实施例中,直接模式用于Inter-B帧中。直接预测也被提议用于Inter-P帧中。空间直接预测模式使用未意识到编码的视频序列的结构和特征的某些基于相邻的运动推导。取代与空间直接预测模式相关的方法,我们最终提议根据编码的宏块通知其邻居和/或编码器/解码器的当前状态以及某些辅助信息(语法)以指出哪个块或者哪组块被使用,从而以."接预测模块(或修改的直接预测模块)和/或直接预测模块集(或修改的直接预测模块集)推导运动信息。并且,可以设计语法,使得宏块模式类型信息也以这种语法隐式编码,节约某些附加位。因此,基于所述直接预测模式的扩展,本发明原理的实施方式引入了自底向上的基于树的划分作为传统的(例如基于MPEG-4AVC标准的)自顶向下的基于树的帧划分的补充。下面将基于MPEG-4AVC标准的扩展对基于语法的超块帧划分的几个实施方式进行更详细的说明。这些示例性实施方式着眼于通过使用某些新语法插入虚拟32x32、32x16、16x32超块划分模式而不在数据流和解码器中引入重要改变。所有的实施方式都能从基于树的自底向上和自顶向下的产生的划分嵌套结构(nestedstructure)受益。方法A体系方法A体系基于在所选择的、宏块尺寸的预测模型(例如P和/或B)中插入附加语法。此附加语法指示相邻宏块是否将继承在先编码块的特性或者将被显式编码。在一个实施方式中,如果相邻宏块被选择继承超块内在先编码的宏块的模式和运动特性,则这些相邻宏块被隐式编码并且根本没有信息(除了编码的运动补偿残差)需要被编码。在--个实施方式中,当确定解码一个超块时,其宏块中只有一个需要被解码。在不损失普遍性的情况下,在此特定的实施方式中,在超块中显式编码的宏块是设置在超块左.h角的宏块。基于此约定,定义编码/解码方案,使得一组4个宏块(符合32x32的组)的只有每个左上角宏块的与"超块"相关的语法被发送。并LL,只有毎个超块(根据约定,左上角的宏块)划分的一个宏块必须包括显式或隐式运动信息。隐式信息例如在直接或skip模式情况下指从相邻数据从相邻数据获得的运动信息。请参看图6,由宏块结合形成的超块的实施例由附图标记600表示。如图6所示,32x32块包括4个宏块,而32x16和16x32块只包括两个宏块。在此示例性实施方式中,左上宏块也在图6中标示。在宏块模式类型被表^在编码的信息之后,超块语法可以被插入到适当的宏块中。对于上面定义的基于树的划分,我们仅仅将与超块相关的语法引入用于帧间预测的16x16宏块中或者用于直接预测的16x16宏块中。让我们根据宏块的x和y坐标给出下列指标,其中帧中最左上的宏块具有坐标(0,0),帧中最右下的宏块具有坐标(M,N),M和N取正整数值。然后,与超块有关的信息最终在每个宏块以偶坐标指示。因此,与超块冇关的信息对丁-(0,0)、(0,2)、(2,0)禾Q(2,2)等处的块被指小。在宏块模式类型之后的某些点,如果模式类型适于超块使用,一个标忐("此处指"super—block—enable")被传输(例如,在MPEG-4AVC标准的扩展中,只有与16x16划分相关的那些模式类型要求显式超块辅助信总)。根据其值,由偶坐标宏块(左上宏块)表示的4个宏块的组被或者不被编码为超宏块模式其中之一。在其没有被编码为任何一个超宏块模式的情况下,不再编码与此特定的4个宏块的组的超宏块相关的进一步信息,所有的宏块按照通常方式编码(例如,在本实施方式中,根据MPEG-4AVC标准)。在super—block—enable标志指示使用超宏块模式的情况下,传输--码字以指示哪一种模式被采用(32x32、32x16或16x32)。在另外一个实施方式中,码字或指标被用于指示不同的超块模式(例如,0(无超块),1(32x32)、2(32x16)、3(16x32))。然后,例如,该指标可以用内容自适应的可变长编码(CAVLC)或内容自适应的二进制算术码进行编码。然后,对于每个超块,使用通常的语法对左上宏块进行编码(与非常小的超块相关的语法是最终的例外)。在32x32超块的情况下,对于剩下的3个宏块也对运动补偿残差误差进行编码。当使用32x16或16x32超块时,合适的左上宏块按照通常方式编码(除了与超块相关的语法),并且对于剩下的宏块,只有残差运动补偿误差使用从用于信号预测目的的适当的左上宏块得到的运动被编码,不需要额外信息。来自原始编码策略(例如根据MPEG-4AVC标准)的宏块的编码顺序被保留(即使对于那些只有残差运动补偿被传输的宏块)。在编码器侧,比宏块大的虚拟区域被标示的事实应当被解决。因此,编码器应当对整个超块检索全局而言最佳和最有效的模式,并且在每个超块的左上宏块中编码模式和预测信息。在一个实施方式中,一旦根据超块的全局编码效率确定了模式,用于非编码的宏块的其余残差信息只需要编码。在一个实施方式中,根据MPEG-4AVC标准,按照通常的宏块编码顺序对其进行编码。如图1和3所示,将要修改和/或扩展的块如下。编码器控制被修改和/或扩展,从而其能够处理用于超宏块划分的新添加的语法。运动估计器被修改和/或扩展,从而其能够利用更大的划分(大于宏块)可以被标示的事实。因此,运动和块模式需要被确定,从而它们从全局而言对于整个超块是最佳的。熵编码器被修改和/或扩展,从而其高效率地编码为了与超宏块相关的数据而传输的非常少量的信息。在解码器侧,与超块相关的语法被翻译为直接模式预测数据,根据由超块划分建力:的宏块之间的关系获得运动矢量预测。因此,如根据附图2和4所描述的那样,非常少的块被如下地修改和/或扩展来处理超宏块划分。熵解码器被扩展,从而其解码通过编码器的熵编码模式编码的与超块相关的语法。解码器控制器被修改和/或扩展,从而其增加了与超块(超宏块)相关的决定步骤。为了使所有其他模块正常工作,解码器控制器设置解码器数据结构,从而所有其他模块将来自超块的未编码宏块视为具有适,运动推3规则和适当预测的运动信息的直接模式。根据--个实施方式,每四个宏块中的至少一个包括某些超块信息。事实上,只有16x16帧间P/B和16x16直接P/B模式(其中位置(x,y)都是偶坐标)可以携带超块信息。当然,本发明的原理不局限于上述说明,因此,在其他实施方式中,每四个宏块中的一个以上的宏块(但优选不是全部,虽然本发明的原理也意在包括具有全部宏块的情形)可以包括某些超块信息。方法B体系方法B体系基于在所选择的、宏块尺寸的预测模型(例如P和/或B)中插入附加语法。在此体系的方法中,没有其他模式需要插入附加信息以标示超宏块划分。在包含这些方法的示例性实施方式中,在4个宏块的组中的左上宏块(根据前面的定义,即具有偶坐标位置的宏块)不携带附加信息也被携带语法。超宏块通过4个一组(即可以形成32x32超块的组).的剩余3个宏块中的某些标志和/或码字标示。只有直接模式块(P或B)需要携带这种标志和/或码字。用于直接编码这三个宏块任何其他模式暗示对于该宏块位置没有超块(因此,在这种情况下不需要任何最终直接模式的额附加辅助信息)。这意味着插入在直接模式中的最终标志和/或码字根据应用环境(即宏块位置和/或邻居)明确地指出从其推导出用于直接预测的运动矢量邻居(和/或多个邻居)。用于超块编码的可能的编码情形如下1.偶坐标的宏块不是16x16预测模式或16x16直接预测模式。因此,超块编码是不可能的。没有附加语法被发送到生成32x32超块的四个一组的其他三个宏块的任何一个。2.偶坐标的宏块是16x16预测模式或16x16直接预测模式。则下列情况是可能的。则根据原始编码技术的光栅扫描顺序(例如,在一个实施方式'f',根据MPEG-4AVC标准),下列的情形是可能的。我们还假定用T四个宏块的组的相对坐标(0,0)、(0,1)、(1,0)、(1,1)能够形成32x32、32x16或者16x32超块,虽然使用其他坐标系统的实施方式也是可能的,这对于本领域普通技术人员而言是能够理解的。a.如果被考虑的宏块是(0,1)宏块(即(0,0)宏块的右侧邻居)不是16x16预测模式或16x16直接预测模式,则不生成超块模式。b.如果(0,1)宏块是16x16预测模式或16x16直接预测模式,则具有下列可能i.如果(0,1)宏块是16x16预测模式,则这表示32x16超块还能够被生成。16x16预测模式按照通常方式编码(例如,在一个实施例中,根据MPEG-4AVC标准)。然后,当宏块扫描顺序达到(1,0)禾B(1,1)邻居时,执行下列1.如果宏块扫描顺序达到(1,0)邻居(即(0,0)下面的邻居),并且其不是16x16直接预测模式,则不生成超块模式。2.如果(1,0)宏块是直接预测模式,则由两种可能性,这两种可能性由插入在宏块类型之后某个地方的附加标志(例如super—block—enable)标示。根据该标志,这表示其是超块的一部分(意味着执行32x16模式)或者不生成超块。如果执行32x16模式,则运动信息从(0,0)宏块继承。a.对于(,1)块不需要编码额外语法。其遵循(1,0)块的决定。如果决定为32x16超块模式,则其从(0,1)块推导运动信息。实际上模式类型可以隐式编码;在运动补偿之后只需要编码残差。如果在(1,0)中超块模式被禁止,贝U(1,1)中可以是用任何经典模式。ii.如果(0,1)块是16x16直接预测模式,则有两种可能性,这两种可能性由插入在宏块类型之后某个地方的附加标志(例如super—block—enable)标示。根据该标志,这表示其是超块的一部分(则32x16模式或16x32模式被编码)或者是普通的直接模式(表示至多在该位置32x16模式可以生成)。如果其是32x16或16x32超块的一部分,则运动信息从(0,0)推导。在相反的情况下,运动信息通过使用常用的方法推导。1.如果在(0,1)允许使用32x16或16x32模式,则只有16x16预测或16x16直接模式对于(1,0)是可能的。a.如果在(1,0)中选择了16x16直接预测模式,---个标志(例如32x32—selection)插入在宏块类型信令后的某个位置。这指出是否在32x32超块中,因此从(0,0)推导运动,或者指出是否是16x32模式(其中运动通过其他方式获得,例如通常采用的MPEG-4AVC标准的直接模式),(1,1)宏块中的直接预测被隐式编码,运动取决于32x32或16x32超块是否编码而被推导,并且只要求传输编码的残差。b.如果为(1,0)选择了16X16预测模式,则使用16X32模式(不需要传送任何附加语法)。(1,l)中的直接预测模式隐式编码,运动根据16X32超块来推导并且只需要传输编码的残差。2.如果32x16模式被初步允许用于(0,1)块,则考虑下述方式a.如果(1,0)块是除了16x16直接预测模式之外的任何模式,则没有超块被编码。b.如果(1,0)块是16x16直接预测模式,则一个标志(例如super—block—enabled)表示是否使用32x16超块,因此暗示运动从(0,0)邻居推导。用于(1,1)宏块的直接预测模式被隐式编码,运动根据32x16超块而推导,并且只传输编码的运动补偿的残差。与前述方法A相似,在编码器侧,比宏块大的虚拟区域被标示的事实应-、1被解决。因此,在本实施方式中,编码器应当对整个超块检索全局而^最佳和最有效的模式,并且根据上述方法B的规则编码模式和预测信息。一旦根据超块的全局编码效率确定了模式,按照通常的宏块编码顺序(例如根据MPEG-4AVC标准)对块进行编码。但是,现在是隐式编码的某些信息根据前面介绍的规则进行处理。如图1和3所示,将要修改和/或扩展的块如下。编码器控制器被修改和/或扩展,从而其能够处理用于超宏块划分的新添加的语法。运动估计器被修改和/或扩展,从而其能够利用更大的划分(大于宏块)可以被标示的事实。因此,运动和块模式需要被确定,从而它们从全局而^对于整个超块是最佳的。熵编码器被修改和/或扩展,从而其高效率地编码为了与超宏块相关的数据而传输的非常少量的信息。可选择地,量化步骤以及用全零量化系数标示区域的步骤也可以被修改和/或扩展,从而当超宏块划分被使用时,从某些失真测量和成本测量较低而言,其最佳地适应于残差的高效编码。事实上,具有超块编码的包含MPEG-4AVC标准的实施方式也可以将编码的块模式功能型扩展,从而当整个超块布局有量化系数时能够有效地标示,以在超块的一部分不具有量化系数来编码时编码或自适应地有效地标示。在解码器侧,惟一的程序是将与超块相关的语法翻译程直接模式预测数据,根据由超块划分建立的宏块之间的关系获得运动矢量预测。因此,如根据附图2和4所描述的那样,非常少的块被修改和/或扩展来如下地处现超宏块划分。.熵解码器被扩展,从而其解码通过编码器的熵编码模式编码的与超块相关的语法。解码器控制器被修改和/或扩展,从而其增加了与超块(超宏块)相关的少量决定步骤。为了使所有其他模块正常工作,解码器控制器设置解码器数据结构,从而所有其他模块将来自超块的未编码(或隐式编码)宏块视为具有适当运动推导规则和适当预测的运动信息的直接模式。可选择地,去量化步骤也可以被修改和/或扩展,从而其最佳地适应于残差的"效编码,^编码器侧引入的可能的变化相配合。表1和表2分别示出丫用于方法A和方法B的示例性语法以指明超表1macroblock_layer(){CDescriptorif(mb_pos.xHor()%2==0&&mb_pos.yVer()%2=0){mb—type2ue(v)!ae(v)}else〗if(get—mbdata(floor(mb—pos,yVer()/2)*2,floor(mbjdos.xHor()/2)*2),super—block—enable!=0&&(Is—32x32_mode|(IsupperrightMBm2x2MBgroup&&Is—!6x32mode)『(Is::lower二leftMBJn2x2MBg腦p&&Is—〗2x16—mode))){/*orsuperblockmodeinsteadofsuperblockenable*/mb—type=DIRECT—MODE—x/*PorB*/}else{mb一type2<table>tableseeoriginaldocumentpage31</column></row><table>结朿框799。判断框730确定超块模式是否被使用以及宏块数据是否能够从超块语法推导出。如果是,控制流程转至功能框740。否则控制流程转至功能框735。功能框740编码残差并将控制流程转至结束框799。功能框735编码宏块类型(mb一type)并将控制流程转至功能框725。请参看图8,根据方法A的解码宏块的示例性方法用附图标记800表示。方法800包括起始框805,其将控制流程转至判断框810。判断框810确定主宏块是否来自2x2组。如果是,则控制流程转至功能框815。否则控制流程转至判断框840。'功能框815解码宏块类型(mb一type),然后将控制流程转至功能框820。如果mb一type指示没有子宏块划分,功能框820解码超块数据,并将控制流程转至功能框825。功能框825解码宏块数据并将控制流程转至功能框830。功能框830进行宏块预测补偿,并将控制流程转至功能框835。功能框835进行残差数据构建,并将控制流程转至结束框899。判断框840确定超块模式是否被使用以及宏块数据是否能够从超块语法推导出。如果是,控制流程转至功能框845。否则控制流程转至功能框860。功能框845将宏块类型(mb一type)设置为具有自适应数据预测的直接编码,并将控制流程转至功能框850。功能框850根据超块信息超块主宏块设置宏块运动,并将控制流程转至功能框855。功能框855解码残差并将控制流程转至功能框830。请参看图9,根据方法A的编码宏块的示例性方法用附图标记900表示。方法900包括起始框905,其将控制流程转至判断框910。判断框910通过内容和先前编码的宏块校验本宏块是否为超块的一部分并能够被直接推导。如果是,则控制流程转至功能框915。否则控制流程转至功能框920。功能框915编码残差数据并将控制流程转至结束框999。功能框920编码宏块类型(mb—type),然后将控制流程转至判断框925。判断框925确定当前模式是否是直接模式。如果是,控制流程转至功能框930。否则控制流程转至功能框935。功能框930编码超宏块模式(例如,如果需要,任何必须的与超块相关的标志),并将控制流程转至功能块915。功能框935编码宏块数据,并将控制流程转至结束框999。请参看图10,根据方法B的解码宏块的示例性方法用附图标记1000表示。方法1000包括起始框1005,其将控制流程转至判断框1010。判断框1010通过内容和先前编码的宏块校验本宏块是否为超块的一部分并能够被直接推导。如果是,则控制流程转至功能框1015。否则控制流程转至功能框1035。功能框1015将宏块类型(mb—type)设置为具有自适应数据预测的直接模式,并将控制流程转至功能框1020。功能框1020根据超块信息和超块主宏块设置宏块运动,并将控制流程转至功能框1025。功能框1025进行宏块预测补偿,并将控制流程转至功能框1030。功能框1030解码并重建残差数据,并将控制流程转至结束框1099.。功能框1035解码宏块类型(mb一type),然后将控制流程转至判断框1040。判断框1040确定当前模式是否是直接模式。如果是,控制流程转至功能框1045。否则控制流程转至功能框1050。判断框1045确定当前块是否为超宏块的一部分。如果是,则控制流程转至功能框1020。否则控制流程转至功能框1055。功能框1055按照通常方式推导宏块运动数据,并将控制流程转至功能框1025。请参看附图11,使用二次编码器(two-passencoder)编码视频数据的示例性方法用附图标记1100表示。方法1100包括起始框1105,其将控制流程转至功能框1110。功能框1U0例如基于MPEG-4AVC标准进行第一次编码以编码视频数据,并将控制流程转至功能框1115。功能框1115进行第二次编码,包括测试每个2x2、2xl和lx2宏块组以确定其是否与超块一样进行编码效率更高,并将控制流程转至功能块1120。功能块1120根据第二次编码将适当的超块语法插入至宏块中,然后将控制流程转至结束框1199。请参看附图12,使用解码视频数据的示例性方法用附图标记1200表示。方法1200包括起始框1205,其将控制流程转至功能框1210。功能框1210解析比特流,并将控制流程转至功能框1215。功能框1215在相关宏块中将超块语法转换为标准的可读数据(例如基于MPEG-4AVC标准),然后将控制流程转至功能框1220。功能框1220例如基于MPEG-4AVC标准进行解码和视频重建,并将控制流程转至结束框1299。下面将说明本发明的部分优点/特征,其中一部分已经在上文提及。例如,一个优点/特征是具有编码器的装置,该编码器通过进行图像的原始划分将图像划分为中等尺寸的一组图像块,选择其中某些图像块进行进一步划分,并选择其中其他图像块进行合并。进一步的划分和合并使用自适应的基于树的帧划分。另外一个优点/特征是具有上述编码器的装置,其中划分由自顶向下树划分和自底向上的树连接的结合获得。另外一个优点/特征是具有所述编码器的装置,如上所述解码器中划分山自顶向下树划分和自底向上的树连接的结合获得,其中所述编码器使用原始划分的块尺寸来生成基于树的帧划分。所述块尺寸是能够用于与特定视频编码标准或推荐性标准相关的基于树的帧划分的任何可用块尺寸。并且,另外一个优点/特征是具有解码器的装置,如上所述解码器中划分由自顶向下树划分和自底向上的树连接的结合获得,其中所述解码器利用自底向上的树连接来产生用于视频数据的超块划分。另外,另外一个优点/特征是具有解码器的装置,如上所述其中所述解码器利用自底向上的树连接来产生用于视频数据的超块划分,其中所述编码器使用自底向上的树连接由16x16宏块生成任何32x32、16x32和32x16划分。另外一个优点/特征是具有解码器的装置,如上所述其中所述解码器利用自底向上的树连接来产生用于视频数据的超块划分,其中所述编码器优化运动数据以能够在全部超块上全局性地具有高效率。另外,另外一个优点/特征是具有解码器的装置,如上所述解码器中划分由自顶向下树划分和自底向上的树连接的结合获得,其中所述解码器使用高级语法选择性地允许和禁止自顶向下树划分和自底向上的树连接至少其中之一。并且,另外一个优点/特征是具有解码器的装置,如上所述其中所述解码器使用高级语法选择性地允许和禁止自顶向下树划分和自底向上的树连接至少其中之一,其中所述编码器在片标题(sliceheader)级、补充增强信息(SEI)级、图像参数集级、序列参数集级和、网络抽象层、单元标题级、图像级、片级和宏块级的至少其中之一编码高级语法。另外-个优点/特征是具有解码器的装置,如上所述其中所述解码器使用高级语法选择性地允许和禁止自顶向下树划分和自底向上的树连接至少其中之-,其中所述编码器在与视频数据对应的产生的比特流中和与视频数据对应的辅助信息至少其中之一中至少隐式或显式地标示与本地超块相关的信息。另外一个优点/特征是具有解码器的装置,其中所述编码器在与视频数据对应的产生的比特流中和与视频数据对应的辅助信息至少其中之一中至少隐式或显式地标示与本地超块相关的信息,其中所述编码器使用至少一个宏块级的附加语法要素至少隐式或显式地标示与本地超块相关的信息。另外一个优点/特征是具有解码器的装置,其中所述编码器在与视频数据对应的产生的比特流中和与视频数据对应的辅助信息至少其中之一中节少隐式或显式地标示与本地超块相关的信息,其中与本地超块相关的信总包括用于矩形超块的超块允许标志、超块禁止标志、超块类型、超块尺寸和划分方向其中至少之一。并且,另外一个优点/特征是具有解码器的装置,其中所述编码器在与视频数据对应的产生的比特流中和与视频数据对应的辅助信息至少其中之一中至少隐式或显式地标示与本地超块相关的信息,其中与本地超块相关的信息被嵌入超块的仅仅一个块中或者分布在属于包含在超块中的相同-组块中的一个以上的块中。并且,另外一个优点/特征是具有解码器的装置,其中所述编码器在与视频数据对应的产生的比特流中和与视频数据对应的辅助信息至少其中之一中至少隐式或显式地标示与本地超块相关的信息,其中在超块的至少一个块中,块编码模式、与本地超块相关的信息和运动信息至少其中之一从当前块中直接推导出,以由至少一个块编码模式、与本地超块相关的信总和运动信息进行编码,显式或隐式地嵌入至少一个相邻块中。并且,另外一个优点/特征是具有解码器的装置,其中在超块的至少一个块中,至少---个块编码模式、与本地超块相关的信息和运动信息从当前块中直接推导出,以由块编码模式、与本地超块相关的信息和运动信息至少其中之一-进行编码,显式或隐式地嵌入至少一个相邻块中,其中用于推导块编码模式、与本地超块相关的信息和运动信息至少其中之一的推导规则取决于块扫描顺序。并且,另外一个优点/特征是具有解码器的装置,其中所述编码器在与视频数据对应的产牛.的比特流中和与视频数据对应的辅助信息至少其中之-.中至少隐式或显式地标示与本地超块相关的信息,其中块扫描顺序与视频编码推荐性标准或视频编码标准规定地现有块扫描顺序相同或不同。并且,另外一个优点/特征是具有解码器的装置,如上所述解码器中划分由自顶向T"树划分和自底向上的树连接的结合获得,其中所述编码器将至少一个与本地超块划分相关的语法元素嵌入直接预测模块,从而基于自适应直接预测模块进行超块帧划分,所述自适应直接预测模块可以将不同的可能预测器用于直接预测模式。并且,另外-一个优点/特征是具有解码器的装置,其中所述编码器将至少一个与本地超块划分相关的语法元素嵌入直接预测模块,从而基于自适应直接预测模块进行超块帧划分,所述自适应直接预测模块可以将不同的可能预测器用于直接预测模式,其中至少一个与本地超块划分相关的语法元素作为用于直接预测的自适应预测器选择器,并且其中运动信息和块模式类型中的至少之一被直接预测或基于相邻宏块数据和超块语法信息推导。并且,另外-…个优点/特征是具有解码器的装置,如上所述解码器中划分由fi顶向下树划分和自底向上的树连接的结合获得,其中残差编码适于利用编码的量化系数和非编码的量化系数至少其中之一的超块自适应变换尺寸和超块自适应信令其中至少之一自适应地处理超块尺寸。本领域普通技术人员根据本发明的原理可以理解本发明的上述和其他特征和优点。可以理解,本发明的原理可以用各种形式的硬件、软件、固件、专用处理器及其组合实现。最优选地,本发明的原理可以作为硬件和软件的组合来实现。并且,软件可以作为嵌入在程序存储单元上地应用程序来实现。应用程序可以被上载至包含任何适当体系结构的机器并由其执行。优选地,该机器在具有硬件的计算极平台上执行,所述硬件例如是一个或多个中央处理器(CPU)、随机访问存储器(RAM)、输入输出(I/O)接口。计算机平台还可以包括操作系统和微指令代码。本文所述各种处理和功能可以是能够由CPU处理的微指令代码的一部分或应用程序的一部分,或者它们的组合。另外,各种外围设备可以连接至计算机平台,例如附加数据存储单元和打印单元。可以进一步理解的是,因为附图中描述的某些系统构成部件和方法优选由软件实现,系统元件或者处理功能框之间的实际连接根据本发明的原理被编程的方式可能存在不同之处。基于本发明的原理,本领域普通技术人员可以设想到用来实现本发明原理的上述和其他方式或结构。虽然结合目前优选实施例对本发明进行了说明,但是可以理解本发明并不局限于公开的实施例。而且,在本发明的原理和范围之内,可以对本发明进行修改以引入本说明书未说明的任何变化、改变、替换或者等同设置。因此,本发明不应被视为由....h述说明来限制,而是由所附权利要求的范围来限定。权利要求1.一种装置,包括编码器(300),用于通过执行图像的原始划分将图像划分为中等尺寸的一组图像块;选择其中某些图像块进行进一步划分;并选择其他图像块进行合并,以编码图像,其中进一步的划分和合并使用自适应的基于树的帧划分。2.根据权利要求l所述的装置,其中划分由自顶向下树划分和自底向上的树连接的结合获得。3.根据权利要求2所述的装置,其中所述编码器(300)使用原始划分的块尺寸来生成基于树的帧划分,所述块尺寸是能够用于与特定视频编码标准或推荐性标准相关的基于树的帧划分的任何可用块尺寸。4.根据权利要求2所述的装置,其中所述编码器(300)利用自底向上的树连接来产生用于视频数据的超块划分。5.根据权利要求4所述的装置,其中所述编码器(300)使用自底向上的树连接由16xl6宏块生成任何32x32、16x32和32xl6划分。6.根据权利要求4所述的装置,其中所述编码器(300)优化运动数据以能够在全部超块上全局性地具有高效率。7.根据权利要求2所述的装置,其中所述编码器(300)使用高级语法选择性地允许和禁止自顶向下树划分和自底向上的树连接至少其中之一。8.根据权利要求7所述的装置,其中所述编码器(300)在片标题级、补充增强信息(SEI)级、图像参数集级、序列参数集级、网络抽象层单元标题级、图像级、片级和宏块级的至少其中之一编码高级语法。9.根据权利要求7所述的装置,其中所述编码器(300)在与视频数据对应的产生的比特流和与视频数据对应的辅助信息至少其中之一中至少隐式或显式地标示与本地超块相关的信息。10.根据权利要求9所述的装置,其中所述编码器(300)使用至少一个宏块级的附加语法要素至少隐式或显式地标示与本地超块相关的信息。11.根据权利要求9所述的装置,其中与本地超块相关的信息包括用于矩形超块的超块允许标志、超块禁止标志、超块类型、超块尺寸和划分方向其中至少之一。12.根据权利要求9所述的装置,其中与本地超块相关的信息仅被嵌入超块的一个块中或者分布在属于包含在超块中的相同一组块中的一个以上的块中。13.根据权利要求9所述的装置,其中在超块的至少一个块中,块编码模式、与本地超块相关的信息和运动信息至少其中之一从当前块中直接推导出,以由至少一个块编码模式、与本地超块相关的信息和运动信息进行编码,显式或隐式地嵌入至少一个相邻块中。14.根据权利要求13所述的装置,其中用于推导块编码模式、与本地超块相关的信息和运动信息至少其中之一的推导规则取决于块扫描顺序。15.根据权利要求9所述的装置,其中块扫描顺序与视频编码推荐性标准或视频编码标准规定的现有块扫描顺序相同或不同。16.根据权利要求2所述的装置,其中所述编码器(300)将至少一个与本地超块划分相关的语法元素嵌入直接预测模块,从而基于自适应直接预测模块进行超块帧划分,所述自适应直接预测模块可以将不同的可能预测器用于直接预测模式。17.根据权利要求16所述的装置,其中至少一个与本地超块划分相关的语法元素作为用于直接预测的自适应预测器选择器,并且其中运动信息和块模式类型中的至少之一被直接预测或基于相邻宏块数据和超块语法信息推导。18.根据权利要求2所述的装置,其中残差编码适于利用编码的量化系数和非编码的量化系数至少其中之一的超块自适应变换尺寸和超块自适应信令其中至少之一自适应地处理超块尺寸(325,350)。19.一种方法,包括通过进行图像的原始划分将图像划分为中等尺寸的一组图像块(510);选择其中某些图像块进行进一歩划分(530);并选择其他图像块进行合并(520)对图像,以编码图像,其中进一步的划分和合并使用自适应的基于树的帧划分(520,530)。20.根据权利要求19所述的方法,其中划分由自顶向下树划分和自底向上的树连接的结合获得(550)。21.根据权利要求20所述的方法,其中所述编码步骤使用原始划分的块尺寸来生成基于树的帧划分,所述块尺寸是能够用于与特定视频编码标准或推荐性标准相关的基于树的帧划分的任何可用块尺寸(510,600)。22.根据权利要求20所述的方法,其中所述编码步骤利用自底向上的树连接来产生用于视频数据的超块划分(550,600)。23.根据权利要求22所述的方法,其中所述编码步骤使用自底向上的树连接由16xl6宏块生成任何32x32、16x32和32xl6划分(520)。24.根据权利要求22所述的方法,其中所述编码步骤优化运动数据以能够在全部超块上全局性地具有高效率(1100)。25.根据权利要求20所述的方法,其中所述解码步骤使用高级语法选择性地允许和禁止自顶向F树划分和自底向上的树连接至少其中之一。26.根据权利要求25所述的方法,其中所述编码步骤在片标题级、补充增强信息(SEI)级、图像参数集级、序列参数集级和、网络抽象层单元标题级、图像级、片级和宏块级的至少其中之一编码高级语法。27.根据权利要求25所述的方法,其中所述编码步骤在与视频数据对应的产生的比特流和与视频数据对应的辅助信息至少其中之一中至少隐式或显式地标示与本地超块相关的信息(710,720,730,910,930)。28.根据权利要求27所述的方法,其中所述编码步骤使用至少一个宏块级的附加语法要素至少隐式或显式地标示与本地超块相关的信息(720,930)。29.根据权利要求27所述的方法,其中与本地超块相关的信息包括用于矩形超块的超块允许标志、超块禁止标志、超块类型、超块尺寸和划分方向其中至少之一(720,930)。30.根据权利要求27所述的方法,其中与本地超块相关的信息仅被嵌入超块的一个块中(700)或者分布在属于包含在超块中的相同一组块中的一个以上的块中(900)。31.根据权利要求27所述的方法,其中在超块的至少一个块中,块编码模式、与本地超块相关的信息和运动信息至少其中之一从当前块中直接推导出,以由至少一个块编码模式、与本地超块相关的信息和运动信息进行编码,显式或隐式地嵌入至少一个相邻块中(730,910,925)。32.根据权利要求31所述的方法,其中用于推导块编码模式、与本地超块相关的信息和运动信息至少其中之一的推导规则取决于块扫描顺序。33.根据权利要求27所述的方法,其中块扫描顺序与视频编码推荐性标准或视频编码标准规定的现有块扫描顺序相同或不同。34.根据权利要求20所述的方法,其中所述编码步骤将至少一个与本地超块划分相关的语法元素嵌入直接预测模块,从而基于自适应直接预测模块进行超块帧划分,所述自适应直接预测模块可以将不同的可能预测器用于直接预测模式(900)。35.根据权利要求34所述的方法,其中至少一个与本地超块划分相关的语法元素作为用于直接预测的自适应预测器选择器,并且其中运动信息和块模式类型中的至少之一被直接预测或基于相邻宏块数据和超块语法信息推导(930,720)。36.根据权利要求20所述的方法,其中残差编码适于利用编码的量化系数和非编码的量化系数至少其中之一的超块自适应变换尺寸和超块自适应信令其中至少之一自适应地处理超块尺寸(325,350)。37.—种装置,包括解码器(400),用于通过进行图像的原始划分将图像划分为中等尺寸的-组图像块,选择其中某些图像块进行进一步划分,并选择其他图像块进行合并,以解码图像,其中进一步的划分和合并使用自适应的基于树的帧划分。38.根据权利要求37所述的装置,其中划分由自顶向下树划分和自底向上的树连接的结合获得。39.根据权利要求38所述的装置,其中所述解码器(400)使用原始划分的块尺寸来生成基于树的帧划分,所述块尺寸是能够用于与特定视频解码标准或推荐性标准相关的基于树的帧划分的任何可用块尺寸。40.根据权利要求38所述的装置,其中所述解码器(400)利用自底向.丄:的树连接来产生用于视频数据的超块划分。41.根据权利要求40所述的装置,其中所述解码器(400)使用自底向t的树连接由16xl6宏块生成任何32x32、16x32和32xl6划分。42.根据权利要求38所述的装置,其中所述解码器(400)使用高级语法选择性地允许和禁止自顶向下树划分和自底向上的树连接至少其中之43.根据权利要求42所述的装置,其中所述解码器(400)在片标题级、补充增强信息(SEI)级、图像参数集级、序列参数集级和、网络抽象层单元标题级、图像级、片级和宏块级的至少其中之一解码高级语法。44.根据权利要求42所述的装置,其中所述解码器(400)由与视频数据对应的产生的比特流和与视频数据对应的辅助信息至少其中之一中至少隐式或显式地解码与本地超块相关的信息。45.根据权利要求44所述的装置,其中所述解码器(400)通过解码至少-个宏块级的附加语法要素至少隐式或显式地解码与本地超块相关的信息。46.根据权利要求44所述的装置,其中与本地超块相关的信息包括用于矩形超块的超块允许标志、超块禁止标志、超块类型、超块尺寸和划分方向其中至少之一。47.根据权利要求44所述的装置,其中所述至少一个附加语法元素从被嵌入超块的一个块中或者分布在属于包含在超块中的相同一组块中的一个以上的块中解码。48.根据权利要求44所述的装置,其中在超块的至少一个块中,块编码模式、与本地超块相关的信息和运动信息至少其中之一从当前块中直接推导出,以由块编码模式、与本地超块相关的信息和运动信息至少其中进行编码,显式或隐式地嵌入至少一个相邻块中。49.根据权利要求48所述的装置,其中用于推导块编码模式、与本地超块相关的信息和运动信息至少其中之一的推导规则取决于块扫描顺序。50.根据权利要求44所述的装置,其中块扫描顺序与视频编码推荐性标准或视频编码标准规定的现有块扫描顺序相同或不同。51.根据权利要求38所述的装置,其中所述解码器(400)从直接预测模块解码至少一个与本地超块划分相关的语法元素,从而基于自适应直接预测模块进行超块帧划分,所述自适应直接预测模块可以将不同的可能预测器用于直接预测模式。52.根据权利要求51所述的装置,其中至少一个与本地超块划分相关的语法元素作为用于直接预测的自适应预测器选择器,并且其中运动信息和块模式类型中的至少之一被直接预测或基于相邻宏块数据和超块语法信息推导。53.根据权利要求38所述的装置,其中残差解码适于利用编码的量化系数和非编码的量化系数至少其中之一的超块自适应变换尺寸和超块自适应信令其中至少之一自适应地处理超块尺寸。54.—种方法,包括用于通过进行图像的原始划分将图像划分为中等尺寸的一组图像块(510),选择其中某些图像块进行进一步划分(530),并选择其他图像块进行合并(520),以解码图像,其中进一步的划分和合并使用自适应的基—f树的帧划分(520,530)。55.根据权利要求54所述的方法,其中划分由自顶向下树划分和自底向上的树连接的结合获得(550)。56.根据权利要求55所述的方法,其中所述解码步骤使用原始划分的块尺寸-来牛成基于树的帧划分,所述块尺寸是能够用于与特定视频解码标准或推荐性标准相关的基于树的帧划分的任何可用块尺寸(510,600)。57.根据权利要求55所述的方法,其中所述解码步骤利用自底向上的树连接来产生用于视频数据的超块划分(550,600)。58.根据权利要求57所述的方法,其中所述解码步骤使用自底向上的树连接由16xl6宏块生成任何32x32、16x32和32xl6划分(520)。59.根据权利要求55所述的方法,其中所述解码步骤解码至少一个高级语法以选择性地允许和禁止自顶向下树划分和自底向上的树连接至少其屮之一。60.根据权利要求59所述的方法,其中所述解码步骤从片标题级、补充增强信息(sm)级、图像参数集级、序列参数集级和、网络抽象层单元标题级、图像级、片级和宏块级的至少其中之一解码高级语法。61.根据权利要求55所述的方法,其中所述解码步骤由与视频数据对应的产生的比特流和与视频数据对应的辅助信息至少其中之一中至少隐式或显式地解码与本地超块相关的信息(840,820,845,850,1010,1020,1045,1055)。62.根据权利要求61所述的方法,其中所述解码步骤通过解码至少一个宏块级的附加语法要素至少隐式或显式地解码与本地超块相关的信息(810,820,840,1010,1045)。63.根据权利要求61所述的方法,其中与本地超块相关的信息包括用于矩形超块的超块允许标志、超块禁止标志、超块类型、超块尺寸和划分方向其中至少之一(810,820,840,1010,1045)。64.根据权利要求61所述的方法,其中所述至少一个附加语法元素从被嵌入超块的一个块中或者分布在属于包含在超块中的相同一组块中的一个以上的块中解码(810,820,840,1010,1045)。65.根据权利要求61所述的方法,其中所述至少一个附加语法元素选择性地标示与本地超块相关的信息是否相对于相应于与本地超块相关的信总的先前编码的块由至少一个相邻块继承(850,1020),并且其中至少一个相邻块的至少一个块编码模式和运动信息从至少一个附加语法元素直接推导,从而能够对至少一个相邻块的至少一个块编码模式和运动信息直接解码。66.根据权利要求65所述的方法,其中用于推导块编码模式、与本地超块相关的信息和运动信息至少其中之一的推导规则取决于块扫描顺序。67.根据权利要求61所述的方法,其中块扫描顺序与视频编码推荐性标准或视频编码标准规定的现有块扫描顺序相同或不同。68.根据权利要求55所述的方法,其中所述解码步骤从直接预测模块解码至少一个与本地超块划分相关的语法元素,从而基于自适应直接预测模块进行超块帧划分,所述自适应直接预测模块可以将不同的可能预测器用T"-直接预测模式。69.根据权利要求68所述的方法,其中至少一个与本地超块划分相关的语法元素作为用于直接预测的自适应预测器选择器,并且其中运动信息和块模式类型中的至少之一被直接预测或基于相邻宏块数据和超块语法信总推导(840,845,850,1010,1015,1020,1045)。70.根据权利要求55所述的方法,其中残差解码适于利用编码的量化系数和非编码的量化系数至少其中之一的超块自适应变换尺寸和超块自适应信令其中至少之一处理超块尺寸。71.—种用于视频编码的视频信号结构,包括图像,通过进行图像的原始划分将图像划分为中等尺寸的一组图像块、选择其中某些图像块进行进一步划分、并选择其他图像块进行合并来进行编码。72.—种存储介质,具有编码在其上的视频信号,包括图像,通过进行图像的原始划分将图像划分为中等尺寸的一组图像块、选择其中某些图像块进行进一步划分、并选择其他图像块进行合并来进行编码。全文摘要本发明提出了一种用于降低分辨率划分的方法和装置。装置包括编码器(300),用于使用自适应的基于树的帧划分编码视频数据,其中划分由自顶向下树划分和自底向上的树连接的结合获得。文档编号H04N7/26GK101507280SQ200780030822公开日2009年8月12日申请日期2007年8月16日优先权日2006年8月25日发明者奥斯卡·迪沃拉·埃斯科达,鹏尹申请人:汤姆逊许可公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1