支持模式切换的熵编码的制作方法

文档序号:7991601阅读:321来源:国知局
支持模式切换的熵编码的制作方法
【专利摘要】描述了一种解码器,用于解码由媒体数据编码而成的数据流。所述解码器包括:模式开关,被配置为根据所述数据流来激活低复杂度模式或高效率模式;熵解码引擎,被配置为使用多个熵解码方案中所选择的一个,通过熵解码从所述数据流中检索符号序列中的每个符号;去符号化器,被配置为将该符号序列去符号化,以便获得语法元素序列;重构器,被配置为根据该语法元素序列,重构所述媒体数据,其中,根据所述低复杂度模式和所述高效率模式中激活的一个,来进行上述选择。另一方面,去符号化器被配置为进行去符号化,以在激活高效率模式的情况下,所述控制参数以第一速率根据所述数据流变化,并且在激活低复杂度模式的情况下,所述控制参数恒定,与数据流无关,或者根据数据流改变,但是以比所述第一速率更低的第二速率改变。
【专利说明】支持模式切换的熵编码
【技术领域】
[0001]本发明涉及一种熵编码概念,用于对诸如视频或音频数据这样的媒体内容进行编码。
【背景技术】
[0002]在本【技术领域】中已知很多音频和视频音频编解码器。通常,这些编解码器减少所需要的数据量,以便表示媒体内容,例如,视频或音频,即,这些编解码器压缩数据。然而,在这些编解码器上强加的要求不限于实现高压缩效率。确切地说,编解码器常常专用于某些应用任务。因此,在音频领域中,具有专用于语音编码的音频编解码器,同时具有专用于编码音乐的其他编解码器。而且,在某些应用中,编码延迟至关重要,因此,一些编解码器专用于低延迟。除此之外,大部分这些编解码器可用于不同等级的复杂度/有效性。即,这些水平中的一些水平用于更低的编码复杂度,以更低的编码效率为代价。例如,H.264视频编码标准提供基线规范和主要规范。首先,在激活/去激活某些编码选项/小工具时,这些编码规范彼此不同,例如,在音频编码领域中可用/没有SBR以及在视频编码领域中可用/没有B帧。除此之外,这些媒体编解码器的很大一部分复杂性与语法元素的熵编码有关。通常,VLC熵编码方案常常不如算法编码方案复杂,而算法编码方案现实了更好的编码效率。因此,在H264标准中,仅仅在主要规范中(而非在基线规范中),可利用上下文自适应二元算法编码(CABAC)。明显,符合基线规范的解码器可被配置为不如符合主要规范的解码器复杂。这同样适用于编码器。由于包括这种解码器和/或编码器的手持式装置具有有限的能量可用性,所以关于更低的复杂度方面,基线规范优于主要规范。不仅由于算法编码方案更复杂,而且由于这些符合主要规范的解码器/编码器必须与符合基线规范的数据流向后兼容,所以符合主要规范的解码器/编码器更复杂。换言之,由于算法编码方案使得复杂度更低的可变长度编码方案增加复杂度,所以复杂度增大。
[0003]鉴于以上情况,如果具有允许在一方面的编码复杂度与另一方面的编码效率之间的编解码器的比率具有更有效的可扩展性的编码概念,那么这会较为有利。

【发明内容】

[0004]因此,本发明的一个目标在于,提供这种编码概念。
[0005]由所附的独立权利要求的主题实现该目标。
[0006]根据一个实施方式,一种用于解码由媒体数据编码而成的数据流的解码器包括:模式开关,被配置为根据数据流来激活低复杂度模式或高效率模式;熵解码引擎,被配置为使用多个熵解码方案中所选择的一个,通过熵解码从数据流中检索符号序列中的每个符号;去符号化器,被配置为将该符号序列去符号化,以便获得语法元素序列;重构器,被配置为根据该语法元素序列,重构媒体数据,其中,根据低复杂度模式和高效率模式中被激活的一个,来进行选择。
[0007]根据另一个实施方式,一种用于解码由媒体数据编码而成的数据流的解码器包括:模式开关,被配置为根据数据流来激活低复杂度模式或高效率模式;去符号化器,被配置为使用可由控制参数控制的映射函数,来将从数据流中获得的符号序列去符号化,以获得具有整数值的语法元素,该映射函数用于将符号序列字的域映射到具有整数值的语法元素的上域(co-domain)中;以及重构器,被配置为根据具有整数值的语法元素,重构媒体数据,其中,该去符号化器被配置为进行去符号化,以在激活高效率模式的情况下,使得控制参数以第一速率根据数据流而变化,并且在激活低复杂度模式的情况下该控制参数恒定而与数据流无关,或者以比第一速率更低的第二速率根据数据流而改变。
【专利附图】

【附图说明】
[0008]下面参照示图,描述本申请的优选的实施方式,在这些示图中,
[0009]图1示出了根据一个实施方式的编码器的方框图;
[0010]图2a到2c示意性示出了样品阵列的不同细分,例如,将图片细分成块;
[0011]图3示出了根据一个实施方式的解码器的方框图;
[0012]图4更详细地示出了根据一个实施方式的编码器的方框图;
[0013]图5更详细地示出了根据一个实施方式的解码器的方框图;
[0014]图6示意性示出了从空间域到谱域的块变换、所产生的变换块及其再变换;
[0015]图7示出了根据一个实施方式的编码器的方框图;
[0016]图8示出了根据一个实施方式的适用于由图8的编码器生成的解码比特流的解码器的方框图;
[0017]图9示出了根据一个实施方式示出带有多路复用局部比特流的数据包的示意图;
[0018]图10示出了根据另一个实施方式示出带有使用尺寸固定的分段的可选分区的数据包的示意图,该示意图;
[0019]图11示出了根据使用局部比特流交错的一个实施方式的编码器的方框图;
[0020]图12示出了根据一个实施方式说明在图11的编码器侧的码字缓冲器的状态的实例的不意图;
[0021]图13示出了根据使用局部比特流交错的一个实施方式的解码器的方框图;
[0022]图14示出了根据使用利用单组码字的码字交错的一个实施方式的解码器的方框图;
[0023]图15示出了根据使用长度固定的比特序列的交错的一个实施方式的编码器的方框图;
[0024]图16示出了根据一个实施方式说明在图15的编码器侧的全局比特缓冲器的状态的实例的不意图;
[0025]图17示出了根据使用长度固定的比特序列的交错的一个实施方式的解码器的方框图;
[0026]图18示出了根据一个实施方式的支持模式切换的解码器;
[0027]图19示出了根据另一个实施方式的支持模式切换的解码器;
[0028]图20示出了根据一个实施方式的适合图18的解码器的编码器;
[0029]图21示出了根据一个实施方式的适合图19的解码器的编码器;以及
[0030]图22 不出了 pStateCtx 和 fullCtxState/256 的映射。[0031]要注意的是,在描述示图期间,在这些示图的几幅图中出现的部件在这些示图的每幅图中使用相同的参考符号表示,并且避免在功能上重复描述这些部件,以便避免不必要的重复。然而,在一幅示图中提供的功能和描述也适用于其他示图,除非明确表示相反。
【具体实施方式】
[0032]下面,首先相对于图1到17描述通用视频编码概念的实施方式。图1到6涉及在语法水平上进行操作的视频编解码器的一部分。以下图8到17涉及代码部分的实施方式,该代码部分涉及将语法元素流转换成数据流,反之亦然。然后,通过在图1到17中概述的一般概念的可能实现方式的形式,描述本发明的特定方面和实施方式。然而,应提前注意的是,本发明的实施方式的大部分方面不限于视频编码。在下述很多细节上,这同样适用。
[0033]图1示出了可实现本申请的方面的编码器10的一个实例。
[0034]编码器将信息样本阵列20编码成数据流。该信息样本阵列可表示任何类型的空间取样的信息信号。例如,信息样本20可为静止图片或视频图片。因此,信息样本可与亮度值、颜色值、照度值、色度值等对应。然而,在样品阵列20为由例如光传感器的时间等生成的深度图的情况下,信息样品还可为深度值。
[0035]编码器10为基于块的编码器。即,编码器10以块40为单位,将样品阵列20编码成数据流30。以块40为单位进行编码不一定表示编码器10完全独立于彼此编码这些块40。确切地说,编码器10可使用先前编码的块的重构,以便外插或帧内预测剩余的块,并且可使用块的粒度,用于设置编码参数,即,用于设置与各个块对应的每个阵列区域编码的方式。
[0036]而且,编码器10为变换编码器。即,编码器10使用变换来将块40编码,以便将在每个块40内的信息样本从空间域传递到谱域内。可使用二维变换(例如,FFT的DCT等)。优选地,块40具有二次形状或矩形。
[0037]如图1中所示,将样品阵列20细分成块40,仅仅用于说明的目的。图1示出了细分成正方形或矩形块40的规则二维设置的样品阵列20,这些正方形或矩形块通过非重叠的方式彼此邻接。可预先确定块40的尺寸。即,编码器10可不将有关在数据流30内的块40的块尺寸的信息传递给解码侧。例如,解码器可预期预定的块尺寸。
[0038]然而,能够具有几种备选方案。例如,块可彼此重叠。然而,可在一种种程度上限制重叠,以使得每个块具有与任何相邻的块不重叠的部分,或者以使得块的每个样品最多与在相邻的块之中沿着预定的方向与当前块并列设置的一个块重叠。后一种情况表示左右相邻的块可与当前块重叠,以便完全覆盖(cover)当前块,但是不彼此叠加(overlay),并且这同样适用于在垂直和对角线方向的相邻的块。
[0039]作为另一个备选方案,样品阵列20细分成块40,编码器10可使细分适合于样品阵列20的内容,通过比特流30将与所使用的细分相关的细分信息传递给解码器。
[0040]图2a到2c示出了样品阵列20细分成块40的不同实例。图2a示出了样品阵列20基于四叉树细分成不同尺寸的块40,代表性块由尺寸增大的40a、40b、40c以及40d表示。根据图2a的细分,首先将样品阵列20分成树块40d的规则的二维设置,反过来,树块具有与其相关的单独细分信息,根据该信息,可根据四叉树结构进一步细分或不细分某个树块40d。根据四叉树结构,位于块40d左边的树块作为例证细分成更小的块。编码器10可为在图2a中由实线和虚线表示的每个块进行一个二维变换。换言之,编码器10能够以块细分为单位变换阵列20。
[0041]可使用更普通的基于多树的细分,代替基于四叉树的细分,并且每个层次等级的子节点的数量在不同的层次等级之间可不同。
[0042]图2b示出了细分的另一个实例。根据图2b,首先将样品阵列20分成宏块40b,这些宏块通过非重叠的相互邻接的方式设置在规则的二维设置中,其中,每个宏块40b使细分信息与其相关,根据该细分信息,可不细分宏块,或者如果进行了细分,那么通过规则的二维方式将宏块细分成尺寸相等的子块,以便为不同的宏块实现不同的细分粒度。结果,在不同尺寸的块40内细分样品阵列20,不同尺寸的代表由40a、40b以及40a’表不。与在图2a中一样,编码器10在每个块上进行二维变换,这些块在图2b中由实线和虚线表示。稍后讨论图2c。
[0043]图3示出了能够将由编码器10生成的数据流30解码的解码器50,以重构样品阵列20的经重构的版本60。解码器50从数据流30中为每个块40提取变换系数块,并且通过在每个变换系数块上执行逆变换,来重构经重构的版本60。
[0044]编码器10和解码器50可被配置为执行熵编码/解码,以便分别将有关变换系数块的信息插入数据流内并且从该数据流中提取该信息。稍后描述在这方面的细节。应注意的是,数据流30不一定包括用于样品阵列20的所有块40的有关变换系数块的信息。确切地说,块40的子集可通过另一种方式编码成比特流30。例如,编码器10可决定抑制插入用于块40中的某个块的变换系数块,而是在比特流30内插入替换的编码参数,这些编码参数能够允许解码器50预测或在经重构的版本60内填充相应的块。例如,编码器10可进行纹理分析,以便在样品阵列20内定位由解码器通过纹理合成的方式在解码器侧填充的样品阵列并且在比特流内表明这一点。
[0045]如以下示图中所述,变换系数块不一定表示样品阵列20的相应块40的最初信息样品的谱域表征。确切地说,这种变换系数块可表示各个块40的预测残差的谱域表征。图4示出了这种编码器的一个实施方式。图4的编码器包括变换级100、熵编码器102、逆变换级104、预测器106、减法器108以及加法器110。减法器108、变换级100以及熵编码器102在图4的编码器的输入112和输出114之间按照提及的顺序串联连接。逆变换级104、加法器110以及预测器106在变换级100的输出与减法器108的反相输入之间按照提及的顺序连接,预测器106的输出还与加法器110的另一个输入连接。
[0046]图4的编码器为预测性基于变换的块编码器。即,根据相同样品阵列20的先前编码并且重构的部分中或者从显示时间内在当前样品阵列20之前或之后的先前编码和重构的其他样品阵列,来预测进入输入112的样品阵列20的块。由预测器106进行该预测。减法器108从这种最初的块中减去预测,并且变换级100在预测残差上进行二维变换。二维变换本身或在变换级100内部的后续措施可造成在变换系数块内量化变换系数。量化的变换系数块例如由熵编码在熵编码器102内进行无损编码,在输出114处输出所产生的数据流。逆变换级104重构量化残差,并且加法器110反过来使经重构的残差与相应的预测相结合,以便获得经重构的信息样品,根据这些信息样品,预测器106可预测上述当前编码的预测块。预测器106可使用不同的预测模式,例如,帧内预测模式以及帧间预测模式,来预测块,并且将预测参数转发给熵编码器102,用于插入数据流内。对于每个帧间预测的预测块,通过熵编码器114将各个运动数据插入比特流内,以便能够允许解码侧重新进行预测。用于图片的预测块的运动数据可涉及包括语法元素的语法部分,该语法元素表示相对于运动向量预测器差分地(differentially)地编码用于当前的预测块的运动向量的运动向量差值,例如,通过规定的方法从相邻的已经编码的预测块的运动向量中获得该预测器。
[0047]S卩,根据图4的实施方式,变换系数块表示样品阵列的残差的频谱表征,而非其实际的信息样品。即,根据图4的实施方式,语法元素序列可进入熵编码器102内,以被熵编码成数据流114。这语法元素序列可包括用于帧间预测块的运动向量差值语法元素、涉及表示重要变换系数水平的位置的重要图(significance map)的语法元素以及为变换块定义重要变换系数水平本身的语法元素。
[0048]应注意的是,图4的实施方式具有几个可选方式,在说明书的介绍部分内已经描述了其中的一些可选方式,该描述以此并入图4的描述中。
[0049]图5示出了能够将由图4的编码器生成的数据流解码的解码器。图5的解码器包括熵解码器150、逆变换级152、加法器154以及预测器156。熵解码器150、逆变换级152以及加法器154按照上述顺序在图5的解码器的输入158与输出160之间串联连接。熵解码器150的另一个输出与预测器156连接,该预测器反过来在加法器154的输出与其另一个的输入之间连接。熵解码器150从在输入158处进入图5的解码器的数据流中提取变换系数块,其中,在级152中,将逆变换应用于变换系数块中,以便获得残差信号。残差信号在加法器154处与预测器156进行的预测相结合,以便在输出160处获得样品阵列的经重构的版本的重构块。根据经重构的版本,预测器156生成预测,从而在编码器侧重建由预测器106进行的预测。为了获得与在编码器侧使用的预测相同的预测,预测器156使用预测参数,熵解码器150还在输入158处从数据流中获得这些预测参数。
[0050]应注意的是,在上述实施方式中,用于进行残差预测和变换的空间粒度不必彼此相等,这在图2C中进行了显示。该示图示出了细分由实线表示的预测粒度以及由虚线表示的残差粒度的预测块。可见,可由编码器选择彼此独立的细分。更确切地说,数据流语法可允许定义与预测细分独立的残差细分。或者,残差细分可为预测细分的拓展,以便每个残差块等同于预测块或者为预测块的合适的子集。这在图2a和图2b中进行了显示,例如,在这些图中,再次显示了由实线表示的预测粒度以及由虚线表示的残差粒度。即,在图2a_2c中,具有与其相关的参考符号的所有块为残差块,对这些残差块进行一次二维变换,而包含虚线块40a的更大的实线块例如为预测块,为这些预测块单独地进行预测参数设置。
[0051]以上实施方式的共同之处在于,(残余或最初)样品的块要在编码器侧变换成变换系数块,该变换系数块反过来要在解码器侧逆变换成样品的重构块。这在图6中进行了显示。图6示出了样品块200。在图6的情况下,该块200例如为方形,并且在尺寸上为4x4样品202。样品202沿着水平方向X和垂直方向y均匀地设置。通过上述二维变换T,块200变换成谱域,即,变换成变换系数206的块204,变换块204与块200的尺寸相同。即,变换块204在水平方向和垂直方向具有的变换系数206与块200具有的样品一样多。然而,由于变换T为谱变换,所以变换系数206在变换块204内的位置不与空间位置对应,而是与块200的内容的光谱分量对应。具体地,变换块204的水平轴与一个轴(光谱频率在水平方向沿着该轴单调递增)对应,而垂直轴与一个轴(光谱频率在垂直方向沿着该轴单调递增)对应,其中,DC分量变换系数位于块204的角落内(在此处例如,为左上角),以便在右下角定位在水平和垂直方向与最高频率对应的变换系数206。忽略空间方向,某个变换系数206所属的空间频率通常从左上角向右下角增大。通过逆变换T-1,变换块204从谱域中重新传递到空间域中,以便重新获得块200的副本208。在变换期间未造成量化/损失的情况下,重构较为完美。
[0052]如上所述,从图6中可见,块200的更大块尺寸增大所产生的谱表示204的频谱分辨率。另一方面,量化噪声常常散布在整个块208上,因此,由于量化噪声,所以在块200内的突出的并且非常部分化的对象常常造成重新变换的块偏离最初块200。然而,使用更大块的主要优点在于,与更小的块相比,在一方面的重要(即,非零(量化))变换系数的数量(即,等级)与另一反面的不重要变换系数的数量之间的比率在更大的块内可减小,从而能够具有更好的编码效率。换言之,通常在变换块204上稀疏地分布重要的变换系数水平,即,未量化为零的变换系数。由于这一点,根据下面更详细地描述的实施方式,通过重要图的方式,在数据流内用信号表示重要变换系数水平的位置。与其分开地,在量化变换系数的情况下,在数据流内传输重要变换系数的值(即,变换系数水平)。[0053]因此,上述所有编码器和解码器被配置为处理语法元素的某个语法。即,假设通过规定的方式在数据流内依次设置上述语法元素(例如,变换系数水平)、涉及变换块的重要图的语法元素、涉及帧间预测块的运动数据语法元素等。例如,可通过伪代码的形式表示这种规定的方式,与在H.264标准或其他音频/视频编解码器中进行的一样。
[0054]换言之,根据规定某些语法元素类型、其语义学以及在其间的顺序的预先定义的语法结构,以上描述主要处理媒体数据(在此处作为例证为音频数据)到语法元素序列的转换。如下所述,图4和5的熵编码器和解码器可被配置为进行操作并且可构成。熵编码器和解码器负责在语法元素序列和数据流(即,符号或比特流)之间进行转换。
[0055]在图7中示出了根据一个实施方式的熵编码器。编码器将一连串语法元素301无损地转换成由两个或多个局部比特流312构成的组。
[0056]在本发明的一个优选的实施方式中,每个语法元素301与由一个或多个类别构成的组中的一个类别相关,即,语法元素类型。例如,类别可规定语法元素的类型。在混合视频编码的背景下,单独的类别可与宏块编码方式、块编码方式、参考图片索引、运动向量差值、细分标记、编码块标记、量化参数、变换系数水平等相关。在其他应用领域(例如,音频、语音、文本、文档或通用数据编码)中,语法元素能够具有不同的分类。
[0057]通常,每个语法元素可采用一组有限或可数无限的值中的一个值,其中,对于不同的语法元素类别,这组可能的语法元素值可不同。例如,具有二元语法元素以及具有整数值的语法元素。
[0058]为了降低编码和解码算法的复杂度,并且为了允许不同的语法元素和语法元素类别具有通用的编码和解码设计,语法元素301转换成二元判定的有序集合,并且然后,这些二元判定由简单的二元编码算法处理。因此,二值化器302通过双射(bijectively)的方式将每个语法元素301的值映射到一系列(或串或字)二进制位(bin) 303中。这系列二进制位303表示一组有序的二元判定。每个二进制位303或二元判定可采用由两个值构成的组中的一个值,例如,值O和I中的一个。对于不同的语法元素类别,二值化方案可不同。一个特定的语法元素类别的二值化方案可取决于这组可能的语法元素值和/或特定类别的语法元素的其他性能。[0059]表1示出了可数无限集的三个实例二值化方案。可数无限集的二值化方案还可用于语法元素值的有限集。尤其对于语法元素值的大有限集,可忽略(由未使用的二进制位序列造成)无效率性,但是这种二值化方案的普遍性在复杂度与存储要求方面提供优点。对于语法元素值的小有限集,通常优选地使二值化方案适应于可能的符号值的数量(在编码效率方面)。
[0060]表2示出了 8个值的有限集的三个实例二值化方案。通过以二进制位序列的有限集表示无冗余码的方式来修改一些二进制位序列(以及潜在地将二进制位序列重新排序),从可数无限集的通用二值化方案中可获得有限集的二值化方案。例如,通过修改通用一元二值化的语法元素7的二进制位序列(见表1),在表2中产生缩短的一元二值化方案。通过修改通用的指数哥伦布(Exp-Golomb)O阶二值化(见表1)并且通过将二进制位序列重新排序(将符号7的缩短的二进制位序列分配给符号I ),在表2中产生O阶的缩短的并且重新排序的指数哥伦布二值化。对于语法元素的有限集,还能够使用非系统化的/非通用的二值化方案,如在表2的最后一列中所例证。
[0061]表1:可数无限集(或大有限集)的二值化实例
【权利要求】
1.一种用于解码由媒体数据编码而成的数据流(401)的解码器,包括: 模式开关(400),被配置为根据所述数据流来激活低复杂度模式或高效率模式; 熵解码引擎(608),被配置为使用多个熵解码方案(322)中被选择的一个,通过熵解码从所述数据流中检索符号序列(326)中的每个符号; 去符号化器(314),被配置为将所述符号序列(326)去符号化,以获得语法元素序列(327); 重构器(404),被配置为根据所述语法元素序列,重构所述媒体数据; 其中,根据所述低复杂度模式和所述高效率模式中激活的一个,来进行所述选择。
2.根据权利要求1所述的解码器,其中,所述熵解码引擎被配置为使所述多个熵解码方案中的每一个都包括对已经为其选择相应的熵解码方案的符号的算法解码,在所述算法解码中使用不同的概率估计时,所述多个熵解码方案彼此不同。
3.根据权利要求2所述的解码器,其中,所述熵解码引擎被配置为使所述多个熵解码方案以共同的概率间隔执行自身的概率细分。
4.根据权利要求1所述的解码器,其中,所述熵解码引擎包括: 多个熵解码器(322),每个所述熵解码器被配置为将所述数据流中的码字转换成部分符号序列(321);以及 选择器(402),被配置为从所述多个熵解码器(322)中所选择的一个中检索符号序列(326)中的每个符号。
5.根据权利要求1到4中任一项所述的解码器,其中,在所述高效率模式被激活的情况下,根据所述符号序列(326)中先前检索的符号,进行所述选择;并且在所述低复杂度模式被激活的情况下,独立于所述符号序列中先前检索的任何符号,进行所述选择。
6.根据权利要求1到5中任一项所述的解码器,其中,所述数据流被构成为连续部分,并且所述符号序列中的每个符号与多个符号类型中的相应的一个相关,其中,对于在当前部分内的预定符号类型的符号,在所述高效率模式被激活的情况下,所述选择根据所述当前部分内的预定符号类型的所述符号序列中的先前检索的符号来进行变化,并且在所述低复杂度模式被激活的情况下,所述选择在所述当前部分内保持恒定。
7.根据权利要求1到6中任一项所述的解码器,其中,所述符号序列(326)中的每个符号与多个符号类型中的相应一个相关,其中,对于预定符号类型的预定符号,所述选择: 在所述高效率模式被激活的情况下,根据所述符号序列中先前检索的符号选择多个上下文中的一个,并且根据与所选择的上下文相关的概率模型,在所述熵解码器(322)或熵解码方案之中进行选 择,同时根据所述预定的符号,更新与所选择的上下文相关的概率模型,以及 在所述低复杂度模式被激活的情况下,根据所述符号序列中先前检索的符号选择多个上下文中的一个,并且根据与所选择的上下文相关的概率模型,在所述熵解码器(322)或熵解码方案之中进行选择,同时使与所选择的上下文相关的概率模型恒定。
8.根据权利要求1到7中任一项所述的解码器,其中,所述符号序列(326)中的每个符号与多个符号类型中的相应一个相关,其中, 对于预定符号类型的每个符号,在所述高效率模式被激活的情况下,根据与所述预定符号类型相关的概率模型进行所述选择,并且根据所述预定符号类型的符号,以第一更新速率更新所述概率模型,以及 对于所述预定符号类型的每个符号,在所述低复杂度模式被激活的情况下,根据所述概率模型进行所述选择,并且根据所述预定符号类型的符号,以低于所述第一更新速率的第二更新速率,间断地更新所述概率模型。
9.根据权利要求1到8中任一项所述的解码器,其中,对于预定符号类型的符号, 在所述高效率模式被激活的情况下,使用以第一概率状态精度限定的概率状态指数,来进行概率模型适应,并且根据以所述第一概率状态精度限定的所述概率状态指数,进行所述选择,以及 在所述低复杂度模式被激活的情况下,不进行概率模型适应,或使用以低于所述第一概率状态精度的第二概率状态精度限定的概率状态指数进行概率模型适应,并且根据以所述第二概率状态精度限定的概率状态指数,进行所述选择。
10.根据权利要求1到9中任一项所述的解码器,其中,所述重构器(404)被配置为独立于被激活的所述高效率模式或所述低复杂度模式进行操作。
11.根据权利要求1到10中任一项所述的解码器,其中,所述重构器(404)被配置为根据独立于被激活的所述高效率模式或所述低复杂度模式的所述语法元素序列的一部分来重构变换系数水平(202)的变换块(200),所述语法元素序列的所述部分以非交错的方式包括: 重要图语法元素,其限定表示在所述变换块(200)内的非零变换系数水平的位置的重要图;以及 水平语法元素,其限定所述非零变换系数水平。
12.根据权利要求1到11中的任一项所述的解码器,其中,所述重构器(404)被配置为根据独立于被激活的所述高效率模式或所述低复杂度模式的所述语法元素序列的一部分来重构变换系数水平(202)的变换块(200),所述语法元素序列的所述部分以非交错的方式包括: 端位置语法元素(last_significant_pos_x.last_signif icant_pos_y),其表示在所述变换块内的最后一个非零变换系数水平的位置; 第一语法元素(coeff_significant_flag),其共同限定重要图并且对于在变换块(200)内沿着从DC位置引向所述最后一个非零变换系数水平的位置的一维路径(274)的每个位置,表示在所述各个位置的所述变换系数水平是否为非零; 第二语法元素(coefT_abs_greaterI),其对于根据所述第一二元语法元素定位非零变换系数水平的所述一维路径(274)的每个位置,表示在所述各个位置的变换系数水平是否大于I ; 第三语法元素(coeff_abs_greater2、coeff_abs_minus3),其对于根据所述第一二元语法元素定位大于I的变换系数水平的所述一维路径的每个位置,显示了在所述各个位置的各个变换系数水平比I多出的量, 其中,在所述端位置语法元素以及所述第一、第二和第三语法元素之间的顺序对于所述高效率模式和所述低复杂度模式是相同的,以及 其中,根据被激活的所述复杂度模式或所述高效率模式,对于所述去符号化器从中获得所述端位置语法元素以及所述第一语法元素、所述第二语法元素和/或所述第三语法元素的符号,不同地进行所述选择(402 )。
13.根据权利要求12所述的解码器,其中,对于在所述去符号化器从中获得所述第一语法元素和所述第二语法元素的符号的子序列之中的预定符号类型的符号,进行所述选择(402),以使得: 在所述高效率模式被激活的情况下,对于所述预定符号类型的每个符号,根据在所述符号的子序列之中的所述预定符号类型的先前检索的符号,选择多个上下文中的一个,并且根据与所选择的上下文相关的概率模型,进行所述选择,以及 在所述低复杂度模式被激活的情况下,以分段恒定的方式进行所述选择,以使得在所述子序列的连续持续的子部分上,所述选择恒定。
14.根据权利要求13所述的解码器,其中,对于在所述去符号化器从中获得所述第一语法元素和所述第二语法元素的所述符号的子序列中的所述预定符号类型的符号,进行所述选择,以使得: 对于所述预定符号类型的每个符号,根据在所述符号的子序列内具有预定符号值并且属于相同的子部分的所述预定符号类型的多个先前检索的符号,或者根据在所述符号子序列内属于相同的子部分的所述预定符号类型的多个先前检索的符号,选择多个上下文中的一个。
15.根据权利要求13所述的解码器,其中,对于根据所述第一二元语法元素定位大于I的变换系数水平的一维路径的每个位置,显示了在所述各个位置的各个变换系数水平比I超出的量的所述第三语法元素包括具有整数值的语法元素(coeff_abs_minus3),并且所述去符号化器(314)被配置为使用由控制参数可控制的映射函数,来将符号序列字的域映射到所述具有整数值的语法元素的上域中,如果所述高效率模式被激活,则根据先前的第三语法元素中具有整数值的语法元素,设置每个具有整数值的语法元素的控制参数,并且在所述低复杂度模式被激活的情 况下,以分段恒定的方式进行所述设置,以使得在子序列的连续持续的子部分上,所述设置恒定,其中,所述选择(402)在所述高效率模式和所述低复杂度模式中,选择所述熵解码器(322)或熵解码方案中与等概率分布相关的预定的一个,用于映射到所述具有整数值的语法元素上的符号序列字的符号。
16.根据权利要求1到15中任一项所述的解码器,其中,所述符号序列(326)的每个符号与多个符号类型中的相应一个相关,其中,对于多个预定符号类型中的每个符号类型的符号,根据与所述相应预定符号相关的相应概率模型进行所述选择,以使得 预定符号类型的数量在所述低复杂度模式中比在所述高效率模式中更低。
17.根据权利要求1到16中的任一项所述的解码器,其中,所述符号序列(326)的每个符号与多个符号类型中的相应一个相关,其中,对于预定符号类型的符号,根据与所述预定符号类型相关的概率模型进行所述选择(402),同时更新或不更新所述相关的概率模型,以使得 与所述高效率模式相比,所述符号序列的学习阶段的长度在所述低复杂度模式中更短,在该学习阶段上,对所述预定符号类型的符号的选择进行的同时,进行所述更新。
18.根据权利要求1到17中的任一项所述的解码器,其中,所述符号序列(326)的每个符号与多个符号类型中的相应一个相关,其中,对于预定符号类型的符号,根据与所述预定符号类型相关的概率模型进行所述选择,同时更新或不更新所述相关的概率模型,以使得与所述高效率模式相比,在选择所述预定符号类型的符号的同时进行更新的频率在所述低复杂度模式中更低。
19.根据权利要求1到18中任一项所述的解码器,其中,所述符号序列(326)的每个符号与多个符号类型中的相应一个相关,其中,对于预定符号类型的符号,通过根据所述符号序列中的多个先前检索的符号,选择多个上下文中的一个,并且根据与所选择的上下文相关的概率模型,在所述熵解码器(322)或所述熵解码方案之中进行选择,来进行所述选择,以使得 与所述高效率模式相比,所述上下文的数量和/或先前检索的符号的数量在所述低复杂度模式中更低。
20.根据权利要求1到19中任一项所述的解码器,其中,所述符号序列(326)的每个符号与多个符号类型中的相应一个相关,其中,对于预定符号类型的符号,根据与所述预定符号类型相关的概率模型,进行所述选择(402),并且根据所述预定符号类型的y个最近符号,对所述预定类型的每X个符号更新相关的概率模型,以使得 与所述高效率模式相比,比率x/y在所述低复杂度模式中更高。
21.根据权利要求1到20中任一项所述的解码器,其中,所述符号序列(326)的每个符号与多个符号类型中的相应一个相关,其中,在数据流中使用语法元素,根据计算,初始化与所述符号类型相关的概率模型,其中,计算与语法元素分别在所述低复杂度模式和所述高效率模式中相同,然而,计算结果的分辨率在所述低复杂度模式和所述高效率模式中更低。
22.一种用于解码由媒体数据编码而成的数据流的解码器,包括: 模式开关,被配置为根据所述数据流来激活低复杂度模式或高效率模式; 去符号化器,被配置为使用由控制参数可控制的映射函数,来将从所述数据流中获得的符号序列去符号化,以获得具有整数值的语法元素,用于将符号序列字的域映射到所述具有整数值的语法元素的上域中; 重构器,被配置为根据所述具有整数值的语法元素,重构所述媒体数据; 其中,所述去符号化器被配置为进行所述去符号化,以使得在所述高效率模式被激活的情况下,所述控制参数以第一速率根据所述数据流变化,并且在所述低复杂度模式被激活的情况下,所述控制参数恒定,与所述数据流无关,或者根据所述数据流改变,但是以比所述第一速率更低的第二速率改变。
23.一种用于解码由媒体数据编码而成的数据流的解码器,包括 模式开关,被配置为根据所述数据流来激活低复杂度模式或高效率模式; 去符号化器,被配置为使用由控制参数可控制的映射函数,来将从所述数据流中获得的符号序列去符号化,以获得具有整数值的语法元素,用于将符号序列字的域映射到所述具有整数值的语法元素的上域中; 重构器,被配置为根据所述具有整数值的语法元素,重构所述媒体数据; 其中,所述去符号化器被配置为进行所述去符号化,以使得在所述高效率模式被激活的情况下,所述控制参数以第一速率根据所述数据流变化,并且在所述低复杂度模式被激活的情况下,所述控制参数恒定,与所述数据流无关,或者根据所述数据流改变,但是以比所述第一速率更低的第二速率改变。
24.根据权利要求23所述的解码器,其中,所述去符号化器被配置为使所述映射函数使用缩短的一元代码,来在小于截止值的具有整数值的语法元素的域的第一间隔内进行映射,并且在等于和大于所述截止值的具有整数值的语法元素的域的第二间隔内组合具有所述截止值的所述缩短的一元代码的形式的前缀与具有VLC码字的形式的后缀,其中,所述解码器包括熵解码器,该熵解码器被配置为使用具有变化的概率估算的熵解码,从所述数据流中获取所述缩短的一元代码的多个第一二进制位,并且使用恒定的等概率旁路模式来获取所述VLC码字的多个第二二进制位。
25.一种用于将媒体数据编码成数据流(601)的编码器,包括 插入器(500),被配置为在所述数据流内用信号通知激活低复杂度模式或高效率模式; 构造器(504),被配置为将所述媒体数据预先编码成语法元素序列; 符号化器(507),被配置为将所述语法元素序列(327)符号化成符号序列; 熵编码引擎(710),被配置为使用多个熵编码方案中所选择的一个,将所述符号序列中的每个符号编码成所述数据流, 其中,所述熵编码引擎被配置为根据所述低复杂度模式和所述高效率模式中的被激活的一个,来进行所述选择。
26.根据权利要求2 5所述的编码器,其中,所述熵编码引擎被配置为使所述多个熵编码方案中的每一个都包括对已经为其选择相应的所述熵编码方案的符号的算法编码,在使用不同的概率估计时,所述多个熵编码方案彼此不同。
27.根据权利要求25所述的编码器,其中,所述熵编码引擎包括 多个熵编码器(310),每个所述熵编码器被配置为将部分符号序列转换成所述数据流的码字; 选择器(509),被配置为将所述符号序列中的每个符号转发给所述多个熵编码器(310)的被选择的一个。
28.一种用于将媒体数据编码成数据流(701)的编码器,包括: 插入器(700),被配置为在所述数据流内用信号通知激活低复杂度模式或高效率模式; 构造器(704),被配置为将所述媒体数据预先编码成包括具有整数值的语法元素的语法元素序列; 符号化器(707),被配置为使用可由控制参数控制的映射函数,来符号化所述具有整数值的语法元素,用于将所述具有整数值的语法元素的域映射到所述符号序列字的上域中;其中,所述符号化器被配置为进行所述符号化,以使得在所述高效率模式被激活的情况下,所述控制参数以第一速率根据所述数据流变化,并且在所述低复杂度模式被激活的情况下,所述控制参数恒定,与所述数据流无关,或者根据所述数据流改变,但是以比所述第一速率更低的第二速率改变。
29.一种用于解码由媒体数据编码而成的数据流(401)的方法,包括: 根据所述数据流来激活低复杂度模式或高效率模式; 使用多个熵解码方案(322)中的被选择的一个,通过熵解码从所述数据流中检索符号序列(326)中的每个符号;将所述序列符号(326)去符号化,以获得语法元素序列(327); 根据所述语法元素序列,重构所述媒体数据; 其中,根据所述低复杂度模式和所述高效率模式中被激活的一个,来在所述多个熵解码方案(322)之中进行选择。
30.一种用于解码由媒体数据编码而成的数据流的方法,包括: 根据所述数据流来激活低复杂度模式或高效率模式; 使用可由控制参数控制的映射函数,来将从所述数据流中获得的符号序列去符号化,以获得具有整数值的语法元素,用于将符号序列字的域映射到所述具有整数值的语法元素的上域中; 根据所述具有整数值的语法元素,重构所述媒体数据; 其中,进行所述去符号化,以使得在所述高效率模式被激活的情况下,所述控制参数以第一速率根据所述数据流变化,并且在所述低复杂度模式被激活的情况下,所述控制参数恒定,与所述数据流无关,或者根据所述数据流改变,但是以比所述第一速率更低的第二速率改变。
31.一种用于将媒体数据编码成数据流的方法,包括: 在所述数据流内用信号通知激活低复杂度模式或高效率模式; 将所述媒体数据预先编码成语法元素序列; 将所述语法元素序列符号化成符号序列; 使用多个熵编码方案中的被选择的一个,将所述符号序列中的每个符号编码成所述数据流, 其中,根据所述低复杂度模式和所述高效率模式中的被激活的一个,来在所述多个熵编码方案之中进行所述选择。
32.一种用于将媒体数据编码成数据流的方法,包括: 在所述数据流内用信号通知激活低复杂度模式或高效率模式; 将所述媒体数据预先编码成包括具有整数值的语法元素的语法元素序列; 使用可由控制参数控制的映射函数,来符号化所述具有整数值的语法元素,用于将所述具有整数值的语法元素的域映射到所述符号序列字的上域中; 其中,进行所述符号化,以使得在所述高效率模式被激活的情况下,所述控制参数以第一速率根据所述数据流变化,并且在所述低复杂度模式被激活的情况下,所述控制参数恒定,与所述数据流无关,或者根据所述数据流改变,但是以比所述第一速率更低的第二速率改变。
33.一种具有程序代码的计算机程序,用于在计算机上运行时,执行根据权利要求29到32中的任一项所述的方法。
【文档编号】H04N19/61GK103748886SQ201280039922
【公开日】2014年4月23日 申请日期:2012年6月18日 优先权日:2011年6月16日
【发明者】瓦莱里·乔治, 本杰明·布罗斯, 海纳·基希霍弗尔, 德特勒夫·马佩, 通·恩固因, 马蒂亚斯·普赖斯, 米斯查·西克曼, 扬·斯蒂格曼, 托马斯·维甘徳 申请人:弗兰霍菲尔运输应用研究公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1