确定用于变换系数级别熵编码和熵解码的上下文模型的方法和设备的制作方法

文档序号:7993983阅读:206来源:国知局
确定用于变换系数级别熵编码和熵解码的上下文模型的方法和设备的制作方法
【专利摘要】本发明提供一种用于确定对变换系数进行熵编码和熵解码的上下文模型的方法和设备。根据所述方法和设备,基于变换单元的颜色分量信息、当前子集的位置、以及在先前子集中是否存在具有比第一临界值更大的值的有效变换系数来获得上下文集索引ctxset,并基于具有连续的1的先前变换系数的长度来获得上下文偏移c1。此外,基于获得的上下文集索引和上下文偏移来确定用于对第一临界值标记进行熵编码和熵解码的上下文索引ctxidx。
【专利说明】确定用于变换系数级别熵编码和熵解码的上下文模型的方法和设备
【技术领域】
[0001]本发明涉及对视频进行编码和解码,更具体地讲,涉及一种用于选择在对变换系数的大小信息进行熵编码和熵解码中使用的上下文模型的方法和设备。
【背景技术】
[0002]根据图像压缩方法(诸如MPEG-1、MPEG-2或MPEG-4H.264/MPEG-4先进视频编码(AVC)),图像被划分为具有预定尺寸的块,然后,通过帧间预测或帧内预测获得块的残差数据。通过变换、量化、扫描、游程编码和熵编码对残差数据进行压缩。在熵编码中,对句法元素(诸如变换系数或运动矢量)进行熵编码以输出比特流。在解码器端,从比特流提取句法元素,并基于提取的句法元素执行解码。

【发明内容】

[0003]技术问题
[0004]将由本发明解决的技术问题是去除在对变换系数级别进行熵编码和熵解码中使用的不必要的上下文模型,并进行简化以减少用于存储上下文模型的存储器耗费。
[0005]本发明还提供增加选择上下文模型的操作的速度,并在不明显降低熵编码和熵解码性能的情况下简化所述操作。
[0006]解决方案
[0007]本发明提供一种用于选择在对变换系数级别进行熵编码和熵解码中使用的上下文模型的方法和设备,其中,基于颜色信息、包括变换系数的子集的位置、以及I的连续长度的信息等来选择在对变换系数级别进行熵编码和熵解码中使用的上下文模型。
[0008]有益效果
[0009]根据本发明的实施例,通过使用数量减少的上下文模型,可减少用于存储上下文模型的存储器的使用量,并且可在性能无明显降低的情况下执行对变换系数级别的熵编码和熵解码。
【专利附图】

【附图说明】
[0010]图1是根据本发明的实施例的用于对视频进行编码的设备的框图;
[0011]图2是根据本发明的实施例的用于对视频进行解码的设备的框图;
[0012]图3是用于描述根据本发明的实施例的编码单元的概念的示图;
[0013]图4是根据本发明的实施例的基于具有分层结构的编码单元的视频编码器的框图;
[0014]图5是根据本发明的实施例的基于具有分层结构的编码单元的视频解码器的框图;
[0015]图6是示出根据本发明的实施例的根据深度的较深层编码单元和分区的示图;[0016]图7是用于描述根据本发明的实施例的编码单元与变换单元之间的关系的示图;
[0017]图8是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图;
[0018]图9是根据本发明的实施例的根据深度的较深层编码单元的示图;
[0019]图10至图12是用于描述根据本发明的实施例的编码单元、预测单元和频率变换单元之间的关系的示图;
[0020]图13是用于描述根据表I的编码模式信息的编码单元、预测单元和变换单元之间的关系的不图;
[0021]图14是示出根据本发明的实施例的对在变换单元中包括的变换系数信息进行熵编码和熵解码的操作的流程图;
[0022]图15示出根据本发明的实施例的通过划分变换单元而获得的子集;
[0023]图16示出根据本发明的实施例的在图15的变换单元中包括的子集;
[0024]图17示出与图16的子集相应的有效图(significantmap);
[0025]图18示出与图16的子集相应的第一临界值标记;
[0026]图19示出与图16的子集相应的第二临界值标记;
[0027]图20是示出在图16至图19中示出的子集中包括的变换系数以及被熵编码和熵解码的变换系数信息的表;
[0028]图21a是示出根据本发明的实施例的熵编码设备的结构框图;
[0029]图21b是示出根据本发明的实施例的熵解码设备的结构框图;
[0030]图22是示出根据本发明的实施例的上下文建模器的结构框图;
[0031]图23示出根据本发明的实施例的被应用于亮度分量的变换单元的多个上下文集以及在每个上下文集中包括的多个上下文;
[0032]图24示出根据本发明的实施例的被应用于色度分量的变换单元的多个上下文集以及在每个上下文集中包括的多个上下文;
[0033]图25是示出根据本发明的实施例的确定用于对变换系数级别进行熵编码和熵解码的上下文模型的方法的流程图;
[0034]图26是示出根据本发明的实施例的确定用于对变换系数级别进行熵编码和熵解码的上下文模型的方法的详细流程图;
[0035]图27a示出根据本发明的实施例的用于确定上下文集的上下文集索引ctxset,其中,在对亮度分量的有效变换系数和色度分量的有效变换系数的第一临界值标记Gtrl标记和第二临界值标记Gtr2标记进行熵编码和熵解码中使用所述上下文集;
[0036]图27b示出根据本发明的实施例的在对第一临界值标记Gtrl标记和第二临界值标记Gtr2标记进行熵编码和熵解码中使用的上下文偏移;
[0037]图28示出根据本发明的实施例的显示上下文偏移索引Cl以及图20的被熵编码或熵解码的变换系数信息的表,其中,在对子集中包括的变换系数进行熵编码或熵解码中使用所述上下文偏移索引Cl ;
[0038]图29示出根据本发明的另一实施例的显示上下文偏移索引Cl以及被熵编码或熵解码的变换系数信息的表,其中,在对子集中包括的变换系数进行熵编码和熵解码中使用所述上下文偏移索引Cl。[0039]最佳实施方式
[0040]根据本发明的一方面,提供一种确定用于对变换系数级别进行熵编码和熵解码的上下文模型的方法,所述方法包括:将变换单元划分为具有预定尺寸的子集,并获得在每个子集中包括的不为O的有效变换系数;基于变换单元的颜色分量信息、包括有效变换系数的第一子集的位置信息、以及在第一子集之前被处理的第二子集中是否存在具有比第一临界值更大的值的有效变换系数,来获得用于在包括多个上下文的多个上下文集之中确定在对第一临界值标记进行熵编码和熵解码中使用的上下文集的上下文集索引,其中,第一临界值标记指示有效变换系数是否具有比第一临界值更大的值;基于具有连续的I的先前变换系数的长度来获得用于确定多个上下文中的一个上下文的上下文偏移,其中,所述多个上下文包括在对第一临界值标记进行熵编码和熵解码中使用的上下文集中;通过使用上下文集索引和上下文偏移来获得指示在对第一临界值标记进行熵编码和熵解码中使用的上下文的上下文索引。
[0041]根据本发明的另一方面,提供一种用于确定对变换系数级别进行熵编码和熵解码的上下文模型的设备,包括:映射单元,将变换单元划分为具有预定尺寸的子集,并获得在每个子集中包括的不为O的有效变换系数;上下文集获得单元,基于变换单元的颜色分量信息、包括有效变换系数的第一子集的位置信息、以及在第一子集之前被处理的第二子集中是否存在具有比第一临界值更大的值的有效变换系数,来获得用于在包括多个上下文的多个上下文集之中确定在对第一临界值标记进行熵编码和熵解码中使用的上下文集的上下文集索引,其中,第一临界值标记指示有效变换系数是否具有比第一临界值更大的值;上下文偏移获得单元,基于具有连续I的先前变换系数的长度来获得用于确定多个上下文中的一个上下文的上下文偏移,其中,所述多个上下文包括在对第一临界值标记进行熵编码和熵解码中使用的上下文集中;上下文确定单元,通过使用上下文集索引和上下文偏移来获得指示在对第一临界值标记进行熵编码和熵解码中使用的上下文的上下文索引。
【具体实施方式】
[0042]以下,在本申请的各种实施例中描述的“图像”可以是不仅指静止图像还指视频图像的包容性的概念。
[0043]当对与图像相关的数据执行各种操作时,与图像相关的数据被划分为数据组,并且可对在同一数据组中包括的数据执行相同操作。在此说明书中,根据预定标准形成的数据组被称为“数据单元”。以下,对每个“数据单元”执行的操作被理解为使用在数据单元中包括的数据来执行。
[0044]以下,将参照图1至图13描述根据本发明的实施例的用于对视频进行编码和解码的方法和设备,其中,基于具有分层树结构的编码单元对具有树结构的句法元素进行编码或解码。另外,将参照图14至图29详细地描述在参照图1至图13描述的对视频进行编码和解码中使用的熵编码和熵解码的方法。
[0045]图1是根据本发明的实施例的视频编码设备100的框图。
[0046]视频编码设备100包括分层编码器110和熵编码器120。
[0047]分层编码器110可以以预定数据单元为单位划分将编码的当前画面,以对每个数据单元执行编码。详细地讲,分层编码器110可基于最大编码单元划分当前画面,其中,最大编码单元是最大尺寸的编码单元。根据本发明的实施例的最大编码单元可以是尺寸为32X 32、64X64、128X 128,256X 256等的数据单元,其中,数据单元的形状是具有2的若干次方且大于8的宽度和长度的正方形。
[0048]根据本发明的实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元被空间划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度,最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
[0049]如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据本发明的实施例的最大编码单元进行划分,因此可根据深度对在最大编码单元中包括的空间域的图像数据进行分层地分类。
[0050]可预先确定编码单元的最大深度和最大尺寸,所述最大深度和最大尺寸限制对最大编码单元的高度和宽度进行分层划分的次数。
[0051]分层编码器110对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换句话说,分层编码器110通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码,选择具有最小编码误差的深度,来确定编码深度。确定的编码深度和根据最大编码单元的被编码的图像数据被输出到熵编码器120。
[0052]基于与等于或小于最大深度的至少一个深度相应的较深层编码单元,对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元来比较对图像数据进行编码的结果。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
[0053]随着编码单元根据深度被分层地划分并随着编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使在一个最大编码单元中编码单元与同一深度相应,也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此,即使图像数据被包括在一个最大编码单元中,图像数据仍被划分为根据深度的区域,并且在一个最大编码单元中编码误差根据区域而不同,因此在图像数据中编码深度可根据区域而不同。因此,可在一个最大编码单元中确定一个或更多个编码深度,并且可根据至少一个编码深度的编码单元来对最大编码单元的图像数据进行划分。
[0054]因此,分层编码器110可确定在最大编码单元中包括的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括在最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。可在最大编码单元的同一区域中根据深度来分层地确定具有编码深度的编码单元,并可在不同区域中独立地确定具有编码深度的编码单元。类似地,当前区域中的编码深度可独立于另一区域的编码深度而被确定。
[0055]根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元执行划分的次数有关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元执行划分的总次数。根据本发明实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度是O时,对最大编码单元划分一次的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是对最大编码单元划分四次的编码单元,则存在深度0、1、
2、3和4的5个深度等级,并因此第一最大深度可被设置为4,第二最大深度可被设置为5。
[0056]可根据最大编码单元执行预测编码和变换。还根据最大编码单元,基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
[0057]由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述,在最大编码单元中,现在将基于当前深度的编码单元来描述预测编码和变换。
[0058]视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
[0059]例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
[0060]为了对最大编码单元执行预测编码,可基于与编码深度相应的编码单元(S卩,不再被划分成与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元或通过对预测单元的高度和宽度中的至少一个进行划分而获得的数据单元。
[0061]例如,当2NX2N(其中,N是正整数)的编码单元不再被划分,并且成为2NX2N的预测单元时,分区的尺寸可以是2NX 2N、2NX N、NX 2N或NX N。分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,1:11或11:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
[0062]预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可对2N X 2N、2N X N、N X 2N或N X N的分区执行帧内模式或帧间模式。另外,可仅对2N X 2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
[0063]视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行变换。
[0064]为了对编码单元执行变换,可基于具有小于或等于编码单元的尺寸的数据单元,来执行变换。例如,用于变换的数据单元可包括用于帧内模式的数据单元和用于帧间模式的数据单元。
[0065]现在将用作变换的基础的数据单元称为“变换单元”。与编码单元类似,编码单元中的变换单元可被递归地划分为更小尺寸的区域,使得变换单元可以以区域为单位被独立地确定。因此,可基于根据变换深度的具有树结构的变换单元,对编码单元中的残差数据进行划分。
[0066]还可在变换单元中设置变换深度,其中,变换深度表示对编码单元的高度和宽度进行划分以获得变换单元所执行的划分的次数。例如,在2NX2N的当前编码单元中,当变换单元的尺寸是2NX2N时,变换深度可以是O,当变换单元的尺寸是NXN时,变换深度可以是1,当变换单元的尺寸是N/2XN/2时,变换深度可以是2。也就是说,还可根据变换深度设置具有树结构的变换单元。
[0067]根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要关于与预测编码和变换相关的信息的信息。因此,分层编码器110不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式和用于变换的变换单元的尺寸。
[0068]稍后将参照图3至图12详细描述根据本发明的实施例的最大编码单元中的根据树结构的编码单元,以及确定分区的方法。
[0069]分层编码器110可通过使用基于拉格朗日乘数的率失真优化,来测量根据深度的较深层编码单元的编码误差。
[0070]熵编码器120在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息,其中,所述最大编码单元的图像数据基于由分层编码器110确定的至少一个编码深度被编码。编码图像数据可以是图像的残差数据的编码结果。关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于在预测单元中的分区类型的信息、预测模式信息和变换单元的尺寸信息。具体地讲,如稍后将描述的,熵编码器120可基于在变换单元的颜色分量信息中是否存在具有比第一临界值更大的值的有效变换系数、当前子集的位置以及先前子集,来获得指示多个上下文集中的一个上下文集的上下文集索引,以便基于具有连续的I的先前变换系数的长度来获得上下文偏移。另外,熵编码器120基于获得的上下文集索引和获得的上下文偏移来确定指示上下文模型的上下文索引ctdldx,其中,上下文模型将被应用于第一临界值标记Greaterthanl标记和第二临界值标记Greaterthan2标记,其中,第一临界值标记Greaterthanl标记指示有效变换系数是否大于第一临界值(即,I),第二临界值标记Greaterthan2标记指示有效变换系数是否大于第二临界值(即,2)。稍后将描述将由熵编码器120执行的确定用于对变换系数进行熵编码的上下文模型的操作。
[0071]可通过使用根据深度的划分信息来定义关于编码深度的信息,其中,根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则对当前编码单元中的图像数据进行编码并输出,因此可定义划分信息以不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,并因此可定义划分信息以对当前编码单元进行划分来获得更低深度的编码单元。
[0072]如果当前深度不是编码深度,则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编码。
[0073]由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此最大编码单元的图像数据的编码深度可根据位置而不同,因此可针对图像数据设置关于编码深度和编码模式的信息。
[0074]因此,熵编码器120可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
[0075]根据本发明的实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获得的方形数据单元。可选择地,最小单元可以是包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大方形数据单元。
[0076]例如,通过熵编码器120输出的编码信息可被分类为根据深度的较深层编码单元的编码信息和根据预测单元的编码信息。根据深度的较深层编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。此外,根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头。
[0077]在视频编码设备100中,较深层编码单元可以是通过将更高深度的编码单元(更高一层)的高度或宽度划分成两份而获得的编码单元。换言之,当当前深度的编码单元的尺寸是2NX 2N时,更低深度的编码单元的尺寸是NXN。另外,尺寸为2NX 2N的当前深度的编码单元可包括最多4个更低深度的编码单元。
[0078]因此,视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。
[0079]因此,如果以传统宏块对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。因此,通过使用视频编码设备100,由于考虑图像的尺寸,在增加编码单元的最大尺寸的同时,基于图像的特征来调整编码单元,因此可增加图像压缩效率。
[0080]图2是根据本发明的实施例的视频解码设备200的框图。
[0081]视频解码设备200包括句法元素提取单元210、熵解码器220和分层解码器230。用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图1和视频编码设备100描述的定义相同。
[0082]句法元素提取单元210接收和解析编码视频的比特流。熵解码器220从解析的比特流,针对每个编码单元提取编码图像数据,并将提取的图像数据输出到分层解码器230,其中,编码单元具有根据每个最大编码单元的树结构。
[0083]另外,熵解码器220从解析的比特流,根据每个最大编码单元,提取关于具有树结构的编码单元的编码深度、编码模式、颜色分量信息、预测模式信息等的信息。提取的关于编码深度和编码模式的信息被输出到分层解码器230。比特流中的图像数据被划分为最大编码单元,使得分层解码器230可针对每个最大编码单元对图像数据进行解码。
[0084]可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外,根据深度的划分信息可被提取为关于编码深度的信息。
[0085]由熵解码器220提取的关于根据每个最大编码单元的编码深度和编码模式的信息是关于在以下情况下被确定为产生最小编码误差的编码深度和编码模式的信息,即,在编码端(诸如,视频编码设备100)根据最大编码单元对每个根据深度的较深层编码单元重复地执行编码的时候。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
[0086]由于关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,因此熵解码器220可根据预定数据单元,提取关于编码深度和编码模式的信息。可将被分配了相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
[0087]此外,如稍后将描述的,熵解码器220可基于在变换单元的颜色分量信息中是否存在具有比第一临界值更大的值的有效变换系数、当前子集的位置以及先前子集,来获得指示多个上下文集中的一个上下文集的上下文集索引,以便基于具有连续的I的先前变换系数的长度来获得上下文偏移。另外,熵解码器220基于获得的上下文集索引和获得的上下文偏移来确定指示上下文模型的上下文索引ctdldx,其中,上下文模型将被应用于第一临界值标记Greaterthanl标记和第二临界值标记Greaterthan2标记,其中,第一临界值标记Greaterthanl标记指示有效变换系数是否大于第一临界值(即,I),第二临界值Greaterthan2标记指示有效变换系数是否大于第二临界值(即,2)。
[0088]分层解码器230基于关于根据最大编码单元的编码深度和编码模式的信息,通过对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换言之,分层解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息,对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。
[0089]分层解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
[0090]此外,分层解码器230可基于关于根据编码深度的编码单元的变换单元的尺寸的信息,根据编码单元中的每个变换单元执行逆变换,以便根据最大编码单元执行逆变换。
[0091]分层解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,分层解码器230可通过使用关于预测单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息,针对当前最大编码单元的图像数据,对当前深度的编码单元进行解码。
[0092]换言之,可通过观察分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由分层解码器230以相同编码模式进行解码的一个数据单元。
[0093]视频解码设备200可获得关于当针对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元的信息,并且可使用所述信息来对当前画面进行解码。换言之,被确定为最大编码单元中的最优编码单元的具有树结构的编码单元的编码的图像数据可被解码。
[0094]因此,即使图像数据具有高分辨率和大数据量,也可通过使用编码单元的尺寸和编码模式,对图像数据进行有效地解码和恢复,其中,通过使用从编码器接收到的关于最优编码模式的信息,根据图像数据的特征自适应地确定所述编码单元的尺寸和编码模式。
[0095]现在将参照图3至图13描述根据本发明的实施例的确定具有树结构的编码单元、预测单元和变换单元的方法。
[0096]图3是用于描述根据本发明的实施例的编码单元的概念的示图。
[0097]编码单元的尺寸可被表示为宽度X高度,并可以是64X64、32X32、16X16和8X8。64X64的编码单元可被划分为64X64、64X32、32X64或32X32的分区,32X32的编码单元可被划分为32X32、32X 16、16X32或16X16的分区,16X16的编码单元可被划分为16X16、16X8、8X16或8X8的分区,8X8的编码单元可被划分为8X8、8X4、4X8或4X4的分区。
[0098]在视频数据310中,分辨率是1920 X 1080,编码单元的最大尺寸是64,最大深度是
2。在视频数据320中,分辨率是1920 X 1080,编码单元的最大尺寸是64,最大深度是3。在视频数据330中,分辨率是352X288,编码单元的最大尺寸是16,最大深度是I。图3中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。
[0099]如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。
[0100]由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1,因此由于通过对最大编码单元划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
[0101]由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。
[0102]图4是根据本发明的实施例的基于具有分层结构的编码单元的视频编码器400的框图。
[0103]帧内预测器410针对当前帧405在帧内模式下对编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495在帧间模式下分别对编码单元执行帧间估计和运动补偿。
[0104]从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆变换器470被恢复为空间域中的数据,恢复的空间域中的数据在通过去块单元480和环路滤波单元490后处理之后被输出为参考帧495。量化后的变换系数可通过熵编码器450被输出为比特流455。
[0105]当对变换单元的句法元素(诸如第一临界值标记Gtrl标记或第二临界值标记Gtr2标记)进行编码时,熵编码器450基于在变换单元的颜色分量信息中是否存在具有比第一临界值更大的值的有效变换系数、当前子集的位置和先前子集,来获得上下文集索引,基于具有连续的I的先前变换系数的长度来获得上下文偏移,并基于获得的上下文集索引和获得的上下文偏移来确定指示上下文模型的上下文索引。
[0106]为了将图像编码器400应用到视频编码设备100中,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度的同时,基于具有树结构的编码单元中的每个编码单元执行操作。
[0107]具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的编码单元中的每个编码单元的分区和预测模式,变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。
[0108]图5是根据本发明的实施例的基于编码单元的视频解码器500的框图。
[0109]解析器510从比特流505解析将被解码的编码图像数据和解码所需的编码信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的数据通过逆变换器540被恢复为空间域中的图像数据。
[0110]针对空间域中的图像数据,帧内预测器550在帧内模式下对编码单元执行帧内预测,运动补偿器560通过使用参考帧585在帧间模式下对编码单元执行运动补偿。
[0111]通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580后处理之后被输出为恢复帧595。另外,通过去块单元570和环路滤波单元580后处理的图像数据可被输出为参考帧585。
[0112]为了将图像解码器500应用到视频解码设备200中,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)针对每个最大编码单元,基于具有树结构的编码单元执行操作。
[0113]帧内预测器550和运动补偿器560确定具有树结构的每个编码单元的分区和预测模式,逆变换器540必须确定每个编码单元的变换单元的尺寸。此外,当对变换单元的句法元素(诸如第一临界值标记Gtrl标记或第二临界值标记Gtr2标记)进行解码时,熵解码器520基于在变换单元的颜色分量信息中是否存在具有比第一临界值更大的值的有效变换系数、当前子集的位置和先前子集,来获得上下文集索引,基于具有连续的I的先前变换系数的长度来获得上下文偏移,并基于获得的上下文索引和获得的上下文偏移来确定指示上下文模型的上下文索引。
[0114]图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。
[0115]视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
[0116]在根据本发明的实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是4。由于沿着分层结构600的垂直轴深度加深,因此较深层编码单元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的水平轴被示出,其中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
[0117]换言之,在分层结构600中,编码单元610是最大编码单元,其中,深度为0,尺寸(即,高度乘宽度)为64X64。随着深度沿着垂直轴加深,存在尺寸为32X32和深度为I的编码单元620、尺寸为16X16和深度为2的编码单元630、尺寸为8X8和深度为3的编码单元640、尺寸为4X4和深度为4的编码单元650。尺寸为4X4和深度为4的编码单元650是最小编码单元。
[0118]编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸为64X64和深度为O的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64X64的分区610、尺寸为64X32的分区612、尺寸为32X64的分区614或尺寸为32X32的分区616。
[0119]类似地,可将尺寸为32 X 32和深度为I的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32X32的分区620、尺寸为32X16的分区622、尺寸为16X32的分区624和尺寸为16X16的分区626。
[0120]类似地,可将尺寸为16 X 16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,包括在编码度单元630中的尺寸为16X16的分区630、尺寸为16X8的分区632、尺寸为8X16的分区634和尺寸为8X8的分区636。
[0121]类似地,可将尺寸为8X8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8X8的分区、尺寸为8X4的分区642、尺寸为4X8的分区644和尺寸为4X4的分区646。
[0122]尺寸为4X4和深度为4的编码单元650是最小编码单元以及最低深度的编码单元。编码单元650的预测单元仅被分配给尺寸为4X4的分区。
[0123]为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。
[0124]随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度I相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度I相应的编码单元和四个与深度2相应的编码单元均被编码。
[0125]为了针对深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通过对与当前深度相应的编码单元中的每个预测单元执行编码,来将针对当前深度选择最小编码误差。可选地,随着深度沿着分层结构600的垂直轴加深,可通过针对每个深度执行编码,比较根据深度的最小编码误差,来搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
[0126]图7是用于描述根据本发明的实施例的在编码单元710和变换单元720之间的关系的不图。
[0127]视频编码设备100或视频解码设备200针对每个最大编码单元,根据具有小于或等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应的编码单元的数据单元,来选择用于在编码期间进行变换的变换单元的尺寸。
[0128]例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是64X64,则可通过使用尺寸为32X32的变换单元720来执行变换。
[0129]此外,可通过对小于64X64的尺寸为32X32、16X 16、8X8和4X4的每个变换单元执行变换,来对尺寸为64X64的编码单元710的数据进行编码,然后可选择具有最小编码误差的变换单元。
[0130]图8是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。
[0131]视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码,并将信息800、信息810和信息820作为关于编码模式的信息来发送。
[0132]信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2NX2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2NX2N的分区802、尺寸为2NXN的分区804、尺寸为NX2N的分区806以及尺寸为NXN的分区808。这里,关于分区类型的信息800被设置来指示尺寸为2NXN的分区804、尺寸为NX 2N的分区806以及尺寸为NXN的分区808中的一个。
[0133]信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
[0134]信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内变换单元828。
[0135]视频解码设备200的熵解码器220可根据每个较深层编码单元,提取并使用用于解码的信息800、810和820。
[0136]图9是根据本发明的实施例的根据深度的较深层编码单元的示图。
[0137]划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
[0138]用于对深度为O和尺寸为2N_0X2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0X2N_0的分区类型912、尺寸为2N_0XN_0的分区类型914、尺寸为N_0X2N_0的分区类型916和尺寸为Ν_0ΧΝ_0的分区类型918。图9仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不限于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。
[0139]根据每种分区类型,对尺寸为2N_0X2N_0的一个分区、尺寸为2N_0XN_0的两个分区、尺寸为N_0X2N_0的两个分区和尺寸为Ν_0ΧΝ_0的四个分区重复地执行预测编码。可对尺寸为2N_0 X 2N_0、N_0 X 2N_0、2N_0 X N_0和N_0 X N_0的分区执行帧内模式和帧间模式下的预测编码。可仅对尺寸为2N_0X2N_0的分区执行跳过模式下的预测编码。
[0140]如果在尺寸为2N_0X2N_0、2N_0XN_0和N_0X2N_0的分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单元910划分到更低深度。
[0141]如果在尺寸为Ν_0ΧΝ_0的分区类型918中编码误差最小,则深度从O改变到I以在操作920中划分分区类型918,并对深度为2和尺寸为Ν_0ΧΝ_0的分区类型编码单元重复地执行编码来搜索最小编码误差。
[0142]用于对深度为I和尺寸为2N_1X2N_1( = Ν_0ΧΝ_0)的(分区类型)编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1X2N_1的分区类型942、尺寸为2N_1XN_1的分区类型944、尺寸为N_1 X2N_1的分区类型946以及尺寸为N_1XN_1的分区类型948。
[0143]如果在尺寸为N_1XN_1的分区类型948中编码误差最小,则深度从I改变到2以在操作950中划分分区类型948,并对深度为2和尺寸为N_2XN_2的编码单元960重复执
行编码来搜索最小编码误差。
[0144]当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-Ι,并且划分信息可被编码直到深度是O到d-2中的一个。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-Ι时,用于对深度为d-Ι和尺寸为2N_(d-l) X2N_(d-l)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-l)X2N(d-l)的分区类型992、尺寸为2N_(d-l)XN(d-l)的分区类型994、尺寸为N_(d-1) X2N(d-l)的分区类型996和尺寸为N_(d_l) XN(d_l)的分区类型998。
[0145]可对分区类型992至998中的尺寸为2N_(d_l) X2N_(d_l)的一个分区、尺寸为2N_(d-l) XN_(d-l)的两个分区、尺寸为N_(d-1) X2N_(d-l)的两个分区、尺寸为1(d-1) XN_(d-l)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
[0146]即使当尺寸为N_(d-l)XN_(d_l)的分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-Ι的编码单元CU_(d-l)也不再被划分到更低深度,构成当前最大编码单元900的编码单元的编码深度被确定为d-Ι,并且当前最大编码单元900的分区类型可被确定为N_(d-1) X N (d-Ι)。此外,由于最大深度是d,因此不设置深度为d-Ι的编码单元952的划分信息。
[0147]数据单元999可以是用于当前最大编码单元的“最小单元”。根据本发明的实施例的最小单元可以是通过将最小编码单元980划分成4份而获得的矩形数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模式设置为编码深度的编码模式。
[0148]这样,在所有深度I至d中对根据深度的最小编码误差进行比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并发送。另外,由于编码单元从O的深度被划分到编码深度,因此仅编码深度的划分信息被设置为0,并且除了编码深度以外的深度的划分信息被设置为I。
[0149]视频解码设备200的熵解码器220可提取并使用关于编码单元900的编码深度和预测单元的信息,来对编码单元912进行解码。视频解码设备200可通过使用根据深度的划分信息,将划分信息为O的深度确定为编码深度,并且使用关于相应深度的编码模式的信息来进行解码。
[0150]图10至图12是用于描述根据本发明的实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。
[0151]编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010中的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
[0152]当在编码单元1010中最大编码单元的深度是O时,编码单元1012和编码单元1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032 和 1048 的深度是 3,编码单元 1040、1042、1044 和 1046 的深度是4。
[0153]在预测单元1060中,通过划分编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,编码单元1014、1022、1050和1054中的分区类型的尺寸是2NXN,编码单元1016、1048和1052中的分区类型的尺寸是NX 2N,编码单元1032的分区类型的尺寸就NXN。编码单元1010的预测单元和分区小于或等于每个编码单元。
[0154]在小于编码单元1052的数据单元中的变换单元1070中,对编码单元1052的图像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050、1052 和 1054 不同于预测单元 1060 中的编码单元 1014,1016,1022、1032、1048、1050、1052和1054。换句话说,视频编码设备100和视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。
[0155]因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由视频编码设备100和视频解码设备200设置的编码信息。
[0156][表 I]
[0157]
【权利要求】
1.一种确定用于对变换系数级别进行熵编码和熵解码的上下文模型的方法,所述方法包括: 将变换单元划分为具有预定尺寸的子集,并获得在每个子集中包括的不为O的有效变换系数; 基于变换单元的颜色分量信息、包括有效变换系数的第一子集的位置信息、在第一子集之前被处理的第二子集中是否存在具有比第一临界值更大的值的有效变换系数,来获得用于在包括多个上下文的多个上下文集之中确定在对第一临界值标记进行熵编码和熵解码中使用的上下文集的上下文集索引,其中,第一临界值标记指示有效变换系数是否具有比第一临界值更大的值; 基于具有连续的I的先前变换系数的长度来获得用于确定多个上下文中的一个上下文的上下文偏移,其中,所述多个上下文包括在对第一临界值标记进行熵编码和熵解码中使用的上下文集中; 通过使用上下文集索引和上下文偏移来获得指示在对第一临界值标记进行熵编码和熵解码中使用的上下文的上下文索引。
2.如权利要求1所述的方法,其中,第一临界值标记是I,并且获得上下文集索引的步骤包括:当变换单元的颜色分量是亮度分量时,根据第一子集的位置是否处于包括DC系数的最左上方位置以及在先前处理的子集中是否存在具有比I更大的值的有效变换系数,来获得指示被不同地设置的多个上下文集中的一个上下文集的上下文集索引。
3.如权利要求2所述的方法,其中,所述多个上下文集包括第一上下文集、第二上下文集、第三上下文集和第四上下文集,其中,第一上下文集不包括先前处理的子集中的具有比I更大的值的有效变换系数,并在对位于最左上方位置的子集中包括的有效变换系数的第一临界值标记进行熵编码或熵解码中被使用,第二上下文集包括先前处理的子集中的具有比I更大的值的有效变换系数,并在对位于最左上方位置的子集中包括的有效变换系数的第一临界值标记进行熵编码或熵解码中被使用,第三上下文集不包括先前处理的子集中的具有比I更大的值的有效变换系数,并在对不位于最左上方位置的子集中包括的有效变换系数的第一临界值标记进行熵编码或熵解码中被使用,第四上下文集包括先前处理的子集中的具有比I更大的值的有效变换系数,并在对不位于最左上方位置的子集中包括的有效变换系数的第一临界值标记进行熵编码或熵解码中被使用。
4.如权利要求1所述的方法,其中,第一临界值是1,并且获得上下文集索引的步骤包括:当变换单元的颜色分量是色度分量时,根据在预先处理的子集中是否存在具有比I更大的值的有效变换系数而不考虑第一子集的位置,来获得指示被不同地设置的两个上下文集中的一个上下文集的上下文集索引。
5.如权利要求1所述的方法,其中,第一临界值是1,并且上下文偏移包括第一上下文偏移、第二上下文偏移、第三上下文偏移和第四上下文偏移,其中,第一上下文偏移被应用于在第一子集中包括的有效变换系数之中的具有等于或大于I的值的有效变换系数,第二上下文偏移被应用于在第一子集中包括的有效变换系数之中的被初步处理的有效变换系数,第三上下文偏移被应用于具有连续的I的先前变换系数的长度为I的有效变换系数,第四上下文偏移被应用于具有连续的I的先前变换系数的长度等于或大于2的有效变换系数。
6.如权利要求5所述的方法,其中,第一上下文偏移被应用于在第一子集中包括的有效变换系数之中的根据预定扫描顺序在第一临界值标记之后被处理的有效变换系数,其中,第一临界值标记最初具有不为I的值。
7.如权利要求1所述的方法,其中,获得上下文索引的步骤包括:当假设指示η个上下文集中的一个上下文集的上下文集索引为CtxSet,指示m个上下文偏移中的一个上下文偏移的上下文偏移为Cl,并且上下文索引为CtxIdxl时,基于以下等式确定指示nXm个上下文中的一个上下文的上下文索引ctxldx:ctxldxl = ctxSet Xm+cl,其中,η是整数,ctxSet是从O到(n-1)的整数,m是整数。
8.如权利要求1所述的方法,还包括:基于变换单元的色度分量信息和包括有效变换系数的第一子集的位置,来获得指示在对第二临界值标记进行熵编码和熵解码中使用的多个上下文集中的一个上下文集的上下文集索引,其中,第二临界值标记指示在第一子集中包括的有效变换系数之中的具有比第一临界值更大的值的有效变换系数是否具有比预定的第二临界值更大的值,所述第二临界值大于第一临界值。
9.如权利要求8所述的方法,其中,将指示在对第二临界值标记进行熵编码和熵解码中使用的多个上下文集中的一个上下文集的上下文集索引设置为与用于确定在对第一临界值标记进行熵编码和熵解码中使用的上下文集的上下文集索引相同。
10.如权利要求8所述的方法,其中,所述多个上下文集包括当变换单元是色度分量时的第一上下文集和第二上下文集,其中,第一上下文子集在对第一子集中包括的有效变换系数的第二临界值标记进行熵编码和熵解码中被使用,并且在第一子集中的具有比I更大的值的有效变换系数不包括在先前处理的子集中,第二上下文子集在对第一子集中包括的有效变换系数的第二临界值标记进行熵编码和熵解码中被使用,并且在第一子集中的具有比I更大的值的有效变换系数包括在先前处理的子集中。
11.一种用于确定对变换系数级别进行熵编码和熵解码的上下文模型的设备,包括: 映射单元,将变换单元划分为具有预定尺寸的子集,并获得在每个子集中包括的不为O的有效变换系数; 上下文集获得单元,基于变换单元的颜色分量信息、包括有效变换系数的第一子集的位置信息、在第一子集之前被处理的第二子集中是否存在具有比第一临界值更大的值的有效变换系数,来获得用于在包括多个上下文的多个上下文集之中确定在对第一临界值标记进行熵编码和熵解码中使用的上下文集的上下文集索引,其中,第一临界值标记指示有效变换系数是否具有比第一临界值更大的值; 上下文偏移获得单元,基于具有连续的I的先前变换系数的长度来获得用于确定多个上下文中的一个上下文的上下文偏移,其中,所述多个上下文包括在对第一临界值标记进行熵编码和熵解码中使用的上下文集中; 上下文确定单元,通过使用上下文集索引和上下文偏移来获得指示在对第一临界值标记进行熵编码和熵解码中使用的上下文的上下文索引。
12.如权利要求11所述的设备,其中,第一临界值是1,并且获得上下文集索引的步骤包括:当变换单元的颜色分量是亮度分量时,根据第一子集的位置是否处于包括DC系数的最左上方位置以及在先前处理的子集中是否存在具有比I更大的值的有效变换系数,来获得指示被不同地设置的多个上下文集中的一个上下文集的上下文集索引。
13.如权利要求12所述的设备,其中,所述多个上下文集包括第一上下文集、第二上下文集、第三上下文集和第四上下文集,其中,第一上下文集不包括先前处理的子集中的具有比I更大的值的有效变换系数,并在对位于最左上方位置的子集中包括的有效变换系数的第一临界值标记进行熵编码或熵解码中被使用,第二上下文集包括先前处理的子集中的具有比I更大的值的有效变换系数,并在对位于最左上方位置的子集中包括的有效变换系数的第一临界值标记进行熵编码或熵解码中被使用,第三上下文集不包括先前处理的子集中的具有比I更大的值的有效变换系数,并在对不位于最左上方位置的子集中包括的有效变换系数的第一临界值标记进行熵编码或熵解码中被使用,第四上下文集包括先前处理的子集中的具有比I更大的值的有效变换系数,并在对不位于最左上方位置的子集中包括的有效变换系数的第一临界值标记进行熵编码或熵解码中被使用。
14.如权利要求11所述的设备,其中,第一临界值是1,并且获得上下文集索引的步骤包括:当变换单元的颜色分量是色度分量时,根据在预先处理的子集中是否存在具有比I更大的值的有效变换系数而不考虑第一子集的位置,来获得指示被不同地设置的两个上下文集中的一个上下文集的上下文集索引。
15.如权利要求11所述的设备,其中,第一临界值是1,并且上下文偏移包括第一上下文偏移、第二上下文偏移、第三上下文偏移和第四上下文偏移,其中,第一上下文偏移被应用于在第一子集中包括的有效变换系数之中的具有等于或大于I的值的有效变换系数,第二上下文偏移被应用于在第一子集中包括的有效变换系数之中的被初步处理的有效变换系数,第三上下文偏移被应用于具有连续的I的先前变换系数的长度为I的有效变换系数,第四上下文偏移被应用于具有连续的I的先前变换系数的长度等于或大于2的有效变换系数。
【文档编号】H04N19/103GK104041052SQ201280065586
【公开日】2014年9月10日 申请日期:2012年10月31日 优先权日:2011年10月31日
【发明者】朴银姬, 闵正惠 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1