用于对视频进行解码的设备的制作方法

文档序号:14844500发布日期:2018-06-30 14:42阅读:126来源:国知局
用于对视频进行解码的设备的制作方法

技术领域

本发明涉及视频的编码和解码,更具体地,涉及一种用于对变换系数信息进行熵编码和解码的方法和设备。



背景技术:

在图像压缩方法(诸如,运动图像专家组(MPEG)-1、MPEG-2和MPEG-4H.264/MPEG-4AVC(先进视频编码))中,图像被划分为均具有预定尺寸的块,并通过使用帧间预测或帧内预测处理来获得每个块的残差数据。通过诸如变换、量化、扫描、游程编码和熵编码的处理来对残差数据进行压缩。在熵编码操作期间,对语法元素(例如关于例如变换系数或预测模式的信息)进行熵编码,并输出比特流。解码器对比特流进行解析以提取语法元素,并基于提取的语法元素来恢复图像。



技术实现要素:

技术问题

本发明提供了一种通过将上下文自适应二进制算术编码(CABAC)方法和旁路算术编码方法进行组合来对变换系数的符号进行算术编码和解码的方法和设备,其中,CABAC方法在具有高压缩性能的同时具有高计算复杂度,旁路算术编码方法在显示更小的压缩吞吐量的同时具有比CABAC方法更低的计算复杂度。

技术方案

根据本发明,基于预定的临界值将关于最后有效系数的位置的符号分类为前缀和后缀,并且对分类为前缀的比特串和分类为后缀的比特串独立地进行算术编码。

有益效果

根据本发明的实施例,可通过应用在具有高压缩性能的同时具有高计算复杂度的CABAC方法以及在显示更小的压缩吞吐量的同时具有比CABAC方法更低的计算复杂度的旁路算术编码方法,通过计算复杂度与处理速度之间的平衡来提高算术编码和解码的处理速度和压缩性能。

附图说明

图1是根据本发明实施例的视频编码设备的框图;

图2是图1中示出的语法元素编码单元的框图;

图3是示出根据本发明实施例的对每个块中的变换系数信息进行算术编码和解码的处理的流程图;

图4是示出根据本发明实施例的为了对与变换系数有关的语法元素执行算术编码而通过对块进行划分所获得的子集的示图;

图5是示出根据本发明实施例的通过将位置分类为前缀比特串和后缀比特串来对最后有效系数的位置进行算术编码的处理的参考示图;

图6是示出根据本发明实施例的对最后有效系数的位置信息进行算术编码的处理的示图;

图7是示出在图2中示出的常规编码单元上执行的使用上下文模型的算术编码处理的示图;

图8是示出根据本发明实施例的用于对视频进行编码的算术编码方法的流程图;

图9a是示出根据本发明实施例的视频编码设备的框图;

图9b是示出包括在图9a的语法元素解码单元中的算术解码设备的框图;

图10是示出根据本发明实施例的用于对视频进行解码的算术解码方法的流程图;

图11是根据本发明实施例的视频编码设备的框图;

图12是根据本发明实施例的视频解码设备的框图;

图13是示出根据本发明实施例的编码单元的概念的示图;

图14是根据本发明实施例的基于分层编码单元的视频编码设备的框图;

图15是根据本发明实施例的基于分层编码单元的视频解码设备的框图;

图16是示出根据本发明实施例的根据深度的编码单元和分区的示图;

图17是用于描述根据本发明实施例的编码单元与变换单元之间的关系的示图;

图18是用于描述根据本发明实施例的与编码深度相应的编码单元的编码信息的示图;

图19是根据本发明实施例的根据深度的编码单元的示图;

图20至图22是用于描述根据本发明实施例的编码单元、预测单元与频率变换单元之间的关系的示图;

图23是用于描述根据表1的编码模式信息的编码单元、预测单元与变换单元之间的关系的示图;

最优模式

根据本发明的一方面,提供了一种用于对视频进行解码的算术解码方法,所述方法包括:从接收的比特流获得分别与第一坐标前缀比特串和第一坐标后缀比特串相应的第一坐标前缀语法元素和第一坐标后缀语法元素,以及分别与第二坐标前缀比特串和第二坐标后缀比特串相应的第二坐标前缀语法元素和第二坐标后缀语法元素,其中,通过基于根据当前块的尺寸确定的临界值对当前块的最后有效系数的第一坐标位置进行分类来获得第一坐标前缀比特串和第一坐标后缀比特串,基于临界值对最后有效系数的第二坐标位置进行分类来获得第二坐标前缀比特串和第二坐标后缀比特串;通过按照第一算术解码方法针对第一坐标前缀语法元素和第二坐标前缀语法元素顺序地执行算术解码操作,以获得第一坐标前缀比特串和第二坐标前缀比特串;通过按照第二算术解码方法针对第一坐标后缀语法元素和第二坐标后缀语法元素顺序地执行算术解码操作,以获得第一坐标后缀比特串和第二坐标后缀比特串;以及通过对第一坐标前缀比特串和第一坐标后缀比特串执行逆二进制化来恢复第一坐标分量,并通过对第二坐标前缀比特串和第二坐标后缀比特串执行逆二进制化来恢复第二坐标分量。

根据本发明的另一方面,提供了一种视频解码设备,包括:解析器,从接收的比特流获得分别与第一坐标前缀比特串和第一坐标后缀比特串相应的第一坐标前缀语法元素和第一坐标后缀语法元素,以及分别与第二坐标前缀比特串和第二坐标后缀比特串相应的第二坐标前缀语法元素和第二坐标后缀语法元素,其中,通过基于根据当前块的尺寸确定的临界值对当前块的最后有效系数的第一坐标位置而获得的第一坐标前缀比特串和第一坐标后缀比特串,通过基于临界值对最后有效系数的第二坐标位置进行分类来获得第二坐标前缀比特串和第二坐标后缀比特串;算术解码器,通过按照第一算术解码方法针对第一坐标前缀语法元素和第二坐标前缀语法元素顺序地执行算术解码操作来获得第一坐标前缀比特串和第二坐标前缀比特串,通过按照第二算术解码方法针对第一坐标后缀语法元素和第二坐标后缀语法元素顺序地执行算术解码操作来获得第一坐标后缀比特串和第二坐标后缀比特串,通过对第一坐标前缀比特串和第一坐标后缀比特串执行逆二进制化来恢复第一坐标分量,并通过对第二坐标前缀比特串和第二坐标后缀比特串执行逆二进制化来恢复第二坐标分量。

根据本发明的另一方面,提供了一种用于对视频进行编码的算术编码方法,所述方法包括:基于根据当前块的尺寸确定的临界值,将当前块中的最后有效系数的位置的第一坐标分量分类为第一坐标前缀比特串和第一坐标后缀比特串;基于所述临界值将最后有效系数的位置的第二坐标分量分类为第二坐标前缀比特串和第二坐标后缀比特串;按照第一算术编码方法对第一坐标前缀比特串和第二坐标前缀比特串顺序地执行算术编码;以及按照第二算术编码方法对第一坐标后缀比特串和第二坐标后缀比特串执行算术编码。

根据本发明的另一方面,提供了一种视频编码设备,包括:图像编码器,对通过划分视频而获得的块执行预测、变换和量化以产生块的语法元素;熵编码器,基于根据当前块的尺寸确定的临界值将当前块中的最后有效系数的位置的第一坐标分量分类为第一坐标前缀比特串和第一坐标后缀比特串,基于所述临界值将最后有效系数的位置的第二坐标分量分类为第二坐标前缀比特串和第二坐标后缀比特串,按照第一算术编码方法对第一坐标前缀比特串和第二坐标前缀比特串顺序地执行算术编码,以及按照第二算术编码方法对第一坐标后缀比特串和第二坐标后缀比特串执行算术编码。

发明模式

以下,将参照附图来详细描述本发明的实施例。在以下描述中,术语“图像”可表示静止图像或运动图像(也就是,视频)。

首先,将参照图1到图10来描述根据本发明实施例的算术编码方法和视频编码设备以及根据本发明实施例的算术解码方法和视频解码设备。

图1是根据本发明实施例的视频编码设备10的框图。

视频编码设备10将配置视频的多个画面中的一个画面划分为分层结构的数据单元,并通过使用分层结构的数据单元来执行预测、变换和量化。如将随后参照图11到图23描述的,分层结构的数据单元可以是最大编码单元、编码单元、预测单元或变换单元。可基于代价而与其它数据单元独立地确定用于预测处理和变换处理的预测单元和变换单元。

由于对最大编码单元的每个区域中的具有分层结构的编码单元中的每一个递归地执行编码,故可获得具有树结构的数据单元。也就是说,可在每个最大编码单元中确定具有树结构的编码单元以及具有树结构的预测单元和变换单元。表示具有分层结构的数据单元的配置的分层信息和用于解码的非分层信息必须被发送以执行解码操作。

与分层结构有关的信息对确定具有树结构的编码单元、具有树结构的预测单元和具有树结构的变换单元是必需的,这将在后面进行描述,并且与分层结构有关的信息可包括最大编码单元的尺寸、编码深度、预测单元的分区信息、表示编码单元是否被划分的划分标记、变换单元的尺寸信息和表示变换单元是否被划分的变换单元(TU)尺寸标记。除了分层结构信息之外的编码信息可包括应用于每个预测单元的帧内/帧间预测的预测模式信息、运动矢量信息、预测方向信息、当使用多个颜色分量时应用于相应的数据单元的颜色分量信息以及变换系数信息。以下,将被熵编码和熵解码的分层信息和非分层信息可称为语法元素或符号。此外,为了便于描述,数据单元称为块。在预测处理期间,块与预测单元或分区相应,在变换处理期间,块与变换单元相应。

参照图1,视频编码设备10包括图像编码器11和语法元素编码器12。

图像编码器11执行诸如图像块的预测、变换和量化的操作以产生语法元素。更详细地,图像编码器11通过在每个块中进行帧内预测和帧间预测来产生预测值,并通过对作为原始块与预测值之间的差的残差进行变换和量化来产生变换系数。

语法元素编码器12对关于在每个块中产生的变换系数的语法元素以及在其它编码处理中产生的其它各种语法元素执行算术编码,以产生比特流。具体地,本实施例的语法元素编码器12基于根据当前块的宽度或长度确定的临界值来将最后有效系数的行位置和列位置分类为前缀和后缀,并通过应用根据上下文自适应二进制算术编码(CABAC)的上下文模型顺序地对通过对前缀执行二进制化而获得的比特串进行算术编码,并且在执行CABAC之后按照旁路(bypass)模式对通过对后缀执行二进制化而获得的比特串进行算术编码,其中,最后有效系数在块中的除了0之外的有效系数中根据预定扫描顺序被最后扫描。

图2是更详细地示出图1中的语法元素编码器12的框图。

参照图2,语法元素编码器20包括二进制化器21、上下文建模器22和二进制算术编码器23。另外,二进制算术编码器23包括常规编码引擎24和旁路编码引擎25。

如果语法元素不具有二进制值,则二进制化器21对语法元素进行二进制化以输出包含二进制值0或1的比特串,也就是,二进制(bin)串。bin表示包含0或1的比特串中的每个比特。根据语法元素的类型,可使用一元二进制化(unary binarization)、截断一元二进制化(truncated unary binarization)、指数哥伦布二进制化(exponential Golomb binarization)和固定长度二进制化(fixed length binarization)中的一种。

具体地,本发明的实施例的二进制化器21基于根据当前块的尺寸确定的临界值将当前编码的语法元素分类为前缀和后缀,并可通过使用彼此独立的二进制化方法来对前缀和后缀进行二进制化以输出前缀比特串和后缀比特串。例如,二进制化器21基于根据当前块的宽度确定的临界值将最后有效系数的列位置分类为前缀和后缀,随后通过将预定的第一二进制化方法应用于列位置的前缀来输出列位置的前缀比特串,并通过将预定的第二二进制化方法应用于列位置的后缀来输出列位置的后缀比特串。第一二进制化方法和第二二进制化方法彼此独立,也就是说,它们可以彼此相同或彼此不同。

相似地,二进制化器21可基于根据当前块的高度确定的临界值将最后有效系数的行位置分类为前缀和后缀,随后通过将预定的第一二进制化方法应用于行位置的前缀来输出行位置的前缀比特串,并通过将预定的第二二进制化方法应用于行位置的后缀来输出行位置的后缀比特串。下面将参照图5来描述将当前编码的语法元素分类为前缀和后缀的处理。

根据语法元素的类型,可在常规编码引擎24中通过使用上下文模型来对比特串中的每个bin进行算术编码,或者可在旁路编码引擎25中对比特字符串中的每个bin进行算术编码。具体地,当最后有效系数的位置被分类为前缀比特串和后缀比特串时,本实施例的常规编码引擎24通过顺序地应用根据CABAC的上下文模型来对被分类为前缀的比特串进行算术编码,旁路编码引擎25可按照旁路模式对被分类为后缀的比特串进行算术编码。

上下文建模器22对常规编码引擎24提供用于对当前语法元素进行算术编码的上下文模型。具体地,当常规编码引擎24对最后有效系数位置的前缀比特串进行算术编码时,上下文建模器22将产生用于对前缀比特串中的每个bin进行编码的二进制值的概率输出到常规编码引擎24。上下文模型是每个bin的概率模型,并且包括关于0和1中的哪一个与最大概率符号(MPS)和最小概率符号(LPS)相应的信息以及MPS或LPS的概率信息。上下文建模器22根据在常规编码引擎24中编码的比特的值是0还是1来更新上下文模型。

常规编码引擎24基于从上下文建模器22提供的上下文模型(也就是,关于MPS和LPS的信息以及MPS或LPS的概率信息)对构成最后有效系数位置的前缀比特串的每个bin执行算术编码。

旁路编码引擎25根据旁路模式对最后有效系数位置的后缀比特串执行算术编码。在旁路模式中,产生二进制信号0和1的概率具有固定值。因此,旁路编码引擎25可对输入的比特串直接执行算术编码,这与使用上下文模型的算术编码方法不同,在所述使用上下文模型的算术编码方法中,在对每个bin进行算术编码的同时更新上下文模型并且更新的上下文模型用于对下一bin的算术编码。

图7是示出在图2的常规编码引擎24中执行的使用上下文模型的算术编码处理的示图。在图7中,当前编码的符号的二进制值是“010”,为了便于描述,假设产生1的概率具有0.2的固定值,产生0的概率具有0.8的固定值。实际上,常规编码引擎24根据二进制值“010”中的每个bin的算术编码来更新产生二进制值的概率。

参照图7,当二进制值“010”中的第一bin值“0”被编码时,初始区间[0.0~1.0]中的较小的80%部分(也就是,[0.0~0.8])被更新为新的区间。此外,当下一bin值“1”被编码时,区间[0.0~0.8]中的较大的20%部分(也就是,[0.64~0.8])被更新为新的区间。此外,当下一bin值“0”被编码时,区间[0.64~0.8]中的较小的80%部分(也就是,[0.64~0.768])被更新为新的区间。在与包括在最终区间[0.64~0.768]中的实际数0.75相应的二进制数0.11中,除了初始数0之外的小数点后面的数“11”作为与编码的符号的二进制值“010”相应的比特串被输出。

以下,下面将详细描述与变换系数有关的信息(也就是,与变换系数有关的语法元素)的算术编码和解码处理。

图3是示出根据本发明实施例的对每个块中的变换系数信息进行算术编码和解码的处理的流程图。

参照图3,在操作31,首先对标记coded_block_flag进行算术编码或解码,其中,标记coded_block_flag表示包括在当前块中的变换系数中是否存在除了0之外的有效系数。

如果当前块仅具有变换系数0并且不具有除了0之外的有效系数,则将值0算术编码为coded_block_flag,并且省略与其它变换系数有关的语法元素的算术编码处理。

在操作32,如果在当前块中存在有效系数(即,coded_block_flag的值是1),则对指示有效系数的位置的有效图(SigMap)进行算术编码或解码。

有效图SigMap可包括指示最后有效系数的有效比特和位置的预定信息。有效比特表示根据每个扫描索引的变换系数是有效系数还是0,并可通过使用significant_coeff_flag[i]而被表示。可针对通过划分当前块而获得的具有预定尺寸的每个子集来设置有效图SigMap。也就是说,significant_coeff_flag[i]可表示包括在当前块的一个子集中的变换系数之中的第i扫描索引的变换系数是否是0。

在传统H.264标准中,在每个有效系数中对指示有效系数是否是最后有效系数的标记End-Of-Block单独地进行算术编码或解码。然而,根据本实施例,关于最后有效系数的位置的信息照其原样被算术编码或解码。例如,如果最后有效系数位于当前块的第x列(其中,x是整数)和第y行(其中,y是整数),也就是说,如果最后有效系数的位置是(x,y),则x和y的值被算术编码或解码。

具体地,根据本实施例的语法元素编码器12基于根据当前块的宽度确定的临界值将最后有效系数的行位置(x)分类为x轴前缀比特串(或第一坐标前缀比特串)和x轴后缀比特串(或第一坐标后缀比特串),并基于根据当前块的高度确定的临界值将最后有效系数的列位置(y)分类为y轴前缀比特串(或第二坐标前缀比特串)和y轴后缀比特串(或第二坐标后缀比特串)。此外,语法元素编码器12通过应用根据CABAC的上下文模型来执行x轴和y轴前缀比特串的算术编码,并按照旁路模式对x轴和y轴后缀比特串执行算术编码。另外,语法元素编码器12可通过形成各自使用不同算术编码类型被编码的前缀比特串和后缀比特串的组来顺序地执行算术编码。也就是说,语法元素编码器12通过应用上下文模型来对x轴前缀比特串和y轴前缀比特串执行算术编码,并可在对前缀比特串执行的算术编码之后或者独立于对前缀比特串执行的算术编码处理,按照旁路模式对x轴后缀比特串和y轴后缀比特串执行算术编码。

图4是示出为了对与变换系数有关的语法元素执行算术编码而通过对块进行划分所获得的子集的示图。在图4中,标号41表示块40中的最后有效系数。

参照图4,为了对包括在块40中的与变换系数有关的语法元素的算术编码执行算术编码,块40可被划分为具有预定尺寸的子集。变换系数信息可包括有效图(SigMap)、指示包括在子集中的有效系数是否大于1的标记(Greaterthan1标记)、指示包括在子集中的有效系数是否大于2的标记(Greaterthan2标记)、表示有效系数的级别大于2的信息(level-3)和关于最后有效系数41的位置的信息。诸如SigMap、Greaterthan1标记、Greaterthan2标记和(level-3)的语法元素可按照子集单元被算术编码。子集的处理顺序可被不同地设置。例如,如箭头所指示的,包括在每个子集中的变换系数信息可按照从子集15到子集0的顺序被算术编码。本发明不限于于此,如果块40的尺寸小,则块可不被划分为子集,但是包括在块40中的诸如SigMap、Greaterthan1标记、Greaterthan2标记和level-3的语法元素可被算术编码。

如上所述,在包括在块40中的有效系数中,根据预定扫描顺序的最后有效系数41的行位置(x)和列位置(y)基于当前块40的尺寸被分别分类为前缀比特串和后缀比特串。随后,通过应用根据CABAC的上下文模型来对前缀比特串进行算术编码,并按照旁路模式对后缀比特串进行算术编码。

以下,下面将更详细地描述将最后有效系数的位置分类为前缀比特串和后缀比特串的处理。

图5是示出将最后有效系数的位置分类为前缀比特串和后缀比特串并对比特串进行算术编码的处理的参考示图。

当假设块的宽度是w(其中,w是整数)并且块的高度是h(其中,h是整数)时,块中的变换系数的位置具有二维坐标值(x,y)。当定义在块的最左上角的变换系数的位置是(0,0)并且在块的最右下角的变换系数的位置是((w-1),(h-1))时,块中的变换系数的行位置x具有从0到(w-1)的值中的一个值,变换系数的列位置y具有从0到(h-1)的值中的一个值。

首先,下面将描述将行位置x分类为前缀比特串和后缀比特串并对比特串进行算术编码的处理。

参照图5,块中的最后有效系数的行位置x具有从0到(w-1)的值。基于根据块的宽度w确定的临界值th,行位置x被分类为等于或小于临界值th的前缀和超过临界值th的后缀(x-th)。

具体地,如果最后有效系数的行位置x的值等于或小于临界值th,则行位置仅被分类为前缀而不被分类为后缀。如果行位置x的值超过临界值th,则行位置x被分类为与临界值th相应的前缀和超过临界值th的后缀(x-th)。也就是说,如果行位置x具有等于或小于临界值th的值,则行位置仅被分类为前缀并且不存在后缀。此外,仅当行位置x超过临界值th时,行位置x被分类为前缀和后缀。

换句话说,如果最后有效系数的行位置x等于或小于临界值th,则行位置x根据预定的第一二进制化方法被二进制化并仅被分类为x轴前缀比特串。如果最后有效系数的行位置x超过临界值th,则行位置x被分类为通过按照第一二进制化方法对临界值th执行二进制化而获得的x轴前缀比特串以及通过按照预定的第二二进制化方法对值(x-th)执行二进制化而获得的x轴后缀比特串。

如上所述,临界值th可基于块的宽度w而被确定,其中,行位置x基于所述临界值th而被分类为前缀和后缀。例如,临界值th可以是在0到(w-1)之间的中间值(w/2)-1,其中,0到(w-1)是行位置x的可允许范围。作为另一示例,如果块的宽度w是2的幂,则可通过以下等式th=(log2w<<1)-1来确定临界值th。临界值th不限于此,并可以以各种方式被设置。

具体地,如果块的宽度w具有值8,则临界值th是(8/2)-1=3,从而行位置x可基于值3被分类为前缀和后缀。如果行位置x超过3,例如,行位置x具有值5,则由于x=th+2=3+2,行位置x被分类为具有值3的前缀和具有值2的后缀。如果行位置x具有3或更小的值,则行位置x被直接二进制化并被分类为前缀,不存在后缀。

在先前描述的示例中,使用不同的二进制化方法分别对前缀3和后缀2进行二进制化。例如,前缀可通过截断一元二进制化处理而被二进制化,后缀可通过固定长度二进制化处理而被二进制化。为了描述方便,在图5中,在行位置x是5并且临界值th是3的情况下,被分类为前缀的值3通过一元二进制化被二进制化为0001(52),被分类为后缀的值2通过一般二进制化处理被二进制化为010(54)。

如上所述,通过应用上下文模型来对前缀比特串0001(52)进行算术编码。针对“0001”中的每个bin来确定上下文索引,并且可基于确定的上下文索引来确定用于对每个bin进行算术编码的上下文模型。按照旁路模式对后缀比特串010(54)进行算术编码而不执行确定上下文建模的处理。在旁路模式中,由于每个bin具有相同的可能性,也就是说,值0和值1具有相同的固定可能性值1/2,可直接对输入比特串101(54)进行算术编码而不使用上下文模型。

如上所述,如果行位置x具有等于或小于临界值th的值,则行位置x仅被分类为前缀,不存在后缀。在上述示例中,假设行位置x具有小于临界值th 3的值1。在这种情况下,行位置x的值(也就是,1)仅通过预定的二进制化方法被分类为前缀比特串,并且不存在后缀比特串。如上所述,通过应用上下文模型来对前缀比特串进行算术编码,并且由于不存在后缀比特串而省略旁路模式中的算术编码处理。

与在将行位置x划分为前缀比特串和后缀比特串之后执行的算术编码相似,列位置y可被分类为前缀比特串和后缀比特串并可被算术编码。也就是说,基于根据块的高度h确定的临界值th,列位置y被分类为等于或小于临界值th的前缀和具有超过临界值th的值(y-th)的后缀。如果列位置y具有等于或小于临界值th的值,则列位置仅被分类为前缀并且不存在后缀。如果列位置y被分类为前缀和后缀,则使用独立的二进制化方法对前缀和后缀中的每一个进行二进制化,从而获得前缀比特串和后缀比特串。

也就是说,最后有效系数的列位置y等于或小于临界值th,使用第一二进制化方法将列位置y二进制化,并将列位置y分类为y轴前缀比特串。如果最后有效系数的列位置y超过临界值th,则列位置y被分类为通过按照第一二进制化方法对临界值th执行二进制化而获得的y轴前缀比特串以及通过按照第二二进制化方法对值(y-th)执行二进制化而获得的y轴后缀比特串。

此外,通过应用上下文模型来对前缀比特串进行算术编码,并且按照旁路模式对后缀比特串进行算术编码。

图6是示出根据本发明实施例的对最后有效系数的位置信息进行算术编码的处理的示图。

如上所述,当最后有效系数的行位置x和列位置y基于根据当前块的尺寸确定的临界值th而被分别分类为前缀比特串和后缀比特串时,根据本实施例的语法元素编码器12通过应用根据CABAC的上下文模型来对前缀比特串执行算术编码,并按照旁路模式对被分类为后缀的比特串执行算术编码。

参照图6,当最后有效系数的行位置x 61被分类为x轴分量前缀62和x轴分量后缀63,并且列位置y被分类为y轴分量前缀66和y轴分量后缀67,语法元素编码器12产生x轴分量前缀62和y轴分量前缀66的组,并通过应用上下文建模68来对所述组执行算术编码。此外,在执行上下文建模68之后或独立于上下文建模68,语法元素编码器12产生x轴分量后缀63和y轴分量后缀67的组,并按照旁路模式69对所述组执行算术编码。如上所述,本实施例的语法元素编码器12可针对应用了相同算术编码方法的比特串的组执行处理,从而可提高计算速度。具体地,x轴分量后缀63和y轴分量后缀67被分为一组并且按照旁路模式对所述组执行算术编码,从而可立即对后缀比特串进行算术编码。由于旁路模式使用如上所述的固定概率值,故可直接输出与整个输入比特串相应的编码结果。此外,如上所述,当最后有效系数的行位置x或列位置y具有等于或小于预定临界值的值时,不存在行位置和列位置的后缀比特串,从而可省略后缀比特串的算术编码处理。

图8是示出根据本发明实施例的用于对视频进行编码的算术编码方法的流程图。

参照图8,在操作81,语法元素编码器12基于根据当前块的尺寸确定的临界值将当前块中的最后有效系数位置的第一坐标分量分类为第一坐标前缀比特串和第一坐标后缀比特串。如上所述,语法元素编码器12根据第一预定二进制化方法对行位置x进行二进制化,并当最后有效系数的行位置x等于或小于临界值th时将二进制化的结果分类为x轴前缀比特串。另外,当最后有效系数的行位置x超过临界值th时,语法元素编码器12将行位置x分类为通过根据第一二进制化方法对临界值th执行二进制化而获得的x轴前缀比特串以及通过根据第二预定二进制化方法对值(x-th)执行二进制化而获得的x轴后缀比特串。

在操作82,语法元素编码器12基于临界值将最后有效系数的第二坐标分量分类为第二坐标前缀比特串和第二坐标后缀比特串。如上所述,当最后有效系数的列位置y等于或小于临界值th时,语法元素编码器12根据第一预定二进制化方法将列位置y二进制化,并将二进制化的结果分类为y轴前缀比特串。另外,当最后有效系数的列位置y超过临界值th时,语法元素编码器12将列位置y分类为通过根据第一二进制化方法对临界值th执行二进制化而获得的y轴前缀比特串以及通过根据第二预定二进制化方法对值(y-th)执行二进制化而获得的y轴后缀比特串。这里,当块的宽度w和高度h彼此相等时,作为用于将行位置x和列位置y分类为前缀和后缀的临界的临界值彼此相等。如果块具有矩形形状,可分别基于块的宽度和高度来确定用于将行位置x和列位置y分类为前缀和后缀的临界值。

在操作83,语法元素编码器12根据第一算术编码方法对第一坐标前缀比特串和第二坐标前缀比特串顺序地执行算术编码。如上所述,语法元素编码器12可产生前缀比特串的组以通过使用上下文模型执行算术编码。

在操作84,语法元素编码器12根据第二算术编码方法对第一坐标后缀比特串和第二坐标后缀比特串执行算术编码。如上所述,语法元素编码器12可产生按照旁路模型算术编码的后缀比特串的组。

图9a是示出根据本发明实施例的视频解码设备90的框图。

参照图a,视频解码设备包括语法元素解码器91和图像恢复单元92。

语法元素解码器91接收表示视频的编码数据的包括各种语法元素的比特流,并对比特流进行解析以获得语法元素。可在语法元素解码器91的解析单元中执行上述操作。由于通过上述视频编码设备10对语法元素进行二进制化和算术编码,故语法元素解码器91通过算术解码和逆二进制化处理来恢复语法元素。

具体地,本实施例的语法元素解码器91从接收的比特流获得分别与x轴分量前缀比特串和x轴分量后缀比特串相应的x轴分量前缀语法元素和x轴分量后缀语法元素,以及分别与y轴分量前缀比特串和y轴分量后缀比特串相应的y轴分量前缀语法元素和x轴分量后缀语法元素,其中,通过基于根据当前块的尺寸确定的临界值对当前块的最后有效系数的x轴位置进行分类来获得x轴分量前缀比特串和x轴分量后缀比特串,通过基于临界值对最后有效系数的y轴位置进行分类来获得y轴分量前缀比特串和y轴分量后缀比特串。

此外,语法元素解码器91按照第一算术解码方法(也就是,使用上下文模型的算术解码)针对x轴分量前缀语法元素和y轴分量前缀语法元素顺序地执行算术解码操作,以获得x轴分量前缀比特串和y轴分量前缀比特串。

另外,语法元素解码器91按照第二算术解码方法(也就是,旁路模式的算术解码)针对x轴分量后缀语法元素和y轴分量后缀语法元素顺序地执行算术解码操作,以获得x轴分量后缀比特串和y轴分量后缀比特串。如上所述,由于在行位置x和列位置y的值小于预定的临界值th的情况下不存在后缀,故在这种情况下省略后缀语法元素的算术解码操作。

当获得x轴分量前缀比特串、y轴分量前缀比特串、x轴分量后缀比特串和y轴分量后缀比特串时,语法元素解码器对x轴分量前缀比特串和x轴分量后缀比特串执行逆二进制化,并添加逆二进制化的x轴分量前缀和x轴分量后缀以恢复x轴分量。另外,语法元素解码器91对y轴分量前缀比特串和y轴分量后缀比特串执行逆二进制化,并添加逆二进制化的y轴分量前缀和y轴分量后缀以恢复y轴分量。

图像恢复单元92通过使用由语法元素解码器91恢复的各种语法元素对当前块执行逆变换和预测。图像恢复单元92可通过使用每个图像块中的恢复的语法元素执行诸如逆量化、逆变换和帧内预测/运动补偿的操作,来恢复图像块。

图9b是包括在图9a的语法元素解码器91中的算术解码设备的框图。图9b中示出的算术解码设备93与图2中示出的语法元素编码设备20相应。算术解码设备93执行在语法元素编码设备20中执行的算术编码处理的逆处理。

参照图9b,算术解码设备93包括上下文建模器94、常规解码器95、旁路解码器96和逆二进制化单元97。

按照旁路模式编码的符号被输出到旁路解码器96以被解码,并且由常规解码器95对按照常规编码方法被编码的符号进行解码。常规解码器95基于从上下文建模器94提供的上下文模型来对当前编码的符号的二进制化值进行算术解码。如上所述,常规解码器95针对从接收的比特流获得的x轴分量前缀语法元素和y轴分量前缀语法元素使用上下文模型来顺序地执行算术解码,从而获得x轴分量前缀比特串和y轴分量前缀比特串。

旁路解码器96针对从接收的比特流获得的x轴分量后缀语法元素和y轴分量后缀语法元素按照旁路模式执行算术解码,从而获得x轴分量后缀比特串和y轴分量后缀比特串。

逆二进制化单元97针对由常规解码器95或旁路解码器96恢复的x轴分量前缀比特串、y轴分量前缀比特串、x轴分量后缀比特串和y轴分量后缀比特串执行逆二进制化,以恢复x轴分量前缀、y轴分量前缀、x轴分量后缀和y轴分量后缀。添加x轴分量前缀和x轴分量后缀以获得最后有效系数的x轴位置,添加y轴分量前缀和y轴分量后缀以获得最后有效系数的y轴位置。

图10是示出根据本发明实施例的用于对视频进行解码的算数解码方法的流程图。

参照图10,在操作101,语法元素解码器91从接收的比特流获得分别与第一坐标分量前缀比特串和第一坐标分量后缀比特串相应的第一坐标分量前缀语法元素和第一坐标分量后缀语法元素,以及分别与第二坐标分量前缀比特串和第二坐标分量后缀比特串相应的第二坐标分量前缀语法元素和第二坐标分量后缀语法元素,其中,通过基于根据当前块的尺寸确定的临界值对当前块的最后有效系数的第一坐标位置进行分类来获得第一坐标分量前缀比特串和第一坐标分量后缀比特串,通过基于临界值对最后有效系数的第二坐标位置来获得第二坐标分量前缀比特串和第二坐标分量后缀比特串。

在操作102,语法元素解码器91按照第一算术解码方法(也就是,使用上下文模型的算术解码)针对第一坐标分量前缀语法元素和第二坐标分量前缀语法元素顺序地执行算术解码操作,以获得第一坐标分量前缀比特串和第二坐标分量前缀比特串。

在操作103,语法元素解码器91按照第二算术解码方法(也就是,旁路模式的算术解码)针对第一坐标分量后缀语法元素和第二坐标分量后缀语法元素顺序地执行算术解码操作,以获得第一坐标分量后缀比特串和第二坐标分量后缀比特串。

在操作104,语法元素解码器91对第一坐标前缀比特串和第一坐标后缀比特串执行逆二进制化以恢复第一坐标分量,并对第二坐标前缀比特串和第二坐标后缀比特串执行逆二进制化以恢复第二坐标分量。

根据本发明的上述实施例,最后有效系数的位置被分类为前缀比特串和后缀比特串,并且应用了相同算术编码方法的比特串被构造为将被顺序处理的组。通过使用上下文建模来对前缀比特串进行算术编码和解码,并按照旁路模式对后缀比特串进行算术编码和解码而不使用上下文建模。因此,与通过仅使用上下文建模来对最后有效系数的位置进行算术编码和解码的情况相比,减小了计算量,从而可提高算术编码和解码的处理速度。

如上所述,在根据本实施例的视频编码设备10和视频解码设备90中,通过将视频数据划分为具有树结构的编码单元来获得块,并且预测单元被用于对编码单元进行预测,变换单元用于对编码单元进行变换。以下,将参照以下图11到图23来描述基于具有树结构的编码单元、预测单元和变换单元的视频编码方法和设备以及视频解码方法和设备。

图11是根据本发明的实施例的视频编码设备100的框图。

视频编码设备100包括分层编码器110和熵编码器120。

分层编码器110划分被编码为预定尺寸的数据单元的当前画面,以在每个数据单元中执行编码操作。具体地,分层编码器110可基于作为最大尺寸的编码单元的最大编码单元来划分当前画面。根据本发明的实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是宽度和高度为2的若干次方的正方形。

可用最大尺寸和深度来表征根据本发明的实施例的编码单元。所述深度表示编码单元在空间上从最大编码单元被划分的次数,并且随着深度加深,可从最大编码单元到最小编码单元划分根据深度的较深层编码单元。最大编码单元的深度是最高深度,最小编码单元的深度是最低深度。由于与每个深度相应的编码单元的尺寸随着最大编码单元的深度加深而减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。

如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分成最大编码单元,每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据本发明的实施例的最大编码单元根据深度被划分,因此在最大编码单元中包括的空间域的图像数据可根据深度被分层地划分。

可预先确定编码单元的最大深度和最大尺寸,其中,编码单元的最大深度和最大尺寸限制最大编码单元的高度和宽度被分层地划分的总次数。

分层编码器110对通过根据深度划分最大编码单元的区域而获得的至少一个划分区域进行编码,并根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换句话说,分层编码器110通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码并选择具有最小编码误差的深度来确定编码深度。确定的编码深度和根据确定的编码深度的编码的图像数据被输出到熵编码器120。

基于与等于或小于最大深度的至少一个深度相应的较深层编码单元来对在最大编码单元中的图像数据进行编码,并基于每个较深层编码单元来对编码图像数据的结果进行比较。可在对较深层编码单元的编码误差进行比较之后选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。

随着编码单元根据深度被分层地划分以及编码单元的数量增加,最大编码单元的尺寸被划分。此外,即使在一个最大编码单元中编码单元与相同深度相应,也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与相同深度相应的每个编码单元划分到更低深度。因此,即使当图像数据被包括在一个最大编码单元中时,图像数据被划分为根据深度的区域并且在一个最大编码单元中编码误差可根据区域而不同,从而在图像数据中编码深度可根据区域而不同。因此,可在一个最大编码单元中确定一个或更多个编码深度,并可根据至少一个编码深度的编码单元来划分最大编码单元的图像数据。

因此,分层编码器110可确定在最大编码单元中包括的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括在最大编码单元中包括的所有较深层编码单元中的与被确定为编码深度的深度相应的编码单元。可在最大编码单元的相同区域中根据深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深度的编码单元。类似地,当前区域中的编码深度可独立于另一区域中的编码深度被确定。

根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元执行的划分次数相关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元执行的划分总次数。根据本发明的实施例的第二最大深度可表示从最大编码单元到最小编码单元的总深度级数。例如,当最大编码单元的深度是0时,最大编码单元被划分一次的编码单元的深度可设置为1,并且最大编码单元被划分两次的编码单元的深度可设置为2。这里,如果最小编码单元是最大编码单元被划分四次的编码单元,则存在深度0、1、2、3和4的5个深度级,从而第一最大深度可设置为4,第二最大深度可设置为5。

可根据最大编码单元来执行预测编码和变换。还根据最大编码单元,基于根据等于最大深度的深度或小于最大深度的深度的较深层编码单元来执行预测编码和变换。

由于每当最大编码单元根据深度被划分时较深层编码单元的数量增加,因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了方便描述,现在将基于最大编码单元中的当前深度的编码单元来描述预测编码和变换。

视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作都使用相同的数据单元,或者可针对每个操作使用不同的数据单元。

例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,而且可选择与编码单元不同的数据单元,以对编码单元中的图像数据执行预测编码。

为了在最大编码单元中执行预测编码,可基于与编码深度相应的编码单元(即,基于不再被划分成与更低深度相应的编码单元的编码单元)执行预测编码。在下文中,现在将不再被划分并变成用于预测编码的基本单元的编码单元称为“预测单元”。通过划分预测单元而获得的分区可包括通过划分预测单元的高度和宽度中的至少一个而获得的预测单元或数据单元。

例如,当2N×2N的编码单元(其中,N是正整数)不再被划分并变成2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例包括通过对称地划分预测单元的高度或宽度而获得的对称分区、通过非对称地划分预测单元的高度或宽度(诸如1:n或n:1)而获得的分区、通过几何划分预测单元而获得的分区以及具有任意形状的分区。

预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一种。例如,可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。此外,可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。

视频编码设备100还可不仅基于用于对图像数据进行编码的编码单元而且基于与所述编码单元不同的数据单元对在编码单元中的图像数据执行变换。

为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如,用于变换的数据单元可包括用于帧内模式的数据单元和用于帧间模式的数据单元。

现在将用作变换的基础的数据单元称为“变换单元”。类似于编码单元,可将编码单元中的变换单元递归地划分成更小尺寸的区域,使得变换单元可以以区域为单位被独立地确定。因此,可基于变换深度根据具有树结构的变换单元来划分编码单元中的残差数据。

也可在变换单元中设置变换深度,其中,变换深度指示通过划分编码单元的高度和宽度以达到变换单元而执行划分的次数。例如,在2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时,变换深度可以是0,当变换单元的尺寸是N×N时,变换深度可以是1,并且当变换单元的尺寸是N/2×N/2时,变换深度可以是2。也就是说,也可根据变换深度来设置具有树结构的变换单元。

根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息而且需要关于与预测编码和变换相关的信息。因此,分层编码器110不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式以及用于变换的变换单元的尺寸。

下面将详细描述根据本发明的实施例的在最大编码单元中根据树结构的编码单元以及确定分区的方法。

分层编码器110可通过使用基于拉格朗日乘子的率失真优化来测量根据深度的较深层编码单元的编码误差。

熵编码器120将基于由分层编码器110确定的至少一个编码深度而编码的最大编码单元的图像数据、以及关于根据编码深度的编码模式的信息输出在比特流中。可通过对图像的残差数据进行编码来获得编码的图像数据。关于根据编码深度的编码模式的信息可包括关于编码深度、关于预测单元中的分区类型、预测模式以及变换单元的尺寸的信息。

可通过使用根据深度的划分信息来定义关于编码深度的信息,所述划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则当前编码单元中的图像数据被编码并输出,从而划分信息可被定义为不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,从而划分信息可被定义为划分当前编码单元以获得更低深度的编码单元。

如果当前深度不是编码深度,则对被划分成更低深度的编码单元的编码单元执行编码。由于在当前深度的一个编码单元中存在更低深度的至少一个编码单元,因此对更低深度的每个编码单元重复地执行编码,从而可针对具有相同深度的编码单元递归地执行编码。

由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一种编码模式的信息,因此可针对一个最大编码单元确定关于至少一种编码模式的信息。此外,由于图像数据根据深度被分层地划分,因此最大编码单元的图像数据的编码深度可根据位置而不同,从而可针对图像数据设置关于编码深度和编码模式的信息。

因此,熵编码器120可将关于相应编码深度和编码模式的编码信息分配给在最大编码单元中包括的编码单元、预测单元和最小单元中的至少一个。

根据本发明的实施例的最小单元是通过将构成最低深度的最小编码单元划分成4份而获得的矩形数据单元。可选地,最小单元可以是可在最大编码单元中所包括的所有的编码单元、预测单元、分区单元和变换单元中包括的最大的矩形数据单元。

例如,可将通过熵编码器120输出的编码信息分类为根据编码单元的编码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式和关于分区的尺寸的信息。根据预测单元的编码信息可包括关于估计的帧间模式的方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息以及关于帧内模式的插值方法的信息。此外,可将关于根据画面、条带或GOP定义的编码单元的最大尺寸的信息以及关于最大深度的信息插入到比特流的头中。

在视频编码设备100中,较深层编码单元可以是通过将作为上面一层的更高深度的编码单元的高度或宽度除以2而获得的编码单元。换句话说,当当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是N×N。此外,尺寸为2N×2N的当前深度的编码单元可包括最多4个更低深度的尺寸是N×N的编码单元。

因此,视频编码设备10可基于考虑当前画面的特性而确定的最大编码单元的尺寸和最大深度,通过针对每个最大编码单元确定具有最佳形状和最佳尺寸的编码单元,来形成具有树结构的编码单元。此外,由于通过使用各种预测模式和变换中的任意一种来对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特性来确定最佳编码模式。

因此,如果以传统宏块来对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块数量过度增加。因此,针对每个宏块产生的压缩信息的条数增加,从而难以发送压缩信息,并且数据压缩效率降低。然而,由于在考虑图像的尺寸时增加编码单元的最大尺寸,同时在考虑图像的特性时调整编码单元,因此可通过使用视频编码设备100提高图像压缩效率。

图12是根据本发明的实施例的视频解码设备200的框图。

视频解码设备200包括语法元素提取器210、熵解码器220以及分层解码器230。针对视频解码设备200的各种操作的各种术语(诸如编码单元、深度、预测单元、变换单元以及关于各种编码模式的信息)的定义与参照图11和视频编码设备100描述的术语相同。

语法元素提取器210接收并解析编码视频的比特流。熵解码器220针对每个编码单元从解析的比特流提取编码的图像数据,并将提取的图像数据输出到分层解码器230,其中,编码单元具有根据每个最大编码单元的树结构。

此外,熵解码器220从解析的比特流提取根据每个最大编码单元的具有树结构的编码单元的关于编码深度和编码模式的信息、颜色分量信息和预测模式信息。提取的关于编码深度和编码模式的信息被输出到分层解码器230。换句话说,将比特流中的图像数据划分成最大编码单元,使得分层解码器230针对每个最大编码单元对图像数据进行解码。

可针对通过在编码终端(如本实施例的视频编码设备100)根据最大编码单元和编码深度在每个编码单元中重复地执行编码而被确定为产生最小编码误差的关于编码深度和编码模式的信息来设置由熵解码器220提取的关于根据最大编码单元的编码深度和编码模式的信息。因此,视频解码设备200可通过根据产生最小编码误差的编码方法对数据进行解码来恢复图像。

由于关于编码深度和编码模式的编码信息可被分配给在相应编码单元、预测单元和最小单元中的预定数据单元,因此熵解码器220可根据预定数据单元来提取关于编码深度和编码模式的信息。如果在每个预定数据单元中记录关于相应最大编码单元的编码深度和编码模式的信息,则关于编码深度和编码模式的相同信息被分配的预定数据单元可被推断为在同一的最大编码单元中包括的数据单元。

分层解码器230通过基于关于根据最大编码单元的编码深度和编码模式的信息来对每个最大编码单元中的图像数据进行解码以恢复当前画面。换句话说,分层解码器230可基于提取的关于针对在每个最大编码单元中包括的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息,来对编码的图像数据进行解码。解码处理可包括预测和逆变换,所述预测包括帧内预测和运动补偿。可根据逆正交变换或逆整数变换的方法来执行逆变换。

分层解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息,根据每个编码单元的分区和预测模式来执行帧内预测或运动补偿。

此外,分层解码器230可以基于关于根据编码深度的编码单元的变换单元的尺寸的信息,根据编码单元中的每个变换单元来执行逆变换,以根据最大编码单元执行逆变换。

分层解码器230可根据深度通过使用划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息表示图像数据在当前深度下不再被划分,则当前深度是编码深度。因此,分层解码器230可通过使用关于针对与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元中的与每个编码深度相应的至少一个编码单元的编码数据进行解码,并输出当前最大编码单元的图像数据。

换句话说,通过观察针对在编码单元、预测单元和最小单元之中的预定数据单元而分配的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,收集的数据单元可被认为是将由分层解码器230以相同编码模式解码的一个数据单元。

视频解码设备200可获得关于当针对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元的信息,并可使用所述信息来对当前画面进行解码。换句话说,可对在每个最大编码单元中的被确定为最佳编码单元的具有树结构的编码单元进行解码。

因此,即使图像数据具有高分辨率和大数据量,仍可通过使用从编码器接收到的关于最佳编码模式的信息,经由使用根据图像数据的特性被自适应地确定的编码单元的尺寸和编码模式来有效地解码并恢复图像数据。

现在将参照图13至图23来描述根据本发明的实施例的确定具有树结构的编码单元、预测单元和变换单元的方法。

图13是用于描述根据本发明的实施例的编码单元的概念的示图。

可以以宽度×高度来表示编码单元的尺寸,并且编码单元的尺寸可以是64×64、32×32、16×16和8×8。64×64的编码单元可划分成64×64、64×32、32×64或32×32的分区,32×32的编码单元可划分成32×32、32×16、16×32或16×16的分区,16×16的编码单元可划分成16×16、16×8、8×16或8×8的分区,并且8×8的编码单元可划分成8×8、8×4、4×8或4×4的分区。

在视频数据310中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是2。在视频数据320中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是3。在视频数据330中,分辨率是352×288,编码单元的最大尺寸是16,最大深度是1。图13中所示的最大深度表示从最大编码单元到最小编码单元的划分总次数。

如果分辨率高或数据量大,则编码单元的最大尺寸可以是大的,以便不仅增加编码效率还准确地反映图像的特性。因此,具有比视频数据330高的分辨率的视频数据310和320的编码单元的最大尺寸可以是64。

由于视频数据310的最大深度是2,因此视频数据310的编码单元315可包括具有64的长轴尺寸的最大编码单元,以及由于通过划分两次最大编码单元将深度加深至二层而具有32和16的长轴尺寸的编码单元。同时,由于视频数据330的最大深度是1,因此视频数据330的编码单元335可包括具有16的长轴尺寸的最大编码单元,以及由于通过划分一次最大编码单元将深度加深至一层而具有8的长轴尺寸的编码单元。

由于视频数据320的最大深度是3,因此视频数据320的编码单元325可包括具有64的长轴尺寸的最大编码单元,以及由于通过划分三次最大编码单元将深度加深至3层而具有32、16和8的长轴尺寸的编码单元。随着深度加深,可精确地表示详细信息。

图14是根据本发明的实施例的基于分层结构的编码单元的图像编码设备的框图。

帧内预测器410在当前帧405中以帧内模式对编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495在当前帧405中以帧间模式对编码单元执行帧间估计和运动补偿。

从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为被量化的变换系数。被量化的变换系数通过反量化器460和逆变换器470被恢复为空间域中的数据,并且空间域中的恢复的数据在通过去块单元480和环路滤波单元490被后处理之后被输出为参考帧495。被量化的变换系数可通过熵编码器450被输出为比特流455。

为了使图像编码器400应用在视频编码设备100中,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度时基于在具有树结构的编码单元中的每个编码单元执行操作。

具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度时确定在具有树结构的编码单元中的每个编码单元的分区和预测模式,并且变换器430确定在具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。

图15是根据本发明的实施例的基于分层结构的编码单元的图像解码设备的框图。

解析器510从比特流505对将被解码的编码图像数据和解码所需的关于编码的信息进行解析。编码的图像数据通过熵解码器520和反量化器530被输出为被反量化的数据,被反量化的数据通过逆变换器540被恢复成空间域中的图像数据。

帧内预测器550针对空间域中的图像数据,以帧内模式对编码单元执行帧内预测,运动补偿器560通过使用参考帧585以帧间模式对编码单元执行运动补偿。

经过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580被后处理之后被输出为恢复帧595。此外,通过去块单元570和环路滤波单元580被后处理的图像数据可被输出为参考帧585。

为了使图像解码器500被应用于视频解码设备200,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)针对每个最大编码单元基于具有树结构的编码单元执行操作。

具体地,帧内预测器550和运动补偿器560基于针对每个具有树结构的编码单元的分区和预测模式来执行操作,逆变换器540基于针对每个编码单元的变换单元的尺寸来执行操作。

图16是示出根据本发明的实施例的根据深度的较深层编码单元和分区的示图。

视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特性。编码单元的最大高度、最大宽度和最大深度可根据图像的特性被自适应地确定,或可被用户不同地设置。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。

在编码单元的分层结构600中,根据本发明的实施例,编码单元的最大高度和最大宽度均为64,最大深度是4。由于深度沿着分层结构600的垂直轴加深,因此较深层编码单元的高度和宽度均被划分。此外,沿着分层结构600的水平轴示出了作为对每个较深层编码单元进行预测编码的基础的预测单元和分区。

换句话说,编码单元610是分层结构600中的最大编码单元,其中,深度是0,尺寸(即,高度乘以宽度)是64×64。深度沿着垂直轴加深,存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640以及尺寸为4×4和深度为4的编码单元650。尺寸为4×4和深度为4的编码单元650是最小编码单元。

编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换句话说,如果尺寸为64×64和深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。

类似地,可将尺寸为32×32和深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。

类似地,可将尺寸为16×16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,包括在编码单元630中的尺寸为16×16的分区、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。

类似地,可将尺寸为8×8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。

尺寸为4×4和深度为4的编码单元650是最小编码单元和最低深度的编码单元。编码单元650的预测单元仅被分配给尺寸为4×4的分区。

为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备100的编码单元确定器120针对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。

包括相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量随着深度加深而增加。例如,与深度2相应的四个编码单元需要覆盖包括在与深度1相应的一个编码单元中的数据。因此,为了根据深度比较相同数据的编码结果,与深度1相应的编码单元和与深度2相应的四个编码单元均被编码。

为了针对深度中的当前深度执行编码,可沿着分层结构600的水平轴,通过针对与当前深度相应的编码单元中的每个预测单元执行编码来选择对于当前深度的最小编码误差。可选地,可通过随着深度沿分层结构600的垂直轴加深来针对每个深度执行编码并比较根据深度的最小编码误差,来搜索最小编码误差。可将编码单元610中具有最小编码误差的深度和分区选择为编码单元610的编码深度和分区类型。

图17是用于描述根据本发明的实施例的在编码单元710和变换单元720之间的关系的示图。

视频编码设备100或视频解码设备200针对每个最大编码单元根据具有小于或等于最大编码单元的尺寸的编码单元对图像进行编码或解码。可基于不大于相应编码单元的数据单元来选择在编码期间用于变换的变换单元的尺寸。

例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。

此外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的每个变换单元执行变换来对尺寸为64×64的编码单元710的数据进行编码,然后可选择具有最小编码误差的变换单元。

图18是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。

视频编码设备100的输出单元130可将针对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元的尺寸的信息820编码为关于编码模式的信息并进行发送。

信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2N×2N的当前编码单元CU_0划分成尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的任何一种。这里,关于分区类型的信息800被设置来指示尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一种。

信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区所执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。

信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。

视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元提取并使用用于解码的信息800、810和820。

图19是根据本发明的实施例的根据深度的较深层编码单元的示图。

划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。

用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。图19仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不限于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。

根据每种分区类型,对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行在帧内模式和帧间模式下的预测编码。可仅对尺寸为2N_0×2N_0的分区执行在跳过模式下的预测编码。

如果在尺寸为2N_0×2N_0、2N_0×N_0和N_0×2N_0的分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单元910划分成更低深度。

如果在尺寸为N_0×N_0的分区类型918中编码误差最小,则深度从0改变到1以在操作920中划分分区类型918,并对深度为2和尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。

用于对深度为1和尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930执行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。

如果在尺寸为N_1×N_1的分区类型948中编码误差最小,则深度从1改变到2以在操作950中划分分区类型948,并对深度为2和尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。

当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-1,并且划分信息可被编码直到深度是0至d-2中的一个。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时,用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-1)×2N(d-1)的分区类型992、尺寸为2N_(d-1)×N(d-1)的分区类型994、尺寸为N_(d-1)×2N(d-1)的分区类型996和尺寸为N_(d-1)×N(d-1)的分区类型998。

可对分区类型992至998中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码以搜索具有最小编码误差的分区类型。

即使当尺寸为N_(d-1)×N_(d-1)的分区类型998具有最小编码误差时,由于最大深度是d,深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度,对于构成当前最大编码单元900的编码单元的编码深度被确定为d-1,并且当前最大编码单元900的分区类型可被确定为N_(d-1)×N(d-1)。此外,由于最大深度是d并且具有最低深度d-1的最小编码单元980不再被划分到更低深度,因此不设置针对最小编码单元980的划分信息。

数据单元999可以是用于当前最大编码单元的“最小单元”。根据本发明的实施例的最小单元可以是通过将最小编码单元980划分成4份而获得的矩形数据单元。通过重复地执行编码,视频编码设备100可通过根据编码单元900的深度比较编码误差来选择具有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模式设置为编码深度的编码模式。

因此,在所有深度1至d中比较根据深度的最小编码误差,可将具有最小编码误差的深度确定为编码深度。编码深度、预测单元的分区类型和预测模式可被编码为关于编码模式的信息并被发送。此外,由于编码单元从深度0被划分到编码深度,因此仅将编码深度的划分信息设置成0,将排除编码深度之外的深度的划分信息设置到1。

视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息以对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息将划分信息是0的深度确定为编码深度,并将关于相应深度的编码模式的信息用于解码。

图20至图22是用于描述根据本发明的实施例的在编码单元1010、预测单元1060和变换单元1070之间的关系的示图。

编码单元1010是在最大编码单元中与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是编码单元1010中的每个的预测单元的分区,变换单元1070是编码单元1010中的每个的变换单元。

当在编码单元1010中最大编码单元的深度是0时,编码单元1012和1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。

在预测单元1060中,通过划分编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,在编码单元1014、1022、1050和1054中的分区类型具有2N×N的尺寸,在编码单元1016、1048和1052中的分区类型具有N×2N的尺寸,编码单元1032的分区类型具有N×N的尺寸。编码单元1010的预测单元和分区小于或等于每个编码单元。

在小于编码单元1052的数据单元中对变换单元1070中的编码单元1052的图像数据执行变换或逆变换。此外,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052在尺寸和形状方面不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050和1052。换句话说,视频编码设备100和视频解码设备200可对相同编码单元中的数据单元单独地执行帧内预测、运动估计、运动补偿、变换和逆变换。

因此,在最大编码单元的每个区域中对具有分层结构的编码单元中的每个编码单元递归地执行编码以确定最佳编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由视频编码设备100和视频解码设备200设置的编码信息。

表1

视频编码设备100的熵编码器120可输出关于具有树结构的编码单元的编码信息,视频解码设备200的熵解码器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。

划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分到更低深度的深度是编码深度,从而可针对所述编码深度来定义关于分区类型、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对更低深度的四个划分编码单元独立地执行编码。

预测模式可以是帧内模式、帧间模式和跳过模式中的一种。帧内模式和帧间模式可被定义在所有分区类型中,跳过模式仅被定义在尺寸为2N×2N的分区类型中。

关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型,以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区类型。可通过以1:n(其中,n是大于1的整数)和n:1划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区类型,可通过以1:n和n:1划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区类型。

可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸可以是作为当前编码单元的尺寸的2N×2N。如果变换单元的划分信息是1,则可通过划分当前编码单元来获得变换单元。此外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型,则变换单元的尺寸可以是N×N,如果当前编码单元的分区类型是非对称分区类型,则变换单元的尺寸可以是N/2×N/2。

关于具有树结构的编码单元的编码信息可包括与编码深度相应的编码单元、预测单元和最小单元中的至少一种。与编码深度相应的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一种。

因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否包括在与编码深度相应的相同编码单元中。此外,通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元,从而可确定最大编码单元中的编码深度的分布。

因此,如果当前编码单元基于邻近数据单元的编码信息被预测,则可直接参考并使用在与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。

可选地,如果当前编码单元基于邻近数据单元的编码信息被预测,则使用所述数据单元的编码信息来搜索与当前编码单元邻近的数据单元,搜索的邻近编码单元可被参考用于预测当前编码单元。

图23是用于描述根据表1的编码模式信息的在编码单元、预测单元和变换单元之间的关系的示图。

最大编码单元1300包括多个编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是编码深度的编码单元,因此划分信息可以被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区类型的信息设置成以下分区类型中的一种:尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336以及尺寸为nR×2N的分区类型1338。

当分区类型被设置成对称(即,分区类型1322、1324、1326或1328)时,如果变换单元的划分信息(TU尺寸标记)是0,则设置尺寸为2N×2N的变换单元1342,如果TU尺寸标记是1,则设置尺寸为N×N的变换单元1344。

当分区类型被设置成非对称(即,分区类型1332、1334、1336或1338)时,如果TU尺寸标记是0,则设置尺寸为2N×2N的变换单元1352,如果TU尺寸标记是1,则设置尺寸为N/2×N/2的变换单元1354。

变换单元的划分信息(TU(变换单元)尺寸标记)是变换索引的类型。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。

例如,当分区类型被设置成对称(即,分区类型2N×2N(1322)、2N×N(1324)、N×2N(1326)或N×N(1328))时,如果变换单元的划分信息(TU尺寸标记)是0,则设置尺寸为2N×2N的变换单元1342,如果TU尺寸标记是1,则设置尺寸为N×N的变换单元1344。

当分区类型被设置成非对称(即,分区类型2N×nU(1332)、2N×nD(1334)、nL×2N(1336)或nR×2N(1338))时,如果TU尺寸标记是0,则设置尺寸为2N×2N的变换单元1352,如果TU尺寸标记是1,则设置尺寸为N/2×N/2的变换单元1354。

参照图19,TU尺寸标记是具有值0或1的标记,但是TU尺寸标记不限于1比特,并且当TU尺寸标记从0增加时可分层地划分变换单元以具有树结构。变换单元的划分信息(TU尺寸标记)可以是变换索引的示例。

在这种情况下,根据本发明的实施例,可通过使用变换单元的TU尺寸标记以及变换单元的最大尺寸和最小尺寸来表示被实际使用的变换单元的尺寸。根据本发明的实施例,视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码。可将对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记编码的结果插入到SPS中。根据本发明的实施例,视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记来对视频进行解码。

例如,(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32,(a-1)则当TU尺寸标记是0时变换单元的尺寸可以是32×32,(a-2)当TU标记尺寸是1时变换单元的尺寸可以是16×16,(a-3)并且当TU尺寸标记是2时变换单元的尺寸可以是8×8。

作为另一示例,(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,(b-1)则当TU尺寸标记是0时变换单元的尺寸可以是32×32。这里,由于变换单元的尺寸不能小于32×32,故TU尺寸标记不能被设置成除0之外的值。

作为另一示例,(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标记是1,则TU尺寸标记可以是0或1。这里,TU尺寸标记不能被设置成除0或1以外的值。

因此,如果尺寸标记是0时定义最大TU尺寸标记为“MaxTransformSizeIndex”、最小变换单元尺寸为“MinTransformSize”并且变换单元尺寸为“RootTuSize”,则可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”可通过等式(1)来定义:

CurrMinTuSize=

max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)) (1)

与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比,当TU尺寸标记是0时的变换单元尺寸“RootTuSize”可表示可在系统中选择的最大变换单元尺寸。在等式(1)中,“RootTuSize/(2^MaxTransformSizeIndex)”表示当在TU尺寸标记是0时的变换单元尺寸“RootTuSize”被划分与最大TU尺寸标记相应的次数时的变换单元尺寸,“MinTransformSize”表示最小变换单元尺寸。因此,在“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中的较小值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。

根据本发明的实施例,最大变换单元尺寸“RootTuSize”可根据预测模式的类型而改变。

例如,如果当前预测模式是帧间模式,则“RootTuSize”可通过使用以下等式(2)来确定。在等式(2)中,“MaxTransformSize”表示最大变换单元尺寸,“PUSize”表示当前预测单元尺寸。

RootTuSize=min(MaxTransformSize,PUSize) (2)

也就是说,如果当前预测模式是帧间模式,则当TU尺寸标记是0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中的较小值。

如果当前分区单元的预测模式是帧内模式,则“RootTuSize”可通过使用以下等式(3)来确定。在等式(3)中,“PartitionSize”表示当前分区单元的尺寸。

RootTuSize=min(MaxTransformSize,PartitionSize) (3)

也就是说,如果当前预测模式是帧内模式,则当TU尺寸标记是0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元尺寸中的较小值。

然而,根据分区单元中的预测模式的类型而变化的当前最大变换单元尺寸“RootTuSize”仅是示例,并且本发明不限于此。

本发明的实施例可被编写为计算机程序,并可在使用计算机可读记录介质执行程序的通用数字计算机中被实现。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)和光记录介质(例如,CD-ROM或DVD)。计算机可读记录介质还可以分布于联网的计算机系统,从而以分布式方式存储和执行计算机可读代码。

虽然已经参照本发明的示例性实施例具体地示出并描述了本发明,但是本领域的普通技术人员将理解的是,在不脱离由权利要求限定的本发明的精神和范围的情况下,可在形式和细节上做出各种改变。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1