用于对多层视频进行解码的方法和设备以及用于对多层视频进行编码的方法和设备的制造方法_2

文档序号:9529472阅读:来源:国知局
因此可对具有相同深度的编码单元递归地执行编 码。
[0090] 由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编 码单元确定关于至少一个编码模式的信息,因此可针对一个最大编码单元确定关于至少一 个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此最大编码单元的图 像数据的编码深度可根据位置而不同,因此可针对图像数据设置关于编码深度和编码模式 的信息。
[0091] 因此,输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括 在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
[0092] 根据本发明的实施例的最小单元是通过将构成最低深度的最小编码单元划分为4 份而获得的正方形数据单元。可选择地,最小单元可以是可包括在最大编码单元中所包括 的所有编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。
[0093] 例如,通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息和 根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息和关于分 区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的预测方向的信息、关于帧 间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以 及关于帧内模式的插值方法的信息。此外,根据画面、条带或G0P定义的关于编码单元的最 大尺寸的信息和关于最大深度的信息可被插入到比特流的头。
[0094] 在视频编码设备100中,较深层编码单元可以是通过将更高深度的编码单元(更 高一层)的高度或宽度划分成两份而获得的编码单元。换言之,当当前深度的编码单元的 尺寸是2NX2N时,更低深度的编码单元的尺寸是NXN。另外,尺寸为2NX2N的当前深度的 编码单元可包括最多4个更低深度的编码单元。
[0095] 因此,视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺 寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形 成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换中的任意一个对每 个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模 式。
[0096] 因此,如果以传统宏块对具有高分辨率或大数据量的图像进行编码,则每个画面 的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压 缩的信息,并且数据压缩效率降低。然而,通过使用视频编码设备1〇〇,由于在考虑图像的尺 寸的情况下增加编码单元的最大尺寸的同时,可通过考虑图像的特征来调整编码单元,因 此可提高图像压缩效率。
[0097] 图2是根据本发明的实施例的视频解码设备200的框图。
[0098] 视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据 解码器230。用于视频解码设备200的各种操作的各种术语(诸如编码单元、深度、预测单 元、变换单元和关于各种编码模式的信息)的定义与参照图1和视频编码设备100描述的 定义相同。
[0099] 接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解 析的比特流,针对每个编码单元提取编码的图像数据,并将提取的图像数据输出到图像数 据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息 提取器220可从关于当前画面的头提取关于当前画面的编码单元的最大尺寸的信息。
[0100] 另外,图像数据和编码信息提取器220从解析的比特流,根据每个最大编码单元, 提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编 码模式的信息被输出到图像数据解码器230。也就是说,比特流中的图像数据被划分为最大 编码单元,使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。
[0101] 可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码 单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度相应的相 应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外, 根据深度的划分信息可被提取为关于编码深度的信息。
[0102] 由图像数据和编码信息提取器220提取的关于根据每个最大编码单元的编码深 度和编码模式的信息是关于这样的编码深度和编码模式的信息:该编码深度和编码模式被 确定为在编码器(诸如,视频编码设备100)根据每个最大编码单元对根据深度的每个较深 层编码单元重复地执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产 生最小编码误差的编码深度和编码模式对图像数据进行解码来重建图像。
[0103] 由于关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元 和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单 元,提取关于编码深度和编码模式的信息。被分配相同的关于编码深度和编码模式的信息 的预定数据单元可以是包括在同一最大编码单元中的数据单元。
[0104] 图像数据解码器230基于关于根据最大编码单元的编码深度和编码模式的信息, 通过对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换言之,图像数据解码 器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的 每个编码单元的分区类型、预测模式和变换单元的信息,对编码的图像数据进行解码。解码 处理可包括预测(包含帧内预测和运动补偿)和逆变换。可根据逆正交变换或逆整数变换 的方法来执行逆变换。
[0105] 图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类 型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
[0106] 此外,为了根据最大编码单元执行逆变换,图像数据解码器230可基于与根据编 码深度的编码单元的变换单元的尺寸有关的信息,根据编码单元中的每个变换单元执行逆 变换。
[0107] 图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元 的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度 是编码深度。因此,图像数据解码器230可通过使用关于用于与编码深度相应的每个编码 单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元中 的与每个编码深度相应的至少一个编码单元的编码数据进行解码,并输出当前最大编码单 元的图像数据。
[0108] 换言之,可通过观察被分配给编码单元、预测单元和最小单元中的预定数据单元 的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元 可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。
[0109] 视频解码设备200可获得与在对每个最大编码单元递归地执行编码时产生最小 编码误差的至少一个编码单元有关的信息,并可使用所述信息来对当前画面进行解码。换 句话说,可对每个最大编码单元中的被确定为最优编码单元的具有树结构的编码单元进行 解码。
[0110] 因此,即使图像数据具有高分辨率或具有庞大数据量时,也可通过使用编码单元 的尺寸和编码模式来有效地对图像数据进行解码和恢复,其中,所述编码单元的尺寸和编 码模式是通过使用从编码器接收的关于最优编码模式的信息,根据图像数据的特性而被自 适应地确定的。
[0111] 现在将参照图3至图13来描述根据本发明的实施例的确定具有树结构的编码单 元、预测单元和变换单元的方法。
[0112] 图3是用于描述根据本发明的实施例的编码单元的构思的示图。
[0113] 编码单元的尺寸可被表示为宽度X高度,并且可以是64X64、32X32、16X16和 8X8。64X64的编码单元可被划分为64X64、64X32、32X64或32X32的分区,32X32的 编码单元可被划分为32X32、32X16、16X32或16X16的分区,16X16的编码单元可被划 分为16\16、16\8、8\16或8\8的分区,8\8的编码单元可被划分为8\8、8\4、4父8或 4X4的分区。
[0114] 在视频数据310中,分辨率为1920X1080,编码单元的最大尺寸为64,最大深度为 2。在视频数据320中,分辨率为1920X1080,编码单元的最大尺寸为64,最大深度为3。在 视频数据330中,分辨率为352X288,编码单元的最大尺寸为16,最大深度为1。图3中示 出的最大深度表示从最大编码单元到最小解码单元的划分总次数。
[0115] 如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码 效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310 和320的编码单元的最大尺寸可以是64。
[0116] 由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度 加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长 轴尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1,因此由于通过对 最大编码单元划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺 寸为16的最大编码单元和长轴尺寸为8的编码单元。
[0117] 由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度 加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长 轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被准确地表达。
[0118] 图4是根据本发明的实施例的基于编码单元的图像编码器400的框图。
[0119] 图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数 据进行编码。换言之,帧内预测器410基于预测单元对当前画面405中的帧内模式下的编 码单元执行帧内预测,帧间预测器415基于预测单元通过使用当前画面405和从恢复画面 缓冲器410获得的参考帧,对当前画面405中的帧间模式下的编码单元执行帧间预测。当 前画面405可被划分为最大编码单元,并且可被顺序编码。在此情况下,可针对通过将最大 编码单元划分为树结构而形成的编码单元执行编码。
[0120] 通过从与正被编码的当前画面405的数据单元相关的数据减去由帧内预测器420 或帧间预测器415输出的与各个模式的编码单元相关的预测数据来产生残差数据,并且残 差数据通过变换器425和量化器430被输出为量化后的变换系数。量化后的变换系数通过 反量化器460和逆变换器470被恢复为空间域中的残差数据。空间域中的残差数据通过与 由帧内预测器420或帧间预测器415输出的与各个模式的编码单元相关的预测数据相加而 被恢复为与当前画面405的编码单元相关的空间域中的数据。恢复的空间域中的数据在通 过去块单元455和SA0执行单元460进行后处理之后被输出为恢复画面。存储在恢复画面 缓冲器410中的恢复画面可被用作用于对其它画面进行帧间预测的参考画面。由变换器 425和量化器430量化的变换系数可通过熵编码器435被输出为比特流440。
[0121] 为了将图像编码器400应用于视频编码设备100,图像编码器400的所有元件 (即,帧间预测器415、帧内预测器420、变换器425、量化器430、熵编码器435、反量化器 445、逆变换器450、去块单元455和SA0执行单元460)基于每个最大编码单元的具有树结 构的编码单元中的每个编码单元执行操作。
[0122] 具体地,帧内预测器420和帧间预测器415通过考虑当前最大编码单元的最大尺 寸和最大深度来确定具有树结构的编码单元中的每个编码单元的分区模式和预测模式,变 换器425确定是否在具有树结构的编码单元中基于四叉树对每个编码单元中的变换单元 进行划分。
[0123] 图5是根据本发明的实施例的基于编码单元的图像解码器500的框图。
[0124] 熵解码器515从比特流505解析将被解码的编码图像数据和解码所需的关于编码 的信息。编码图像数据是量化后的变换系数,其中,反量化器520和逆变换器525从量化后 的变换系数恢复残差数据。
[0125] 帧内预测器550对帧内模式下的编码单元执行帧内预测。帧间预测器535通过使 用当前画面405和从恢复画面缓冲器530获得的参考帧对当前画面405中的帧间模式下的 编码单元执行帧间预测。
[0126] 当通过帧内预测器540或帧间预测器535输出的与各个模式的编码单元相关的预 测数据与残差数据相加时,空间域中的数据被恢复,并且恢复的空间域中的数据可在通过 去块单元545和SA0执行单元550进行后处理之后被输出为恢复画面560。另外,存储在恢 复画面缓冲器530中的恢复画面可被输出为参考画面。
[0127] 为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,图像解 码器 500可执行在熵解码器515的操作可被执行之后执行的操作。
[0128] 为了将图像解码器500应用于视频解码设备200,图像解码器500的所有元件 (即,熵解码器515、反量化器520、逆变换器530、帧内预测器540、帧间预测器535、去块单 元545和SA0执行单元550)针对每个最大编码单元基于具有树结构的编码单元执行操作。
[0129] 具体地,帧内预测器540和帧间预测器535针对具有树结构的每个编码单元确定 分区模式和预测模式,逆变换器525确定是否在具有树结构的编码单元中基于四叉树对每 个编码单元中的变换单元进行划分。
[0130] 图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。
[0131] 视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可 根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不 同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来 确定根据深度的较深层编码单元的尺寸。
[0132] 根据本发明的实施例,在编码单元的分层结构600中,编码单元的最大高度和最 大宽度均是64,最大深度是4。由于深度沿着分层结构600的垂直轴加深,因此较深层编码 单元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的水平轴被示出,其 中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
[0133] 换言之,在分层结构600中,编码单元610是最大编码单元,其中,深度为0,尺寸 (即,高度乘宽度)为64X64。深度沿着垂直轴加深,存在尺寸为32X32和深度为1的编 码单元620、尺寸为16X16和深度为2的编码单元630、尺寸为8X8和深度为3的编码单 元640、以及尺寸为4X4和深度为4的编码单元650。尺寸为4X4和深度为4的编码单元 650是最小编码单兀。
[0134] 编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸 为64X64和深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元 610中的分区,S卩,尺寸为64X64的分区610、尺寸为64X32的分区612、尺寸为32X64的 分区614或尺寸为32X32的分区616。
[0135] 类似地,可将尺寸为32X32和深度为1的编码单元620的预测单元划分成包括在 编码单元620中的分区,S卩,尺寸为32X32的分区620、尺寸为32X16的分区622、尺寸为 16X32的分区624和尺寸为16X16的分区626。
[0136] 类似地,可将尺寸为16X16和深度为2的编码单元630的预测单元划分成包括 在编码单元630中的分区,S卩,包括在编码度单元630中的尺寸为16X16的分区、尺寸为 16X8的分区632、尺寸为8X16的分区634和尺寸为8X8的分区636。
[0137] 类似地,可将尺寸为8X8和深度为3的编码单元640的预测单元划分成包括在编 码单元640中的分区,S卩,包括在编码单元640中的尺寸为8X8的分区、尺寸为8X4的分 区642、尺寸为4X8的分区644和尺寸为4X4的分区646。
[0138] 尺寸为4X4和深度为4的编码单兀650是最小编码单兀,并且是最低深度的编码 单元。编码单元650的预测单元仅被分配给尺寸为4X4的分区。
[0139] 为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备 100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执 行编码。
[0140] 随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单 元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一 个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度1相应 的编码单元和四个与深度2相应的编码单元均被编码。
[0141] 为了针对多个深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通 过对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度选择最小编 码误差。可选地,随着深度沿着分层结构600的垂直轴加深,可通过针对每个深度执行编码 并比较根据深度的最小编码误差,以搜索最小编码误差。在编码单元610中的具有最小编 码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
[0142] 图7是用于描述根据本发明的实施例的编码单元710和变换单元720之间的关系 的示图。
[0143] 视频编码设备100或视频解码设备200针对每个最大编码单元,根据具有小于或 等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应编码单 元的数据单元,来选择用于在编码期间进行变换的变换单元的尺寸。
[0144] 例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是 64X64,则可通过使用尺寸为32X32的变换单元720来执行变换。
[0145] 此外,可通过对小于64X64的尺寸为32X32、16X16、8X8和4X4的变换单元中 的每一个执行变换,来对尺寸为64X64的编码单元710的数据进行编码,然后可选择具有 最小编码误差的变换单兀。
[0146] 图8是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息 的示图。
[0147] 视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分 区类型的信息800、关于预测模式的信息810以及关于变换单元的尺寸的信息820进行编 码,并将信息800、信息810以及信息820作为关于编码模式的信息来发送。
[0148] 信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信 息,其中,分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2NX2N 的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2NX2N的分区802、尺寸为 2NXN的分区804、尺寸为NX2N的分区806和尺寸为NXN的分区808。这里,关于分区类 型的信息800被设置为指示以下分区之一:尺寸为2NXN的分区804、尺寸为NX2N的分区 806和尺寸为NXN的分区808。
[0149] 信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的 分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
[0150] 信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元 可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内 变换单元828。
[0151] 视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单 元,提取并使用用于解码的信息800、信息810和信息820。
[0152] 图9是根据本发明的实施例的根据深度的较深层编码单元的示图。
[0153] 划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分 成更低深度的编码单元。
[0154] 用于对深度为0和尺寸为2N_0X2N_0的编码单元900进行预测编码的预测单元 910可包括以下分区类型的分区:尺寸为2N_0X2N_0的分区类型912、尺寸为2N_0XN_0的 分区类型914、尺寸为N_0X2N_0的分区类型916和尺寸为Ν_0ΧΝ_0的分区类型918。图 9仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不限 于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状 的分区。
[0155] 根据每种分区类型,对尺寸为2N_0X2N_0的一个分区、尺寸为2N_0XN_0的两个 分区、尺寸为N_0X2N_0的两个分区和尺寸为Ν_0ΧΝ_0的四个分区重复地执行预测编码。 可对尺寸为2N_0X2N_0、N_0X2N_0、2N_0XN_0和N_0XN_0的分区执行帧内模式和帧间模 式下的预测编码。仅对尺寸为
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1