用于视频编码的设备和方法与流程

文档序号：17441767发布日期：2019-04-17 04:51阅读：162来源：国知局

本发明涉及视频编码领域。更具体地说，本发明涉及用于编码视频数据的编码装置和解码装置。

背景技术：

数字视频通信和存储应用由各种各样的数字设备来实现，例如数码相机、蜂窝无线电话、笔记本电脑、广播系统、视频会议系统等。这些应用中最重要和最具挑战性的任务之一为视频压缩。视频压缩的任务是复杂的，并受到两个相互矛盾的参数的约束：压缩效率和计算复杂度。itu-th.264/avc或itu-th.265/hevc等视频编码标准提供了良好的参数折衷。由于这个原因，支持视频编码标准几乎是对任意视频压缩应用的强制性要求。

现有视频编码标准基于将源图像划分为视频编码块(或短块)。这些块的处理取决于它们的尺寸、空间位置和编码器指定的编码模式。根据预测类型，可将编码模式分为两组：帧内和帧间预测模式。帧内预测模式使用相同图片(也称为帧或图像)的像素来生成参考样本以计算正在重构的块的像素的预测值。帧内预测也可以称为空间预测。帧间预测模式旨在用于时间预测，并使用前一个或后一个图片的参考样本来预测当前图片的块的像素。在预测阶段之后，对原始信号与预测信号之间的差值即预测误差进行变换编码。然后，使用熵编码器(例如，用于avc/h.264和hevc/h.265的cabac)对变换系数和边信息进行编码。最近通过的itu-th.265/hevc标准(iso/iec23008-2:2013中2013年11月的《信息技术—异构环境中高效编码和媒体分发第2部分：高效视频编码》)宣布了一套现有技术的视频编码工具，合理地权衡了编码效率和计算复杂度。《ieee视频技术电路和系统汇刊》2012年12月第22卷第12期中，garyj.sullivan的《高效视频编码(highefficiencyvideocoding，简称hevc)标准概述》中给出了itu-th.265/hevc标准概述。其全部内容通过引用并入本文。

与itu-th.264/avc视频编码标准类似，hevc/h.265视频编码标准将源图片划分成块，例如编码单元(codingunit，简称cu)。可以进一步地将每个cu分成更小的cu或预测单元(predictingunit，简称pu)。pu可以根据应用于pu的像素的处理类型进行帧内或帧间预测。在帧间预测的情况下，pu表示运动补偿通过为pu指定的运动矢量处理的像素面积。对于帧内预测，相邻块的相邻像素用作参考样本以预测当前块。pu指定一种预测模式，该预测模式从该pu中包含的所有转换单元(transformunit，简称tu)的帧内预测模式集合中选择。tu可以具有不同的大小(例如，4×4、8×8、16×16和32×32像素)，并且可以采用不同的方式进行处理。tu中进行变换编码，即利用离散余弦变换或离散正弦变换对预测误差进行变换(在hevc/h.265标准中，将变换编码应用于帧内编码块)并量化。因此，重构的像素包括量化噪声(量化噪声会变得明显，比如，作为单元之间的块效应、锐边附近的环状伪影等)，其是诸如dbf、sao和alf等环内滤波器所试图抑制的。使用复杂的预测编码(诸如运动补偿和帧内预测)和分区技术(例如，用于cu和pu的qt以及用于tu的rqt)允许标准化委员会大幅减少pu中的冗余。

导致这些视频编码标准成功应用的预测工具可以粗略地区分为帧间和帧内预测工具。帧内预测仅依赖于当前图片中包含的信息，而帧间预测采用不同图片之间的冗余以进一步提高编码效率。因此，通常帧内预测需要比帧间预测更高的比特率，以实现典型视频信号的相同视觉质量。

目前，使用不同的机制来发送关于如何选择由帧内或帧间预测工具生成的预测器的信息。最直接的方法就是在编码单元(codingunit，简称cu)或预测单元(predictionunit，简称pu)级别上使用一个或多个比特，其中，该级别处指示帧内预测模式。该方法已经在许多工具(例如，pdpc和mpi)上实现。另一种机制是通过增强型多变换(enhancedmultipletransform，简称emt)实现的，也称为自适应多变换(adaptivemultipletransform，简称amt)。这种方法背后的基本思想是使用cu级别标志(emtcuflag)来表示是否需要tu级别索引(emttuidx)。然而，emt不直接与预测编码部分相关。

信令的另一个方面是如何编码和解码该信息。传统方法中该信息是熵编码的。例如，可以使用cabac或其它熵编码器。另一种方法是将残差或预测信息中的边信息隐藏起来。在后一种方法中，将校验函数应用于主信号(即，应用于运动矢量差异投影的残差或量级)，以在解码器侧检索隐藏值。因此，有不同方式可以指示已选择的预测模式。但是，这些方式相互独立，无法彼此协调。

主要问题是预测工具的非系统化信令机制在诸如hm和jem的不同混合视频编码框架中会引起大量的开销。如果启用预测相关的语法元素的任何组合，则该问题的另一个结果可能是随着编码器侧计算量的增加，编码器侧的计算复杂度随之增加。

因此，需要用于视频编码的设备和方法。

技术实现要素：

用于视频编码的设备和方法是本发明的一个目的。

上述和其它目的通过独立权利要求的主题来实现。根据从属权利要求、说明书以及附图，进一步的实现形式是显而易见的。

下文中采用多个术语，在实施例中，这些术语具有以下含义：切片-独立编码/解码的图像的不同空间区域。切片头-用于传输与特定切片相关联的信息的数据结构。视频编码块(或短块)-m×n(m列n行)像素数组或样本(每个像素/样本与至少一个像素/样本值相关联)或m×n变换系数数组。编码树单元(codingtreeunit，简称ctu)网格-用于将像素块分成用于视频编码的宏块的网格结构。编码单元(codingunit，简称cu)-亮度样本的编码块，具有三个样本数组的图像的色度样本的两个对应编码块，单色图片的样本编码块或使用三个单独的色彩平面和语法进行编码的图片的样本编码块。图像参数集(pictureparameterset，简称pps)-包含适用于零个或多个整体编码图像的语法元素的语法结构，其由在每个切片头中发现的语法元素确定。序列参数集(sequenceparameterset，简称sps)-包含适用于零个或多个整体编码视频序列的语法元素的语法结构，其由在pps中发现的语法元素的内容确定，pps在每个切片头中发现的语法元素所引用。视频参数集(videoparameterset，简称vps)-包含适用于零个或多个整体编码视频序列的语法元素的语法结构。预测单元(predictionunit，简称pu)-亮度样本的预测块，具有三个样本数组的图片的色度样本的两个对应预测块，单色图片的样本预测块或使用三个单独的色彩平面和语法进行预测所述预测块样本的图片的样本预测块。转换单元(transformunit，简称tu)-亮度样本的转换块，具有三个样本数组的图片的色度样本的两个对应转换块，单色图片的样本转换块或使用三个单独的色彩平面和语法进行预测所述转换块样本的图片的样本转换块。补充增强信息(supplementalenhancementinformation，简称sei)-可插入到视频比特流中来增强视频的使用的额外信息。亮度-指示图像样本的亮度的信息。色度-指示图像样本的颜色的信息，其可用红色差色度分量(reddifferencechromacomponent，简称cr)和蓝色差色度分量(bluedifferencechromacomponent，简称cb)来描述。

根据第一方面，本发明涉及一种用于对编码视频数据进行解码的装置，所述编码视频数据包括多个帧，每个帧被划分为多个视频编码块，包括当前(即当前处理的)视频编码块，其又包括多个比所述当前视频编码块层级低的子块。所述装置包括：解码单元，用于对编码视频数据进行解码，以提供与当前视频编码块相关联的残差视频编码块，并从编码视频数据中提取参数调整信息；预测单元，用于通过为当前视频编码块的每个子块生成预测子块，为当前视频编码块生成预测视频编码块，其中，所述预测单元还用于针对当前视频编码块的每个子块，根据参数调整信息来调整为当前视频编码块定义的预测参数，并基于调整后的预测参数生成预测子块；以及恢复单元(也称为变换单元)，用于根据残差视频编码块和预测视频编码块恢复当前视频编码块。

在一种实现形式中，所述当前视频编码块可以是由pu和/或tu形式的子块组成的cu。或者，所述当前视频编码块可以是由tu形式的子块组成的pu。

在根据第一方面的解码装置的第一种可能的实现方式中，所述预测单元用于执行帧内预测和/或帧间预测以生成预测视频编码块。

在根据第一方面或其第一实现方式的解码装置的第二种可能的实现方式中，对所述编码视频数据进行熵编码，并且所述解码单元用于通过解码所述编码视频数据从编码视频数据中提取参数调整信息。

在根据第一方面或其第一实现方式的解码装置的第三种可能的实现方式中，所述参数调整信息隐藏在所述编码视频数据中，并且所述解码单元，通过将校验函数，尤其是奇偶校验函数，应用于编码视频数据的至少一部分，从编码视频数据中提取参数调整信息。

在根据第一方面或其第一至第三实现方式中的任何一个的解码装置的第四种可能的实现方式中，所述预测参数是定义第一预测标志状态和第二预测标志状态的预测标志，并且预测单元用于根据所述参数调整信息来调整预测标志的状态。

在根据第一方面的第四实施方式的解码装置的第五种可能的实现方式中，所述预测参数定义帧内预测模式，例如，所述预测参数是帧内预测模式索引。

根据第二方面，本发明涉及一种用于对编码视频数据进行解码的方法，所述编码视频数据包括多个帧，每个帧被划分为多个视频编码块，包括当前(即当前处理的)视频编码块，其又包括多个比所述当前视频编码块层级低的子块。所述解码方法包括：解码所述编码视频数据，以提供与当前视频编码块相关联的残差视频编码块，并从编码视频数据中提取参数调整信息；通过为当前视频编码块的每个子块生成预测子块，为当前视频编码块生成预测视频编码块，包括：针对当前视频编码块的每个子块，根据参数调整信息来调整为当前视频编码块定义的预测参数，并基于调整后的预测参数生成预测子块的步骤；以及基于残差视频编码块和预测视频编码块恢复当前视频编码块。

根据本发明第二方面所述的解码方法可以由根据本发明第一方面所述的解码装置执行。根据本发明第二方面所述的解码方法的进一步特征可以直接从根据本发明第一方面及其不同实现方式所述的解码装置的功能中得到。

根据第三方面，本发明涉及一种用于编码视频数据的装置，所述编码视频数据包括多个帧，每个帧被划分为多个视频编码块，包括当前块，即当前处理的视频编码块，其又包括多个比所述当前视频编码块层级低的子块。所述编码装置包括：预测单元，用于通过为当前所述视频编码块的每个子块生成预测子块，以及基于预测参数，为当前视频编码块生成预测视频编码块，其中，所述预测单元还用于针对当前视频编码块的每个子块，生成参数调整信息，为此，根据调整后的预测参数而不是所述预测参数来生成预测子块；以及编码单元，用于生成编码视频数据，其中所述编码视频数据包含基于预测视频编码块的编码视频编码块，其中编码视频数据包含参数调整信息。

在一种实现形式中，所述当前视频编码块可以是由pu和/或tu形式的子块组成的cu。或者，所述当前视频编码块可以是由tu形式的子块组成的pu。

在根据第二方面的编码装置的第一种可能的实现方式中，所述预测单元用于执行帧内预测和/或帧间预测，以根据当前视频编码块生成预测视频编码块。

在根据第二方面或其第一实现方式的所述编码装置的第二种可能的实现方式中，所述预测单元还用于基于比率失真标准来判断所述当前视频编码块的每个子块是否基于调整后的预测参数，而不是所述预测参数，来生成预测子块。

在根据第二方面或其第一或第二实现方式的所述编码装置的第三种可能的实现方式中，所述编码单元用于包括所述参数调整信息作为编码视频数据中的熵编码参数调整信息。

在根据第二方面或其第一或第二实现方式的所述编码装置的第四种可能的实现方式中，所述编码单元用于包括基于数据隐藏技术的所述编码视频数据中的参数调整信息。

在根据第二方面或其第一或第二实现方式的所述编码装置的第五种可能的实现方式中，所述编码单元用于包括基于数据隐藏技术的所述编码视频数据中的参数调整信息，或者包括所述参数调整信息作为所述编码视频数据中的熵编码参数调整信息，其视与当前视频编码块和预测视频编码块的差异相关联的冗余度量值而定。

如果在预测相关的语法元素中检测到足以执行数据隐藏的冗余，则应在其中隐藏要在相同层级编码的预测参数。否则，将熵编码用于信令。采用类似的方法将数据隐藏于残差中：如果在那里检测到所述冗余，则应使用数据隐藏。否则，将熵编码用于tu级别的信令。

根据第四方面，本发明涉及一种用于编码视频数据的方法，所述编码视频数据包括多个帧，每个帧被划分为多个视频编码块，包括当前块，即当前处理的视频编码块，其又包括多个比所述当前视频编码块层级低的子块。所述编码方法包括：通过为当前所述视频编码块的每个子块生成预测子块，以及基于预测参数，为当前视频编码块生成预测视频编码块，包括：为当前视频编码块的每个子块，生成参数调整信息的步骤，为此，根据调整后的预测参数而不是所述预测参数来生成预测子块；以及生成编码视频数据，其中所述编码视频数据包含基于预测视频编码块的编码视频编码块，其中编码视频数据包含参数调整信息。

根据本发明第四方面所述的编码方法可以由根据本发明第三方面所述的编码装置执行。根据本发明第四方面所述的编码方法的进一步特征可以直接从根据本发明第三方面及其不同实现方式所述的编码装置的功能中得到。

根据第五方面，本发明涉及一种计算机程序，包括：程序代码，用于在计算机上运行时执行根据第四方面所述的方法。

本发明的实施例允许改进hm和jem框架中使用的信令机制以指示所选择的预测器。本发明的实施例提供了一种分层结构的信令机制，该机制能够通过在较低层级上发送附加信息，比如参数调整信息，来调整在较高层级上选择的预测参数。此外，本发明的实施例允许在熵编码和数据隐藏之间自适应地选择，以指示所选择的预测参数。

本发明可以硬件和/或软件的方式来实现。

附图说明

本发明的具体实施例将结合以下附图进行描述，其中：

图1示出了根据一个实施例提供的解码装置和编码装置的示意图；

图2示出了一个实施例提供的一种解码方法的示意图；

图3示出了一个实施例提供的一种编码方法的示意图；

图4示出了示例性视频编码块的示意图，以说明在本发明的实施例中实现的方面；

图5示出了可以由本发明的实施例使用的预测参数的概述图；

图6示出了根据一个实施例提供的在解码装置中实现的处理步骤的图；

图7a和7b示出了根据不同实施例提供的解码装置中实现的处理步骤的图；

图8示出了根据一个实施例提供的在编码装置中实现的处理步骤的图；

图9a和9b-1、9b-2示出了根据一个实施例提供的在编码装置中实现的处理步骤的图；

图10a和10b示出了根据一个实施例提供的在解码装置中实现的处理步骤的图；

图11示出了由本发明的不同实施例预测的三个不同的视频编码块；

图12示出了根据一个实施例提供的在编码装置中实现的处理步骤的图；

图13示出了根据一个实施例提供的在解码装置中实现的处理步骤的图；

图14示出了根据一个实施例提供的在解码装置中实现的处理步骤的图；

图15示出了根据一个实施例提供的在解码装置中实现的处理步骤的图；

图16示出了示例性视频编码块的示意图，以说明在本发明的实施例中实现的方面。

在各附图中，相同的或至少功能等同的特征使用相同的标号。

具体实施方式

以下结合附图进行描述，所述附图是本发明的一部分，并通过图解说明的方式示出可以实施本发明的具体方面。可以理解的是，在不脱离本发明范围的情况下，可以利用其它方面，并做出结构或逻辑上的改变。因此，以下详细的描述并不视为具有限制意义，本发明的范围由所附权利要求书界定。

例如，可以理解的是，与所描述的方法有关的内容对于与用于执行所述方法的对应的设备或系统也同样适用，反之亦然。例如，如果描述了一个具体的方法步骤，则对应的设备可以包括用于执行所描述的方法步骤的单元，即使此类单元未在图中详细阐述或说明。此外，应理解，除非另外具体指出，否则本文中描述的各种示例性方面的特征可彼此组合。

图1示出了根据一个实施例的用于解码视频数据的解码装置121和用于编码视频数据的编码装置101的示意图。

所述编码装置101用于编码视频数据，其中，所述编码视频数据包括多个帧，每个帧被划分为多个视频编码块，包括当前块，即当前处理的视频编码块，其又包括多个比所述当前视频编码块层级低的子块。

在一个实施例中，所述当前视频编码块可以是由pu和/或tu形式的子块组成的cu。或者，所述当前视频编码块可以是由tu形式的子块组成的pu。

所述编码装置101包括：预测单元105，用于通过为当前所述视频编码块的每个子块生成预测子块，并根据至少一个预测参数，为当前视频编码块生成预测视频编码块。其中，所述预测单元105还用于为当前视频编码块的每个子块生成参数调整信息，为此，根据调整后的预测参数而不是所述预测参数来生成预测子块。

此外，所述编码装置101包括编码单元103，用于生成编码视频数据，其中，所述编码视频数据包含基于预测视频编码块和参数调整信息的编码视频编码块。

在一个实施例中，所述编码装置101可以实现为混合编码器，例如，如hevc标准中所定义的，并且可以包括图1中未示出的其它组件，例如熵编码器。

所述解码装置121用于通过，比如，比特流的形式，对所述编码装置101提供的所述编码视频数据进行解码。

所述解码装置121包括解码单元123，用于解码编码视频数据，以提供与当前视频编码块相关联的残差视频编码块，并从编码视频数据中提取参数调整信息。

此外，所述解码装置121包括预测单元125，用于通过为当前所述视频编码块的每个子块生成预测子块，为当前视频编码块生成预测视频编码块。其中，所述预测单元125还用于针对当前视频编码块的每个子块，根据参数调整信息来调整为当前视频编码块定义的预测参数，并基于调整后的预测参数生成预测子块。

此外，所述解码装置121包括恢复单元127(有时也称为变换单元)，用于根据残差视频编码块和预测视频编码块恢复当前视频编码块。

在一个实施例中，所述解码装置121可以实现为混合解码器，例如，如hevc标准中所定义的，并且可以包括图1中未示出的其它组件。

在一个实施例中，所述编码装置101的预测单元105和所述解码装置121的预测单元125用于执行帧内预测和/或帧间预测，以生成所述预测视频编码块。

在一个实施例中，所述编码装置101的预测单元105还用于基于比率失真标准来判断所述当前视频编码块的每个子块是否基于调整后的预测参数，来生成预测子块。

在一个实施例中，所述编码装置101的编码单元103用于包括所述参数调整信息作为所述编码视频数据中的熵编码参数调整信息。对于这样的实施例来说，所述解码装置121的解码单元123用于通过对编码视频数据进行解码，从编码视频数据中提取参数调整信息。

在一个实施例中，所述编码装置101的编码单元103用于包括基于数据隐藏技术的所述编码视频数据中的参数调整信息。对于这样的实施例，所述解码装置的解码单元123用于通过将校验函数，尤其是奇偶校验函数，应用于包含隐藏参数调整信息的编码视频数据的至少一部分，从编码视频数据中提取参数调整信息。

数据隐藏技术可以在本发明的实施例中实现，用于将参数调整信息隐藏在编码视频数据中。关于数据隐藏技术的更多细节，可以在例如viviennesze、madhukarbudagavi和garyj.sullivan的《高效视频编码(highefficiencyvideocoding，简称hevc)：算法和架构》(springer，2014，isbn978-3-319-06895-4)一文中找到。其全部内容通过引用并入本文。

在一个实施例中，所述编码装置101的编码单元103用于包括基于数据隐藏技术的所述编码视频数据中的参数调整信息，或者包括所述参数调整信息作为所述编码视频数据中的熵编码参数调整信息，其视与当前视频编码块和预测视频编码块的差异相关联的冗余度量值而定。

例如，如果在预测相关的语法元素中检测到足以执行数据隐藏的冗余，则应在预测相关的语法元素中隐藏要在相同层级编码的预测参数。否则，将熵编码用于信令。采用类似的方法将数据隐藏于残差中：如果在那里检测到所述冗余，则可使用数据隐藏。否则，将熵编码用于tu级别的信令。

在一个实施例中，如果较低级别的信令无法实现(例如，如果非零量化变换系数的数量不足以在残差中执行隐藏)或被禁止(例如，对于诸如4×4tu的小块，可以禁用熵编码信息以最小化信令开销)，则在较低层级上的信令信息可以默认为在较高级别使用的值。

在一个实施例中，所述预测参数是定义第一状态和第二状态的预测标志，并且所述解码装置121的预测单元125用于根据所述参数调整信息来调整预测标志的状态。

在一个实施例中，所述预测参数定义帧内预测模式，例如，预测参数是帧内预测模式索引。从更笼统的角度来看，所述预测参数可以包括图5中所示的一个或多个参数，这将在下面进一步详细描述。

图2示出了根据一个实施例提供的用于解码编码视频数据的相应方法200的示意图，所述编码视频数据包括多个帧，每个帧被划分为多个视频编码块，包括当前(即当前处理的)视频编码块，其又包括多个比所述当前视频编码块层级低的子块。

所述解码方法200包括以下步骤：解码201所述编码视频数据，以提供与当前视频编码块相关联的残差视频编码块，并从编码视频数据中提取参数调整信息；通过为当前视频编码块的每个子块生成预测子块，为当前视频编码块生成203预测视频编码块，包括：针对当前视频编码块的每个子块，根据参数调整信息来调整为当前视频编码块定义的预测参数，并基于调整后的预测参数生成预测子块的步骤；以及基于残差视频编码块和预测视频编码块恢复205当前视频编码块。

图3示出了根据一个实施例提供的用于编码视频数据的方法300的示意图，所述编码视频数据包括多个帧，每个帧被划分为多个视频编码块，包括当前(即当前处理的)视频编码块，其又包括多个比所述当前视频编码块层级低的子块。

所述编码方法300包括如下步骤：通过为当前所述视频编码块的每个子块生成预测子块，为当前视频编码块生成301预测视频编码块，包括：为当前视频编码块的每个子块，生成参数调整信息的步骤，为此，根据调整后的预测参数而不是所述预测参数来生成预测子块；以及生成303编码视频数据，其中所述编码视频数据包含基于预测视频编码块的编码视频编码块，编码视频数据包含参数调整信息。

下面将描述编码装置101、解码装置121、解码方法200和编码方法300的更多实施例。

图4示出了示例性的、当前处理的视频编码块的示意图，在这种情况下，视频编码块是pu。图4中所示的视频编码块包括tu形式的多个子块。从图4可以看出，这些子块，即tu，可以具有不同的大小，但通常小于当前视频编码块，即pu。因此，可以认为子块(即tu)来自比视频编码块(即pu)更低的层级。

对于更高层级的视频编码块来说，具有虚线背景的tu的最佳预测参数(例如，基于比率失真标准确定)与为pu选择或定义的预测参数相匹配。对于更高层级的视频编码块来说，具有白色背景的tu的最佳预测参数(例如，基于比率失真标准确定)与为pu选择或定义的预测参数不同。因此，对于具有白色背景的图4的示例性子块，所述编码装置101的预测单元105生成相应的参数调整信息，其由编码装置101的编码单元103纳入编码视频数据中。在解码装置121侧，解码单元123从编码视频数据中提取该参数调整信息。在此基础上，所述预测单元125，针对具有白色背景的图4的每一个示例性子块，调整发送给pu的预测参数为一个或多个调整后的预测参数，并且根据一个或多个调整后的预测参数，生成相应的预测子块。

图5示出了不同的(帧内和帧间)预测参数的表格，如有必要，这些参数可根据一个实施例的编码装置101和/或根据一个实施例的解码装置121所使用和调整。例如，所述预测参数可以定义帧内预测模式。

图6示出了根据一个实施例提供的在解码装置121中实现的处理方案600的处理步骤的图。在图6所示的实施例中，所述解码装置处理cu级、pu级和tu级的块。在本实施例中，cu级别的块处于比其pu级别和tu级别的子块更高的层级。此外，pu级别的块处于比其tu级别的子块更高级别的层级。图6中所示的处理方案600包括以下处理步骤。

处理步骤601包括从所述编码装置101提供的比特流中解析一组cu级别标志fcu。

处理步骤603包括使用fcu的值来分配预测参数p的值。

处理步骤605包括检查cu级别条件，例如跳转标志。如果这些条件符合，则应转到处理步骤609来处理每个pu。否则，在处理步骤607中“按原样”将预测参数p应用于整个cu。

处理步骤611包括针对属于给定cu的每个pu，从比特流解析一组pu级别标志fpu-u。这些标志fpu-u(例如，帧内预测模式索引或运动矢量差)可以无条件地存在于比特流中。

处理步骤613包括检查pu级别的条件，例如指示哪个插值滤波器将被选择用于帧内或帧间预测的标志。如果这些条件符合，则可以在处理步骤615中检索一些附加标志fpu-c。否则，返回到处理步骤609开始下一个pu的处理。

处理步骤617包括使用标志集fpu调整预测参数集p，并且包括转到属于给定pu的每个tu(即，转到处理步骤619)。

处理步骤621包括针对属于给定pu的每个tu，从比特流解析一组tu级别的标志fpu-u。这些标志fpu-u(例如，cbf)可以无条件地存在于比特流中。

处理步骤623包括检查tu级别的条件，例如非零量化变换系数的数量，以检测是要使用默认变换还是要解析emttu级别索引。如果这些条件符合，则可以在处理步骤625中检索一些附加标志fpu-c。否则，返回到处理步骤619处理下一个tu。

处理步骤627包括使用标志集ftu调整预测参数集p，并基于调整后的预测参数处理相应的tu。

图7a和7b示出了根据不同实施例提供的解码装置121中实现的处理步骤的图，用于实现图6中所示的处理步骤615和625，即处理步骤“获取fpu-c值”和“获取ftu-c值”。在一个实施例中，这些处理步骤可根据参数调整信息是否被熵编码或是否隐藏在编码视频数据中(例如，帧内预测模式索引、运动矢量和残差)而不同。

图7a示出了对于熵编码值，即熵编码的参数调整信息，在解码装置121的实施例中实现的处理步骤。在本实施例中，可以从编码装置101提供的比特流中，执行熵编码值f的解析，即熵编码参数调整信息(参见图7a的处理步骤701)。

图7b示出了对于参数调整信息，即隐藏在主信号中的f值，在解码装置121的实施例中实现的处理步骤。在处理步骤711中，可以检查一些隐藏约束(例如，非零量化变换系数的数量是否大于阈值)。如果满足条件，则在处理步骤715中对主信号应用校验函数(例如，奇偶校验函数)，来检索参数调整信息，即隐藏值f。否则，在处理步骤713中为参数调整信息分配默认值。

应当注意，根据本发明的实施例，在每个层级，可以选择要编码的视频数据的相关语法元素作为主机信号(例如，在pu层级为帧内预测模式索引或运动矢量，以及在tu层级为残差，即非零量化变换系数)。可以在编码装置101(以及解码装置121)中实现多种不同的数据隐藏技术，用于将参数调整信息隐藏在编码视频数据中，从而减少因在编码视频数据中纳入参数调整信息引起的任何信令开销。数据隐藏技术可以在本发明的实施例中实现，用于将参数调整信息隐藏在编码视频数据中。关于数据隐藏技术的更多细节，可以在例如viviennesze、madhukarbudagavi和garyj.sullivan的《高效视频编码(highefficiencyvideocoding，简称hevc)：算法和架构》(springer，2014，isbn978-3-319-06895-4)一文中找到。其全部内容通过引用并入本文。

在下文中，将在三种不同的帧内预测方案的上下文中描述编码装置101和解码装置121的更多实施例。这三种方案分别是位置相关帧内预测组合(positiondependentintrapredictioncombination，简称pdpc)、自适应参考样本平滑/参考样本自适应滤波器(adaptivereferencesamplesmoothing，简称arss，referencesampleadaptivefilter，简称rsaf)和距离加权定向帧内预测(distance-weighteddirectionalintra-prediction，简称dwdip)。pdpc是指在平滑之前和之后使用参考样本的值生成帧内预测器的技术，而arss/rsaf是指使用特殊隐藏标志启用或禁用参考样本平滑的技术。pdpc与arss/rsaf为现有已知技术，因此，下面将简要描述dwdip。

通常，dwdip会通过两个参考像素值的距离加权线性组合，来帧内预测当前处理的视频编码块(或其子块)的像素的像素值。关于dwidp的更多细节，可以参考本申请的发明人的两个其它专利申请，其已经与本申请同一天提交。

图8示出了根据一个实施例提供的在编码装置101中实现的帧内预测处理方案800，其中pdpc和arss/rsaf都用作帧内预测工具。更具体地，针对帧内预测工具标志和索引的不同组合计算比率失真成本(参见处理步骤801、803、805、807和809)，并且选择提供最小比率失真成本的pu和tu层级的标志和索引的组合(参见处理步骤802)。帧内预测过程基于pdpc或arss/rsaf。图9a和9b-1、9b-2中所示的处理方案900将提供关于该帧内预测过程的细节(隐藏在处理步骤805和809中)。

图9a和9b-1、9b-2示出了根据实施例提供的在编码装置101中实现的处理方案900的图。对于帧内预测模式索引iipm和pdpc标志m_pdpcidx的所选值(参见处理步骤901和903)，在生成帧内预测器，即预测块时，应考虑到tu层级的标志m_tu_flag可以为0(图9b-2)或1(图9b-1)，以提供比率失真成本最低的预测器。该tu层级的标志m_tu_flag根据m_pdpcidx的取值不同，可以具有不同的含义。如果m_pdpcidx＝＝1，则对于非dc帧内预测模式(在处理步骤931中执行检查)，m_tu_flag开启(m_tu_flag＝＝1)或关闭(m_tu_flag＝＝0)用于tu的pdpc机制。如果m_pdpcidx＝＝0，则m_tu_flag开启(m_tu_flag＝＝1)或关闭(m_tu_flag＝＝0)用于tu的arss/rsaf机制。在这两种情况下，由于采用的更加灵活的预测机制可提供更精确的预测器，就可能获得额外的编码增益，并允许这种增益超过因在编码的比特流中放置tu层级的标志m_tu_flag，即参数调整信息，产生的额外信令开销而导致的rd成本增加。

更具体地，通过处理方案900，编码装置对属于pu的tu进行迭代(处理步骤907和933)，在计算每个预测信号(处理步骤913、919、941和947)的rd成本的相应处理步骤中，针对自适应分配的参数，为每个tu(处理步骤911、917、939和945)生成预测信号，并根据计算出的rd成本选择最佳(即最优)变体(处理步骤921和949)。每个最佳变体在任一个处理步骤(处理步骤909、915、937或943)中都有定义的标志集。在编码装置101已选择最佳标志组合之后，计算用于进一步pu层级rd优化过程的整个pu(处理步骤929、935)的rd成本。

如上所述，tu层级标志m_tu_flag可以是熵编码的或隐藏的，例如，在tu残差中(参见处理步骤923、925和927和处理步骤951、953和955)。在后一种情况下，如果满足一些隐藏条件，则可以隐藏该标志(例如，非零量化变换系数的数量或者最后和第一非零量化变换系数之间的距离大于阈值)。否则，m_tu_flag设置为其默认值，即0(m_tu_flag＝＝0)。

图10a和10b示出了根据实施例提供的在解码装置121中实现的对应处理方案1000的图，其中pdpc和arss/rsaf都用作帧内预测工具。

在解析帧内预测模式索引iipm和pdpc标志m_pdpcidx的值之后(参见处理步骤1001和1003)，检查m_pdpcidx的值(参见处理步骤1005)。如果m_pdpcidx＝＝1，则对于属于给定pu的每个tu，检查是否将pdpc机制应用于tu(参见由处理步骤1007、1009、1011a、1011b、1013和1015组成的处理循环)。否则，如果选择了平面或定向帧内预测模式(iipm！＝1)(参见处理步骤1017)，arss/rsaf机制将替换pdpc(参见由处理步骤1019、1021、1023a、1023b、1025和1027组成的处理循环)。如果选择dc帧内预测模式，则可以跳过自适应参考样本平滑(arss/rsaf)(参见处理步骤1025)。此外，对于属于给定pu的每个tu，要检查是否满足隐藏条件(“能够隐藏m_tu_flag[i]吗？”)(参见处理步骤1009和1021)。如果条件满足，则将校验函数应用于给定tu中的残差，以检索m_tu_flag的值(参见处理步骤1011a和1023a)。如果条件不满足，则可以解析比特流以获得m_tu_flag的值(参见处理步骤1011b和1023b)。如果m_tu_flag[i]＝＝0，则pdpc和arss/rsaf都不应用于第i个tu(参见处理步骤1013和1025)。否则，pdpc和arss/rsaf分别用于m_pdpcidx＝＝1和m_pdpcidx＝＝0(参见处理步骤1015和1027)。

在下文中，将描述编码装置101和解码装置121的更多实施例，这些实施例也采用了上面已经提到的dwdip技术。

图11示出了使用pdpc技术、arss/rsaf技术和dwdip技术由本发明的实施例预测的三个不同视频编码块。

图12示出了根据实施例提供的编码装置101中实现的处理方案的图，该处理方案采用了dwdip技术。图13示出了根据一个实施例提供的在解码装置121中实现的相应处理方案的图。

在pu层级，编码装置101检查对于帧内预测模式(在处理步骤1201中确定)是否启用dwdip处理的两种情况：启用(idw_dir_mode_pu_flag＝＝1；参见处理步骤1215)；不启用(idw_dir_mode_pu_flag＝＝0；参见处理步骤1203)。对于这两种情况，在dwdip开启和关闭时(参见处理步骤1205和1217)，都要计算rqt(残差四叉树；在tu级别上分区)不同变体的rd成本(参见处理步骤1211和1225)。值得注意的是，根据定义，dwdip仅适用于定向帧内预测模式，即iipm>1(参见处理步骤1213)。最后，选择提供最小rd成本的idw_dir_mode_pu_flag标志值(参见处理步骤1227)。计算pu层级rd成本的处理步骤1211可以使用tu层级rd成本计算的结果(处理步骤1209)。类似地，处理步骤1225可以使用处理步骤1223a和1223b的结果。对于4×4tu，可以对标志idw_dir_mode_pu_flag的任何值禁用dwdip(参见处理步骤1219、1221b和1221a)。

图13所示的相应方案1300根据实施例在解码装置121中实现，其使用相同的约束和语法元素来进行解析，因此，图13中所示的处理方案1300的处理步骤与以上所述的处理方案1200的处理步骤是等效的。

图14示出了根据实施例在解码装置121中实现的处理方案1400的图，其利用了pdpc技术以及dwdip技术。图14中所示的处理方案1400与图13中所示的处理方案1300的不同之处仅在于纳入了可通过使用m_pdpcidx开启或关闭的pdpc技术(参见处理步骤1405)。图14中所示的处理方案1400的其它处理步骤与图13中所示的处理方案1300的相应处理步骤相同，参考上述图12和13中所示的处理方案1200和1300的处理步骤的描述。

图15示出了根据实施例在解码装置121中实现的处理方案1500的图，其利用了pdpc技术以及dwdip技术，并允许在tu层级禁用dwdip技术。图15中所示的处理方案1500与图14中所示的处理方案1400的不同之处仅在于添加了允许启用(m_puhintrafiltflag[i]＝＝1)和禁用(m_puhintrafiltflag[i]＝＝0)tu层级的dwdip处理的标志m_puhintrafiltflag(参见处理步骤1515)。图15中所示的处理方案1500的其它处理步骤与图13和14中所示的处理方案1300和1400的相应处理步骤相同，参考上述图12和13中所示的处理方案1200和1300的处理步骤的描述。

图16示出了示例性视频编码块的示意图，以说明在本发明的实施例中实现的方面。如图16所示，根据实施例提供的编码装置101和/或解码装置121使用的参数调整信息还可以包括关于当前处理的视频编码块内的子块的位置信息。在角度帧内预测的情况下，可以通过从子块到当前处理的视频编码块的参考样本的最小距离来确定特定位置，例如，相邻视频编码块的已预测参考样本。可以在由角度帧内预测模式指定的方向上计算该最小距离，并将其与根据块的大小而预定义的阈值进行比较。可以根据与预定义的阈值的比较结果来决定是否对子块预测参数执行调整。

本发明的实施例允许通过利用分层结构在不同级别的已选择预测器上发送不同决定，来调整预测器或预测块。根据本发明的实施例，在较低级别上做出的决定可以覆盖较高级别上做出的决定。然而，根据本发明的实施例，如果较低级别的信令无法实现(例如，如果非零量化变换系数的数量不足以在残差中执行隐藏)或被禁止(例如，对于诸如4x4tu的小块，可以禁用熵编码信息以最小化信令开销)，则在较低层级上的信令信息可以默认为在较高级别使用的值。

可以在本发明的实施例中实现代表不同层级上的编码预测参数的不同技术，其可以根据预测相关语法元素(比如帧内预测模式索引或运动矢量差异)和残差中包含的冗余情况，灵活地在熵编码或数据隐藏之间进行选择，从而最小化信令开销。如果在预测相关的语法元素中检测到足以执行数据隐藏的冗余，则可以在其中隐藏要在相同层级编码的预测参数。否则，将熵编码用于信令。采用类似的方法将数据隐藏于残差中：如果在那里检测到所述冗余，则可使用数据隐藏。否则，将熵编码用于tu级别的信令。

尽管本发明的特定特征或方面可能已经仅结合几种实施方式或实施例中的一种进行公开，但此类特征或方面可以和其它实施方式或实施例中的一个或多个特征或方面相结合，只要对任何给定或特定的应用有需要或有利即可。而且，在一定程度上，术语包括摂、有摂、具有摂或这些词的其它变形在详细的说明书或权利要求书中使用，这类术语和所述术语包括摂是类似的，都是表示包括的含义。同样，术语示例性地摂、例如摂和如摂仅表示为示例，而不是最好或最佳的。可以使用术语“耦合”和“连接”及其派生词。应当理解，这些术语可以用于指示两个元件彼此协作或交互，而不管它们是直接物理接触还是电接触，或者它们彼此不直接接触。

尽管本文中已说明和描述特定方面，但应了解，多种替代和/或等效实现形式可在不脱离本发明的范围的情况下替代所示和描述的特定方面。本申请旨在覆盖本文论述的特定方面的任何修改或变更。

尽管以上权利要求书中的元件是利用对应的标签按照特定顺序列举的，但是除非对权利要求的阐述另有暗示用于实施部分或所有这些元件的特定顺序，否则这些元件不必限于以所述特定顺序来实施。

通过以上启示，对于本领域技术人员来说，许多替代、修改和变化是显而易见的。当然，本领域技术人员容易认识到除本文所述的应用之外，还存在本发明的众多其它应用。虽然已参考一个或多个特定实施例描述了本发明，但本领域技术人员将认识到在不偏离本发明的范围的前提下，仍可对本发明作出许多改变。因此，应理解，只要是在所附权利要求书及其等效物的范围内，可以用不同于本文具体描述的方式来实施本发明。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：阿列克谢·康斯坦丁诺维奇·菲利波夫;瓦西里·亚历斯维奇·拉夫特斯基
技术所有人：华为技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。