用于对视频信号进行熵编码和解码的方法和设备与流程

文档序号:15213373发布日期:2018-08-21 15:46阅读:187来源:国知局

本发明涉及用于对视频信号进行熵编码和熵解码的方法和设备,更具体地讲,涉及一种自适应地选择上下文模型的方法以及一种在使用基于上下文的自适应二进制算术编码(cabac)的情况下自适应地利用旁路模式的方法。



背景技术:

熵编码是一种对通过编码处理确定的句法元素进行非压缩式压缩并生成原始字节序列有效载荷(rbsp)的处理。熵编码使用句法的统计并且为频繁生成的句法分配短比特,为其它句法分配长比特,然后将句法元素表示成简要数据。

在这些当中,基于上下文的自适应二进制算术编码(cabac)使用基于句法的上下文以及在执行二进制算术编码的过程期间先前生成的符号的自适应更新的概率模型。然而,cabac具有许多操作和高复杂度以及顺序结构,因此,难以并行操作。

因此,在视频压缩技术中,需要更高效地压缩和发送句法元素,为此,需要改进熵编码的性能。



技术实现要素:

技术问题

本发明在于提出一种当执行cabac时改进上下文模式的预测性能的方法。

本发明在于提出一种以块为单位针对所有句法利用基于旁路模式的cabac的方法。

本发明在于提出一种以块为单位针对特定句法利用基于旁路模式的cabac的方法以及一种用于调整特定句法的分组方法。

本发明在于提出一种关于是否以块为单位应用基于自适应旁路模式的cabac的推导方法。

本发明在于提出一种根据邻近块的块大小和句法值来选择上下文模型的方法。

本发明在于提出一种以切片为单位基于句法的统计更新概率模型的方法。

本发明在于提出一种以切片为单位基于句法的统计更新二值化的方法。

技术方案

本发明在于提出一种基于邻近块选择上下文模型的方法。

本发明在于提出一种基于块大小选择上下文模型的方法。

本发明在于定义指示是否基于先前切片的句法统计更新上下文模型的标志。

本发明在于定义用于更新上下文模型的上下文模型的初始值。

本发明在于提出一种基于先前切片的句法统计更新上下文模型的方法。

本发明在于定义指示是否为旁路模式的旁路标志。

本发明在于提出一种将各个组的句法分类以便自适应地应用旁路模式的方法。

本发明在于定义旁路组索引以便自适应地应用旁路模式。

本发明在于提出一种基于旁路组索引执行旁路模式算术解码的方法。

本发明在于提出一种推导当前块的旁路模式的方法。

本发明在于定义指示是否从先前帧预测旁路标志的旁路时间预测标志。

本发明在于提出一种基于旁路时间预测标志执行旁路模式算术解码的方法。

技术效果

本发明可通过在执行cabac时利用块大小和句法值或者基于先前切片的统计更新上下文模型以便改进上下文模型的预测性能来改进熵编码的性能。

本发明可通过在利用旁路模式执行cabac时以块为单位执行当前块的所有句法的熵编码来改进熵编码的性能。

附图说明

图1是示出根据本发明的实施方式的用于对视频信号进行编码的编码器的配置的框图。

图2是示出根据本发明的实施方式的用于对视频信号进行解码的解码器的配置的框图。

图3示出作为应用本发明的实施方式,应用基于上下文的自适应二进制算术编码(cabac)的熵编码单元的示意性框图。

图4示出作为应用本发明的实施方式,应用基于上下文的自适应二进制算术编码(cabac)的熵解码单元的示意性框图。

图5示出作为应用本发明的实施方式,根据基于上下文的自适应二进制算术编码(cabac)执行的编码流程图。

图6示出作为应用本发明的实施方式,根据基于上下文的自适应二进制算术编码(cabac)执行的解码流程图。

图7示出用于描述作为应用本发明的实施方式,基于邻近块选择上下文模型的方法的块关系图。

图8是示出作为应用本发明的实施方式,使用左块和顶块选择上下文模型的方法的流程图。

图9示出用于描述作为应用本发明的实施方式,基于块大小选择上下文模型的方法的块关系图。

图10示出作为应用本发明的实施方式,根据邻近块的块大小和句法值的上下文模型的索引值。

图11是作为应用本发明的实施方式,指示是否基于先前切片的句法统计执行更新的标志的句法。

图12是作为应用本发明的实施方式,用于更新上下文模型的上下文模型初始值的句法。

图13是示出作为应用本发明的实施方式,基于先前切片的句法统计更新上下文模型的方法的流程图。

图14示出用于描述作为应用本发明的实施方式,基于统计的二进制更新方法的表。

图15是用于描述作为应用本发明的实施方式,各个块的二值化二值(bin)数和cabac二值数的块关系图。

图16是定义作为应用本发明的实施方式,指示是否为处于旁路模式的旁路标志的句法。

图17示出用于描述将各个组的句法分类以便于自适应地应用旁路模式的方法的表。

图18是定义作为应用本发明的实施方式,用于自适应地应用旁路模式的旁路组索引的句法。

图19是描述作为应用本发明的实施方式,基于旁路组索引执行旁路模式算术解码的处理的流程图。

图20是用于描述作为应用本发明的实施方式,推导当前块的旁路模式的方法的块关系图。

图21是作为应用本发明的实施方式,指示是否从先前帧预测旁路标志的旁路时间预测标志的句法。

图22是描述作为应用本发明的实施方式,基于旁路时间预测标志执行旁路模式算术解码的处理的流程图。

具体实施方式

本发明提供了一种对视频信号执行熵解码的方法,该方法包括以下步骤:获得当前切片的上下文模型初始值;基于先前切片的句法统计来计算概率值;推导与当前切片的上下文模型初始值对应的加权值和与先前切片的句法统计对应的加权值;以及使用加权值来更新当前切片的上下文模型初始值。

在本发明中,该方法还包括以下步骤:从视频信号获得指示是否对上下文模型执行更新的更新标志,并且当基于更新标志对上下文模型执行更新时,获得当前切片的上下文模型初始值。

在本发明中,该方法还包括以下步骤:获得当前切片的上下文模型初始值与先前切片的上下文模型初始值之间的差值,并且基于差值获得当前切片的上下文模型初始值。

在本发明中,针对各个句法元素获得所述差值。

在本发明中,该方法还包括以下步骤:从邻近块推导句法元素的上下文模型;以及使用该上下文模型来执行熵解码,并且使用块大小或块分割深度中的至少一个来推导上下文模型。

在本发明中,基于邻近块的大小与当前块的大小的比较结果来推导上下文模型。

在本发明中,针对当前块的各个分割深度基于邻近块的句法元素值来确定上下文模型。

本发明提供了一种对视频信号执行熵解码的方法,该方法包括以下步骤:从视频信号获得旁路组索引,其中,该旁路组索引是指示应用旁路模式的一组特定句法的索引;检查与旁路组索引对应的句法元素;针对句法元素获得指示是否应用旁路模式的旁路标志;以及当根据旁路标志对特定句法应用旁路模式时,对该特定句法执行旁路二进制算术解码。

在本发明中,以切片为单位获得旁路组索引,并且以块为单位获得旁路标志。

在本发明中,旁路组索引对应于可从编码单元句法、预测单元句法、预测信息句法、变换单元句法和量化系数句法组合的至少一个组。

在本发明中,从先前切片或先前帧的对应块推导旁路标志。

在本发明中,对应块是位于与当前块相同位置的块或者位于由当前块的运动矢量指示的位置的块。

在本发明中,该方法还包括以下步骤:从视频信号获得旁路时间预测标志,并且旁路时间预测标志指示是否从先前帧或先前切片推导旁路标志。

本发明提供了一种对视频信号执行熵解码的设备,该设备包括:存储器,其用于存储基于先前切片的句法统计的概率值;以及上下文建模单元,其用于获得当前切片的上下文模型初始值,基于先前切片的句法统计来计算概率值,推导与当前切片的上下文模型初始值对应的加权值和与先前切片的句法统计对应的加权值,并且使用加权值更新先前切片的上下文模型初始值。

在本发明中,上下文建模单元从视频信号获得指示是否对上下文模型执行更新的更新标志,并且当基于更新标志对上下文模型执行更新时,获得当前切片的上下文模型初始值。

本发明提供了一种对视频信号执行熵解码的设备,该设备包括:解析单元,其用于从视频信号解析旁路组索引;以及二进制算术解码单元,其用于检查与旁路组索引对应的句法元素,针对句法元素获得指示是否应用旁路模式的旁路标志,并且当根据旁路标志对特定句法应用旁路模式时,对该特定句法执行旁路二进制算术解码,并且旁路组索引是指示应用旁路模式的一组特定句法的索引。

本发明的模式

以下,参照附图描述根据本发明的实施方式的示例性元件和操作。然而,要注意的是,参照附图描述的本发明的元件和操作仅作为实施方式提供,本发明的技术精神以及核心配置和操作不限于此。

另外,本说明书中所使用的术语是现在广泛使用的常用术语,但是在特殊情况下,使用由申请人随机选择的术语。在这种情况下,对应术语的含义在对应部分的详细描述中清楚地描述。因此,要注意的是,本发明不应被解释为仅基于本说明书的对应描述中所使用的术语的名称,本发明应该通过甚至检查对应术语的含义来解释。

此外,本公开中所使用的术语是为了描述本发明而选择的常用术语,但是如果存在具有相似含义的其它术语,则可由这些术语替换以便于更适当的分析。例如,信号、数据、样本、画面、帧和块可在各个编码处理中适当地替换和解释。

另外,尽管在本公开中没有明确地描述,本公开中所描述的概念和方法可被应用于其它实施方式,并且在本发明的发明构思内,这些实施方式的组合也适用。

图1示出根据本发明的一个实施方式的对视频信号进行编码的编码器的示意性框图。

参照图1,编码器100可包括图像分割单元110、变换单元120、量化单元130、解量化单元140、逆变换单元150、滤波单元160、dpb(解码画面缓冲器)170、帧间预测单元180、帧内预测单元185和熵编码单元190。

图像分割单元110可将输入到编码器100的输入图像(或者画面、帧)划分成一个或更多个处理单元。例如,处理单元可以是编码树单元(ctu)、编码单元(cu)、预测单元(pu)或变换单元(tu)。

编码器100可通过从输入图像信号减去从帧间预测单元180或帧内预测单元185输出的预测信号来生成残差信号。所生成的残差信号可被发送到变换单元120。

变换单元120可对残差信号应用变换技术以生成变换系数。例如,变换技术可包括离散余弦变换(dct)、离散正弦变换(dst)、karhunen–loève变换(klt)、基于图形的变换(gbt)或条件非线性变换(cnt)中的至少一个。当gbt将像素之间的关系信息表示为图形时,gbt意指从图形获得的变换。cnt意指通过使用所有先前重构的像素生成预测信号并基于其获得的变换。另外,变换处理可被应用于相同大小的正方形的像素块或者正方形以外的可变大小的块。

量化单元130可将变换系数量化并将量化的系数发送到熵编码单元190。熵编码单元190可对量化的信号进行熵编码,然后输出熵编码的信号作为比特流。

从量化单元130输出的量化的信号可用于生成预测信号。例如,量化的信号可经由环路中的解量化单元140和逆变换单元150经受解量化和逆变换,以分别重构残差信号。重构的残差信号可与从帧间预测单元180或帧内预测单元185输出的预测信号相加,以生成重构的信号。

滤波单元160可对重构的信号应用滤波,然后将滤波的重构的信号输出到重现装置或解码画面缓冲器170。发送到解码画面缓冲器170的滤波的信号可在帧间预测单元180中用作基准画面。这样,在画面间预测模式下使用滤波的画面作为基准画面,不仅画面质量可改进,而且编码效率也可改进。

解码画面缓冲器170可存储滤波的画面以便在帧间预测单元180中用作基准画面。

帧间预测单元180可参考重构的画面来执行时间预测和/或空间预测以去除时间冗余和/或空间冗余。在这种情况下,基准画面用于预测。在这种情况下,为了减少从帧间预测模式发送的运动信息的量,可基于邻近块与当前块之间的运动信息的相关性来预测运动信息。

帧内预测单元185可通过参考当前要编码的块附近的样本来预测当前块。帧内预测单元185可执行以下过程以执行帧内预测。首先,帧内预测单元185可准备生成预测信号所需的基准样本。然后,帧内预测单元185可使用所准备的基准样本来生成预测信号。此后,帧内预测单元185可对预测模式进行编码。此时,可通过基准样本填充和/或基准样本滤波来准备基准样本。由于基准样本已经历预测和重构处理,所以可能存在量化误差。因此,为了减小这些误差,可对用于帧内预测的各个预测模式执行基准样本滤波处理。

经由帧间预测单元180或帧内预测单元185生成的预测信号可用于生成重构的信号或者用于生成残差信号。

图2示出根据本发明的一个实施方式的对视频信号进行解码的解码器的示意性框图。

参照图2,解码器200可包括熵解码单元210、解量化单元220、逆变换单元230、滤波单元240、解码画面缓冲器(dpb)250、帧间预测单元260和帧内预测单元265。

可使用重现装置来重现从解码器200输出的重构的视频信号。

解码器200可接收从如图1所示的编码器输出的信号。可经由熵解码单元210对所接收的信号进行熵解码。

解量化单元220可使用量化步长信息从熵解码的信号获得变换系数。

逆变换单元230可对变换系数进行逆变换以获得残差信号。

可通过将所获得的残差信号与从帧间预测单元260或帧内预测单元265输出的预测信号相加来生成重构的信号。

滤波单元240可对重构的信号应用滤波,并且可将滤波的重构的信号输出到重现装置或解码画面缓冲单元250。发送到解码画面缓冲单元250的滤波的信号可用作帧间预测单元260中的基准画面。

本文中,对编码器100的滤波单元160、帧间预测单元180和帧内预测单元185的详细描述可同样分别适用于解码器200的滤波单元240、帧间预测单元260和帧内预测单元265。

图3示出作为应用本发明的实施方式,应用基于上下文的自适应二进制算术编码(cabac)的熵编码单元的示意性框图。

应用了本发明的熵编码单元300包括二值化单元310、上下文建模单元320、二进制算术编码单元330和存储器360,并且二进制算术编码单元330包括常规二进制编码单元340和旁路二进制编码单元350。这里,常规二进制编码单元340和旁路二进制编码单元350可分别被称为常规编码引擎和旁路编码引擎。

二值化单元310可接收数据符号序列并对其执行二值化以输出包括二值化的值0或1的二进制符号(二值)串。二值化单元310可将句法元素映射到二进制符号。例如一元(u)、截断一元(tu)、k阶指数哥伦布(egk)和固定长度处理等的各种不同的二值化处理可用于二值化。可基于句法元素的类型来选择二值化处理。

输出的二进制符号串被发送到上下文建模单元320。

上下文建模单元320从存储器选择对当前块进行编码所需的概率信息,并将它发送到二进制算术编码单元330。例如,上下文建模单元320可基于要编码的句法元素选择上下文存储器,并且可通过二值索引(binidx)来选择对当前句法元素进行编码所需的概率信息。这里,上下文意指符号的生成概率的信息,并且上下文建模意指以作为二值化的结果的二值作为输入估计二进制算术编码所需的二值的概率的处理。

上下文建模单元320可提供获得高编码效率所需的精确概率估计。因此,不同的上下文模型可用于不同的二进制符号,并且可基于先前编码的二进制符号的值来更新上下文模型的概率。在这种情况下,先前编码的二进制符号的值可被存储在存储器360中,并且上下文建模单元320可从其使用先前编码的二进制符号的值。

具有相似分布的二进制符号可共享相同的上下文模型。关于各个二进制符号的上下文模型可使用二值的句法信息、指示二值串中的二值的位置的二值索引和包括二值的块的邻近块中所包括的二值的概率中的至少一个。

二进制算术编码单元330包括常规二进制编码单元340和旁路二进制编码单元350,并且对输出的串执行熵编码并输出压缩的数据比特。

常规二进制编码单元340基于递归区间划分来执行算术编码。

首先,初始值为0至1的区间(或范围)基于二值的概率被划分成两个子区间。编码的比特提供偏移,所述偏移在被转换为二进制分数时选择两个子区间中的一个,其指示解码的二值的值。

在每一个解码的二值之后,区间可被更新为等于所选择的子区间,并且区间划分处理重复其本身。区间和偏移具有有限的比特精度,因此每当区间下降至特定值以下时可能需要重新归一化,以防止下溢。可在各个二值被解码之后发生重新归一化。

旁路二进制编码单元350在没有上下文模式的情况下执行编码,并且通过将当前编码的二值的概率固定为0.5来执行编码。这可在难以确定句法的概率或者被设计为高速编码时使用。

图4示出作为应用本发明的实施方式,应用基于上下文的自适应二进制算术编码(cabac)的熵解码单元的示意性框图。

熵解码单元400包括上下文建模单元410、二进制算术解码单元420、存储器450和逆二值化单元460,并且二进制算术解码单元420包括常规二进制解码单元430和旁路二进制解码单元440。

熵解码单元400可接收比特流并且可从其识别旁路标志。这里,旁路标志指示是否为旁路模式,并且旁路模式意指通过将当前编码的二值的概率固定为0.5来执行编码,而不使用上下文模型。

在根据旁路标志不是旁路模式的情况下,常规二进制解码单元430根据常规模式执行二进制算术解码。

此时,上下文建模单元410从存储器450选择对当前比特流进行解码所需的概率信息,并将其发送到常规二进制解码单元430。

此外,在根据旁路标志是旁路模式的情况下,旁路二进制解码单元440根据旁路模式执行二进制算术解码。

逆二值化单元460接收从二进制算术解码单元420解码的二进制数形式的二值,并将其变换为整数形式的句法元素值并输出。

图5示出作为应用本发明的实施方式,根据基于上下文的自适应二进制算术编码(cabac)执行的编码流程图。

编码器可对句法元素执行二值化(步骤s510)。

编码器可检查是根据常规模式执行二进制算术编码还是根据旁路模式执行二进制算术编码(步骤s520)。例如,编码器可基于旁路标志检查是处于常规模式还是旁路模式,并且例如当旁路标志为1时,这可指示旁路模式,当旁路标志为0时,这可指示常规模式。

当处于常规模式时,编码器可选择概率模型(步骤s530),并且可基于概率模型执行二进制算术解码(步骤s540)。此外,编码器可更新概率模型(步骤s550),并且可在步骤s530中基于更新的概率模型再次选择恰当的概率模型。

此外,当处于旁路模式时,编码器可基于概率0.5执行二进制算术解码(步骤s560)。

图6示出作为应用本发明的实施方式,根据基于上下文的自适应二进制算术编码(cabac)执行的解码流程图。

首先,解码器可接收比特流(步骤s610)。

解码器可从比特流提取旁路标志,并且检查处于常规模式还是旁路模式(步骤s620)。这里,旁路标志可根据句法的类型而预定。

在旁路标志指示常规模式的情况下,解码器可选择概率模型(步骤s630),并且可基于概率模型执行二进制算术解码(步骤s640)。此外,解码器可更新概率模型(步骤s650),并且可在步骤s630中基于更新的概率模型再次选择恰当的概率模型。

此外,当旁路标志指示旁路模式时,解码器可基于概率0.5执行二进制算术解码(步骤s660)。

解码器可对解码的二值串执行逆二值化(步骤s670)。例如,解码器可接收二进制数形式的二值,并且可将其变换为整数形式的句法元素值并输出。

图7示出用于描述作为应用本发明的实施方式,基于邻近块选择上下文模型的方法的块关系图。

参照图7,当前块被称为c,与当前块相邻的左块被称为l,顶块被称为a。当前块c的句法的上下文模型可使用作为邻近块的左块l或顶块a中的至少一个来确定。下式1表示基于左块和顶块选择上下文模型的方法。

[式1]

ctxidx=(condl&&availablel)+(conda&&availablea)

本文中,availablel和availablea分别表示左块和顶块是否存在,condl和conda意指左块和顶块的相应句法值。

根据上式1,可根据邻近块的句法值使用三个上下文模型。可根据邻近块的句法值来确定上下文模型,而无需考虑当前块的大小和邻近块的大小。然而,根据编码的块的大小,句法元素的统计性质通常可改变。因此,本发明提出一种基于块大小和统计性质来选择上下文模型的新方法。

图8是示出作为应用本发明的实施方式,使用左块和顶块来选择上下文模型的方法的流程图。

根据本发明,选择上下文模型的方法可被应用于编码器和解码器二者,并且为了描述方便,将基于解码器来描述。

首先,解码器可推导与当前块邻近的左块和顶块(步骤s810)。即,解码器可检查与当前块邻近的左块和顶块是否可用。

在左块和顶块中的至少一个可用的情况下,解码器可从左块和顶块中的至少一个推导句法值(步骤s820)。

另外,解码器可基于左块和顶块中的至少一个的句法值来确定上下文模型(步骤s830)。

基于所确定的上下文模型,解码器可推导上下文索引(ctxidx)值(步骤s840)。

解码器可基于上下文索引(ctxidx)值来执行二进制算术解码(步骤s850)。

图9示出用于描述作为应用本发明的实施方式,基于块大小选择上下文模型的方法的块关系图。

根据本发明,选择上下文模型的方法可被应用于编码器和解码器二者,并且为了描述方便,将基于解码器来描述。

作为本发明的实施方式,解码器可基于邻近块的块大小和句法值中的至少一个来选择上下文模型。例如,参照图9,关于c1块,可分别使用作为左侧和顶侧的相邻块的l1和a1的句法值来选择上下文模型。关于c2块,可分别使用作为左侧和顶侧的相邻块的l2和a2的句法值来选择上下文模型。在相邻块类似l2分割的情况下,可使用至少一个分割块,并且图9示出使用l2的情况。

由于c1块和c2块的大小不同,所以句法性质可不同。因此,通过将邻近块的块大小和句法值一起考虑,可选择上下文模型。

下式2表示使用左块和顶块以及四叉树深度来选择上下文模型的方法。

[式2]

ctxidx=(qtdepth>>1)*3+(condl&&availablel)+(conda&&availablea)

本文中,qtdepth意指当前块的四叉树深度的值。例如,在允许cu大小从8×8至256×256的情况下,qtdepth值可具有0至5的值。此外,availablel和availablea分别表示是否存在左块和顶块,并且condl和conda分别意指左块和顶块的句法值。根据上式2,可根据邻近块的句法值使用九个上下文模型。

对此的详细实施方式将参照图10更详细地描述。

图10示出作为应用本发明的实施方式,根据邻近块的块大小和句法值的上下文模型的索引值。

参照图10,在允许块大小从8×8至256×256的情况下,识别出根据邻近块的块大小和句法值不同地确定ctxidx值。

例如,在块大小为256×256或128×128的情况下,ctxidx值可具有值0、1和2,并且可根据邻近块的句法值的总和来确定ctxidx值。在左块和顶块的所有句法值均为0的情况下,ctxidx值为0,并且在左块或顶块的句法值中的任一个为1的情况下,ctxidx值为1。在左块和顶块的所有句法值均为1的情况下,ctxidx值为2。

类似地,在块大小为64×64或32×32的情况下,ctxidx值可具有值3、4和5,并且可根据邻近块的句法值来确定ctxidx值。

另外,在块大小为16×16或8×8的情况下,ctxidx值可具有值6、7和8,并且可根据邻近块的句法值来确定ctxidx值。

图11是作为应用本发明的实施方式,指示是否基于先前切片的句法统计执行更新的标志的句法。

根据本发明,可基于对应句法的统计来更新上下文模型或者可按照切片为单位改变二值化方法。

参照图11,示出指示是否对上下文模型执行更新的标志的句法。例如,cabac_update_flag(s1110)是指示是否基于先前切片的句法的统计来应用更新的标志。当cabac_update_flag值为1时,对上下文模型执行更新,并且当cabac_update_flag值为0时,不对上下文模型执行更新。

此外,可类似cabac_update_flag在切片头中针对所有句法指定是否执行更新,但本发明不限于此。例如,也可在其它层面(序列参数集、画面参数集、编码树集、编码单元、变换单元等)中定义,或者可针对各个句法确定是否对上下文模型执行更新。

以下,将描述对上下文模型执行更新的方法。

图12是作为应用本发明的实施方式,用于更新上下文模型的上下文模型初始值的句法。

作为更新上下文模型的方法的实施方式,可通过直接发送上下文模型的初始值来执行更新。

参照图12,解码器可获得指示是否对上下文模型执行更新的标志(步骤s1210)。例如,如图11中所描述的,解码器可通过获得cabac_update_flag来检查是否对上下文模型执行更新。

当作为检查的结果cabac_update_flag为1时(步骤s1220),可获得上下文模型初始值以用于对上下文模型执行更新(步骤s1230)。例如,指示上下文模型初始值的句法可被表示为cabac_init_value_diff。这里,上下文模型初始值可被定义为当前切片的上下文模型初始值与先前切片的上下文模型初始值之间的差值。

作为另一实施方式,可针对各个句法发送用于对上下文模型执行更新的上下文模型初始值。

图13是示出作为应用本发明的实施方式,基于先前切片的句法统计更新上下文模型的方法的流程图。

作为更新上下文模型的实施方式,解码器可通过累积先前切片中的句法的统计性质来更新上下文模型。即,通过使用基于从先前切片获得的统计的概率值与当前切片中的上下文模型的初始值的加权值的总和,可确定新的上下文模型的初始值。

首先,解码器可获得当前切片的上下文模型初始值(步骤s1310)。这里,对应上下文模型初始值可被直接发送,但是本发明不限于此。例如,发送先前切片的上下文模型初始值与当前切片的上下文模型初始值之间的差值,并且可推导当前切片的上下文模型初始值。

解码器可计算基于先前切片的句法统计的概率值(步骤s1320)。

解码器可推导与当前切片的上下文模型初始值对应的加权值和与先前切片的句法统计对应的加权值(步骤s1330)。

此外,解码器可应用与当前切片的上下文模型初始值对应的加权值和与先前切片的句法统计对应的加权值,并且可更新当前切片的上下文模型初始值(步骤s1340)。

下式3表示基于先前切片中的句法的统计性质更新上下文模型的方法。

[式3]

ctxslice(i)=w1×ctxinit+w2×ctxslice(i-1)

这里,ctxinit表示当前切片中定义的上下文模型的初始值,并且ctxslice(i-1)表示从先前切片中实际出现的句法的统计获得的统计值。w1和w2表示用于更新当前切片的上下文模型初始值的加权值。

图14示出用于描述作为应用本发明的实施方式,基于统计的二进制更新方法的表。

根据本发明,可直接更新上下文值的初始统计值,或者可与统计分布对应地修改二值化映射。即,可根据先前切片中生成的句法的统计分布自适应地修改二值化方法。

图14示出基于统计的二进制更新方法。

当存在四个符号值时,可在两个比特中进行二值化。此时,当二值化的第一比特使用0的生成概率较高的概率模型时,应该向频繁生成的符号分配二值化码“00”和“01”。然而,由于在图14中符号2的生成概率高于符号1的生成概率,所以如图14(a)所示,可能高效的是将符号2二值化为“01”。

作为本发明的另一实施方式,可将具有最高概率的符号0二值化为1比特,并且可针对剩余符号根据统计分布以截断一元形式执行二值化。

图15是用于描述作为应用本发明的实施方式,各个块的二值化二值数和cabac二值数的块关系图。

作为本发明的实施方式,可针对各个块对块中的所有句法进行旁路模式编码。

图15示出各个块的二值化二值数和cabac二值数。在大多数块中,由于cabac中生成的二值数小于二值化中生成的二值数,所以熵编码高效。然而,在特定块(例如,a、b、c和d块)中,由于cabac中生成的二值数大于二值化中生成的二值数,所以熵编码效率低。

在这种情况下,当代替常规模式使用旁路模式时,最大二值数可被限制为二值化二值数。例如,对于图15中的块d,二值化二值数为50比特,但是通过cabac生成55比特,因此,熵编码效率低。当针对该块对块中的所有句法使用旁路模式时,生成50比特,因此,可节省5比特。

同样,在a、b和c块的情况下,由于通过cabac生成的二值数大于通过二值化的二值数,所以当对这些块使用旁路模式时,生成20比特,因此,可分别节省3比特、5比特和2比特。

图16是定义作为应用本发明的实施方式,指示是否处于旁路模式的旁路标志的句法。

图16示出所提出的以块为单位自适应地应用旁路模式的句法。根据本发明,可在编码单元层面或者在最大编码块单元(例如,编码树单元)中发送标志。在图16中,旁路标志在编码单元层面发送,并且在块句法的最前部解码。

在旁路标志值为1的情况下,在旁路模式下对块中的所有句法进行解码,在旁路标志值为0的情况下,通过为各个句法确定的常规模式或者通过旁路模式对块中的句法进行解码。

另外,即使在使用旁路模式对单个块进行解码的情况下,各个句法的概率模型根据对应值可执行或者可不执行更新。

图17示出用于描述将各个组的句法分类以便自适应地应用旁路模式的方法的表。

作为本发明的实施方式,可针对各个块在旁路模式下对块中的特定句法进行编码。这是因为将块中的所有句法设定为旁路模式的情况并不比将块中的所有句法设定为常规模式的情况更高效。

因此,本发明提出一种自适应地使用旁路模式的方法。

作为第一示例,在不包括量化的系数的情况下,可使用旁路模式。

作为第二示例,特定句法可被分组,并且可针对各个组应用常规模式或旁路模式。

图17示出针对各个组将句法分类的实施方式。

例如,组1可包括编码单元句法。作为特定示例,编码单元句法可包括split_cu_flag、cu_transquant_bypass_flag、cu_skip_flag、pred_mode_flag或part_mode的至少一个句法。这里,split_cu_flag是指示编码单元是否被分割成一半水平和垂直大小的编码单元的标志。cu_transquant_bypass_flag是指示缩放、变换和环路滤波处理是否被绕过的标志。cu_skip_flag是指示编码单元是否被跳过的标志。pred_mode_flag是指示当前编码单元是在帧间预测模式还是帧内预测模式下编码的标志。part_mode指示当前编码单元的分区模式。

组2除了组1之外可另外包括预测单元句法。作为特定示例,预测单元句法可包括merge_flag或merge_idx的至少一个句法。这里,merge_flag是指示是否从邻近帧间预测分区预测当前预测单元的帧间预测参数的标志,并且merge_idx指示合并候选列表的合并候选索引。

组3除了组2之外可另外包括预测信息句法。作为特定示例,预测信息句法可包括图像内的预测模式、运动矢量预测索引、图像之间的预测方向索引、基准图像索引和运动矢量残差值的至少一个句法。

组4除了组3之外可另外包括变换单元句法。作为特定示例,变换单元句法可包括split_transform_flag、cbf或delta_qp的至少一个句法。这里,split_transform_flag是指示块是否被分区为一半水平和垂直大小的块以便于变换编码的标志。cbf是指示变换块是否包括1或以上的非零变换系数级别的标志。delta_qp指示当前编码单元的量化参数与预测值之间的差值。

组5除了组4之外可另外包括量化系数句法。作为特定示例,量化系数句法可包括与量化系数的编码有关的transform_skip_flag、last_sig_coeff、sig_coeff_flag或coeff_abs_level中的至少一个。这里,transform_skip_flag是指示是否对相关的变换块应用变换的标志。last_sig_coeff指示变换块中根据扫描顺序的最后系数的位置信息。sig_coeff_flag是指示在当前变换块中的变换系数位置中变换系数级别是否为非零的标志。coeff_abs_level是指示扫描位置中的变换系数级别是否大于特定值的标志。

组5对应于在旁路模式下对块中的所有句法进行编码的情况。

图18是定义作为应用本发明的实施方式,用于自适应地应用旁路模式的旁路组索引的句法。

参照图18,示出以切片为单位使用句法分组信息自适应地应用旁路模式的句法。

本发明可在切片头、画面参数集或序列参数集当中的至少一个层面发送用于应用旁路模式的旁路组索引。这里,旁路组索引是指示应用旁路模式的一组特定句法的索引。例如,图17中所描述的五个组可分别被分配给旁路组索引0至4。旁路组索引可用于自适应地应用旁路模式。

参照图18,在切片头中发送旁路组索引,并且可针对各个块确定对哪一句法应用旁路模式。

在这种情况下,可发送指示是否以块为单位应用旁路模式的旁路标志(bypass_flag),但是本发明不限于此。即使在使用旁路模式对单个块进行解码的情况下,可根据对应值执行或不执行各个句法的概率模型的更新。

图19是描述作为应用本发明的实施方式,基于旁路组索引执行旁路模式算术解码的处理的流程图。

解码器可从比特流解析旁路组索引(步骤s1910)。这里,旁路组索引是指示应用旁路模式的一组特定句法的索引。例如,图17中所描述的五个组可分别被分配给旁路组索引0至4。旁路组索引可用于自适应地应用旁路模式。

此外,旁路模式通常可被应用于与旁路组索引对应的句法元素,但是本发明不限于此。例如,即使对于与旁路组索引对应的句法元素,也可针对各个特定句法再次确定应用旁路模式。

例如,解码器可检查与旁路组索引对应的句法元素,并且可确定应用旁路模式的目标句法(步骤s1920)。

解码器可在解析旁路组索引的层面或较低层面接收指示是否针对特定句法应用旁路模式的旁路标志(步骤s1930)。例如,解码器可在切片头中解析旁路组索引,并且在块层面接收旁路标志。

基于旁路标志,可确定在各个块中对哪一句法应用旁路模式,并且在应用旁路模式的情况下,可对对应块中的句法或者对特定句法执行旁路二进制算术解码(步骤s1940)。

图20是用于描述作为应用本发明的实施方式,推导当前块的旁路模式的方法的块关系图。

作为本发明的实施方式,提出一种在解码器中针对各个块推导是否应用旁路模式的方法。

在图20中,假设阴影区域是在旁路模式下解码的块。

根据本发明,利用n-1帧中所使用的旁路模式信息,可在n帧中推导当前块的旁路模式信息。在图20中,描述了使用n-1帧的旁路模式,但是本发明不限于此,也可使用先前帧的旁路模式。另外,也可使用同一帧中的其它块的旁路模式信息(而非帧单元),并且也可使用邻近块的旁路模式。

作为实施方式,可使用与当前意图解码的块共同定位的块的旁路模式而无需任何改变。

另选地,也可使用在当前块的运动矢量所指示的位置的块的旁路模式信息。

另外,实施方式可基于块大小来执行。例如,实施方式可仅在先前帧的对应块的大小(x1,x3)等于或大于当前块(c1,c3)的情况下应用。即,在先前帧的对应块x2的大小小于当前块c2的大小的情况下,可不使用旁路模式标志值。

图21是作为应用本发明的实施方式,指示是否从先前帧预测旁路标志的旁路时间预测标志的句法。

本发明提出一种在切片层面定义旁路时间预测标志的方法。旁路时间预测标志指示是否从先前帧预测旁路标志。

例如,旁路时间预测标志可由bypass_temporal_pred_flag表示。当bypass_temporal_pred_flag=1时,当前切片可从先前帧预测旁路标志,并且当bypass_temporal_pred_flag=0时,当前切片不从先前帧预测旁路标志。

解码器可在切片头单元中获得旁路时间预测标志,因此,可确定是否从先前帧预测旁路标志。在这种情况下,可直接使用先前帧的旁路模式标志。

另选地,在先前帧是不使用旁路模式的帧的情况下,可通过计算实际生成概率来推导旁路模式标志值。

另外,在使用旁路时间预测标志的情况下,可不以块为单位发送旁路模式的句法。

图22是描述作为应用本发明的实施方式,基于旁路时间预测标志执行旁路模式算术解码的处理的流程图。

本发明提出一种基于旁路时间预测标志从先前帧推导旁路标志并使用其执行旁路模式算术解码的方法。

解码器可从比特流解析旁路时间预测标志(步骤s2210)。在这种情况下,可从切片头获得旁路时间预测标志,但是本发明不限于此,可从序列参数集、画面参数集、帧、切片、编码树单元、编码单元、预测单元、变换单元或块中的至少一个获得。

在根据旁路时间预测标志从先前切片(或先前帧)推导旁路标志的情况下,解码器可推导先前切片(或先前帧)的对应块(步骤s2220)。这里,对应块可意指与当前块共同定位的块。另选地,对应块可意指由当前块的运动矢量指示的块。

例如,当bypass_temporal_pred_flag=1时,解码器可从先前帧或先前切片推导对应块,当bypass_temporal_pred_flag=0时,解码器不从先前帧或先前切片推导对应块。

作为示例,解码器可确定是否基于块大小推导先前切片(或先前帧)的对应块。例如,在对应块的预测块等于或大于当前块的预测块的情况下,可使用对应块的信息。在对应块的预测块小于当前块的预测块的情况下,可不使用对应块的信息。

解码器可推导对应块的旁路标志,并且可基于旁路标志值确定是否对当前块应用旁路模式(步骤s2230)。

在根据旁路标志对当前块应用旁路模式的情况下,解码器可对当前块执行旁路二进制算术解码,否则,解码器可根据常规模式执行算术解码(步骤s2240)。

如上所述,本发明中所描述的实施方式可在计算机、处理器、微处理器、控制器或芯片中实现并执行。例如,图1至图14所示的功能单元可在计算机、处理器、微处理器、控制器或芯片中实现并执行。

如上所述,应用本发明的解码器和编码器可被包括在多媒体广播发送/接收设备、移动通信终端、家庭影院视频设备、数字影院视频设备、监视摄像机、视频聊天设备、实时通信设备(例如,视频通信)、移动流传输设备、存储介质、可携式摄像机、vod服务提供设备、互联网流服务提供设备、三维3d视频设备、电话会议视频设备和医学视频设备中,并且可用于对视频信号和数据信号进行编码。

此外,应用本发明的解码/编码方法可按照要由计算机执行的程序的形式生成,并且可被存储在计算机可读记录介质中。具有根据本发明的数据结构的多媒体数据也可被存储在计算机可读记录介质中。计算机可读记录介质包括存储有可由计算机系统读取的数据的所有类型的存储装置。例如,计算机可读记录介质可包括bd、usb、rom、ram、cd-rom、磁带、软盘和光学数据存储装置。此外,计算机可读记录介质包括以载波形式实现的介质(例如,通过互联网的传输)。此外,通过该编码方法生成的比特流可被存储在计算机可读记录介质中,或者可经由有线/无线通信网络发送。

工业实用性

为了例示公开了本发明的示例性实施方式,在所附权利要求所公开的本发明的技术精神和范围内,本领域技术人员可改进、改变、替换或添加各种其它实施方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1