改善编码效率的基于上下文自适应算术编码和解码方法和装置以及使用其的视频编码和...的制作方法

文档序号：7637914阅读：140来源：国知局

专利名称：改善编码效率的基于上下文自适应算术编码和解码方法和装置以及使用其的视频编码和 ...的制作方法
技术领域：
符合本发明的装置和方法涉及改善编码效率的基于上下文自适应算术编码和解码，而且更具体地，涉及通过将输入视频的给定片段的上下文模型
初始化为与该给定片段相同的时间位置处的基础层片段的上下文模型而改善算术编码和解码中的编码效率的基于上下文自适应算术编码和解码方法
和装置。
背景技术：
视频编码器执行熵编码以将代表视频输入元素的数据符号转换为适当地为传输或存储而压缩的位流。所述数据符号可以包括经量化的变换系数、运动向量、各种首部等等。熵编码的例包括预测编码、可变长度编码、算术编码等等。特别地，算术编码提供最高的压縮效率。
成功的熵编码依赖于符号的准确的概率模型。为了估计要编码的符号的
概率，基于上下文自适应算术编码利用局部、空间、或时间特征。联合^L频组(JVT)分级视频模型利用基于上下文自适应算术编码，其中使用要编码的符号自适应地更新概率模型
发明内容
技术问题
然而，为了提供充分的编码效率，基于上下文自适应算术编码方法需要更多数量的编码块以及信息的累积。因而，传统基于上下文自适应算术编码方法的不足在于，当打算为每个片段将上下文模型初始化为预定概率模型时，在初始化之后可能会消耗不必要的位以达到预定编码效率。
技术方案
本发明提供通过将给定片段的上下文模型初始化为与该给定片段相同
的时间位置处的基础层片段的上下文模型而改善编码效率并减少误差传播
的3见频编码和解码方法和装置。
本领域技术人员通过以下描述将清楚上述方面以及本发明的其它方面。根据本发明的一个方面，提供一种用于对具有多层结构的视频信号的增
强层帧中的给定片段执行基于上下文自适应算术编码的方法，该方法包括将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型；利用重置的上下文模型对该给定片段的数据符号进行算术编码；以及基于经算术编码的数据符号的值更新所述上下文^f莫型。
根据本发明的另一个方面，提供一种用于对具有多层结构的视频信号的增强层帧中的给定片段执行基于上下文自适应算术解码的方法，该方法包括将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型；利用重置的上下文模型对与该给定片段对应的位流进行算术解码以产生该给定片段的数据符号；以及基于所述数据符号的值更
新所述上下文模型。
根据本发明的另一个方面，提供一种用于对具有多层结构的视频信号的增强层帧中的给定片段执行基于上下文自适应算术编码的方法，该方法包括将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基
以及预定值至少其中之一；利用重置的上下文模型对该给定片段的数据符号进行算术编码；以及基于经算术编码的数据符号的值更新所述上下文模型。
根据本发明的另一个方面，提供一种用于对具有多层结构的视频信号的增强层帧中的给定片段执行基于上下文自适应算术解码的方法，该方法包括将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型、时间上在给定片段之前解码的片段的上下文模型、以及预定值至少其中之一；利用重置的上下文模型对与该给定片段对应的位流进行算术解码以产生该给定片段的数据符号；以及基于所述数据符号的值更新所述上下文模型。
根据本发明的另一个方面，提供一种包括用于对具有多层结构的增强层帧中的给定片段执行基于上下文自适应算术编码的方法的视频编码方法，该视频编码方法包括从该给定片段中减去该给定片段的预测图像并产生余量图像；对所述余量图像执行空间变换并产生变换系数；将所述变换系数量化；
将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型；利用重置的上下文模型对该给定片段的数据符号进行
算术编码；基于经算术编码的数据符号的值更新所述上下文模型；产生包含经算术编码的数据符号的位流；以及发送所述位流。
根据本发明的另一个方面，提供一种包括用于对具有多层结构的增强层帧中的给定片段执行基于上下文自适应算术解码的方法的视频解码方法，该视频解码方法包括分析位流并提取关于要重建的该给定片段的数据；根据所述数据将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型；利用重置的上下文模型对与该给定片段对应的数据符号进行算术解码以产生该给定片段的数据符号；基于所述数据符号的值更新所述上下文模型；将所述数据符号去量化以产生变换系数；对所述变换系数执行逆空间变换以重建通过从该给定片段中减去预测图像而得到的余量图像；以及将通过运动补偿重建的预测图像添加到所述重建的余量图像并重建该给定片段。
根据本发明的另一个方面，提供一种用于对具有多层结构的视频信号的增强层帧中的给定片段进行编码的方法，该方法包括从该给定片段中减去该给定片段的预测图像并产生余量图像；对所述余量图像执行空间变换并产生变换系数；将所述变换系数量化；将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型、时间上在给定片段之前编码的片段的上下文模型、以及预定值至少其中之一；利用重置的上下文模型对该给定片段的数据符号进行算术编码；基于经算术编码的数据符号的值更新所述上下文模型；产生包含经算术编码的数据符号的位流；以及发送所述位流。
根据本发明的另一个方面，提供一种用于对具有多层结构的视频信号的增强层帧中的给定片段进行解码的方法，该方法包括分析位流并提取关于要重建的该给定片段的数据；根据所述数据将该给定片段的上下文模型重置
为与该给定片段相同的时间位置处的基础层片段的上下文模型、时间上在给
定片段之前解码的片段的上下文模型、以及预定值至少其中之一；利用重置的上下文模型对与该给定片段对应的位流进行算术解码以产生该给定片段的数据符号；基于所述数据符号的值更新所述上下文模型；将所述数据符号去量化以产生变换系数；对所述变换系数执行逆空间变换以重建通过从该给
定片段中减去预测图像而得到的余量图像；以及将通过运动补偿重建的预测
图像添加到所述重建的余量图像并重建该给定片段。
根据本发明的另一个方面，提供一种用于压缩具有多层结构的增强层帧
中的给定片段的视频编码器，该编码器包括从该给定片段中减去该给定片段的预测图像并产生余量图像的单元；对所述余量图像执行空间变换并产生变换系数的单元；将所述变换系数量化的单元；将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型的单元；利用重置的上下文模型对该给定片段的数据符号进行算术编码的单元；基于经算术编码的数据符号的值更新所述上下文模型的单元；产生包含经算术编码的数据符号的位流的单元；以及发送所述位流的单元。
根据本发明的另一个方面，提供一种用于重建具有多层结构的增强层帧中的给定片段的视频解码器，该解码器包括分析位流并提取关于要重建的该给定片段的数据的单元；根据所述数据将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型的单元；利用重置的上下文模型对与该给定片段对应的位流进行算术解码以产生该给定片段的数据符号的单元；基于所述数据符号的值更新所述上下文模型的单元；将所述数据符号去量化以产生变换系数的单元；对所述变换系数执行逆空间变换以重建通过从该给定片段中减去预测图像而得到的余量图像的单元；以及将通过运动补偿重建的预测图像添加到所述重建的余量图像并重建该给定片段的单元。
根据本发明的另一个方面，提供一种用于压缩具有多层结构的增强层帧中的给定片段的视频编码器，该编码器包括从该给定片段中减去该给定片段的预测图像并产生余量图像的单元；对所述余量图像执行空间变换并产生变换系数的单元；将所述变换系数量化的单元；将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型、时间上在给定片段之前编码的片段的上下文模型、以及预定值至少其中之一的单
元；利用重置的上下文模型对该给定片段的数据符号进行算术编码的单元；基于经算术编码的数据符号的值更新所述上下文模型的单元；产生包含经算
术编码的数据符号的位流的单元；以及发送所述位流的单元。
根据本发明的另一个方面，提供一种用于重建具有多层结构的增强层帧中的给定片段的视频解码器，该解码器包括分析位流并提取关于要重建的
该给定片段的数据的单元；根据所述数据将该给定片段的上下文模型重置为
与该给定片段相同的时间位置处的基础层片段的上下文模型、时间上在给定
片段之前解码的片段的上下文模型、以及预定值至少其中之一的单元；利用重置的上下文模型对与该给定片段对应的位流进行算术解码以产生该给定片段的数据符号的单元；基于所述数据符号的值更新所述上下文模型的单元；将所述数据符号去量化以产生变换系数的单元；对所述变换系数执行逆空间变换以重建通过从该给定片段中减去预测图像而得到的余量图像的单元；以及将通过运动补偿重建的预测图像添加到所述重建的余量图像并重建该给定片段的单元。

通过结合附图详细描述其示范性实施例，本发明的以上和其它特征以及优点将变得更加显而易见，其中
图1示出根据本发明第一示范性实施例的基于上下文自适应算术编码方
法；
图2示出根据本发明第二示范性实施例的基于上下文自适应算术编码方
法；
图3示出根据本发明第三示范性实施例的基于上下文自适应算术编码方
法；
图4是示出根据本发明示范性实施例的包括基于上下文自适应算术编码方法的视频编码方法的流程图5是示出根据本发明示范性实施例的包括基于上下文自适应算术解码方法的视频解码方法的流程图6是示出根据本发明示范性实施例的包括基于上下文自适应算术编码方法的视频编码方法的流程方法的视频解码方法的流程图8是根据本发明示范性实施例的视频编码器的框图；图9是根据本发明示范性实施例的视频解码器的框图。
具体实施例方式
通过参照下面对示范性实施例的详细描述以及附图，将更容易理解本发明的要点和特征以及其实现方法。然而，本发明可以以许多不同形式具体化，而且不应当被解读为限于这里阐述的示范性实施例。更确切地，提供这些示范性实施例是为了使本公开彻底和完整并向本领域技术人员全面传达本发明的概念，而且本发明将仅由所附权利要求书限定。说明书全文中类似的引用数字指代类似的元素。
现在将参照其中示出本发明的示范性实施例的附图更全面地描述本发明。
基于上下文自适应二进制算术编码(CABAC)通过下述实现高压缩性能基于符号上下文为每个符号选择概率模型；基于局部统计数据适配与所述概率模型对应的概率估计；以及对所述符号执行算术编码。所述数据符号的编码过程最多由四个基本步骤组成1. 二进制化；2.上下文建模；3.算术编码；以及4.概率更新。
1. 二进制化
在基于上下文自适应二进制算术编码(CABAC)技术当中，二进制算术编码允许将给定的非二进制取值符号唯一地映射到二进制序列。CABAC 中，仅有二进制结果进入编码过程。诸如变换系数或运动矢量的非二进制取值符号在实际算术编码过程之前被转换为二进制码。除了在发送之前先由算术编码器将二进制码编码之外，该过程与将数据符号转换为可变长度码类似。
为简洁起见，现在将在阐述关于CABAC的细节的同时讨论本发明，但本发明不限于此。
对二进制化码的各个位(即，双态(bin))递归地执行下列的上下文建模、算术编码、以及概率更新的基本操作。
2. 上下文建卄莫
基于最近编码的数据符号统计数据选择的作为二进制化符号的一个或多个双态的概率模型的上下文模型将每个双态的概率存储为T或'0，。
3. 算术编码
算术编码器基于选择的概率模型对每个双态进行编码。每个双态仅具有分别与值T和'0'对应的两个概率子范围。
4. 概率更新使用实际编码的值更新选择的概率模型。也即，如果双态值为T,则将1的频率计数增加一。
上述CABAC技术中，由于以片段为单元执行上下文建模，使用每个片段起始处的固定表初始化上下文模型的概率值。与传统可变长度编码(VLC ) 技术相比，为了提供更高的编码效率，需要CABAC技术累积预定量的信息以便经常地利用最近编码的数据符号的统计数据更新上下文模型。于是，使用预定概率模型为每个片段初始化上下文模型将导致不必要的位消耗乃至引起性能下降，这是由初始化之后块的数量增加造成的。
片段的数据符号类似的统计分布。因而，本发明提出通过使用时间上在基层片段之前编码的片段的统计特性作为给定片段的上下文模型的初始值而减少初始化上下文模型之后紧接的编码效率下降从而改进CAB AC技术。
使用基层片段的统计特性改善了编码性能而且减少了例如经运动补偿的时间滤波(MCTF)结构的时间滤波分层结构中的误差传播。
图1示出根据本发明第一示范性实施例的基于上下文自适应算术编码方法。
将增强层高通帧中的给定片段的上下文模型初始化为在相同的时间位置处的基础层高通帧中的相应片段的上下文模型以进行多层视频编码。例如，可以将增强层高通帧111的上下文模型初始化为在相同的时间位置处的基础层高通帧121的上下文模型。
在用于通过MCTF实现的多层结构的每个层的视频编码方法中，为了维持由MCTF实现的结构的目的而参考预定帧。为此，在其中给定帧出现误差的情况下，误差可能传播到时间上更高的等级。然而，在使用MCTF的视频编码方法中，可以通过参考基础层的高通帧的上下文模型初始化增强层的低通帧的上下文模型来实现显示较低误差传播率的鲁棒系统。
同时，当参考基础层低通帧的上下文模型时，可以选择性地参考构成所述上下文模型的某些概率模型。这种情况下，可以将关于是否已经参考过各个概率模型的信息插入位流以发送到解码器方。
本示范性实施例中，也可以将增强层低通帧118和119的上下文模型分别初始化为在相同的时间位置处的基础层低通帧128和129的上下文沖莫型，从而避免帧编码初始阶段期间编码效率的退化。
当基础层和增强层的分辨率等级彼此不同时，可能不具有与增强层高通帧相同的时间位置处的基础层帧。参照图1,由于帧114将不具有与基础层
对应的帧，因而像传统CABAC编码技术中一样使用预定义的初始化值来初始化与其对应的上下文冲莫型。此外，可以j吏用时间上在帧114之前编码的帧的上下文模型来初始化帧114,现在将参照图2对其进行描述。
图2示出根据本发明第二示范性实施例的基于上下文自适应算术编码方法，其中使用之前编码的帧的上下文模型作为不具有相应的基础层帧的增强层帧的上下文模型。
如上面参照图l所述，将具有在相同的时间位置处的相应的基础层帧的增强层巾贞111至113的上下文模型初始化为它们相应的基础层帧121至123 的上下文模型。另一方面，可以使用之前编码的帧的上下文模型作为不具有相应的基础层帧的增强层巾贞114至117的上下文模型。
在经时间滤波的分层结构中，高通帧倾向于具有彼此类似的统计特性。因而，可以使用紧接给定片段之前编码的片段的上下文模型作为给定高通帧片段的上下文模型的初始值。其中，使用紧接给定片段之前编码的片段的上下文模型作为给定片段的上下文模型的初始值以从最低等级到最高等级的次序连续地编码高通帧。当帧被划分为两个或更多片段时，紧接给定片段之前编码的片段可表示在相同的时间等级中的相邻高通帧的相应的片段、或者在相同的高通帧中紧接给定片段之前编码的片段。
因而，在如图1中所示的经时间滤波的分层结构中，使用紧接给定片段之前编码的片段的上下文模型作为给定片段的上下文模型的初始值以从最低等级到最高等级的次序连续地编码高通帧中的片段。图1-3中的箭头表示参考上下文模型的方向。这些示范性实施例中，也将时间上在给定片段之前编码的片段的上下文模型用作为由箭头指示的给定片段的上下文模型的初始值。
当从视频输入中检测到急剧的场景变化时，紧接给定片段之前编码的片段的统计特性与给定片段的不同。于是，利用紧接给定片段之前编码的片段的上下文模型来编码给定片段的方法将不能提供高编码效率。为此，本发明可以通过使用关于下层中时间上与给定片段最接近的片段的统计信息来提供高编码效率。进一步，使用关于下层中时间上与给定片段最接近的片^1的统计信息的方法与第一和第二示范性实施例的方法相比可以减少误差传插、因为片段中出现的误差仅能够传播到使用该片段作为参考的处于较高等级
的片段。
另一个示范性实施例中，可以选择性地参考紧接给定片段之前编码的片段的上下文模型、或者下层中时间上与给定片段最接近的片段的上下文模型。
在另外可选的示范性实施例中，可仅仅选择性地参考组成片段的上下文模型的某些概率模型。该情况下，如上所述，可以将关于是否已经参考过各个概率模型的信息插入位流以发送到解码器方。
图3示出根据本发明第三示范性实施例的基于上下文自适应算术编码方法。
将每个高通帧的增强层中的给定片段的上下文模型初始化为从在相同增强层中的与给定片段相同的时间位置处的基础层片段、以及时间上在给定片段之前编码的片段中所选之一的上下文模型。也即，对于不具有在相同的时间位置处的它们相应的基础层的片段114至117，将给定片段的上下文模
型之一。对于具有在相同的时间位置处的它们相应的基础层的片段111至 113，将给定片段的上下文模型初始化为相应的基础层片段的上下文模型、或者时间上在给定片段之前编码的片段的上下文模型之一。
在具有类似的统计特性的片段的上下文模型当中，选择最大地增强给定片段的编码效率的上下文模型用于执行给定片段的算术编码。该过程可以由下列步骤组成确定是否将使用根据经验预定义的初始值算术编码片段(例如，片段113);确定是否将如标注为131的箭头所指示的参考相应的基础层片段的上下文模型；确定是否将如标注为132的箭头所指示的参考紧接给定片段113之前编码的片段的上下文模型；以及确定是否将如标注为133的箭头所指示的参考时间上与给定片段最接近的片段的上下文模型。
可以如上面参照图2和3所述选择性地使用组成为初始化所选的一个上下文模型的概率模型。
在第二和第三示范性实施例中，将数据插入位流并发送到解码器，所述
数据包括关于是否已经使用预定义值的信息、关于是否已经使用相应的基础层片段的上下文模型的信息、关于是否已经使用时间上在给定片段之前编码的片段的信息。如果利用基础层片段、或时间上在给定片段之前编码的片段
的上下文模型算术编码给定片段，则所述数据可以包括关于是否已经使用组成时间上在给定片段之前编码的片段的上下文模型的每个概率模型作为参考模型的信息。
的^J贞编码方法的流程图。
所述视频编码方法包括从给定片段减去要压缩的给定片段的预测图像以产生余量信号(步骤S410);对余量信号执行空间变换并产生变换系数(步骤S420 );将包含变换系数以及在产生预测图像期间获得的运动向量的数据符号量化(步骤S430 );对经量化的数据信号进行熵编码(步骤S440至S470 ); 以及产生用于向解码器发送的位流(步骤S480和S490 )。
所述熵编码过程包括二进制化(步骤S440);上下文模型的重置(步骤S454或S456 );算术编码(步骤S460 );以及上下文模型的更新(步骤 S470)。然而，当使用基于上下文自适应算术编码代替CABAC时，可以跳过二进制化步骤S440。
在二进制化步骤S440中，将具有非二进制值的数据符号转换或二进制化为二进制值。
当在步骤S450中当前压缩的块是所述片段中的第一个块时，在步骤 S452至S456中重置该片段的上下文模型。以块为单位执行熵编码并以片|史为单位重置上下文模型，以确保片段的独立性。换句话说，为所述片^1中的第一个块的符号重置上下文模型。随着要编码的块的数量增加，自适应地更新与其对应的上下文模型。本示范性实施例中，通过参考时间上在所述片段
之前编码的片段的上下文模型来重置所选的上下文^t莫型，上面参照图2和3 对其进行了描述。同样，在使用一个上下文模型的情况下，其可以参考所述上下文模型的部分概率模型。该情况下，可以传输包含每个概率模型的参考信息的位流。
图2和3中示出将用于重置给定片段的上下文模型的片段的示例。如图 2或3中所示，包括根据本发明的第二或第三示范性实施例的算术编码方法的视频编码方法可以进一步包括选择可用于参考的上下文模型之一。选4奪可用于参考的上下文模型之一的准则包括编码效率、误差传播概率等等。换句话说，可从候选上下文模型当中选择具有最高编码效率的上下文模型或者具有最低误差传播概率的上下文模型。
在步骤S460中，根据以之前选择的片段的上下文模型作为初始值的概率模型对经二进制化的符号进行算术编码。
在步骤S470中，基于经二进制化的符号的实际值更新所述上下文模型。例如，如果数据符号的一个双态具有值'0，，则增加'0，的频率计数。于是，下次选择该模型时，'0，的概率将稍微高一些。
图5是示出根据本发明示范性实施例的包括基于上下文自适应算术解码方法的视频解码方法的流程图。
在步骤S510中解码器分析接收的位流以提取用于重建视频帧的数据。所述数据可以包括关于所选的上下文模型的信息，例如，当在由编码器执行的算术编码期间为初始化给定片段的上下文模型而选择时间上在给定片段之前编码的片段的上下文模型之一时所选的上下文模型的片段信息。
当给定块是片段中的第一个块时(步骤S520中的"是")，在步骤S522 至S526中重置给定片段的上下文模型。当存在具有与给定片段相同的时间位置的基础层片段时(步骤S522中的"是")，在步骤S524中将给定片段的上下文模型重置为该基础层片段的上下文模型。相反地，当不存在具有与给定片段相同的时间位置的基础层片段时(步骤S522中的"否")，在步骤S526 中将给定片段的上下文模型重置为时间上在给定片段之前解码的片段的上下文模型。
可以参考的之前解码的片段的上下文模型如上面参照图2和3所述。
在步骤S530中，根据上下文模型对与所述片段对应的位流进行算术解码。在步骤S540中，基于经解码的数据符号的实际值更新所述上下文才莫型。当使用基于上下文自适应二进制算术解码时，在步骤S550中将经算术解码的数据符号转换或去二进制化为非二进制值。
在步骤S560中，对经去二进制化的数据符号执行去量化并产生变换系数，而且在步骤S570中，对变换系数执行逆空间变换以重建给定片段的余量信号。在步骤S580中，将通过运动补偿重建的给定块的预测图像添加到余量信号，从而重建给定片段。
图6是示出根据本发明示范性实施例的包括基于上下文自适应算术编码方法的视频编码方法的流程图。
所述视频编码方法包括从给定片段中减去给定片段的预测图像以产生余量图像(步骤S610);对余量图像执行空间变换并产生变换系数(步骤
S620 );将变换系数量化(步骤S630 );对经量化的变化系数进行熵编码(步骤S640至S670);产生位流(步骤S680 );以及向解码器发送位流(步-骤 S690 )。
在所述说明性实施例中，以如下方式执行熵编码。在其中为每个片l殳初始化基于CABAC的上下文模型的视频编码方法中，如果给定块是给定片賴二中的第一个块(步骤S650中的"是")，则将给定片段的上下文模型重置为对应的基础层片段的上下文模型、时间上在给定片段之前编码的片段的上下文模型、或者由视频编码器提供的预定初始值。换句话说，根据该说明性实施例的视频编码方法可以进一步包括选择与增强层中的给定片段对应的基础层片段的上下文模型、相同的增强层中时间上在给定片段之前编码的片段的上下文模型、或者由视频编码器提供的预定初始值之一。
同时，当仅参考组成片段的上下文模型的某些概率模型时，根据所述说明性实施例的视频编码方法可以进一步包括选择用于作为参考模型的一既率模型。
从两个或更多上下文模型当中选择的上下文模型在步骤S655中被初始化，并在步骤S660中被算术编码。在步骤S670中，利用经算术编码的lt据符号值更新所述上下文模型。
通过以上步骤产生的位流可以包含关于在重置给定片段的上下文^^莫型
编码的片段的上下文模型的每个概率模型作为参考模型的信息。
图7是示出根据本发明示范性实施例的包括基于上下文自适应算术解码方法的视频解码方法的流程图。
在步骤S710中，视频解码器分析位流以提取关于要重建的给定片段的数据。所述关于给定片段的数据可以包含关于用于初始化给定片段的上下文模型的片段的信息、关于给定片段的上下文模型的信息、或者关于是否已经使用组成时间上在给定片段之前编码的片段的上下文模型的每个概率模型作为参考模型的信息。
当当前解码的块是给定片段中的第一个块时，(步骤S720中的"是")，在步骤S725中根据从位流中提取的关于上下文模型的初始值的信息将给定片段的上下文模型重置为对应的基础层片段的上下文模型或者时间上在给定片段之前解码的片段的上下文模型。
22在步骤S730中，利用上下文模型对与给定片段对应的位流进行算术解码。在步骤S740中，基于经算术解码的数据符号的值更新所述上下文模型。在步骤S750中，将经算术解码的值转换或去二进制化为非二进制值。在步骤S760中，对经去二进制化的值执行去量化并产生变换系数。然而，当不使用基于上下文自适应二进制算术编码(CABAC)时，可以跳过去二进制化步骤S750。
视频解码器在步骤S770中对变换系数执行逆空间变换以重建余量图像，并在步骤S780中将通过运动补偿重建的预测图像添加到余量图像以重建给定片段。
图8是根据本发明示范性实施例的视频编码器800的框图。视频编码器800包括空间变换器840、量化器850、熵编码单元860、运动估计器810、以及运动补偿器820。
获得运动向量。块匹配算法被广泛用于运动估计。具体地，在参考帧的特定搜索区域内以像素为单位移动给定运动块，并将给出最小误差的位移估计为运动向量。对于运动估计，可以^吏用分层可变尺寸块匹配(HVSBM)。然而，在本发明的示范性实施例中，使用筒单的固定块尺寸运动估计。运动估计器 810将诸如作为运动估计的结果获得的运动向量、运动块尺寸、以及参考帧编号的运动^:据发送到熵编码单元860。
运动补偿器820利用由运动估计器810计算得到的运动向量对参考帧4丸行运动补偿并产生给定帧的预测帧。
减法器830计算给定帧与预测帧之间的差以去除输入视频帧中的时间冗余。
空间变换器840利用支持空间分级的空间变换技术来去除其中已经由减法器830去除时间冗余的帧中的空间冗余。所述空间变换方法可以包括离散余弦变换(DCT)、或小波变换。将经空间变换的值称为变换系数。
量化器850对由空间变换器840获得的变换系数施加量化。量化意味着利用离散值表示以任意实数值形成的变换系数、并根据预定量化表将所述离散值与索引进行匹配的过程。将经量化的结果值称为量化系数。
熵编码单元860无损地编码包括由量化器850获得的经量化的变换系数以及从运动估计器810接收的运动数据的数据符号。熵编码单元860包括二
进制化器861、上下文模型选择器862、算术编码器863、以及上下文模型更新器864。
二进制化器861将数据符号转换为二进制值并接着将其发送到上下文才莫型选择器862。当不使用CABAC时可以省略二进制化器861。
上下文模型选择器862选择预先定义为给定片段的上下文模型的初始值的初始值、或者时间上在给定片段之前编码的片段的上下文模型。将关于所选择的上下文模型的初始值的信息发送到位流产生器870并插入到位流以发送。同时，当在编码器方和解码器方之间预先定义了参考时间上在给定片4殳之前编码的片段以初始化给定片段的上下文模型的方法时，可以不提供上下文模型选择器862。
算术编码器863利用所述上下文模型对给定块的数据符号执行基于上下文自适应算术编码。
上下文模型更新器864基于经算术编码的数据符号的值更新所述上下文模型。
为了支持闭环编码以减少因编码器与解码器之间的失配而导致的漂移误差，视频编码器800可以进一步包括去量化器和逆空间变换器。
图9是根据本发明示范性实施例的视频解码器900的框图。
解码器900包括位流分析器910、熵解码单元920、去量化器930、逆空间变换器940、以及运动补偿器950。
位流分析器910分析从编码器接收的位流以提取熵解码单元920解码位流所需的信息。
熵解码单元920执行作为熵编码的逆操作的无损解码以提取运动数据和紋理数据，所述运动数据接着被供给到运动补偿器950，所述紋理数据接着被供给到去量化器930。熵解码单元920包括上下文模型设置器921、算术解码器922、上下文模型更新器923、以及去二进制化器924。
上下文模型设置器921根据由位流分析器910提取的信息初始化要解码的片段的上下文信息。由位流分析器910提取的所述信息可以包含关于具有将被用作为给定片段的上下文模型的初始值的上下文模型的片段的信息、以及关于将被用作为给定片段的上下文模型的初始值的概率模型的信息。本发明的示范性实施例中，可以与片段中的块的类型独立地初始化上下文模型。
算术解码器922根据由上下文模型设置器921设置的上下文模型对与给
定片段的数据符号对应的位流执行基于上下文自适应算术解码。
上下文模型更新器923基于经算术解码的数据符号的值更新给定上下文模型。当使用基于上下文自适应二进制算术解码时，去二进制化器924将由算术解码器922获得的经解码的二进制值转换为非二进制值。去二进制化器执行数据的逆二进制化。
去量化器930将从熵解码单元920接收的紋理信息去量化。去量化是/人自编码器接收的匹配的量化索？ 1获得量化系数的过程。
逆空间变换器940对在去量化之后获得的系数执行逆空间变换以重建空间域中的余量图像。运动补偿器950利用来自熵解码单元920的运动数据对之前重建的视频帧执行运动补偿，并产生经运动补偿的帧。
当利用时间预测产生由逆空间变换器940重建的余量图像时，加法器 960将从运动补偿器950接收的经运动补偿的图像添加到余量图像以重建视频帧。
图8至9中，各种组件意味着(但不限于)执行特定任务的软件或诸如现场可编程门阵列(FPGA)或专用集成电路(ASIC)的硬件组件。所述组件可以有利地被配置为驻留在可寻址存储介质上，并被配置为在一个或多个处理器上执行。可以将所述组件和模块中提供的功能合并到较少的组件和模块中、或进一步分离到附加的组件和模块中。
虽然已经利用几个示范性实施例参照以片段为单元初始化的上下文才莫型展示和描述了本发明，但是本领域技术人员应当理解，本发明不限于上述示范性实施例，而且也可以在本发明的范围内初始化上下文模型。
工业实用性
如上所述，根据本发明的示范性实施例的基于上下文自适应算术编码和解码方法和装置至少提供以下优点
首先，所述视频编码和解码方法和装置通过将给定片段的上下文模型初始化为基础层片段的上下文模型能够改善总体编码效率并减少误差传播。
其次，所述视频编码和解码方法和装置还通过将给定片段的上下文才莫型
初始化为两个或更多之前编码的片段的上下文模型之一提供改善的编码性厶匕
总结本详细的说明书，本领域技术人员将理解，可以对示范性实施例做出许多变换和修改而基本不背离本发明的原理。因此，所公开的本发明的示范性实施例是用于一i&性的说明而非出于限制的目的。
权利要求
1.一种用于对包括多层结构的视频信号的增强层帧中的给定片段执行基于上下文自适应算术编码的方法，该方法包括将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型；利用重置的上下文模型对该给定片段的数据符号进行算术编码；以及基于经算术编码的数据符号的值更新所述上下文模型。
2. 如权利要求1所述的方法，进一步包括二进制化所述数据符号，其中所述给定片段的数据符号是经二进制化的数据符号。
3. 如权利要求1所述的方法，其中重置所述给定片段的上下文模型包括如果存在与该给定片段相同的时间位置处的基础层片段，则将该《会定片段的上下文模型重置为所述基础层片段的上下文模型；以及如果不存在与该给定片段相同的时间位置处的基础层片段，则将该主会定片段的上下文模型重置为时间上在该给定片段之前编码的片段的上下文模型。
4. 如权利要求3所述的方法，其中所述时间上在该给定片段之前编码的片段的上下文模型是从时间上在该给定片段之前编码的至少两个片段的上下文模型当中选择的一个上下文模型。
5. 如权利要求3所述的方法，其中所述时间上在该给定片段之前编码的片段的上下文模型是选择性地包括时间上在该给定片段之前编码的片段的上下文模型中包含的多个概率模型当中的至少一个概率模型的上下文模型。
6. 如权利要求1所迷的方法，其中所述与该给定片段相同的时间位置处的基础层片段是基础层中的低通帧或高通帧的片段。
7. 如权利要求1所迷的方法，其中所述与该给定片段相同的时间位置处的基础层片段的上下文模型是选择性地包括所述基础层片段的上下文模型中包含的多个概率模型当中的至少一个概率模型的上下文模型。
8. —种用于对包括多层结构的视频信号的增强层帧中的给定片段执行基于上下文自适应算术解码的方法，该方法包括将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型；利用重置的上下文模型对与该给定片段对应的位流进行算术解码以产生该给定片段的数据符号；以及基于所述数据符号的值更新所述上下文模型。
9. 如权利要求8所述的方法，进一步包括去二进制化所述数据符号。
10. 如权利要求8所述的方法，其中重置所述给定片段的上下文模型包括如果存在与该给定片段相同的时间位置处的基础层片段，则将该给定片段的上下文模型重置为所述基础层片段的上下文模型；以及如果不存在与该给定片段相同的时间位置处的基础层片段，则将该给定片段的上下文模型重置为时间上在该给定片段之前解码的片段的上下文模型。
11. 如权利要求10所述的方法，其中所述时间上在该给定片段之前解码的片段的上下文模型是从时间上在该给定片段之前解码的至少两个片段的上下文模型当中选择的一个上下文模型。
12. 如权利要求10所述的方法，其中所述时间上在该给定片段之前解码的片段的上下文模型是选择性地包括时间上在该给定片段之前解码的片段的上下文模型中包含的多个概率模型当中的至少一个概率模型的上下文模型。
13. 如权利要求8所述的方法，其中所述与该给定片段相同的时间位置处的基础层片段是基础层中的低通帧或高通帧的片段。
14. 如权利要求8所述的方法，其中所述与该给定片段相同的时间位置处的基础层片段的上下文模型是选择性地包括所述基础层片段的上下文模型中包含的多个概率模型当中的至少一个概率模型的上下文模型。
15. —种用于对包括多层结构的视频信号的增强层帧中的给定片执行基于上下文自适应算术编码的方法，该方法包括将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型、时间上在给定片段之前编码的片段的上下文模型、以及预定值至少其中之一；利用重置的上下文模型对该给定片段的数据符号进行算术编码；以及基于经算术编码的数据符号的值更新所述上下文模型。
16. 如权利要求15所述的方法，进一步包括二进制化所述数据符号，其中所述给定片段的数据符号是经二进制化的数据符号。
17. 如权利要求15所述的方法，其中所述与该给定片段相同的时间位置处的基础层片段是基础层中的低通帧或高通帧的片段。
18. 如权利要求15所述的方法，其中所述与该给定片l殳相同的时间位置处的基础层片段的上下文模型是选择性地包括所述基础层片段的上下文模型中包含的多个概率模型当中的至少一个概率模型的上下文模型。
19. 如权利要求15所述的方法，进一步包括如果所述给定片段包括多个块则确定所述数据符号是否是该多个块当中的第一个块的符号，其中如果所述数据符号不是第一个块的符号，则所述重置不发生而且利用更新的上下文模型执行所述算术编码。
20. —种用于对包括多层结构的视频信号的增强层帧中的给定片段执行基于上下文自适应算术解码的方法，该方法包括将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型、时间上在给定片段之前解码的片段的上下文模型、以及预定值至少其中之一；利用重置的上下文模型对与该给定片段对应的位流进行算术解码以产生该给定片段的数据符号；以及基于所述数据符号的值更新所述上下文模型。
21. 如权利要求20所述的方法，进一步包括去二进制化所述数据符号，其中所述片段的数据符号是经二进制化的数据符号。
22. 如权利要求20所述的方法，其中所述与该给定片段相同的时间位置处的基础层片段是基础层中的低通帧或高通帧的片段。
23. 如权利要求20所述的方法，其中所述与该给定片段相同的时间位置处的基础层片段的上下文模型是选择性地包括所迷基础层片段的上下文模型中包含的多个概率模型当中的至少一个概率模型的上下文模型。
24. 如权利要求20所述的方法，进一步包括如果所述给定片段包括多个块则确定所述位流是否包括该多个块当中的第一个块的数据符号，其中如果所述位流不包括该多个块当中的第一个块的数据符号，则所述重置不发生而且利用更新的上下文模型执行所述算术解码。
25. —种包括用于对包括多层结构的增强层帧中的给定片段执行基于上下文自适应算术编码的方法的一见频编^马方法，该;视频编码方法包括从该给定片段中减去该给定片段的预测图像并产生余量图像；对所迷余量图像执行空间变换并产生变换系数；将所述变换系数量化；将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型；利用重置的上下文模型对该给定片段的数据符号进行算术编码；基于经算术编码的数据符号的值更新所述上下文模型；产生包括经算术编码的数据符号的位流；以及发送所述位流。
26. 如权利要求25所述的方法，进一步包括二进制化所述数据符号，其中所述给定片段的数据符号是经二进制化的数据符号。
27. 如权利要求25所述的方法，其中重置所述给定片段的上下文^莫型包括如果存在与该给定片段相同的时间位置处的基础层片段，则将该给定片段的上下文模型重置为所述基础层片段的上下文模型；以及如果不存在与该给定片段相同的时间位置处的基础层片段，则将该给定片段的上下文模型重置为时间上在该给定片段之前编码的片段的上下文模型。
28. 如权利要求27所述的方法，其中所述时间上在该给定片段之前编码的片段的上下文模型是从时间上在该给定片段之前编码的至少两个片段的上下文模型当中选择的一个上下文模型。
29. 如权利要求27所述的方法，其中所述时间上在该给定片段之前编码的片段的上下文模型是选择性地包括时间上在该给定片段之前编码的片段的上下文模型中包含的多个概率模型当中的至少一个概率模型的上下文模型。
30. 如权利要求27所述的方法，其中所述位流包括关于是否已经使用组成时间上在该给定片段之前编码的片段的上下文模型的每个概率模型的信息。
31. 如权利要求25所述的方法，其中所述与该给定片段相同的时间位置处的基础层片段是基础层中的低通帧或高通帧的片段。
32. 如权利要求25所述的方法，其中所述与该给定片段相同的时间位置处的基础层片段的上下文模型是选择性地包括所述基础层片段的上下文模型中包含的多个概率模型当中的至少一个概率模型的上下文模型。
33. 如权利要求25所述的方法，其中所述位流包括关于是否已经使用组成与该给定片段相同的时间位置处的基础层片段的上下文模型的每个概率模型作为参考模型的信息。
34. —种包括用于对包括多层结构的增强层帧中的给定片段执行基于上下文自适应算术解码的方法的视频解码方法，该视频解码方法包括分析位流并提取关于要重建的该给定片段的数据；根据所述数据将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型；利用重置的上下文模型对与该给定片段对应的位流进行算术解码以产生该给定片段的数据符号；基于所述数据符号的值更新所述上下文模型；将所述数据符号去量化以产生变换系数；对所述变换系数执行逆空间变换以重建通过从该给定片段中减去预观'] 图像而得到的余量图像；以及将通过运动补偿重建的预测图像添加到所述重建的余量图像并重建该给定片段。
35. 如权利要求34所述的方法，进一步包括去二进制化所述数据符号。
36. 如权利要求34所述的方法，其中重置所述给定片段的上下文模型包括如果存在与该给定片段相同的时间位置处的基础层片段，则将该给定片段的上下文模型重置为所述基础层片段的上下文模型；以及如果不存在与该给定片段相同的时间位置处的基础层片段，则将该给定片段的上下文模型重置为时间上在该给定片段之前解码的片段的上下文模型。
37. 如权利要求36所述的方法，其中所述数据包括关于是否已经使用组成时间上在该给定片段之前编码的片段的上下文模型的每个概率模型作为参考模型的信息。
38. 如权利要求34所述的方法，其中所述与该给定片段相同的时间位置处的基础层片段是基础层中的低通帧或高通帧的片段。
39. 如权利要求34所述的方法，其中所述数据包括关于是否已经使用组成与该给定片段相同的时间位置处的基础层片段的上下文模型的每个概率模型的信息作为参考模型的信息。
40. —种用于对包括多层结构的视频信号的增强层帧中的给定片段进行编码的方法，该方法包4舌从该给定片段中减去该给定片段的预测图像并产生余量图像；对所述余量图像执行空间变换并产生变换系数；将所述变换系数量化；将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型、时间上在给定片段之前编码的片段的上下文模型、以及预定值至少其中之一；利用重置的上下文模型对该给定片段的数据符号进行算术编码；基于经算术编码的数据符号的值更新所述上下文模型；产生包括经算术编码的数据符号的位流；以及发送所述位》乾。
41. 如权利要求40所述的方法，进一步包括二进制化所述数据符号，其中所述给定片段的数据符号是经二进制化的数据符号。
42. 如权利要求40所述的方法，其中所述与该给定片段相同的时间位置处的基础层片段是基础层中的低通帧或高通帧。
43. 如权利要求40所述的方法，其中所述与该给定片段相同的时间位置处的基础层片段的上下文模型是选择性地包括所述基础层片段的上下文模型中包含的多个概率模型当中的至少一个概率模型的上下文模型。
44. 如权利要求40所述的方法，其中所迷位流包括关于是否已经使用组成时间上在该给定片段之前编码的片段的上下文模型的每个概率模型作为参考模型的信息。
45. —种用于对包括多层结构的视频信号的增强层帧中的给定片段进行解码的方法，该方法包括分析位流并提取关于要重建的该给定片段的数据；根据所述数据将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型、时间上在给定片段之前解码的片段的上下文模型、以及预定值至少其中之一；利用重置的上下文模型对与该给定片段对应的位流进行算术解码以产生该给定片段的数据符号；基于所述数据符号的值更新所述上下文模型；将所述数据符号去量化以产生变换系数；对所述变换系数执行逆空间变换以重建通过从该给定片段中减去预测图像而得到的余量图像；以及将通过运动补偿重建的预测图像添加到所述重建的余量图像并重建该给定片段。
46. 如权利要求45所述的方法，进一步包括去二进制化所述数据符号，其中所述给定片段的数据符号是经二进制化的数据符号。
47. 如权利要求45所述的方法，其中所述与该给定片段相同的时间位置处的基础层片段是基础层中的低通帧或高通帧的片段。
48. 如权利要求45所述的方法，其中所述数据包括关于是否已经使用組成时间上在该给定片段之前编码的片段的上下文模型的每个概率模型作为参考模型的信息。
49. 一种用于压缩包括多层结构的增强层帧中的给定片段的视频编码器，该编码器包括从该给定片段中减去该给定片段的预测图像并产生余量图像的单元；对所述余量图像执行空间变换并产生变换系数的单元；将所述变换系数量化的单元；将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型的单元；利用重置的上下文模型对该给定片段的数据符号进行算术编码的单元；基于经算术编码的数据符号的值更新所述上下文模型的单元；产生包括经算术编码的数据符号的位流的单元；以及发送所述位流的单元。
50. —种用于重建包括多层结构的增强层帧中的给定片段的视频解码器，该解码器包括分析位流并提取关于要重建的该给定片段的数据的单元；根据所述数据将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型的单元；利用重置的上下文模型对与该给定片段对应的位流进行算术解码以产生该给定片段的数据符号的单元；基于所述数据符号的值更新所述上下文模型的单元；将所述数据符号去量化以产生变换系数的单元；对所述变换系数执行逆空间变换以重建通过从该给定片段中减去预测图像而得到的余量图像的单元；以及将通过运动补偿重建的预测图像添加到所述重建的余量图像并重建该给定片段的单元。
51. —种用于压缩包括多层结构的增强层帧中的给定片段的视频编码器，该编码器包括从该给定片段中减去该给定片段的预测图像并产生余量图像的单元；对所述余量图像执行空间变换并产生变换系数的单元；将所述变换系数量化的单元；将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型、时间上在给定片段之前编码的片段的上下文模型、以及预定值至少其中之一的单元；利用重置的上下文模型对该给定片段的数据符号进行算术编码的单元；基于经算术编码的数据符号的值更新所述上下文模型的单元；产生包括经算术编码的数据符号的位流的单元；以及发送所述位流的单元。
52. —种用于重建包括多层结构的增强层帧中的给定片段的视频解码器，该解码器包括分析位流并提取关于要重建的该给定片段的数据的单元；根据所述数据将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型、时间上在给定片段之前解码的片段的上下文沖莫型、以及预定值至少其中之一的单元；利用重置的上下文模型对与该给定片段对应的位流进行算术解码以产生该给定片段的数据符号的单元；基于所述数据符号的值更新所述上下文模型的单元；将所述数据符号去量化以产生变换系数的单元；对所述变换系数执行逆空间变换以重建通过从该给定片段中减去预测图像而得到的余量图像的单元；以及将通过运动补偿重建的预测图像添加到所述重建的余量图像并重建该给定片段的单元。
53. —种具有用于实现如权利要求1所述的方法的程序的计算机可读记录程序介质。
54. —种具有用于实现如权利要求8所述的方法的程序的计算机可读记录程序介质。
55. —种具有用于实现如权利要求15所述的方法的程序的计算机可读记录程序介质。
56. —种具有用于实现如权利要求20所述的方法的程序的计算机可读记录程序介质。
57. —种具有用于实现如权利要求25所述的方法的程序的计算机可读记录程序介质。
58. —种具有用于实现如权利要求34所述的方法的程序的计算片几可读记录程序介质。
59. —种具有用于实现如权利要求40所述的方法的程序的计算机可读记录程序介质。
60. —种具有用于实现如权利要求45所述的方法的程序的计算才几可读记录程序介质。
全文摘要
提供改善编码效率的基于上下文自适应算术编码和解码方法和装置以及使用其的视频编码和解码方法和装置。用于对具有多层结构的视频信号的增强层帧中的给定片段执行基于上下文自适应算术编码的所述方法包括步骤将该给定片段的上下文模型重置为与该给定片段相同的时间位置处的基础层片段的上下文模型；利用重置的上下文模型对该给定片段的数据符号进行算术编码；以及基于经算术编码的数据符号的值更新所述上下文模型。
文档编号H04N7/24GK101189874SQ200680020062
公开日2008年5月28日申请日期2006年4月18日优先权日2005年4月19日
发明者车尚昌, 韩宇镇申请人:三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：车尚昌;韩宇镇
技术所有人：三星电子株式会社
我是此专利的发明人

上一篇：图像传感器及图像读取装置的制作方法
上一篇：在数据处理设备和安全模块之间的安全通信的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。