视频数据的解码方法

文档序号：7993048阅读：247来源：国知局

视频数据的解码方法
【专利摘要】提供了以下方法：导出当前预测单元的参考图片索引和运动向量；利用所述参考图片索引与所述运动向量生成所述当前预测单元的预测区块，通过反扫描、反量化以及反变换生成残余区块；以及利用所述预测区块和所述残余区块生成重建的像素。利用根据所述运动向量所选择的内插滤波器来生成所述预测区块的预测像素。相应地，通过将各种合并候选区块包括进来而提高运动信息的编码效率。另外，根据所述运动向量所确定的预测像素的位置来选择不同的滤波器，以此减小编码器和解码器的计算复杂度。
【专利说明】视频数据的解码方法
【技术领域】
[0001]本发明涉及一种对视频数据解码的方法，具体而言，涉及一种通过利用空间合并候选区块和时间合并候选区块建构出合并候选区块列表，以此在合并模式下导出运动信息，并且利用所述运动信息来生成预测区块的方法。
【背景技术】
[0002]用于对视频数据进行压缩的方法包括MPEG-2、MPEG-4以及H.264/MPEG-4AVC。在这些方法中，一副图片被分成若干个宏块以对图像进行编码，其中各个宏块的编码是利用帧内预测或帧间预测来产生预测区块而进行的。原始区块与预测区块之间的差异经过变换形成变换后的区块，生成的变换后的区块然后加以量化，量化过程中利用了一个量化参数以及多个预定的量化矩阵中的一个矩阵。用预定的扫描方式对量化后的区块的量化系数进行扫描，然后进行熵编码。对每个宏块执行量化参数的调整，并利用先前的量化参数进行编码。
[0003]在H.264/MPEG-4AVC方法中，利用运动估计来消除连续图片之间的时间冗余。为检测时间冗余，利用一个或多个参考图片来估计当前区块的运动，并利用运动信息执行运动补偿来产生预测区块。运动信息包括一个或多个参考图片索引以及一个或多个运动向量。
[0004]在H.264/MPEG-4AVC方法中，只有运动向量的预测和编码用到相邻的运动向量，而参考图片索引的编码并不使用相邻的参考图片索引。另外，因为预测区块的内插使用的是长抽头滤波器，所以用于产生预测区块的计算复杂度高。
[0005]然而，如果帧间预测使用了各种大小，那么当前区块的运动信息与一个或多个相邻区块的运动信息之间的关联性增加。如果图像几乎不发生运动或运动缓慢，那么随着图片不断变大，当前区块的运动向量与参考图片内相邻区块的运动向量之间的关联性增加。因此，在图片大小大于高清晰度图片的大小，并且在运动估计和运动补偿中可以使用各种大小的情况下，上述传统的压缩方法对运动信息的压缩效率便会降低。

【发明内容】

[0006][技术问题]
[0007]本发明涉及一种对视频数据解码的方法:通过利用空间合并候选区块和时间合并候选区块构建合并候选区块来以此导出运动信息，利用由所述运动向量确定的滤波器生成预测区块。
[0008][技术解决方案]
[0009]本发明的一个方面提供一种对视频数据解码的方法，包括:导出当前预测单元的参考图片索引和运动向量；利用所述参考图片索引与所述运动向量生成所述当前预测单元的预测区块；通过对量化系数分量执行反扫描生成量化后的区块；利用量化参数对所述量化后的区块执行反量化生成变换后的区块；通过对所述变换后的区块执行反变换生成残余区块；以及利用所述预测区块和所述残余区块生成重建的像素。利用根据所述运动向量所选择的内插滤波器来生成所述预测区块的预测像素。
[0010][有利效果]
[0011]根据本发明的方法包括:导出当前预测单元的参考图片索引和运动向量；利用所述参考图片索引与所述运动向量生成所述当前预测单元的预测区块；通过反扫描、反量化以及反变换生成残余区块；以及利用所述预测区块和所述残余区块生成重建的像素。利用根据所述运动向量所选择的内插滤波器来生成所述预测区块的预测像素。相应地，通过将各种合并候选区块包括进来而提高运动信息的编码效率。另外，根据所述运动向量所确定的这些预测像素的位置来选择不同的滤波器，以此减小编码器和解码器的计算复杂度。
【专利附图】

【附图说明】
[0012]图1是根据本发明的图像编码装置的方框图。
[0013]图2是示出了根据本发明的以帧间预测模式对视频数据编码的方法的流程图。
[0014]图3是示出了根据本发明的由运动向量表示像素位置的概念图。
[0015]图4是示出了根据本发明的以合并模式对运动信息编码的方法的流程图。
[0016]图5是示出了根据本发明的空间合并候选区块的位置的概念图。
[0017]图6是示出了根据本发明的按不对称分割模式的空间合并候选区块的位置的概念图。
[0018]图7是示出了根据本发明的按再一种不对称分割模式的空间合并候选区块的位置的概念图。
[0019]图8是示出了根据本发明的按另一种不对称分割模式的空间合并候选区块的位置的概念图。
[0020]图9是示出了根据本发明的按又一种不对称分割模式的空间合并候选区块的位置的概念图。
[0021]图10是示出了根据本发明的时间合并候选区块的位置的概念图。
[0022]图11是示出了根据本发明的存储运动信息的方法的概念图。
[0023]图12是根据本发明的图像解码装置200的方框图。
[0024]图13是示出了根据本发明的以帧间预测模式对图像解码的方法的流程图。
[0025]图14是示出了以合并模式导出运动信息的方法的流程图。
[0026]图15是示出了根据本发明的以帧间预测模式生成残余区块的过程的流程图。
【具体实施方式】
[0027]下文中，结合附图详细描述本发明的各实施例。然而，本发明不限于下文所述的示范性实施例，而是可以按各种方式实施。因此，可以对本发明进行许多其他的修改和更改，并且应了解，在所公开的概念的范围内，本发明可以按不同于所具体描述的其他方式加以实践。
[0028]根据本发明的图像编码装置以及图像解码装置可以是用户终端，例如个人计算机、个人移动终端、移动多媒体播放器、智能电话或无线通信终端。所述图像编码装置以及图像解码装置可以包括用于与各种设备通信的通信单元、用于存储在图像编码和解码中所用到的各种程序和数据的存储器。
[0029]图1是根据本发明的图像编码装置100的方框图。
[0030]参看图1，根据本发明的图像编码装置100包括图片分割单元110、帧内预测单元120、巾贞间预测单元130、变换单元140、量化单元150、扫描单元160、熵编码单元170、反量化/变换单元180、后处理单元190以及图片存储单元195。
[0031]图片分割单元110将一幅图片或切片(slice)分割成若干个最大编码单元(LCU)，然后将每个IXU分割成一个或多个编码单元。IXU的大小可以是32x32、64x64或128x128。图片分割单元110用于确定每个编码单元的预测模式和分割模式。
[0032]一个IXU包括一个或多个编码单元。该IXU采用递归四叉树结构，以此规定IXU的分割结构。用于规定编码单元大小的最大值和最小值的各个参数包括在一个序列参数集中。分割结构用一个或多个分开的编码单元标记(split_cu_flag)来规定。编码单元的大小是2Nx2N。如果IXU的大小是64x64，最小编码单元(SOT)的大小是8x8，那么编码单元的大小可以是 64x64,32x32,16x16 或 8x8。
[0033]一个编码单元包括一个或多个预测单元。在帧内预测中，预测单元的大小是2Nx2N或NxN。在帧间预测中，预测单元的大小由分割模式决定。如果编码单元是对称分割的，那么分割模式采用2Nx2N、2NxN、Nx2N与NxN其中之一。如果编码单元是不对称分割的，那么分割模式采用2NXnU、2NXnD、nLX2N与nRx2N其中之一。分割模式可以根据编码单元的大小而定以减小硬件复杂度。如果编码单元的大小是最小值，那么不可以采用不对称分割。同样，如果编码单元的大小是最小值，那么不可以采用NxN分割模式。
[0034]一个编码单元包括一个或多个变换单元。变换单元采用递归四叉树结构，以此规定编码单元的分割结构。分割结构用一个或多个分开的变换单元标记(split_tu_flag)来规定。用于规定变换单元大小的最大值和最小值的各个参数包括在一个序列参数集中。
[0035]帧内预测单元120用于确定当前预测单元的帧内预测模式，并利用这个帧内预测模式产生预测区块。
[0036]帧间预测单元130利用存储在图片存储单元195中的一个或多个参考图片来确定当前预测单元的运动信息，并生成所述预测单元的预测区块。其中运动信息包括一个或多个参考图片索引以及一个或多个运动向量。
[0037]变换单元140用于变换残余区块，以生成变换后的区块。残余区块的大小与变换单元相同。如果预测单元大于变换单元，那么当前区块与预测区块之间的残余信号被分成多个残余区块。
[0038]量化单元150用于确定变换后的区块的量化中使用的量化参数。量化参数是一个量化步长。量化参数根据每个量化单元来确定。量化单元的大小可以变化，并且可以是编码单元所允许的大小中的一个。如果编码单元的大小等于或大于量化单元大小的最小值，那么编码单元成为量化单元。最小的量化单元中可以包括多个编码单元。根据每个图片确定量化单元大小的最小值，用于规定量化单元大小的最小值的参数被包括在图片参数集之中。
[0039]量化单元150产生一个量化参数预测值，然后将这个量化参数预测值从量化参数中减去，生成一个差值量化参数。对差值量化参数进行熵编码。
[0040]量化参数预测值是利用相邻编码单元的量化参数以及先前编码单元的量化参数生成的，如下所述。
[0041]依次获取左量化参数、上量化参数以及先前的量化参数。当有两个或两个以上的量化参数可用时，将以此次序获取的前两个可用的量化参数的平均值设置为所述量化参数预测值；当仅有一个量化参数可用时，将这个可用的量化参数设置为量化参数预测值。也就是，如果左量化参数和上量化参数可用，那么将左量化参数和上量化参数的平均值设置为所述量化参数预测值。如果左量化参数与上量化参数中只有一个可用，那么将这个可用的量化参数与先前的量化参数的平均值设置为所述量化参数预测值。如果左量化参数和上量化参数都不可用，那么将先前的量化参数设置为所述量化参数预测值。平均值采取四舍五入法。
[0042]通过二进制化处理，将差值量化参数转换成用于表示所述差值量化参数的绝对值的二进制序列与一个用于表示所述差值量化参数的正负号的二进制位，然后对这个二进制序列进行算术编码。如果差值量化参数的绝对值是0，那么这个表示正负号的二进制位可以省略。绝对值的二进制化使用截断一元码。
[0043]量化单元150利用量化矩阵和量化参数对变换后的区块进行量化以生成量化后的区块。将量化后的区块提供给反量化/变换单元180和扫描单元160。
[0044]由扫描单兀160确定对量化后的区块应用扫描模式。
[0045]在帧间预测中，如果熵编码使用的是CABAC，那么扫描模式采用的是对角线扫描。量化后的区块的量化系数被分解成系数分量。这些系数分量为有效标记(significantflag)、系数正负号以及系数级。对每一个系数分量应用对角线扫描。有效标记表示的是对应的量化系数是否为零。系数正负号表示非零的量化系数的正负号，系数级表示非零的量化系数的绝对值。
[0046]当变换单元的大小大于预定大小时，量化后的区块被分割成多个子集并且对每个子集应用对角线扫描。每个子集的有效标记、系数正负号以及系数级都分别按对角线扫描模式进行扫描。预定大小是4x4。子集是含有16个变换系数的4x4区块。
[0047]扫描子集的扫描模式与扫描系数分量的扫描模式相同。对每个子集的有效标记、系数正负号以及系数级的扫描按反方向进行。这些子集的扫描也按反方向进行。
[0048]对表示最后一个非零系数位置的参数编码并将其传输到解码侧。表示最后一个非零系数位置的参数指示了量化后的区块中最后一个非零量化系数的位置。为除第一子集和最后子集以外的其他每个子集定义一个非零子集标记并将其传输到解码侧。第一子集含有一个DC系数。最后子集含有最后的非零系数。非零子集标记用来表示子集是否含有非零系数。
[0049]熵编码单元170对被扫描单元160扫描后的分量、从帧内预测单元120接收到的帧内预测信息、从帧间预测单元130接收到的运动信息等进行熵编码。
[0050]反量化/变换单元180对量化后的区块的量化系数进行反量化，对反量化后的区块进行反变换，以生成残余信号。
[0051]后处理单元190执行去块滤波处理，以去除图片重建中产生的块效应。
[0052]图片存储单元195从后处理单元190接收后处理后的图像并将图像存储到图片单元中。图片可以是帧或场(field)。
[0053]图2是示出了根据本发明的以帧间预测模式对视频数据编码的方法的流程图。[0054]确定当前区块的运动信息(SllO)。当前区块是预测单元。当前区块的大小由编码单元的大小和分割模式进行确定。
[0055]运动信息随预测类型而变。如果预测类型是单向预测，那么运动信息包括用于指定参考列表O的图片的参考索引和一个运动向量。如果预测类型是双向预测，那么运动信息包括用来指定参考列表O的图片和参考列表1的图片的两个参考索弓丨，以及列表O运动向量和列表1运动向量。
[0056]利用这些运动信息生成当前区块的预测区块(S120)。
[0057]如果运动向量表示整数型像素位置，那么拷贝运动向量所指定的参考图片的区块来生成预测区块。如果运动向量指示子像素位置，那么对参考图片的像素执行内插来生成预测区块。运动向量采用的是四分之一像素单位。
[0058]图3是示出了根据本发明的由运动向量表示像素位置的概念图。
[0059]在图3中，标记为LO、RO、Rl、LUAO和BO的像素是参考图片的整数型位置像素，子像素位置处标记为到rui的像素是要通过内插滤波器进行内插的小数像素，内插滤波器基于运动向量来选择。
[0060]如果要执行内插的像素位于子像素位置aM、bL0或Cui处，那么通过对水平方向上最接近的整数型位置像素应用内插滤波器来生成标记为Bmbui或Cui的像素。如果要执行内插的像素位于子像素位置屯、hL0或Ilui处，那么通过对垂直方向上最接近的整数型位置像素应用内插滤波器来生成标记为Clu^hui或IIui的像素。如果要执行内插的像素位于子像素位置或九。处，那么通过对垂直方向上最接近的内插所得的像素(其中每一个的标记中包括字符“a”)应用内插滤波器来生成标记为eM、或Pui的像素。如果要执行内插的像素位于子像素位置gM、kL0或Y。处，那么通过对垂直方向上最接近的内插所得的像素(其中每一个的标记中包括字符“c”)应用内插滤波器来生成标记为gmh或的像素。如果要执行内插的像素位于子像素位置L、jL0或Qul处，那么通过对垂直方向上相邻的内插所得的像素(其中每一个的标记中包括字符“c”)应用内插滤波器来生成标记为Ldui或的像素。
[0061]根据要执行内插的像素的子像素位置确定内插滤波器，也可以根据预测模式与要执行内插的像素的子像素位置来确定。
[0062]表1显示了示范性的滤波器。子像素位置H表示内插方向上的半像素位置。例如，位置bLc^hL。、:^。、jm和1?对应于子像素位置H。子像素位置FL和FR表示内插方向上的四分之一像素位置。例如，位置a^!、dL0> eL0> fL0和gLd对应于子像素位置FL，位置C11^ nL0> pL0>qL0和b对应于子像素位置FR。
[0063] 表1
【权利要求】
1.一种对视频数据解码的方法，包括: 导出当前预测单元的参考图片索引和运动向量；利用所述参考图片索引与所述运动向量生成所述当前预测单元的预测区块；通过对量化系数分量执行反扫描生成量化后的区块；利用量化参数对所述量化后的区块执行反量化生成变换后的区块；通过对所述变换后的区块执行反变换生成残余区块；以及利用所述预测区块和所述残余区块生成重建的像素，其中，所述预测区块的预测像素是利用根据所述运动向量所选择的内插滤波器来生成的。
2.根据权利要求1所述的方法，其中，如果所述运动向量指示的是四分之一像素位置，那么所述内插滤波器是7抽头不对称滤波器或6抽头不对称滤波器。
3.根据权利要求1所述的方法，其中，按每个量化单元导出所述量化参数，并且所述量化单元的大小是编码单元所允许的大小中的一个。
4.根据权利要求3所述的方法，其中，利用差值量化参数与量化参数预测值来导出所述量化参数。
5.根据权利要求4所述的方法，其中，如果左量化参数、上量化参数以及先前的量化参数中有至少两个可用，那么所述量化参数预测值是两个可用量化参数的平均值。
6.根据权利要求5所述的方法，其中，如果所述当前编码单元位于图片或切片的上边界处，那么所述量化参数是所述左量化参数与所述先前的量化参数的平均值。
7.根据权利要求1所述的方法，其中，所述滤波器的抽头的数量根据所述运动向量所指示的预测像素位置来确定。
【文档编号】H04N19/139GK104012094SQ201280054703
【公开日】2014年8月27日申请日期:2012年11月2日优先权日:2011年11月7日
【发明者】吴秀美, 梁文玉申请人:李英锦

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴秀美;梁文玉
技术所有人：李英锦
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。