处理视频信号的方法和设备与流程

文档序号:13015882阅读:168来源:国知局
本申请是2012年10月9日提交的国际申请日为2011年4月8日的申请号为201180018198.0(PCT/KR2011/002497)的,发明名称为“处理视频信号的方法和设备”专利申请的分案申请。技术领域本发明涉及用于处理视频信号的方法和设备,并且更具体地涉及用于编码或解码视频信号的方法和设备。

背景技术:
压缩编码是通过通信线来传输数字信息或以适合于存储介质的形式来存储该数字信息的信号处理技术。音频、视频和文本信息可以是压缩编码的目标,并且具体地,对于视频信息执行的压缩编码被称为视频压缩。通过考虑空间相关、时间相关、随机相关等消除冗余信息来执行视频信号压缩。然而,随着多种媒体和数据传输媒体的发展,需要高效视频信号处理方法和设备。

技术实现要素:
【技术问题】为了提高视频压缩效率,可以使用一种使用相邻分区的运动向量来预测当前分区的运动向量的方法。在该情况下,使用相邻分区的运动向量来预测当前分区的运动向量,而与在当前分区和相邻分区的参考画面之间的差别无关。这降低了运动向量预测的精度。而且,因为相邻运动向量候选组限于具有与当前分区相同的参考画面列表和相同的参考画面的相邻分区,所以可以获取可用的相邻运动向量的概率降低。另外,当候选者的数量增加时,选择要用于运动向量预测的相邻运动向量的处理的复杂度增加,并且因此,需要一种用于有效地执行该选择处理的方法。【技术解决方案】为了解决上述问题,本发明的一个目的是通过运动向量缩放来提高运动向量预测的精度,该运动向量缩放考虑了在参考画面之间的时间距离差。本发明的另一个目的是检测参考来自不同的参考画面列表的同一参考画面的相邻的运动向量,并且使用所检测的相邻运动向量用于运动向量预测。本发明的另一个目的是扩展用于运动向量预测的相邻运动向量候选组。本发明的另一个目的是提供一种用于选择要在当前分区的运动向量预测候选组中包括的相邻运动向量的处理的有效优先权搜索条件。本发明的另一个目的是通过向正常的帧间模式应用在合并模式中使用的获取相邻分区的运动信息的方法来在所有模式中统一运动信息预测方法。【有益效果】根据本发明的视频信号处理设备,能够通过下述方式来提高运动向量预测的精度:考虑到在参考画面之间的时间距离差来缩放相邻分区的运动向量,并且使用缩放的相邻分区运动向量来预测当前分区的运动向量。而且,因为除了参考在同一参考画面列表中的同一参考画面的相邻运动向量之外还使用各个候选组的相邻运动向量,所以能够提高运动向量预测的灵活性,并且扩展用于精确的运动向量预测的相邻运动向量的选择范围。另外,通过适当地组合运动向量预测候选组选择条件和分区位置顺序计数来搜索用于当前分区的运动向量预测的相邻分区运动向量,并且因此,可以降低搜索操作复杂度,并且可以获取可用的相邻运动向量。而且,能够通过在合并模式、跳跃模式和帧间模式中统一相邻分区运动信息获取方法来降低相邻分区运动信息的获取的复杂度。附图说明图1是根据本发明的实施例的视频信号编码器的框图;图2是根据本发明的实施例的视频信号解码器的框图;图3图示根据本发明的实施例划分单元的示例;图4图示根据本发明的实施例的以分级方式来表示图3的划分结构的方法;图5图示根据本发明的实施例的预测单元的各种划分形式;图6图示当前分区的示例性空间相邻分区;图7和8图示缩放相邻分区的运动向量的方法;图9图示参考来自不同的参考画面列表的同一参考画面的示例;图10和11示出当前分区和空间相邻分区的示例性参考画面列表和参考索引值;图12是根据本发明的实施例的视频信号解码器的运动估计器的框图;图13和14示出根据本发明的实施例的、从其选择要在当前分区的运动向量预测候选组中包括的运动向量的空间相邻分区。图15示出在合并模式中的要与当前分区合并的相邻分区;以及图16是图示本发明的运动向量预测候选组选择条件的流程图。具体实施方式根据本发明的一个方面,一种视频信号处理方法包括:选择用于当前分区的运动向量预测的至少一个相邻分区运动向量;当该相邻分区运动向量的参考画面与该当前分区的参考画面不同时,缩放该选择的相邻分区运动向量;使用该缩放的运动向量来获取该当前分区的运动向量预测值;并且,使用该运动向量预测值来获取该当前分区的运动向量。该缩放的运动向量可以是使用在画面之间的时间距离线性地内插的运动向量。该运动向量预测候选组可以包括分别选自第一组和第二组的运动向量,该第一组包括该当前分区的左下相邻分区Am+1和在该当前分区的左相邻分区中的最下分区Am,该第二组包括该当前分区的右上相邻分区Bn+1、在该当前分区的上相邻分区中的最右分区Bn和该当前分区的左上相邻分区B-1。选择该相邻分区运动向量可以包括:基于关于参考画面列表、参考画面和指示帧间模式的信息的运动向量预测候选组选择条件来分别从该第一组和该第二组选择运动向量。该运动向量预测候选组选择条件依序确定;(a)相邻分区是否是具有与该当前分区相同的参考画面列表和相同的参考画面的帧间模式分区,(b)相邻分区是否是具有与该当前分区不同的参考画面列表和与该当前分区相同的参考画面的帧间模式分区,(c)相邻分区是否是具有与该当前分区相同的参考画面列表和与该当前分区不同的参考画面的帧间模式分区,以及,(d)相邻分区是否是帧间模式分区。可以基于画面顺序计数(POC)值来确定该相邻分区是否是具有与该当前分区不同的参考画面列表和与该当前分区相同的参考画面的帧间模式分区。选择该相邻分区运动向量可以包括:对于该第一或第二组的分区执行条件第一搜索,该条件第一搜索比分区位置顺序更高地优先化该运动向量预测候选组选择条件。选择该相邻分区运动向量可以包括:对于该第一或第二组的分区执行分区位置第一搜索,该分区位置第一搜索比该运动向量预测候选组选择条件更高地优先化分区位置顺序。选择该相邻分区运动向量可以包括:对于该第一或第二组的分区执行对于该运动向量预测组选择条件(a)的条件第一搜索;并且如果通过该条件第一搜索未搜索到可用相邻分区运动向量,则执行对于该运动向量预测候选组选择条件(b)、(c)和(d)的分区位置第一搜索。根据本发明的另一个方面,一种视频信号处理设备包括:相邻分区运动向量选择器,用于选择要在当前分区的运动向量预测候选组中包括的相邻分区运动向量;运动向量缩放器,用于当该相邻分区的参考画面与该当前分区的参考画面不同时,缩放该选择的相邻分区运动向量;运动向量预测值获取单元,用于使用包括该缩放的运动向量的运动向量预测候选组来获取该当前分区的运动向量预测值;以及,运动向量获取单元,用于使用该运动向量预测值来获取该当前分区的运动向量。【本发明的模式】下面将参考附图描述本发明的示例性实施例。在描述本发明之前,应当注意,在本发明中公开的大多数术语对应于在本领域中公知的一般术语,但是申请人已经在需要时选择了一些术语,并且将在本发明的下面的说明中将其公开。因此,优选的是,由申请人限定的术语基于其在本发明中的含义来理解。在说明书中,可以基于下面的标准来解释下面的术语和甚至未描述的术语。“编译码(coding)”可以被解释为“编码”或“解码”,并且“信息”包括值、参数、系数、元素等,并且可以根据情况被不同地解释。然而,本发明不限于此。“单元”用于指定基本图像处理单元或在图像中的特定位置,并且可以与术语“块”、“分区”或“区域”可交换地使用。另外,在说明书中,“单元”可以表示“编译码单元”、“预测单元”、“变换单元”。图1是根据本发明的实施例的视频信号编码器100的框图。参见图1,视频信号编码器100包括变换器110、量化器115、逆量化器120、逆变换器125、滤波单元130、预测单元150和熵编码单元160。变换器110可以转换向其输入的视频信号的像素值以获取变换系数。例如,变换器110可以使用离散余弦变换(DCT)或子波变换。DCT将输入视频信号划分为具有预定大小的块,并且变换该块。编译码效率可以取决于在变换区域中的值的分布和特性。量化器115量化从变换器110输出的变换系数。逆量化器120逆量化变换系数,并且逆变换器125使用逆量化的变换系数来恢复像素值。滤波单元130执行滤波以提高恢复的图像的质量。例如,滤波单元130可以包括解块滤波器和自适应回路滤波器。滤波的图像被输出或存储在存储器156中,以被用作参考画面。为了提高编译码效率,取代直接地编译码视频信号的方法,而使用下述方法:使用先前编译码的区域来预测图像,并且向预测图像加上在预测图像和原始图像之间的残差值以获取恢复的图像。帧内预测器152执行当前图像的帧内预测,并且帧间预测器154使用在存储器156中存储的参考画面来预测当前图像。帧内预测器152根据在当前图像中的恢复区域执行帧内预测,并且向熵编码单元160传输帧内编译码信息帧间预测器154可以包括运动补偿器162和运动估计器164。运动估计器164参考恢复区域获取当前区域的运动向量。运动估计器164向熵编码单元160传输关于参考区域的位置信息(参考画面、运动向量等),使得可以在比特流中包括位置信息。运动补偿器162使用从运动估计器164传输的运动向量值来执行帧间运动补偿。熵编码单元160熵编码从帧间预测器154输入的量化的变换系数、帧间编译码信息、帧内编译码信息和参考区域信息,以产生视频信号比特流。熵编码单元160可以使用可变长度编译码(VLC)和算术编译码。VLC将输入符号转换为连续码字。在此,码字可以具有可变长度。例如,将频繁产生的符号表示为短码字,而将不频繁产生的符号表示为长码字。可以将基于上下文的自适应可变长度编译码(CAVLC)用作VLC方案。算术编译码将连续符号转换为一个素数。能够根据算术编译码来获得用于表示每一个符号所需的优化的素数个比特。基于上下文的自适应二进制算术编译码(CABAC)可以被用作算术编译码方案。图2是根据本发明的实施例的视频信号解码器200的框图。参见图2,视频信号解码器200包括熵解码单元210、逆量化器220、逆变换器225、滤波单元230和预测单元250。熵解码单元210解码向其输入的视频信号比特流,以提取变换系数和相对于每一个区域的运动向量。逆量化器220逆量化熵解码的变换系数,并且逆变换器225使用逆量化的变换系数来恢复像素值。滤波单元230滤波图像以提高图像质量。滤波单元230可以包括用于减少块失真的解块滤波器和/或用于消除图像失真的自适应回路滤波器。滤波的图像被输出或存储在帧存储器256中,以被用作参考图像。预测单元250包括帧内预测器252和帧间预测器264,并且使用由熵解码单元210解码的诸如编译码类型、变换系数和相对于每一个区域的运动向量来恢复预测图像。为此,帧内预测器252根据在当前图像中的解码的样品执行帧内预测。帧间预测器254使用在帧存储器256中存储的参考图像来估计运动向量,并且产生预测图像。帧间预测器254包括运动补偿器262和运动估计器264。运动估计器264获取表示在参考帧的当前块和参考块之间的关系的运动向量,并且向运动补偿器262递送运动向量。将从帧内预测器252或帧间预测器254输出的预测值和从逆变换器225输出的像素值求和以产生恢复的视频帧。将参考图3至5给出在视频信号编码器和视频信号解码器的操作中划分编译码单元和预测单元的方法的说明。编译码单元是用于在上述的视频信号处理操作中(例如,在帧内/帧间预测、变换、量化和/或熵编码中)处理图像的基本单元。不必固定用于编译码图像的编译码单元的大小。编译码单元可以具有矩形形式,并且一个编译码单元可以被划分为多个编译码单元。图3图示根据本发明的实施例的划分编译码单元的示例。例如,具有2N×2N的大小的编译码单元可以被划分为四个N×N编译码单元。可以递归地执行编译码单元划分。不必将所有的编译码单元划分为具有相同形式的单元。然而,可以限制编译码单元的最大大小310或最小大小320,以便利编译码和处理操作。可以对于编译码单元存储表示是否划分编译码单元的信息。例如,假定一个编译码单元可以被划分为四个正方形编译码单元,如图3中所示。图4图示根据本发明的实施例的、使用0和1以分级方式来表示图3的编译码单元划分结构的方法。表示是否划分编译码单元的信息可以当划分编译码单元时被设置为“1”,并且当未划分编译码单元时被设置为“0”。如图4中所示,当用于指示是否划分编译码单元的标记值是“1”时,与该节点对应的块被划分为四个块。当该标记值是“0”时,可以在不划分对应于该节点的块的情况下处理对应的编译码单元。不必将块划分为四个正方形块。可以将与预定划分方法对应的代码映射到划分信息。例如,当划分信息值是1时,可以将对应的块划分为两个水平矩形子块,当该信息值是2时,可以将块划分为两个垂直矩形子块,并且,当该信息值是3时,可以将块划分为四个正方形子块。该方法是示例性的,并且不限制本发明。可以使用递归树结构来表示上述的编译码单元结构。具体地,具有最大大小的一个画面或编译码单元变为根,并且,被划分为子编译码单元的编译码单元具有与子编译码单元一样多的子节点。不再被划分的页面单元变为叶节点。如果可以将编译码单元仅划分为正方形单元,则可以将编译码单元划分为最多四个子编译码单元,并且因此,表示编译码单元的树可以是四元树。编码器根据视频的特性(例如,分辨率)或考虑到编译码效率来选择最佳的编译码单元大小,并且可以在比特流中包括关于最佳编译码单元大小的信息或从其可以得出最佳编译码单位大小的信息。例如,可以限定最大编译码单元大小和树的最大深度。在正方形划分的情况下,因为编译码单元的高度和宽度对应于父节点的高度和宽度的一半,所以可以使用上述信息来获取最小编译码单元大小。相反,可以预限定最小编译码单元大小和树的最大深度,并且,可以在必要时使用最小编译码单元大小和最大深度来得出最大编译码大小。因为编译码单元大小在正方形划分的情况下是2的倍数,所以可以将实际编译码单元大小表示为以2为底数的对数值,以便提高传输效率。解码器可以获取表示是否划分当前编译码单元的信息。如果仅在特定条件下获取(传输)该信息,则可以提高效率。例如,当在画面中包括在画面内的特定位置处的当前编译码单元并且当前的编译码单元大于预定最小编译码单元时,可以划分当前的编译码单元,并且因此,仅在该情况下,能够获取用于表示是否划分当前编译码单元的信息。如果该信息表示划分当前编译码单元,则划分的编译码单元的大小对应于当前编译码单元的大小的一半,并且,基于当前的处理位置来将当前编译码单元划分为四个正方形编译码单元。可以对于划分的编译码单元重复上述处理。对于不再被划分的编译码单元(即,编译码单元树的叶节点)执行用于编译码的画面预测(运动补偿)。被执行画面预测的基本单元被称为预测单元或预测块。可以以各种形式将预测单元划分为子预测单元,包括诸如正方形和矩形的对称形式、非对称形式和几何形式。例如,可以将一个预测单元划分为2N×2N、2N×N和N×2N个子预测单元,如图5中所示。比特流可以包括表示是否划分预测单元的信息或关于预测单元的划分形式的信息。可以从其他信息得出该信息。在说明书中描述的术语“分区”可以用于替换预测单元或子预测单元。然而,本发明不限于此。为了恢复被执行解码的当前单元,可以使用包括当前单元的当前画面或其他画面的解码部分。仅使用当前画面来用于恢复,即仅执行帧间预测的画面(片段)被称为帧内画面或I画面(片段),使用一个运动向量和参考索引来预测每一个单元的画面(片段)被称为预测画面或P画面(片段),并且,使用最多两个运动向量和参考索引的画面(片段)被称为双预测画面或B画面(片段)。帧内预测器执行帧内预测,该帧内预测根据在当前画面中的恢复区域预测目标单元的像素值。例如,帧内预测器可以根据位于当前单元的上面、左面、左上和/或右上处的单元的像素预测当前单元的像素值。帧内模式可以根据用于像素值预测的参考像素所位于的参考区域的方向和预测方案而包括垂直模式、水平模式、DC模式和角度模式。垂直模式使用目标单元的垂直相邻区域的值来作为当前单元的预测值,而水平模式使用目标单元的水平相邻区域来作为参考区域。DC模式使用参考区域的平均值。当参考区域位于任意方向时使用角度模式。在角度模式中,可以通过在当前像素和参考像素之间的角度来指示方向。为了方便,可以使用预定角度和预定模式编号,并且角度的数量可以取决于目标单元的大小。可以限定几个特定模式,并且将其用于上述的预测方法。虽然预测模式可以作为指示预测模式的值被传输,但是可以使用预测当前块的预测模式值的方法,以便提高传输效率。在此,解码器可以使用表示是否不改变地使用用于预测模式的预测值的信息和指示在预测值和实际值之间的差的信息来获取当前块的预测模式。帧间预测器使用关于除了当前画面之外的恢复画面的信息来执行预测目标单元的像素值的帧间预测。用于预测的画面被称为参考画面。可以使用指示参考画面的索引和运动向量来表示用于预测当前单元的参考区域。帧间预测包括前向预测、后向预测和双向预测。前向预测使用在当前画面之前显示(输出)的一个参考画面,而后向预测使用在当前画面后显示(或输出)的一个参考画面。对于后向预测,可能需要一个运动信息(例如,运动向量和参考画面索引)。双向预测可以使用最多两个参考区域。这两个参考区域可以被包括在同一参考画面中或分别被包括在不同的参考画面中。即,双向预测可以使用最多两个运动信息(例如,运动向量和参考画面索引),并且两个运动向量可以具有相同的参考画面索引或分别具有不同的参考画面索引。在此,可以在当前画面前和当前画面后显示(或输出)参考画面。在帧间模式中编译码的预测单元可以以任意形式(例如,对称形式、非对称形式或几何形式)被划分为多个分区。可以根据如上所述的一个或两个参考画面预测每一个分区。当前预测单元的运动信息可以包括运动向量信息和参考画面索引。运动向量信息可以包括运动向量、运动向量预测值或差别运动向量,并且可以表示详细说明运动向量预测值的索引信息。详细说明运动向量预测值的索引信息从在运动向量预测候选组中包括的多个运动向量中指定要被用作在下述运动向量竞争中的当前分区的运动向量预测值的运动向量。能够通过传输索引信息来从运动向量预测候选组中直接地指定用于预测当前分区的运动向量的运动向量。否则,可以不传输索引信息而使用根据预定优先级使用在运动向量预测候选组中包括的运动向量中的一个的间接方法。差别运动向量表示在运动向量和运动向量预测值之间的差别。能够使用运动向量和参考画面索引来获取当前预测单元的参考单元。在具有参考画面索引的参考画面中存在参考单元。由运动向量详细说明的单元的像素值或内插值可以被用作当前预测单元的预测值。即,执行使用运动信息根据先前解码的画面预测当前预测单元的运动补偿。对于当前画面,可以使用用于帧间预测的画面来产生参考画面列表。在B画面的情况下,需要两个参考画面列表,该两个参考画面列表在下面的说明中被称为参考画面列表0(或列表0)和参考画面列表1(或列表1)。为了减少与运动向量相关的传输流量,能够使用下述方法:使用关于先前编译码的单元的运动信息来获取运动向量预测值,并且仅传输相对于该运动向量预测值的运动向量差别。解码器使用关于其他解码单元的运动信息来获得当前单元的运动向量预测值,并且使用向其传输的运动向量差别来获取当前单元的运动向量。参见图6,例如,如果位于当前预测单元(分区)左面的分区是相邻分区A,使用当前预测单元上面的分区是相邻分区B,位于当前预测单元的右上的分区是相邻分区C,并且,相邻分区A、B和C的运动向量分别是MV_a、MV_b和MV_c,则可以根据MV_a、MV_b和MV_c的水平和垂直分量的中值得出当前分区的运动向量预测值MVp。如果不能获得关于相邻分区C的解码信息,则位于当前分区的左上处的相邻分区D及其运动向量MV_d可以替换关于相邻分区C的解码信息。如果即使当相邻分区的参考画面与当前分区的参考画面不同时,也使用相邻分区的运动向量来获得当前分区的运动向量预测值MVp,则限制精确的运动向量预测。因此,本发明使用缩放相邻分区运动向量的方法来执行更精确的运动向量预测。运动向量缩放是使用在每一个分区(当前分区和相邻分区)的当前画面和参考画面之间的时间距离来线性地内插运动向量的技术。即,运动向量缩放使用在相邻分区的当前画面和参考画面之间的时间距离与在当前分区的当前画面和参考画面之间的时间距离的比率来线性地内插相邻分区的运动向量。更具体地,可以通过下面的等式1来获得缩放的运动向量MV’x。[等式1]MV’x={(fME-fc)/(fX-fc)
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1