处理视频信号的方法和设备的制作方法

文档序号:7849065阅读:200来源:国知局
专利名称:处理视频信号的方法和设备的制作方法
技术领域
本发明涉及用于处理视频信号的方法和设备,并且更具体地涉及用于编码或解码视频信号的方法和设备。
背景技术
压缩编码是通过通信线来传输数字信息或以适合于存储介质的形式来存储该数字信息的信号处理技木。音频、视频和文本信息可以是压缩编码的目标,并且具体地,对于视频信息执行的压缩编码被称为视频压缩。通过考虑空间相关、时间相关、随机相关等消除冗余信息来执行视频信号压缩。然而,随着多种媒体和数据传输媒体的发展,需要高效视频信号处理方法和设备
发明内容
技术问题为了提高视频压缩效率,可以使用ー种使用相邻分区的运动向量来预测当前分区的运动向量的方法。在该情况下,使用相邻分区的运动向量来预测当前分区的运动向量,而与在当前分区和相邻分区的參考画面之间的差别无关。这降低了运动向量预测的精度。而且,因为相邻运动向量候选组限于具有与当前分区相同的參考画面列表和相同的參考画面的相邻分区,所以可以获取可用的相邻运动向量的概率降低。另外,当候选者的数量增加时,选择要用于运动向量预测的相邻运动向量的处理的复杂度増加,并且因此,需要一种用于有效地执行该选择处理的方法。技术解决方案为了解决上述问题,本发明的ー个目的是通过运动向量缩放来提高运动向量预测的精度,该运动向量缩放考虑了在參考画面之间的时间距离差。本发明的另ー个目的是检测參考来自不同的參考画面列表的同一參考画面的相邻的运动向量,并且使用所检测的相邻运动向量用于运动向量预测。本发明的另ー个目的是扩展用于运动向量预测的相邻运动向量候选组。本发明的另ー个目的是提供一种用于选择要在当前分区的运动向量预测候选组中包括的相邻运动向量的处理的有效优先权搜索条件。本发明的另ー个目的是通过向正常的帧间模式应用在合并模式中使用的获取相邻分区的运动信息的方法来在所有模式中统ー运动信息预测方法。有益效果根据本发明的视频信号处理设备,能够通过下述方式来提高运动向量预测的精度考虑到在參考画面之间的时间距离差来缩放相邻分区的运动向量,并且使用缩放的相邻分区运动向量来预测当前分区的运动向量。而且,因为除了參考在同一參考画面列表中的同一參考画面的相邻运动向量之外还使用各个候选组的相邻运动向量,所以能够提高运动向量预测的灵活性,并且扩展用于精确的运动向量预测的相邻运动向量的选择范围。另外,通过适当地组合运动向量预测候选组选择条件和分区位置顺序计数来捜索用于当前分区的运动向量预测的相邻分区运动向量,并且因此,可以降低捜索操作复杂度,并且可以获取可用的相邻运动向量。而且,能够通过在合并模式、跳跃模式和帧间模式中统ー相邻分区运动信息获取方法来降低相邻分区运动信息的获取的复杂度。


图I是根据本发明的实施例的视频信号编码器的框图;图2是根据本发明的实施例的视频信号解码器的框图;图3图示根据本发明的实施例划分单元的示例;
图4图示根据本发明的实施例的以分级方式来表示图3的划分结构的方法;图5图示根据本发明的实施例的预测单元的各种划分形式;图6图示当前分区的示例性空间相邻分区;图7和8图示缩放相邻分区的运动向量的方法;图9图示參考来自不同的參考画面列表的同一參考画面的示例;图10和11示出当前分区和空间相邻分区的示例性參考画面列表和參考索引值;图12是根据本发明的实施例的视频信号解码器的运动估计器的框图;图13和14示出根据本发明的实施例的、从其选择要在当前分区的运动向量预测候选组中包括的运动向量的空间相邻分区。图15示出在合并模式中的要与当前分区合并的相邻分区;以及图16是图示本发明的运动向量预测候选组选择条件的流程图。
具体实施例方式根据本发明的ー个方面,一种视频信号处理方法包括选择用于当前分区的运动向量预测的至少ー个相邻分区运动向量;当该相邻分区运动向量的參考画面与该当前分区的參考画面不同时,缩放该选择的相邻分区运动向量;使用该缩放的运动向量来获取该当前分区的运动向量预测值;并且,使用该运动向量预测值来获取该当前分区的运动向量。该缩放的运动向量可以是使用在画面之间的时间距离线性地内插的运动向量。该运动向量预测候选组可以包括分别选自第一组和第二组的运动向量,该第一组包括该当前分区的左下相邻分区Am+1和在该当前分区的左相邻分区中的最下分区Am,该第ニ组包括该当前分区的右上相邻分区Bn+1、在该当前分区的上相邻分区中的最右分区Bn和该当前分区的左上相邻分区B_lt)选择该相邻分区运动向量可以包括基于关于參考画面列表、參考画面和指示帧间模式的信息的运动向量预测候选组选择条件来分别从该第一组和该第二组选择运动向量。该运动向量预测候选组选择条件依序确定;Ca)相邻分区是否是具有与该当前分区相同的參考画面列表和相同的參考画面的帧间模式分区,(b)相邻分区是否是具有与该当前分区不同的參考画面列表和与该当前分区相同的參考画面的帧间模式分区,(c)相邻分区是否是具有与该当前分区相同的參考画面列表和与该当前分区不同的參考画面的帧间模式分区,以及,Cd)相邻分区是否是帧间模式分区。可以基于画面顺序计数(POC)值来确定该相邻分区是否是具有与该当前分区不同的參考画面列表和与该当前分区相同的參考画面的帧间模式分区。选择该相邻分区运动向量可以包括对于该第一或第二组的分区执行条件第一搜索,该条件第一捜索比分区位置顺序更高地优先化该运动向量预测候选组选择条件。选择该相邻分区运动向量可以包括对于该第一或第二组的分区执行分区位置第一捜索,该分区位置第一捜索比该运动向量预测候选组选择条件更高地优先化分区位置顺序。选择该相邻分区运动向量可以包括对于该第一或第二组的分区执行对于该运动向量预测组选择条件(a)的条件第一捜索;并且如果通过该条件第一捜索未捜索到可用相 邻分区运动向量,则执行对于该运动向量预测候选组选择条件(b)、(C)和(d)的分区位置
第一搜索。根据本发明的另ー个方面,一种视频信号处理设备包括相邻分区运动向量选择器,用于选择要在当前分区的运动向量预测候选组中包括的相邻分区运动向量;运动向量缩放器,用于当该相邻分区的參考画面与该当前分区的參考画面不同时,缩放该选择的相邻分区运动向量;运动向量预测值获取单元,用于使用包括该缩放的运动向量的运动向量预测候选组来获取该当前分区的运动向量预测值;以及,运动向量获取单元,用于使用该运动向量预测值来获取该当前分区的运动向量。本发明的模式下面将參考附图描述本发明的示例性实施例。在描述本发明之前,应当注意,在本发明中公开的大多数术语对应于在本领域中公知的一般术语,但是申请人已经在需要时选择了ー些术语,并且将在本发明的下面的说明中将其公开。因此,优选的是,由申请人限定的术语基于其在本发明中的含义来理解。在说明书中,可以基于下面的标准来解释下面的术语和甚至未描述的术语。“编译码(coding)”可以被解释为“编码”或“解码”,并且“信息”包括值、參数、系数、元素等,并且可以根据情况被不同地解释。然而,本发明不限于此。“单元”用于指定基本图像处理单元或在图像中的特定位置,并且可以与术语“块”、“分区”或“区域”可交換地使用。另外,在说明书中,“単元”可以表示“编译码单元”、“预测单元”、“变换单元”。图I是根据本发明的实施例的视频信号编码器100的框图。參见图1,视频信号编码器100包括变换器110、量化器115、逆量化器120、逆变换器125、滤波单元130、预测单元150和熵编码单元160。变换器110可以转换向其输入的视频信号的像素值以获取变换系数。例如,变换器110可以使用离散余弦变换(DCT)或子波变换。DCT将输入视频信号划分为具有预定大小的块,并且变换该块。编译码效率可以取决于在变换区域中的值的分布和特性。量化器115量化从变换器110输出的变换系数。逆量化器120逆量化变换系数,并且逆变换器125使用逆量化的变换系数来恢复像素值。滤波单元130执行滤波以提高恢复的图像的质量。例如,滤波单元130可以包括解块滤波器和自适应回路滤波器。滤波的图像被输出或存储在存储器156中,以被用作參考画面。为了提高编译码效率,取代直接地编译码视频信号的方法,而使用下述方法使用先前编译码的区域来预测图像,并且向预测图像加上在预测图像和原始图像之间的残差值以获取恢复的图像。帧内预测器152执行当前图像的帧内预測,并且帧间预测器154使用在存储器156中存储的參考画面来预测当前图像。帧内预测器152根据在当前图像中的恢复区域执行帧内预测,并且向熵编码単元160传输帧内编译码信息帧间预测器154可以包括运动补偿器162和运动估计器164。运动估计器164參考恢复区域获取当前区域的运动向量。运动估计器164向熵编码単元160传输关于參考区域的位置信息(參考画面、运动向量等),使得可以在比特流中包括位置信息。运动补偿器162使用从运动估计器164传输的运动向量值来执行帧间运动补偿。 熵编码単元160熵编码从帧间预测器154输入的量化的变换系数、帧间编译码信息、帧内编译码信息和參考区域信息,以产生视频信号比特流。熵编码単元160可以使用可变长度编译码(VLC)和算术编译码。VLC将输入符号转换为连续码字。在此,码字可以具有可变长度。例如,将频繁产生的符号表示为短码字,而将不频繁产生的符号表示为长码字。可以将基于上下文的自适应可变长度编译码(CAVLC)用作VLC方案。算术编译码将连续符号转换为ー个素数。能够根据算木编译码来获得用于表示每ー个符号所需的优化的素数个比持。基于上下文的自适应ニ进制算木编译码(CABAC)可以被用作算木编译码方案。图2是根据本发明的实施例的视频信号解码器200的框图。參见图2,视频信号解码器200包括熵解码单元210、逆量化器220、逆变换器225、滤波单元230和预测单元250。熵解码単元210解码向其输入的视频信号比特流,以提取变换系数和相对于每一个区域的运动向量。逆量化器220逆量化熵解码的变换系数,并且逆变换器225使用逆量化的变换系数来恢复像素值。滤波单元230滤波图像以提高图像质量。滤波单元230可以包括用于减少块失真的解块滤波器和/或用于消除图像失真的自适应回路滤波器。滤波的图像被输出或存储在帧存储器256中,以被用作參考图像。预测单元250包括帧内预测器252和帧间预测器264,并且使用由熵解码単元210解码的诸如编译码类型、变换系数和相对于每ー个区域的运动向量来恢复预测图像。为此,帧内预测器252根据在当前图像中的解码的样品执行帧内预测。帧间预测器254使用在帧存储器256中存储的參考图像来估计运动向量,并且产生预测图像。帧间预测器254包括运动补偿器262和运动估计器264。运动估计器264获取表示在參考帧的当前块和參考块之间的关系的运动向量,并且向运动补偿器262递送运动向量。将从帧内预测器252或帧间预测器254输出的预测值和从逆变换器225输出的像素值求和以产生恢复的视频帧。将參考图3至5给出在视频信号编码器和视频信号解码器的操作中划分编译码单元和预测单元的方法的说明。编译码単元是用于在上述的视频信号处理操作中(例如,在帧内/帧间预测、变换、量化和/或熵编码中)处理图像的基本単元。不必固定用于编译码图像的编译码単元的大小。编译码単元可以具有矩形形式,并且ー个编译码单元可以被划分为多个编译码単元。
图3图示根据本发明的实施例的划分编译码单元的示例。例如,具有2NX 2N的大小的编译码単元可以 被划分为四个NXN编译码単元。可以递归地执行编译码单元划分。不必将所有的编译码単元划分为具有相同形式的単元。然而,可以限制编译码単元的最大大小310或最小大小320,以便利编译码和处理操作。可以对于编译码単元存储表示是否划分编译码単元的信息。例如,假定ー个编译码单元可以被划分为四个正方形编译码単元,如图3中所示。图4图示根据本发明的实施例的、使用O和I以分级方式来表示图3的编译码单元划分结构的方法。表示是否划分编译码单元的信息可以当划分编译码单元时被设置为“1”,并且当未划分编译码单元时被设置为“O”。如图4中所示,当用于指示是否划分编译码単元的标记值是“I”时,与该节点对应的块被划分为四个块。当该标记值是“O”时,可以在不划分对应于该节点的块的情况下处理对应的编译码单元。不必将块划分为四个正方形块。可以将与预定划分方法对应的代码映射到划分信息。例如,当划分信息值是I时,可以将对应的块划分为两个水平矩形子块,当该信息值是2时,可以将块划分为两个垂直矩形子块,并且,当该信息值是3时,可以将块划分为四个正方形子块。该方法是示例性的,并且不限制本发明。可以使用递归树结构来表示上述的编译码単元结构。具体地,具有最大大小的一个画面或编译码単元变为根,并且,被划分为子编译码単元的编译码単元具有与子编译码単元一祥多的子节点。不再被划分的页面单元变为叶节点。如果可以将编译码单元仅划分为正方形単元,则可以将编译码单元划分为最多四个子编译码单元,并且因此,表示编译码単元的树可以是四元树。编码器根据视频的特性(例如,分辨率)或考虑到编译码效率来选择最佳的编译码単元大小,并且可以在比特流中包括关于最佳編译码单元大小的信息或从其可以得出最佳编译码単位大小的信息。例如,可以限定最大编译码単元大小和树的最大深度。在正方形划分的情况下,因为编译码单元的高度和宽度对应于父节点的高度和宽度的一半,所以可以使用上述信息来获取最小编译码単元大小。相反,可以预限定最小编译码単元大小和树的最大深度,并且,可以在必要时使用最小编译码単元大小和最大深度来得出最大编译码大小。因为编译码单元大小在正方形划分的情况下是2的倍数,所以可以将实际编译码单元大小表示为以2为底数的对数值,以便提高传输效率。解码器可以获取表示是否划分当前編译码单元的信息。如果仅在特定条件下获取(传输)该信息,则可以提高效率。例如,当在画面中包括在画面内的特定位置处的当前编译码单元并且当前的编译码单元大于预定最小编译码单元时,可以划分当前的编译码単元,并且因此,仅在该情况下,能够获取用于表示是否划分当前編译码单元的信息。如果该信息表示划分当前編译码单元,则划分的编译码単元的大小对应于当前編译码单元的大小的一半,并且,基于当前的处理位置来将当前编译码单元划分为四个正方形编译码単元。可以对于划分的编译码単元重复上述处理。对于不再被划分的编译码単元(S卩,编译码单元树的叶节点)执行用于编译码的画面预测(运动补偿)。被执行画面预测的基本単元被称为预测単元或预测块。可以以各种形式将预测単元划分为子预测单元,包括诸如正方形和矩形的对称形式、非対称形式和几何形式。例如,可以将ー个预测单元划分为2NX2N、2NXN和NX2N个子预测单元,如图5中所示。比特流可以包括表示是否划分预测单元的信息或关于预测单元的划分形式的信息。可以从其他信息得出该信息。在说明书中描述的术语“分区”可以用于替换预测单元或子预测单元。然而,本发明不限于此。为了恢复被执行解码的当前単元,可以使用包括当前単元的当前画面或其他画面的解码部分。仅使用当前画面来用于恢复,即仅执行帧间预测的画面(片段)被称为帧内画面或I画面(片段),使用一个运动向量和參考索引来预测每一个单元的画面(片段)被称为预测画面或P画面(片段),并且,使用最多两个运动向量和參考索引的画面(片段)被称为双预测画面或B画面(片段)。帧内预测器执行帧内预测,该帧内预测根据在当前画面中的恢复区域预测目标单元的像素值。例如,帧内预测器可以根据位于当前单元的上面、左面、左上和/或右上处的単元的像素预测当前単元的像素值。帧内模式可以根据用于像素值预测的參考像素所位于的參考区域的方向和预测 方案而包括垂直模式、水平模式、DC模式和角度模式。垂直模式使用目标单元的垂直相邻区域的值来作为当前単元的预测值,而水平模式使用目标单元的水平相邻区域来作为參考区域。DC模式使用參考区域的平均值。当參考区域位于任意方向时使用角度模式。在角度模式中,可以通过在当前像素和參考像素之间的角度来指示方向。为了方便,可以使用预定角度和预定模式编号,并且角度的数量可以取决于目标単元的大小。可以限定几个特定模式,并且将其用于上述的预测方法。虽然预测模式可以作为指示预测模式的值被传输,但是可以使用预测当前块的预测模式值的方法,以便提高传输效率。在此,解码器可以使用表示是否不改变地使用用于预测模式的预测值的信息和指示在预测值和实际值之间的差的信息来获取当前块的预测模式。帧间预测器使用关于除了当前画面之外的恢复画面的信息来执行预测目标単元的像素值的帧间预測。用于预测的画面被称为參考画面。可以使用指示參考画面的索引和运动向量来表示用于预测当前単元的參考区域。帧间预测包括前向预测、后向预测和双向预测。前向预测使用在当前画面之前显示(输出)的一个參考画面,而后向预测使用在当前画面后显示(或输出)的一个參考画面。对于后向预测,可能需要一个运动信息(例如,运动向量和參考画面索引)。双向预测可以使用最多两个參考区域。这两个參考区域可以被包括在同一參考画面中或分别被包括在不同的參考画面中。即,双向预测可以使用最多两个运动信息(例如,运动向量和參考画面索引),并且两个运动向量可以具有相同的參考画面索引或分别具有不同的參考画面索引。在此,可以在当前画面前和当前画面后显示(或输出)參考画面。在帧间模式中编译码的预测单元可以以任意形式(例如,对称形式、非対称形式或几何形式)被划分为多个分区。可以根据如上所述的ー个或两个參考画面预测每ー个分区。当前预测单元的运动信息可以包括运动向量信息和參考画面索引。运动向量信息可以包括运动向量、运动向量预测值或差别运动向量,并且可以表示详细说明运动向量预测值的索引信息。详细说明运动向量预测值的索引信息从在运动向量预测候选组中包括的多个运动向量中指定要被用作在下述运动向量竞争中的当前分区的运动向量预测值的运动向量。能够通过传输索引信息来从运动向量预测候选组中直接地指定用于预测当前分区的运动向量的运动向量。否则,可以不传输索引信息而使用根据预定优先级使用在运动向量预测候选组中包括的运动向量中的一个的间接方法。差别运动向量表示在运动向量和运动向量预测值之间的差別。能够使用运动向量和參考画面索引来获取当前预测单元的參考单元。在具有參考画面索引的參考画面中存在參考单元。由运动向量详细说明的単元的像素值或内插值可以被用作当前预测单元的预测值。即,执行使用运动信息根据先前解码的画面预测当前预测単元的运动补偿。对于当前画面,可以使用用于帧间预测的画面来产生參考画面列表。在B画面的情况下,需要两个參考画面列表,该两个參考画面列表在下面的说明中被称为參考画面列表O (或列表O)和參考画面列表I (或列表I)。为了減少与运动向量相关的传输流量,能够使用下述方法使用关于先前编译码的単元的运动信息来获取运动向量预测值,并且仅传输相对于该运动向量预测值的运动向量差別。解码器使用关于其他解码单元的运动信息来获得当前単元的运动向量预测值,并 且使用向其传输的运动向量差别来获取当前単元的运动向量。參见图6,例如,如果位于当前预测单元(分区)左面的分区是相邻分区A,使用当前预测单元上面的分区是相邻分区B,位于当前预测单元的右上的分区是相邻分区C,并且,相邻分区A、B和C的运动向量分别是MV_a、MV_b和MV_c,则可以根据MV_a、MV_b和MV_c的水平和垂直分量的中值得出当前分区的运动向量预测值MVp。如果不能获得关于相邻分区C的解码信息,则位于当前分区的左上处的相邻分区D及其运动向量MV_d可以替换关于相邻分区C的解码信息。如果即使当相邻分区的參考画面与当前分区的參考画面不同时,也使用相邻分区的运动向量来获得当前分区的运动向量预测值MVp,则限制精确的运动向量预测。因此,本发明使用缩放相邻分区运动向量的方法来执行更精确的运动向量预测。运动向量缩放是使用在每ー个分区(当前分区和相邻分区)的当前画面和參考画面之间的时间距离来线性地内插运动向量的技木。即,运动向量缩放使用在相邻分区的当前画面和參考画面之间的时间距离与在当前分区的当前画面和參考画面之间的时间距离的比率来线性地内插相邻分区的运动向量。更具体地,可以通过下面的等式I来获得缩放的运动向量MV’ X。[等式I]MV,X= {(fME-fc) / (fx-fc)} X MVx在此,MVx表示相邻分区的运动向量MV_a、MV_b、MV_c和MV_d中的ー个,并且MV’x表示MVx的缩放值。另外,fx指示对应的相邻分区的參考画面的编号, ΜΕ表示当前分区的參考画面的编号,并且fc表示当前画面的编号。可以通过线性内插来缩小或放大相邻分区的运动向量,使得该运动向量对应于当前分区的參考画面,并且,可以减小由在分区之间的參考画面差引起的误差。根据本发明的实施例,可以执行通过整数的计算进行的运动向量缩放。參见图7和8,可以使用在相邻分区的參考画面和当前画面之间的时间距离td与在当前分区的參考画面和当前画面之间的时间距离tb的比率(DistScaleFactor)来获得相邻分区的运动向量mvLON的缩放值mvLON_scaled,如下面的等式表达。[等式2]
mvL0N_scaled=(DistScaleFactor*mvL0N+128)>>8在此,可以通过下面的等式来获得DistScaleFactor,如在MPEG-4AVC/H. 264中定义。[等式3]DistScaleFactor=Clip3(-1024, 1023, (tb*tx+32)>>6)在此,tx=(16384+Abs (td/2))/td。可以基于画面的时间距离比率(tb/td)来将被选择来用于当前分区的运动向量预测的相邻分区的运动向量转换为缩放值。当选择的相邻分区的运动向量预测方向与当前分区的运动向量预测方向不同时,可以在反向上缩放相邻分区的运动向量,如图8中所示。上述的运动向量缩放方法可以用于提高当前分区的运动向量预测的精度。例如, 可以如下使用相邻分区A、B、C和D的运动向量MV_a、MV_b、MV_c和MV_d来获得当前分区的运动向量预测值MVp,如图6中所示。当相邻分区A、B、C 和 D 的參考索引 ref idx_a、ref idx_b、ref idx_c 和 refidx_d 中的一个与当前分区的參考索引refidx相同时(例如,当參考索引refidx_a等于当前分区的參考索引refidx时),可以获取i) “MV_a”、“MV_b的缩放值”和“MV_c的缩放值”的中值,ii) “MV_a”、“MV_b的缩放值”、“MV_c的缩放值”和“MV_d的缩放值”的中值,iii) “MV_a”和“MV_b的缩放值(MV_b是具有最接近当前分区的參考索引的參考索引的相邻分区B的运动向量)”的平均值,以及,iv) “MV_a”中的一个来作为当前分区的运动向量预测值MVp。当相邻分区A、B、C 和 D 的參考索引 refidx_a、refidx_b> refidx_c 和 refidx_d中的两个与当前分区的參考索引refidx相同时(例如,当參考索引refidx_a和refidx_b等于当前分区的參考索引refidx吋),可以获取i) “MV_a”、“MV_b”和“MV_c的缩放值”的中值,ii) “MV_a”、“MV_b”、“MV_c的缩放值”和“ MV_d的缩放值”的中值,iii) “MV_a”和“MV_b”的平均值,以及,iv) “MV_a (或MV b)”中的一个来作为当前分区的运动向量预测值MVp。当相邻分区A、B、C 和 D 的參考索引 refidx_a、refidx_b> refidx_c 和 refidx_d中的三个与当前分区的參考索引refidx相同时(例如,当參考索引refidx_a、refidx_b和refidx_c等于当前分区的參考索引refidx吋),可以获取i ) “MV_a”、“MV_b ”和“MV_c ’,的中值,ii) “MV_a”、“MV_b”、“MV_c” 和“MV_d 的缩放值”的中值,iii) “MV_a”、“MV_b”和“MV_c”的平均值,以及,iv) “MV_a (或MV_b或MV_c)”中的一个来作为当前分区的运动向量预测值MVp。当相邻分区A、B、C 和 D 的參考索引 ref idx_a、ref idx_b、ref idx_c 和 refidx_d 中的任何一个与当前分区的參考索引refidx不同时,可以获取i) “MV_a的缩放值”、“MV_b的缩放值”和“MV_c的缩放值”的中值,ii) “MV_a的缩放值”、“MV_b的缩放值”、“MV_c的缩放值”和“ MV_d的缩放值”的中值,以及,iii) “MV_a的缩放值”、“MV_b的缩放值”和“ MV_c的缩放值”的中值中的一个来作为当前分区的运动向量预测值MVp。使用相邻分区的运动向量(或缩放的运动向量)的中值或平均值来获得当前分区的运动向量预测值MVp的上述方法是示例性的,并且本发明不限于此。即,虽然可以如上所述使用当前分区的四个相邻分区(左、上、左上和右上分区),也可以使用三个相邻分区(左、上和右上分区)。
而且,可以对于当前分区的时间相邻分区及其空间相邻分区执行上述的运动向量缩放方法,以预测当前分区的运动向量。当前分区的空间相邻分区是位于与当前分区相同的画面(或片段)中的当前分区的左面或上面的分区。当前分区的时间相邻分区位于在与对应于当前分区的画面不同的画面中的与当前分区对应的位置中,诸如当前分区的共置分区(co-located partition)。根据本发明的实施例,能够使用时间相邻分区的运动向量以及空间相邻分区的运动向量来获得当前分区的运动向量预测值,如下详细所述。根据本发明,如上所述,当使用具有与当前分区不同的參考索引(或參考画面)的相邻分区的运动向量来执行运动向量预测时,能够通过缩放相邻分区的运动向量来提高运动向量预测的精度。根据本发明的实施例,能够使用具有与当前分区不同的參考画面列表的相邻分区的运动向量以及具有与当前分区相同的參考画面列表和相同的參考索引的相邻分区的运动向量来用于当前分区的运动向量预测。如上所述,执行双向预测的B片段具有两个參考画面列表參考画面列表O (列表 O)和參考画面列表I (列表I)。使用列表O的预测被称为LO预测,并且使用列表I的预测被称为LI预测。參见图9,B片段可以指示来自不同的參考画面列表的相同的參考画面。该情况出现在仅參考前ー个画面的低延迟环境中。在图9中,画面η-l在作为列表O的第O个參考画面的同时对应于列表I的第I个參考画面,并且,画面n-2在作为列表O的第I个參考画面的同时对应于列表I的第O个參考画面。因此,本发明可以使用參考与当前分区相同的參考画面的相邻分区的运动向量来用于当前分区的运动向量预测,即使当前分区和相邻分区使用不同的參考画面列表。在此,可以基于画面顺序计数(POC)来确定分区是否參考来自不同的參考画面列表的同一參考画面。POC表示以时间顺序向画面分配的编号。因此,具有比目标编译码画面的POC小的POC的參考画面是过去画面,而具有比目标编译码画面的POC大的POC的參考画面是未来画面。图10和11示出具有与当前分区相同的參考画面和与当前分区不同的參考画面列表的示例性相邻分区。在图10和11中,PredFlagLO和predFlagLl是列表标记值,其指示对应的分区是否參考參考画面列表ListO和Listl。当列表标记值是I时,对应的分区參考对应的參考画面列表。当列表标记值是O时,对应的分区不參考对应的參考画面列表。refldxLO和refldxLl是当与其对应的列表标记值predFlagLO和predFlagLl是I时在对应的列表中的參考索引值。參考索引值当与其对应的列表标记值是O,S卩,未參考对应的參考画面列表时被设置为-I。參见图10,当前分区Cur具有指示LO预测的值predFlagLOl和值refldxLOO,并且因此,可以使用具有与当前分区Cur相同的列表标记值predFlagLOl (相同的參考画面列表)和相同的參考索引reldxLOO的相邻分区A和C的运动向量来预测当前分区Cur的运动向量。分区B具有与当前分区不同的值predFlagLOO、指示LI预测的值predFlagLll和值refldxLll。Listl的与參考索引ref_idx I对应的画面的POC是4,该POC等于与被当前分区參考的ListO的參考索引O对应的画面。这表示分区B和当前分区參考同一參考画面。本发明可以使用參考与当前分区相同的參考画面(相同的P0C)的分区的运动向量来用于当前分区的运动向量预测,即使參考画面是来自不同的參考画面列表。因此,在图10中,可以使用在LO方向上的分区A的运动向量、在LI方向上的分区B的运动向量和在LO方向上的分区C的运动向量的中值来获取当前分区的运动向量预测值。參见图11,当前分区Cur具有指示LO预测的值predFlagLOl,分区B和C具有指示中贞内预测的值predFlagLO和predFlagLlO,并且分区A具有指示LI预测的值predFlagLl I。由当前分区參考的ListO的、与參考索引ref_idx O对应的画面的POC值4等于被分区A參考的Listl的、与參考索引ref_idx I对应的画面的POC值。这表示分区A和当前分区參考同一參考画面。因此,本发明可以使用在LI方向上的分区A的运动向量来用于当前分区的运动向量预测。如上所述,除了在相邻分区中具有与当前分区相同的參考画面列表的相同參考索引的帧间模式分区的运动向量之外,本发明的实施例还可以选择具有与当前分区相同的POC,S卩,与当前分区相同的參考画面的帧间模式分区的运动向量,即使參考画面来自不同的參考画面列表,并且,本发明的实施例使用该运动向量来用于当前分区的运动向量预测。
预测当前分区的运动向量的技术可以被扩展为高级运动向量预测(AMVP)技术,该AMVP技术从当前分区的空间和时间相邻分区收集运动向量预测候选组,并且获取当前分区的运动向量预测值。从在运动向量预测候选组中包括的运动向量候选者选择最佳运动向量以将该最佳运动向量用作运动向量预测值被称为运动向量竞争。參见图12,根据本发明的视频信号解码器的运动估计器264可以包括相邻分区运动向量选择器282,其选择要在当前分区的运动向量预测候选组中包括的相邻分区运动向量;运动向量缩放器284,其当相邻分区的參考画面与当前分区不同时缩放选择的相邻分区运动向量;运动向量预测值获取单元286,其使用包括缩放的相邻分区运动向量的运动向量预测候选组来获取当前分区的运动向量预测值;以及,运动向量获取单元288,其使用运动向量预测值来获取当前分区的运动向量。相邻分区运动向量选择器282可以从当前分区的空间和时间相邻分区收集运动向量候选者。运动向量获取单元288可以通过将通过运动向量预测值获取单元286获得的运动向量预测值与差别运动向量求和来计算当前分区的运动向量。根据本发明的视频信号编码器的运动估计器164可以包括相邻分区运动向量选择器、运动向量缩放器、运动向量预测值获取单元和运动向量获取单元,它们具有与根据本发明的视频信号解码器的上述的运动估计器264相同的功能。參见图13,当前分区的运动向量预测候选组可以包括选自与当前分区的ー组左
相邻分区\、ん.....Aha对应的左组的运动向量a’ ;选自与当前分区的ー组上相邻分区B。、
B1.....Biib对应的上组的运动向量b’ ;以及,选自与与当前分区在对角线上相邻的ー组分区
C、D和E对应的角组的运动向量c’。可以得出运动向量a’、b’和c’的中值并将其包括在运动向量预测候选组中。在该情况下,能够使用i)当运动向量a’、b’和c’全部可用时的三个运动向量a’、b’和c’的中值,ii)当仅可用两个运动向量时通过向不可用的运动向量分配O得出的运动向量a’、b’和c’的两个的中值,iii)当仅可用三个运动向量中的一个时的可用运动向量,以及,iv)当全部三个运动向量不可用时的O。当不能对于其设置可用值时,运动向量a’、b’和c’不被包括在运动向量预测候选组中。
除了上述的空间相邻分区的运动向量之外,可以在运动向量预测候选组中包括时间相邻分区的运动向量。在该情况下,时间相邻分区的运动向量可以自适应地被包括在运动向量预测候选组中。即,可以另外使用表示时间相邻分区的运动向量是否用于运动向量竞争的时间竞争信息。因此,当运动向量竞争用于获取当前预测单元的运动向量预测值吋,能够基于时间竞争信息来限制时间相邻分区的运动向量用作运动向量预测候选者。时间竞争信息经受运动向量竞争,并且因此,仅当运动竞争指示信息指示使用运动向量竞争时,才可以获取时间竞争信息。如图13中所示,要在运动向量预测候选组中包括的运动向量a’、b’和c’可以通过各种方法选自当前分区的空间相邻分区的组(左组、上组和角组)。可以对于在每ー个组中的分区从ー个方向向另ー个方向依序搜索具有与当前分区相同的參考画面列表和相同的參考索引的帧间模式分区,并且,可以在运动向量预测候选组中包括第一检测的分区的运动向量。替代地,可以对于在每ー个组中的分区从ー个方向向另ー个方向依序搜索具有帧 间模式的分区,而与參考画面列表和參考索引无关,并且,可以在运动向量预测候选组中包括第一检测的分区的运动向量。在该情况下,从每ー个组选择的运动向量包括根据本发明的实施例缩放的值。替代地,仅在其中不能对于每一个组通过參考画面列表和參考索引捜索可用的运动向量的情况下,可以选择具有帧间模式的分区的运动向量。即,i)可以从对于在每ー个组中的分区从ー个方向向另ー个方向依序捜索具有与当前分区相同的參考画面列表和相同的參考索引的帧间模式分区,并且,可以在运动向量预测候选组中包括第一检测的分区的运动向量。如果没有可用的运动向量,则ii)可以从对于在每一个组中的分区从ー个方向向另ー个方向依序捜索具有帧间模式的分区,可以选择第一检测分区的运动向量,并且,可以在运动向量预测候选组中包括运动向量的缩放值。否则,能够设置下面的运动向量预测候选组选择条件,以便对于每ー个组选择要在运动向量预测候选组中包括的可用运动向量。现在将參考图16来描述根据本发明的运动向量预测候选组选择条件。i)(条件I)检查相邻分区是否是具有与当前分区相同的參考画面列表和相同的參考画面的帧间模式分区(S102)。在此,捜索具有与当前分区相同的參考画面列表和相同的參考画面的帧间模式分区。ii)当不满足条件I时,(条件2)检查相邻分区是否是具有与当前分区相同的參考画面的帧间模式分区(S104)。在该情况下,捜索在具有与当前分区不同的參考画面列表的同时具有与当前分区相同的參考画面的帧间模式分区。iii)当未满足条件I和2吋,(条件3)检查相邻分区是否是具有与当前分区相同的參考画面的帧间模式分区(S106)。在该情况下,捜索在具有与当前分区不同的參考画面的同时具有与当前分区相同的參考画面列表的帧间模式分区。iv)当未满足条件1、2和3时,(条件4)检查相邻分区是否是帧间模式分区(S108)。在该情况下,捜索不满足条件1、2和3的帧间模式分区,即,具有与当前分区不同的參考画面列表和參考画面的帧间模式分区。为了收集用于当前分区的运动向量预测的运动向量预测候选组,本发明可以通过以预定顺序来捜索分区检查在上述组(左组、上组和角组)中包括的分区是否满足条件I至4。在该情况下,能够根据运动向量预测候选组选择条件和分区位置顺序的适当组合来以各种顺序搜索每一个组的分区。在搜索处理期间满足该条件的第一相邻分区的运动向量可以被选择和包括在运动向量预测候选组中。如果选择了满足条件I和2的相邻分区的运动向量(S110),则可以在运动向量预测候选组中包括选择的运动向量,因为该运动向量具有与当前分区的运动向量相同的參考画面(S120)。如果选择了满足条件3和4的相邻分区的运动向量(S112),则所选择的运动向量可以被缩放(S114)并且包括在运动向量预测候选组中(S120)。然而,如果没有满足条件I至4的任何ー个的相邻分区运动向量,则认为不存在可用的相邻分区运动向量(S130)。将參考表I至4来给出对于在每一个组中包括的相邻分区,根据运动向量预测候选组选择条件和分区位置顺序的组合来捜索要被选择为运动向量预测候选组的相邻分区运动向量的顺序的示例的说明。然而,本发明不限于下面的实施例,并且可以以各种方式来改变搜索要被选择为运动向量预测候选组的相邻分区运动向量的顺序。 在下面的实施例中,“条件第一捜索”表示根据分区的位置的顺序来依序搜索满足运动向量预测候选组选择条件之一的、在组中的分区,并且然后对于下ー个条件重复相同的处理的处理,并且,“分区位置第一捜索”表示依序检查相邻分区是否满足四个运动向量预测候选组选择条件并且然后对于下一个相邻分区重复同一处理的处理。即,“条件第一捜索”向用于在每一个组中的分区的运动向量预测候选组选择条件提供更高的优先级,而“分区位置第一捜索”向在每ー个组中的分区的位置的顺序提供更高的优先级。在此,分区位置顺序是从ー个方向向另ー个方向的相邻分区的预定顺序。在表I至4中,分区O、分区I和分区2是以位置顺序布置的在同一组中的分区。分区O表示对应的组的第一分区,并且分区2表示该组的最后分区。在组中包括的分区的数量不必是3。在表I至4中,数字表示捜索顺序编号。[表 I]
权利要求
1.一种视频信号处理方法,包括 选择用于当前分区的运动向量预测的至少一个相邻分区运动向量; 当所述相邻分区运动向量的参考画面与所述当前分区的参考画面不同时,缩放选择的相邻分区运动向量; 使用缩放的运动向量来获取所述当前分区的运动向量预测值;并且, 使用所述运动向量预测值来获取所述当前分区的运动向量。
2.根据权利要求I所述的视频信号处理方法,其中,所述缩放的运动向量是使用画面间时间距离线性地内插的运动向量。
3.一种视频信号处理方法,包括 选择要在当前分区的运动向量预测候选组中包括的相邻分区运动向量; 当所述相邻分区运动向量的参考画面与所述当前分区的参考画面不同时,缩放选择的相邻分区运动向量; 使用包括缩放的运动向量的所述运动向量预测候选组来获取所述当前分区的运动向量预测值;以及, 使用所述运动向量预测值来获取所述当前分区的运动向量。
4.根据权利要求3所述的视频信号处理方法,其中,所述缩放的运动向量是使用画面间时间距离线性地内插的运动向量。
5.根据权利要求3所述的视频信号处理方法,其中,所述运动向量预测候选组包括分别地选自第一组和第二组的运动向量,所述第一组包括所述当前分区的左下相邻分区Am+1和在所述当前分区的左相邻分区中的最下分区Am,所述第二组包括所述当前分区的右上相邻分区Bn+1、在所述当前分区的上相邻分区中的最右分区Bn和所述当前分区的左上相邻分区 B_lt)
6.根据权利要求5所述的视频信号处理方法,其中,选择所述相邻分区运动向量包括基于参考画面列表、参考画面和包括指示帧间模式的信息的运动向量预测候选组选择条件来分别从所述第一组和所述第二组选择运动向量。
7.根据权利要求6所述的视频信号处理方法,其中,所述运动向量预测候选组选择条件依序确定 (a)相邻分区是否是具有与所述当前分区相同的参考画面列表和相同的参考画面的帧间模式分区, (b)相邻分区是否是具有与所述当前分区不同的参考画面列表和与所述当前分区相同的参考画面的帧间模式分区, (c)相邻分区是否是具有与所述当前分区相同的参考画面列表和与所述当前分区不同的参考画面的帧间模式分区,以及, Cd)相邻分区是否是帧间模式分区。
8.根据权利要求7所述的视频信号处理方法,其中,基于画面顺序计数(POC)值来确定相邻分区是否是具有与所述当前分区不同的参考画面列表和与所述当前分区相同的参考画面的帧间模式分区。
9.根据权利要求7所述的视频信号处理方法,其中,选择所述相邻分区运动向量包括在所述第一或第二组的分区上执行条件第一搜索,所述条件第一搜索比分区位置顺序更高地优先化所述运动向量预测候选组选择条件。
10.根据权利要求7所述的视频信号处理方法,其中,选择所述相邻分区运动向量包括在所述第一或第二组的分区上,执行分区位置第一搜索,所述分区位置第一搜索比所述运动向量预测候选组选择条件更高地优先化分区位置顺序。
11.根据权利要求7所述的视频信号处理方法,其中,选择所述相邻分区运动向量包括 对于所述第一或第二组的分区执行对于所述运动向量预测组选择条件(a)的条件第一搜索;并且 如果通过所述条件第一搜索未定位到可用的相邻分区运动向量,则执行对于所述运动向量预测候选组选择条件(b)、(c)和(d)的分区位置第一搜索。
12.一种视频信号处理设备,包括 相邻分区运动向量选择器,用于选择要在当前分区的运动向量预测候选组中包括的相邻分区运动向量; 运动向量缩放器,用于当所述相邻分区运动向量的参考画面与所述当前分区的参考画面不同时,缩放选择的相邻分区运动向量; 运动向量预测值获取单元,用于使用包括缩放的运动向量的运动向量预测候选组来获取所述当前分区的运动向量预测值;以及, 运动向量获取单元,用于使用所述运动向量预测值来获取所述当前分区的运动向量。
全文摘要
本发明涉及用于处理视频信号的方法和设备,其可以通过考虑在参考画面之间在时间距离上的差的运动向量缩放来提高运动向量预测的精度。为此,本发明提供了视频信号处理方法和使用该方法的视频信号处理设备,并且该方法包括步骤选择用于所述当前分区的运动向量预测的至少一个内运动向量;当该相邻分区运动向量的参考画面与当前分区的参考画面不同时,缩放已经选择的相邻分区运动向量;使用缩放的运动向量来获取当前分区的运动向量预测值;并且,使用运动向量预测值来获取当前分区的运动向量。
文档编号H04N7/26GK102835113SQ201180018198
公开日2012年12月19日 申请日期2011年4月8日 优先权日2010年4月9日
发明者朴俊永, 朴胜煜, 林宰显, 金郑善, 崔瑛喜, 成宰源, 全柄文, 全勇俊 申请人:Lg 电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1