用于视频编解码的降低了复杂度的模板匹配预测方法和装置的制作方法

文档序号：7847814阅读：171来源：国知局

专利名称：用于视频编解码的降低了复杂度的模板匹配预测方法和装置的制作方法
技术领域：
本发明整体地涉及视频的编码和解码，更具体地，涉及用于视频编解码的降低了复杂度的模板匹配预测方法和装置。
背景技术：
亚像素(sub-pel)运动补偿广泛地运用在当前视频编码器和解码器中。例如，·在国际标准化组织/国际电工委员会(IS0/IEC)、运动图片专家组-4(MPEG-4)第10部分、高级视频编码(AVC)标准/国际电信联盟、电信部门(ITU-T)H. 264建议(下文简写为“MPEG-4AVC标准”)中，使用的是达到1/4像素精度的运动补偿。这一方案在本文中称为“现有第一技术方法”。请看图1，根据MPEG-4AVC标准并通过因数4(即1/4像素矢量)对帧进行的上采样通常是由参考数字100表示。该上采样首先涉及应用6抽头维纳(Wiener)滤波器生成半像素，然后包括应用双线性滤波器生成1/4像素。由视频编码专家组(VCEG)提出的现有第二技术方法涉及针对具有混叠伪影的序列使用1/8像素补偿来进一步提高编码效率。除了使用固定内插(interpolation)滤波器之外，为了更好地处理混叠、量化和运动估计误差，相机噪声，等等，已经考虑了自适应的内插方案。自适应的内插方案针对各亚像素位置动态估计内插滤波器系数以便提高编码效率。在考虑了所有复杂内插方案的情况下，在解码器处以亚像素精度内插所有参考帧并存储这样的内插得到的帧是没有意义的，因为只有一些亚像素位置必须被内插。这样的方案将很可能引起解码器处的高内存消耗以及高计算复杂度。在解码器处动态执行运动补偿的一个方法就是由基于MPEG-4AVC标准的关键技术域(KTA)软件改进所执行的方法。模板匹配预测(TMP)是用于通过避免传送运动/移位信息(运动矢量、参考指数和移位矢量)来提高帧间和帧内预测二者的编码效率的一种技术。模板匹配预测是以视频图片中存在有很多重复图样的假设为基础的。因此，模板匹配通过匹配相邻像素而对整个解码视频图片中的类似图样进行搜索。最后的预测通常是几个最佳匹配的平均值。模板匹配可以使用于帧间和帧内预测二者。然而，模板匹配预测的缺点在于，对于编码器和解码器都必须执行相同的搜索。因此，模板匹配预测可能会极大地增加解码器的复杂度。
_7] 帧间预测中的模板匹配预测帧间预测中的模板匹配预测是在不发送运动矢量的情况下预测目标像素的一种方法。在给定帧的目标块的情况下，在该目标块内的目标像素通过从一组参考样本中寻找到最佳像素来确定，其中，该最佳像素的相邻像素与目标像素的相邻像素具有最闻的相关性。该目标像素的那些相邻像素称为模板。在现有技术中，该模板通常从该目标像素的已重建的周围像素中取出。请看图2，用于帧间预测的模板匹配预测方案的示例通常通过参考标号200表示。模板匹配预测方案200涉及具有搜索域211、在搜索域211内的预测212以及相对于预测212的邻域213的已重建的参考帧210。模板匹配预测方案200还涉及具有目标块251、相对于目标块251的模板252以及已重建的域253的当前帧250。在帧间预测的情况下，该模板匹配处理可以被视为在解码器侧处的运动矢量搜索。这里，模板匹配的执行非常类似于传统的运动估计技术。即，通过计算参考帧中相应地移位的模板形域的成本函数来评估运动矢量。然后使用该模板的最佳运动矢量来预测目标域。只有已经存在有重建信号或至少存在有预测信号的图像中的那些域被访问用于搜索。因此，该解码器可以在没有附加辅助信息的情况下执行该模板匹配处理并预测该目标域。模板匹配可以在不传送运动矢量的情况下预测目标块内的像素。根据预期，如果目标块及其模板之间有很高的相关性，那么模板匹配预测的预测性能就比得上传统块匹配方案的预测性能。在现有技术中，该模板通常从该目标像素的已重建空间相邻像素取出。邻近像素与目标像素之间有时候存在较低的相关性。因此，模板匹配预测的性能可能比传统的块匹配方案性能低。 _0] 帧内预测中的模板匹配预测在帧内预测中，模板匹配是可用的非局部预测方法中的一种，因为该预测可以由远离该目标块的像素所生成。在帧内模板匹配中，模板定义类似于帧内模板匹配的定义。然而，一个不同点在于搜索范围受限于当前图片的已解码部分。请看图3，用于帧内预测的模板匹配预测方案的示例通常通过参考标号300表示。模板匹配预测方案300涉及图片377的已解码部分310。图片377的已解码部分310具有搜索域311、在搜索域311内的候选预测312以及相对于候选预测312的邻域313。模块匹配预测方案300还涉及图片377的未解码部分320。图片377的未解码部分320具有目标块321以及相对于目标块321的模板322。为了简明起见，以下说明是基于帧内模块匹配的。然而，本领域和相关领域的一般的技术人员应理解，帧内模板的对应物可以较为容易地延伸。与解码器处的模板匹配预测有关的问题是，因为模板匹配需要在解码器处执行搜索并且模板匹配在不需要任何约束的情况下执行这样的搜索，因此，需要在解码器处以亚像素精度针对所有参考帧执行亚像素内插并且存储这样的内插得到的帧，尽管事实是仅有一些亚像素位置必须被内插。这就可能增加了相当大的复杂度，例如包括在该解码器处的存储复杂度和计算复杂度。

发明内容
通过本发明解决了现有技术的这些和其他瑕疵和缺点，本发明涉及用于视频编解码的降低了复杂度的模板匹配预测方法和装置。根据本发明的一个方面，提供了一种装置。该装置包括视频编码器，该视频编码器用于通过使用模板匹配预测来编码图片中的至少一个图像块。通过使用降低了执行所述模板匹配预测的复杂度的一个或多个约束标准来可选地约束所述模板匹配预测。根据本发明的另一个方面，提供了一种在视频编码器内使用的方法。该方法包括通过使用模板匹配预测来编码图片中的至少一个图像块。通过使用降低了执行所述模板匹配预测的复杂度的一个或多个约束标准来可选地约束所述模板匹配预测。
根据本发明的又一个另外的方面，提供了一种装置。该装置包括视频解码器，该视频解码器用于通过使用模板匹配预测来解码图片中的至少一个图像块。通过使用降低了执行所述模板匹配预测的复杂度的一个或多个约束标准来可选地约束所述模板匹配预测。根据本发明的另一个方面，提供了一种在视频解码器内使用的方法。该方法包括通过使用模板匹配预测来解码图片中的至少一个图像块。通过使用降低了执行所述模板匹配预测的复杂度的一个或多个约束标准来可选地约束所述模板匹配预测。本发明的这些和其他方面、特点和优点通过示例性实施例的详细说明将变得更清楚明白，请结合附图阅读以下说明。

根据以下示例性图示可以更好地了解本发明，其中图I是示出根据MPEG-4AVC标准通过因数4(用于1/4像素矢量)对帧进行上采样的图示。图2是示出用于帧间预测的模板匹配预测方案的示例的图示。图3是示出用于帧内预测的模板匹配预测方案的示例的图示。图4是示出根据本发明的一个实施例的本发明可以应用到其上的示例性视频编码器的框图。图5是示出根据本发明的一个实施例的本发明可以应用到其上的示例性视频解码器的框图。图6是示出根据本发明的一个实施例通过使用降低了复杂度的模板匹配来编码图片的图像数据的示例性方法的流程图；以及图7是示出根据本发明的一个实施例通过使用降低了复杂度的模板匹配来解码图片的图像数据的示例性方法的流程图。
具体实施例方式本发明涉及用于视频编解码的降低了复杂度的模板匹配预测方法和装置。本说明示例了本发明的原理，因此，应该理解的是，尽管本文没有明确地说明或示出，本发明领域的技术人员应该可以设想体现本发明原理并包括在其宗旨和范围之内的各种安排。本文所叙述的所有示例和条件性语言都旨在用于教学目的，以便帮助读者理解本发明人在现有技术基础上所得出的原理和构思，而不应解释为对这种具体描述的示例和条件的限制。此外，本文的所有说明所叙述的本发明的原理、性质、具体实施例及其具体示例都旨在包括其结构上和功能上的等同物。此外，这种等同物旨在同时包括当前已知的等同物以及未来要提出的等同物，即执行相同功能的所开发的任何元件(不论结构如何)。因此，例如，本领域的技术人员应该理解，本发明所提出的框图指体现本发明原理的示例性电路的概念图。类似地，可以理解的是，任何流程图表、流程图解、状态转换图和虚拟代码等等，都指可以在可读计算机介质中大体上表示的并因此由计算机或处理器执行的各种不同的处理，无论这种计算机或处理器是否已明确示出。
本图表中所显示的不同元件的功能可以通过使用专用硬件以及可以联合适当软件来执行软件命令的硬件来提供。当由处理器所提供时，该功能可以由单专用处理器、单共享处理器或多个单处理器所提供，其中，一些处理器可以共享。此外，术语“处理器”或“控制器”的显式使用不应构想为专门指可以执行软件的硬件，并且可暗含地包括而不限于数字信号处理器(“DSP”)的硬件、用于存储软件的只读存储器(“ROM”)、随机存取存储器(“RAM”)以及非易失性存储器。还可以包括其他传统的和/或常用的硬件。类似地，图表中所显示的任何开关都只是概念式的，这些功能可以通过程序逻辑、专用逻辑、程序控制和专用逻辑的相互作用或者甚至通过手动来执行，通过上下文可以更具体地了解执行者可以选择的特定技术。在本文的权利要求中，表示为实现特定功能的方法的任何元件都旨在包括任何一种实现该功能的方式，例如包括a)实现该功能的电路元件的组合；或幻任何形式的软件，包括固件或微代码等等，它们结合用于执行该软件的适当的电路以便实现该功能。对于由这些权利要求所限定的本发明的原理，存在这样的事实，即，由不同的所详述的手段提供的功能根据权利要求所要求的方式结合且集合在一起。因此可以认为，可以提供那些功能的任何手段都等同于本文所示出的那些手段。本发明的说明书中提及的“一个实施例”或“实施例”及其它的变形指结合该实施例所描述的特定特点、结构、特征等包括在本发明的至少一个实施例内。因此，出现在通篇说明书中各部分的词组“在一个实施例中”或“在实施例中”以及其它变形不一定都指代同
一实施例。应该理解的是，例如，在“A/B”、“A和/或B”以及“A和B中的至少一个”的情况下，以下的和/或”以及“其中至少一个”中的任何一个的使用都旨在包括只选择第一列举选项(A)、只选择第二例举选项(B)或选择该两个选项(A和B)。做为另外一个示例，在“A、B和/或C”以及“A、B和C中的至少一个”的情况下，这样的词组都旨在包括只选择该第一例举选项(A)、只选择第二例举选项(B)、只选择第三例举选项(C)、只选择第一和第二例举选项(A和B)、只选择第一和第三例举选项(A和C)、只选择第二和第三例举选项(B和C)或选择三项(A、B和C)。正如本领域和相关领域一般的技术人员可以显而易见地容易理解的，其可以延伸用于所例举的更多的项。此外，正如本文所使用的，词“图片(picutre) ”和“图像(image) ”可以交替使用，并指来自视频序列的静态图像或图片。众所周知，图片可以是帧或场。此外，正如本文所使用的，词“发信号通知(signal) ”指向相应的解码器指示某事。例如，编码器可以发信号通知搜索的特定类型(整像素搜索、半像素搜索或者1/4像素搜索)和/或搜索范围(相邻运动矢量、小搜索范围或大搜索范围)和/或滤波器类型(双线性滤波器或如在标准运动补偿中使用的内插滤波器)，以便使解码器清楚了解使用在编码器侧的搜索的特定类型和/或搜索范围和/或滤波器类型。通过这种方式，相同类型的搜索和/或搜索范围和/或滤波器类型可以都使用在编码器侧和解码器侧。应该理解的是，可以通过各种方式完成发信号通知。例如，一个或多个语法元素、标志等可以用来将信息发信号通知给相应的解码器。此外，正如本文所使用的，词组“标准运动补偿”和“标准运动估计”分别指运动补偿和运动估计，其中，这种补偿或估计根据现有的视频编码标准和/或现有的视频编码建议(与本发明原理相反)执行。因此，例如，词组“标准运动估计”可以用来指例如根据MPEG-4AVC标准来执行的传统的运动估计处理。此外，还注意到，词组“标准运动补偿”和“常规运动补偿”在本文中可交替使用，且词组“标准运动估计”和“常规运动估计”在本文中可交替使用。众所周知，运动估计是确定运动矢量的处理，该运动矢量描述了从一个二维图像到另外一个二维图像(通常来自视频序列中的相邻帧)的变换。请看图4，本发明原理可以应用到其上的示例性视频编码器通常由参考标号400表示。视频编码器400包括帧排序缓冲器410，缓冲器410具有与组合器485的非反相输入端存在有信号通信关系的输出端。组合器485的输出端以信号通信的方式与变换器和量化器425的第一输入端连接。变换器和量化器425的输出端以信号通信的方式与熵编码器445的第一输入端以及逆变换器和逆量化器450的第一输入端连接。熵编码器445的输出端以信号通信的方式与组合器490的第一非反相输入端连接。该组合器490的输出端以信号通信的方式与输出缓冲器435的第一输入端连接。编码器控制器405的第一输出端以信号通信的方式与巾贞排序缓冲器410的第二输入端、逆变换器和逆量化器450的第二输入端、图片类型判定模块415的输入端、宏块类型 (MB-型)判定模块420的第一输入端、巾贞内预测模块460的第二输入端、去块滤波器465的第二输入端、运动补偿器470的第一输入端、运动估计器和模板匹配预测模块475的第一输入端以及参考图片缓冲器480的第二输入端连接。编码器控制器405的第二输出端以信号通信的方式与辅助增强信息(SEI)插入器430的第一输入端、变换器和量化器425的第二输入端、熵编码器445的第二输入端、输出缓冲器435的第二输入端，以及序列参数集(SPS)和图片参数集(PPS)的插入器440的输入端连接。SEI插入器430的输出端以信号通信的方式与组合器490的第二非反相输入端连接。图片类型判定模块415的第一输出端以信号通信的方式与帧排序缓冲器410的第三输入端连接。图片类型判定模块415的第二输出端以信号通信的方式与宏块类型判定模块420的第二输入端连接。序列参数集(SPS)和图片参数集(PPS)的插入器440的输出端以信号通信的方式与组合器490的第三非反相输入端连接。逆量化器和逆变换器450的输出端以信号通信的方式与组合器419的第一非反相输入端连接。组合器419的输出端以信号通信的方式与帧内预测模块460的第一输入端以及去块滤波器465的第一输入端连接。去块滤波器465的输出端以信号通信的方式与参考图片缓冲器480的第一输入端连接。该参考图片缓冲器480的输出端以信号通信的方式与运动估计器和模板匹配预测模块475的第二输入端以及运动补偿器470的第三输入端连接。运动估计器和模板匹配预测模块475的第一输出端以信号通信的方式与运动补偿器470的第二输入端连接。运动估计器和模板匹配预测模块475的第二输出端以信号通信的方式与熵编码器445的第三输入端连接。运动补偿器470的输出端以信号通信的方式与开关497的第一输入端连接。帧内预测模块460的输出端以信号通信的方式与开关497的第二输入端连接。宏块类型判定模块420的输出端以信号通信的方式与开关497的第三输入端连接。开关497的第三输入端确定了开关的“数据”输入(被比作控制输入端，即第三输入端)是由运动补偿器470还是帧内预测模块460来提供。开关497的输出端以信号通信的方式与组合器419的第二非反相输入端以及组合器485的反相输入端连接。帧排序缓冲器410的第一输入端以及编码器控制器405的输入端可作为编码器400的输入端用于接收输入图片。此外，辅助增强信息(SEI)插入器430的第二输入端可作为编码器400的输入端，用于接收元数据。输出缓冲器435的输出端可作为编码器400的输出端，用于输出比特流。请看图5，本发明原理中可以应用到其上的示例性视频解码器通常由参考标号500表示。视频解码器500包括输入缓冲器510，缓冲器510具有与熵解码器445的第一输入端以信号通信方式连接的输出端。熵解码器545的第一输出端以信号通信的方式与逆变换器和逆量化器550的第一输入端连接。逆变换器和逆量化器550的输出端以信号通信的方式与组合器525的第二非反相输入端连接。组合器525的输出端以信号通信的方式与去块滤波器565的第二输入端以及巾贞内预测模块560的第一输入端连接。去块滤波器565的第二输出端以信号通信的方式与参考图片缓冲器580的第一输入端连接。参考图片缓冲器580的输出端以信号通信的方式与运动补偿器和模板匹配预测模块570的第二输入端连接。熵解码器545的第二输出端以信号通信的方式与运动补偿器和模板匹配预测模块570的第三输入端、去块滤波器565的第一输入端以及巾贞内预测器560的第三输入端连接。该熵解码器545的第三输出端以信号通信的方式与解码器控制器505的输入端连接。解码器控制器505的第一输出端以信号通信的方式与熵解码器545的第二输入端连接。解码器控制器405的第二输出端以信号通信的方式与逆变换器和逆量化器550的第二输入端连接。解码器控制器505的第三输出端以信号通信的方式与去块滤波器565的第三输入端连接。熵解码器505的第四输出端以信号通信的方式与帧内预测器560的第二输入端、运动补偿器和模板匹配预测模块570的第一输入端，以及参考图片缓冲器580的第二输入端连接。该运动补偿器的输出端和模板匹配预测模块570以信号通信的方式与开关597的第一输入端连接。该巾贞内预测模块560的输出端以信号通信的方式与开关597的第二输入端连接。开关597的输出端以信号通信的方式与组合器525的第一非反相输入端连接。输入缓冲器510的输入端可以作为解码器500的输入端，用于输入比特流。去块滤波器565的第一输出端可以作为解码器500的输出端,用于输出输出图片。因此，如上所述，本发明涉及用于视频编解码的降低了复杂度的模板匹配预测方法和装置。应该理解的是，本文所披露的方法和装置降低了解码器的复杂度，同时还维持了模板匹配预测的编码效率。此外，本发明还可以降低编码器的复杂度。如上所述，模块匹配预测(TMP)可通过避免传送运动/移位信息(运动矢量、参考指数和移位矢量)来提高帧间和帧内预测二者的编码效率。然而，模板匹配预测的缺点在于，对于编码器和解码器都必须执行相同的搜索。这意味着解码器复杂度可能极大地提高。根据本发明，公开了通过约束针对模板匹配预测的相应设置来简化模板匹配预测的方法和装置。有利地，根据本发明这种简化后的模板匹配预测降低了解码器的复杂度。解码复杂度同时包括内存消耗以及计算的复杂度。特别地，在本发明的一个实施例中，将模板匹配预测限制为低于亚像素精度。在另外一个实施例内，使用更少的搜索点(即，搜索更少的位置)。在另外一个实施例中，使用更简单的亚像素内插方案。通常地，模板匹配预测根据本发明可考虑包括以下步骤(I)限定TMP搜索精度；(2)如果TMP搜索精度大于整像素精度，那么亮度/色度的亚像素位置通过编码器以TMP精度被内插。(3)在给定帧的目标块的情况下，由编码器针对内插得到的帧中的一组参考样本中的最佳像素执行搜索，其中，最佳像素的相邻像素与目标像素的相邻像素具有最高的相关性。(4)最佳像素被用作该块的模板匹配预测。
在第一实施例中，提出了将模板匹配预测限制为以比其它常规运动补偿方法更低的亚像素精度进行搜索。该限制不会降低编码效率太多，因为将要对从模板匹配预测中获得的几个最佳匹配取平均值，并且已经发现该取平均值和亚像素在减少混叠方面起到类似的作用。在一个实施例中，在编码器处，亚像素位置在常规运动搜索和模板匹配预测之前针对整个帧被内插。然后常规运动搜索和模板匹配预测之间的判定以比特流的形式发送出去。在解码器处，取决于是常规运动搜索还是模板匹配预测被使用，运动补偿可以针对每个目标块被动态地执行。在一个具体的子实施例中，将模板匹配预测搜索限制为只在整像素精度下被允许。例如，在这样的情况下，内插精度可以以(例如常规运动搜索所需要的)亚像素执行，但是，TMP搜索可以被限制为只以整像素网格进行。因此，如果模板匹配预测被选择用于块，则在解码器处不需要针对该块的任何内插。如果色度分辨率与亮度分辨率不相同(例如，在YUV4:2:0的情况下)，则色度运动矢量(MV)就是亮度运动矢量的一半且运动矢量搜索只针对亮度执行，因为当色度运动矢量处在半像素精度时，可以使色度运动矢量近似为最接近整像素。在第二实施例中，建议将模板匹配预测限制为较少的(更少的)搜索点。在一个实施例中，模板匹配预测只搜索一组候选位置。这些候选位置可以在具有良好预测中心(诸如当前块的运动矢量预测因子(motion vector predictor))的小搜索范围内，或者来源于空间/时间相邻像素的运动矢量。这基于如下推测当前像素非常可能类似于相邻像素中的那些，且模板匹配预测通常使用那些像素作为模板。在第三实施例中，建议将不太复杂的亚像素内插方法用于模板匹配预测。在一个子实施例中，允许亮度分量为整像素精度，且色度分量为半像素精度。对于半像素内插，使用双线性滤波器。这基于类似第一方案的理论，即取平均值和亚像素对混叠的减少具有类似作用，因此，不要求有非常复杂的亚像素内插滤波器。以上方案可以单独应用或一起应用。此外，以上方案可以高阶语法被发送，高阶语法例如是条带头(slice header)、图像参数集(PPS)、序列参数集(SPS)、网络提取层(NAL)单元头以及辅助增强信息(SEI)消息等等。语法表I示出了根据本发明一个实施例的用于条带头的示例性语法。表I
权利要求
1.一种装置，包括视频编码器(400)，用于通过使用模板匹配预测来编码图片中的至少一个图像块，其中，通过使用降低了执行所述模板匹配预测的复杂度的一个或多个约束标准来可选地约束所述模板匹配预测。
2.根据权利要求I所述的装置，其中，所述一个或多个约束标准包括将针对所述模板匹配预测而执行的模板匹配预测运动矢量搜索约束为比标准运动补偿方法所使用的精度更低的亚像素精度，该标准运动补偿方法对应于现有视频编码标准和现有视频编码建议中的至少一个，以及，将针对所述模板匹配预测而执行的所述模板匹配预测运动矢量搜索约束为比现有视频编码标准和现有视频编码建议中的至少一个中的、在相应解码器处缺少必需的运动搜索的编码模式所使用的精度更低的亚像素精度。
3.根据权利要求2所述的装置，其中，在执行所述模板匹配预测运动矢量搜索和标准运动估计方法中的任一个之前，亚像素位置针对整个所述图片被内插，内插得到的亚像素位置中的至少一些被用于所述模板匹配预测运动矢量搜索。
4.根据权利要求3所述的装置，其中，在通过使用所述模板匹配预测运动矢量搜索的结果来对所述图像块进行编码和通过使用所述标准运动估计方法的结果来对所述图像块进行编码之间作出判定，并且该判定的结果被编码以供传送到相应的解码器。
5.根据权利要求I所述的装置，其中，所述一个或多个约束标准包括将所述模板匹配预测约束为与结合标准运动估计方法而执行的运动估计方法相比搜索更少的位置，该标准运动估计方法对应于现有视频编码标准和现有视频编码建议中的至少一个。
6.根据权利要求5所述的装置，其中，所述更少的位置对应于搜索范围，其中，该搜索范围的中心对应于所述图像块的运动矢量预测因子。
7.根据权利要求5所述的装置，其中，所述更少的位置是由相对于所述图像块的空间相邻像素和时间相邻像素中的至少一个的运动矢量确定的。
8.根据权利要求I所述的装置，其中，所述一个或多个约束标准包括将所述模板匹配预测约束为将与标准内插方案相比而言较不复杂的亚像素内插方案用于针对所述模板匹配预测而执行的模板匹配预测运动矢量搜索，该标准内插方案对应于现有视频编码标准和现有视频编码建议中的至少一个。
9.根据权利要求2所述的装置，其中，所述图像块的亮度分量被以整像素精度内插，且所述图像块的色度分量被以半像素精度内插。
10.一种用在视频编码器中的方法，包括通过使用模板匹配预测来编码图片中的至少一个图像块(615，620，640，641，642)，其中，通过使用降低了执行所述模板匹配预测的复杂度的一个或多个约束标准来可选地约束所述模板匹配预测(615，625，640)。
11.根据权利要求10所述的方法，其中，所述一个或多个约束标准包括将针对所述模板匹配预测而执行的模板匹配预测运动矢量搜索约束为比标准运动补偿方法所使用的精度更低的亚像素精度，该标准运动补偿方法对应于现有视频编码标准和现有视频编码建议中的至少一个，以及，将针对所述模板匹配预测而执行的所述模板匹配预测运动矢量搜索约束为比现有视频编码标准和现有视频编码建议中的至少一个中的、在相应解码器处缺少必需的运动搜索的编码模式所使用的精度更低的亚像素精度(615)。
12.根据权利要求11所述的方法，其中，在执行所述模板匹配预测运动矢量搜索和标准运动估计方法中的任一个之前，亚像素位置针对整个所述图片被内插(625)，内插得到的亚像素位置中的至少一些被用于所述模板匹配预测运动矢量搜索(640，642)。
13.根据权利要求12所述的方法，其中，在通过使用所述模板匹配预测运动矢量搜索的结果来对所述图像块进行编码或通过使用所述标准运动估计方法的结果来对所述图像块进行编码之间作出判定出38，645，650)，并且该判定的结果被编码以供传送到相应的解码器(655,652)。
14.根据权利要求10所述的方法，其中，所述一个或多个约束标准包括将所述模板匹配预测约束为与结合标准运动估计方法而执行的运动估计方法相比搜索更少的位置(640)，该标准运动估计方法对应于现有视频编码标准和现有视频编码建议中的至少一个。
15.根据权利要求14所述的方法，其中，所述更少的位置对应于搜索范围，其中，该搜索范围的中心对应于所述图像块的运动矢量预测因子(640)。
16.根据权利要求14所述的方法，其中，所述更少的位置是由相对于所述图像块的空间相邻像素和时间相邻像素中的至少一个的运动矢量确定的(640)。
17.根据权利要求10所述的方法，其中，所述一个或多个约束标准包括将所述模板匹配预测约束为将与标准内插方案相比而言较不复杂的亚像素内插方案用于针对所述模板匹配预测而执行的模板匹配预测运动矢量搜索(625)，该标准内插方案对应于现有视频编码标准和现有视频编码建议中的至少一个。
18.根据权利要求17所述的方法，其中，所述图像块的亮度分量被以整像素精度内插，且所述图像块的色度分量被以半像素精度内插￠25)。
19.一种装置,包括视频解码器(500)，用于通过使用模板匹配预测来解码图片中的至少一个图像块，其中，通过使用降低了执行所述模板匹配预测的复杂度的一个或多个约束标准来可选地约束所述模板匹配预测。
20.根据权利要求19所述的装置，其中，所述一个或多个约束标准包括将针对所述模板匹配预测而执行的模板匹配预测运动矢量搜索约束为比标准运动补偿方法所使用的精度更低的亚像素精度，该标准运动补偿方法对应于现有视频编码标准和现有视频编码建议中的至少一个，以及，将针对所述模板匹配预测而执行的所述模板匹配预测运动矢量搜索约束为比现有视频编码标准和现有视频编码建议中的至少一个中的、在相应解码器处缺少必需的运动搜索的编码模式所使用的精度更低的亚像素精度。
21.根据权利要求20所述的装置，其中，在通过使用所述模板匹配预测运动矢量搜索的结果来对所述图像块进行编码或通过使用所述标准运动估计方法的结果来对所述图像块进行编码之间的判定的结果被解码，并且，由所述视频解码器(500)使用该结果来确定是应用所述模板匹配预测运动矢量搜索还是应用所述标准运动估计方法来解码所述图像块。
22.根据权利要求21所述的装置，其中，当所述判定的结果指示出所述图像块是通过使用所述模板匹配预测运动矢量搜索的结果而被编码的时，只允许以整像素分辨率进行所述模板匹配预测运动矢量搜索。
23.根据权利要求19所述的装置，其中，所述一个或多个约束标准包括将所述模板匹配预测约束为与结合标准运动估计方法而执行的运动估计方法相比搜索更少的位置，该标准运动估计方法对应于现有视频编码标准和现有视频编码建议中的至少一个。
24.根据权利要求23所述的装置，其中，所述更少的位置对应于搜索范围，其中，该搜索范围的中心对应于所述图像块的运动矢量预测因子。
25.根据权利要求23所述的装置，其中，所述更少的位置是由相对于所述图像块的空间相邻像素和时间相邻像素中的至少一个的运动矢量确定的。
26.根据权利要求19所述的装置，其中，所述一个或多个约束标准包括将所述模板匹配预测约束为将与标准内插方案相比而言较不复杂的亚像素内插方案用于针对所述模板匹配预测而执行的模板匹配预测运动矢量搜索，该标准内插方案对应于现有视频编码标准和现有视频编码建议中的至少一个。
27.根据权利要求26所述的装置，其中，所述图像块的亮度分量被以整像素精度内插，且所述图像块的色度分量被以半像素精度内插。
28.一种用在视频解码器中的方法，包括通过使用模板匹配预测来解码图片中的至少一个图像块(715，745，750，770)，其中，通过使用降低了执行所述模板匹配预测的复杂度的一个或多个约束标准来可选地约束所述模板匹配预测(715，745，750)。
29.根据权利要求28所述的方法，其中，所述一个或多个约束标准包括将针对所述模板匹配预测而执行的模板匹配预测运动矢量搜索约束为比标准运动补偿方法所使用的精度更低的亚像素精度，该标准运动补偿方法对应于现有视频编码标准和现有视频编码建议中的至少一个，以及，将针对所述模板匹配预测而执行的所述模板匹配预测运动矢量搜索约束为比现有视频编码标准和现有视频编码建议中的至少一个中的、在相应解码器处缺少必需的运动搜索的编码模式所使用的精度更低的亚像素精度(715，745)。
30.根据权利要求29所述的方法，其中，在通过使用所述模板匹配预测运动矢量搜索的结果来编码所述图像块或通过使用所述标准运动估计方法的结果来编码所述图像块之间的判定的结果被解码(730，740)，并且，由所述视频解码器使用该结果来确定是应用所述模板匹配预测运动矢量搜索(745，750)还是应用所述标准运动估计方法(755，760，765)来解码所述图像块。
31.根据权利要求30所述的方法，其中，当所述判定的结果指示出所述图像块是通过使用所述模板匹配预测运动矢量搜索的结果而被编码的时，只允许以整像素分辨率进行所述模板匹配预测运动矢量搜索(745)。
32.根据权利要求28所述的方法，其中，所述一个或多个约束标准包括将所述模板匹配预测约束为与结合标准运动估计方法而执行的运动估计方法相比搜索更少的位置，该标准运动估计方法对应于现有视频编码标准和现有视频编码建议中的至少一个(715，750)。
33.根据权利要求32所述的方法，其中，所述更少的位置对应于搜索范围，其中该搜索范围的中心对应于所述图像块的运动矢量预测因子(750)。
34.根据权利要求32所述的方法，其中，所述更少的位置是由相对于所述图像块的空间相邻像素和时间相邻像素中的至少一个的运动矢量确定的(750)。
35.根据权利要求28所述的方法，其中，所述一个或多个约束标准包括将所述模板匹配预测约束为将与标准内插方案相比而言较不复杂的亚像素内插方案用于针对所述模板匹配预测而执行的模板匹配预测运动矢量搜索(715，745)，该标准内插方案对应于现有视频编码标准和现有视频编码建议中的至少一个。
36.根据权利要求35所述的方法，其中，所述图像块的亮度分量被以整像素精度内插，且所述图像块的色度分量被以半像素精度内插(745)。
37.一种编码了视频信号数据的计算机可读存储介质，包括通过使用模板匹配预测而编码的图片中的至少一个图像块，其中，通过使用降低了执行所述模板匹配预测的复杂度的一个或多个约束标准来可选地约束所述模板匹配预测。
全文摘要
提供了用于视频编解码的降低了复杂度的模板匹配预测方法和装置。编码方法通过使用模板匹配预测来编码图片中的至少一个图像块(615，620，640，641，642)，其中，通过使用降低了执行该模板匹配预测的复杂度的一个或多个约束标准来可选地约束该模板匹配预测(615，625，640)。
文档编号H04N7/26GK102804774SQ201180006641
公开日2012年11月28日申请日期2011年1月19日优先权日2010年1月19日
发明者郑云飞, 尹鹏, 吕小安, 许茜, 约珥·索申请人:汤姆逊许可证公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郑云飞;尹鹏;吕小安;许茜;约珥·索
技术所有人：汤姆逊许可证公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。