解码端运动向量导出方法

文档序号：9768083阅读：322来源：国知局

解码端运动向量导出方法
【技术领域】
[0001]本发明有关于一种数据编码/解码方法，且特别有关于一种解码端运动向量导出(Decoder-side Mot1n Vector Derivat1n，以下简称为DMVD)方法。
【背景技术】
[0002]在视频编码中，可利用图像序列中发现的时序(temporal)与空间(spatial)相关来减少比特率/提升编码效率。通常来说，运动补偿帧间预测(mot1n compensated inter-frame predict1n)很大程度地影响最终的压缩效率。诸如运动向量(Mot1n Vector，以下简称为MV)数据与参考图像索引的运动信息是在编码端获得并编码在比特流中，因此解码器可基于已解码的运动信息而简单地执行运动补偿预测。然而，运动信息的编码需要很高的比特率。因此，提出一种DMVD机制。
[0003]在编码端与解码端可利用模板匹配(Template Matching，以下简称为TM)算法来决定运动信息。此外，对于预测(predict 1n，以下简称为P)图像的不同宏块(MacroBlock，以下简称为MB)类型，编码额外的标志以标示DMVD的使用。图1是P图像的传统TM机制的示意图。通常来说，传统TM机制是利用邻近于预测目标块的块的像素以及在重建(alreadyreconstructed)参考图像中的像素之间的相关。如图1所示，当前图像中的DMVD目标块102具有N X N像素的块大小，且为MB 106的一部分;此外，自DMVD目标块102的上方与左侧扩充M个像素来定义反转L型模板104。此处，反转L型是指L型相对于水平轴的镜像。应注意，反转L型模板104仅覆盖重建像素。为清楚起见，当前图像中的重建像素是以斜线表示。随后，在每一参考图像中定义以候选MV为中心的小搜寻范围。在一个或多个重建参考图像(在时间上早于当前图像)中的至少一个置换模板区域(displaced template reg1n)，是通过最小化当前图像中的反转L型模板104以及重建参考图像中的置换模板之间的失真值(例如，绝对差值和(Sum of Absolute Difference，以下简称为SAD))而决定。如图1所示，由反转L型模板104与置换模板108之间的最小失真值可找出置换模板108。以此方式，通过TM机制可成功地决定DMVD目标块102的最终MV 110。
[0004]阿亨工业大学(RWTH Aachen University)首先提出可用于VCEG-AG16与VCEG-AH15rl 中的DMVD。其支持的MB类型包含?_51(1? MB、P_L0_16xl6MB、P_L0_L0_16x8MB、P_L0_L0_8xl6MB、以及具有四个P_L0_8x8子宏块(Sub-MacroBlock，以下简称为SubMBW9P_8x8MB。对于省略模式(skip mode)中的MB(S卩，P_SKIP MB)，N等于16，M等于4，且利用单一参考图像来寻找DMVD目标块102的最终MV 110。此外，当SKIP_MV不等于TM_MV时，其中SKIP_MV为通过H.264标准定义的MV而TM_MV为通过上述TM机制找出的最终MV，每一个MB即发送一个标志tm_skip_active_f lag，上述标志设定当前16x16MB是否使用DMVD编码或传统MV编码。因此，当解码器解码一个MB时，解码器必须执行TM操作以决定TM_MV，并随后比较TM_MV与SKIP_MV以判断自编码器产生的比特流中是否编码标志tm_skip_active_flag。对于非省略模式中的MB (SP，P_L0_16x16MB、P_L0_L0_16x8MB、P_L0_L0_8x16MB、以及具有四 fP_L0_8185诎冊的？_8181?)，可利用多个参考图像来寻找DMVD目标块102的最终MV 110。对于P_1^0_16116]\113，1^等于16，]\1等于4，且每16116]\?即发送一个标志1:!11_3(31:;^6_;1^13〖，上述标志设定当前16x16MB是否使用DMVD编码或传统MV编码。对于P_L0_L0_16x8MB，N等于8，M等于4，且每16x8MB即发送一个标志tm_active_f lag，上述标志设定当前16x8MB分区是否使用DMVD编码或传统MV编码。对于P_L0_L0_8xl6MB，N等于8，]\1等于4，且每8116冊即发送一个标志饱_active_flag，上述标志设定当前8x16MB分区是否使用DMVD编码或传统MV编码。对于P_LO_8x8SubMB，N等于4，]\1等于4，且每81831^]\?即发送一个标志1:!11_3(31:;^6_;1^13〖，上述标志设定当前8x8SubMB分区是否使用DMVD编码或传统MV编码;此外，由于N小于8，故不允许8x8变换。由此可见，对于TM机制支持的全部块类型，传统反转L型模板的模板大小M都相等(S卩，M =4)0
[0005]在TM阶段中，计算反转L型模板104的失真值(例如，SAD)以作为在搜寻范围中找出的每一候选MV的成本(cost)。在多假设(mult1-hypothesis)预测情况下，可为DMVD目标块102以最低成本决定一组最后MV，而不是在单假设(single-hypothesis)预测情况下以最低成本仅识别一个最后MV。随后，依据传统设计，利用简单平均操作(average operat1n)来决定最终预测块。
[0006]简单来说，对于省略模式中的MB，可利用单一参考图像以及单一假设，并依据以一个候选MV为中心的搜寻范围执行整体像素全搜寻(integer-pel full search)来检查多个候选MV。此外，子像素细化(sub-pel refinement)可应用于已侦测的整体MV。对于非省略模式中的MB，可利用多个参考图像以及多个假设，并依据多个参考图像以及多个假设来执行整体像素全搜寻。此外，子像素细化可应用于每一已侦测的整体MV，且可通过对子像素MV预测执行简单平均计算来获得最终预测块。
[0007]为进一步减少搜寻位置数，也提出了一种基于候选的搜寻机制。图2是依据先前基于候选的搜寻机制的利用邻近重建块的MV作为DMVD目标块202的候选MV的示意图。如图2所示，利用邻近重建块A与C(若右上角重建块C可用)或A与C’(若右上角重建块C不可用)的MV作为候选MV来搜寻DMVD目标块202的最终MV。换句话来说，相较于上述TM全搜寻机制，基于候选的搜寻机制将每一参考图像的搜寻位置数减少至2。此外，子像素细化也可省略或适用于利用基于候选的搜寻机制找出的每一个整体MV。
[0008]如上所述，当于编码端发现SKIP_MV等于TM_MV时，P_SKIP MB的标志tm_skip_active_f lag并未编码在比特流中。当分析由编码器产生的比特流时，解码器必须执行TM操作以决定TM_MV并随后检查SKIP_MV是否等于TM_MV。当SKIP_MV等于TM_MV时，解码器知道在比特流中并未编码P_SKIP MB的标志tm_skip_active_flag。然而，当参考图像中具有一个错误参考像素时，获得的TM_MV可能不正确。当标志tm_skip_active_flag已编码在比特流中但由于错误参考像素而发现SKIP_MV等于TM_MV时，解码器将错误地认为并未发送P_SKIPMB的标志tm_skip_active_f lag。因此，解码器可能无法分析当前图像的剩余部分，且若在图像的开始并无重同步标记(resynchronizat1n marker)，甚至无法分析后续的图像。若修改先前的DMVD设计以使一直发送每一fP_SKIP MB的标志tm_skip_active_flag来解决上述分析问题，由于一直发送每一个支持MB类型的标志tm_skip_active_f lag/tm_active_flag，编码效率可被很大程度地降低。
[0009]先前的DMVD设计仅支持P部分画面(siice)(图像)；此外，先前的DMVD设计缺乏灵活性。举例来说，TM全搜寻机制中所用的模板仅限制于具有固定模板大小的反转L型模板，几乎全部的支持MB类型都需要编码在比特流中的标志，MV的最高精准度限制为1/4像素的精准度，且基于候选的搜寻机制仅利用左边块以及右上角块(或左上角块)的MV。

【发明内容】

[0010]有鉴于此，特提供以下技术方案:
[0011 ]本发明实施例提供一种解码端运动向量导出方法，包含:通过解码端运动向量导出模块设置解码端运动向量导出运动向量精准度，包含:使能特定运动向量精准度作为解码端运动向量导出运动向量精准度，其中特定运动向量精准度与非解码端运动向量导出运动向量精准度不同；以及依据解码端运动向量导出运动向量精准度决定解码端运动向量导出目标块的最终运动向量。
[0012]本发明实施例另提供一种解码端运动向量导出方法，包含:依据多假设预测搜寻至少一个参考图像来决定解码端运动向量导出目标块的多个最终运动向量;通过参考分别对应于多个最终运动向量的多个失真值，利用解码端运动向量导出模块来计算多个最终运动向量的权重因子；以及依据已计算的权重因子通过混合多个最终运动向量的多个预测块来决定最终预测块。
[0013]本发明实施例另提供一种解码端运动向量导出方法，包含:在编码器上执行解码端运动向量导出编码操作；以及将自编码器上执行的解码端运动向量导出编码操作中获得的搜寻控制信息发送至解码器，以使编码器与解码器之间具有非对称的解码端运动向量导出搜寻复杂度。
[0014]以上所述的解码端运动向量导出方法，能够通过解码端运动向量导出模块提升编码效率、减少解码端运动向量导出搜寻复杂度、以及提高解码端运动向量导出方法的灵活性。
【附图说明】
[0015]图1是P图像的传统TM机制的不意图。
[0016]图2是依据先前基于候选的搜寻机制的利用邻近重建块的MV作为DMVD目标块的候选MV的示意图。
[0017]图3是依本发明实施例的数据处理系统的范例的示意图。
[0018]图4是当前块以及多个邻近块的示意图，其中邻近块中的DMVD控制信息是被参考用于决定如何编码当前块的DMVD控制信息。
[0019]图5是依本发明快速搜寻机制范例的被选为DMVD目标块的候选MV的邻近块的MV的示意图。
[0020]图6是依本发明另一快速搜寻机制范例的被选为DMVD目标块的候选MV的参考图像中块的MV的示意图。
[0021 ]图7是依本发明实施例的模板设计的第一范例的示意图。
[0022]图8是依本发明实施例的模板设计的第二范例的示意图。
[0023]图9是依本发明实施例

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄毓文;蔡玉宝;傅智铭;雷少民;
技术所有人：联发科技股份有限公司;
我是此专利的发明人

上一篇：一种解码器及有损解码视频图像的方法
上一篇：影像压缩方法、影像解压缩方法与影像处理系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。