一种子像素运动向量估计方法和装置的制造方法

文档序号：9251231阅读：430来源：国知局

一种子像素运动向量估计方法和装置的制造方法
【技术领域】
[0001] 本发明涉及视频图像处理的技术领域，特别是涉及一种子像素运动向量估计方法和装置。
【背景技术】
[0002] 随着高分辨率拍摄设备的普及化，互联网视频量急速增长。为了高效地存储和传输高清视频，业界势必采用具有更高压缩编码效率的新一代视频编码标准。例如，新一代视频编码标准H. 265/HEVC(HighEfficiencyVideoCoding，高效视频编码标准），与上一代视频编码标准H. 264/AVC(AdvancedVideoCoding，高阶视讯编码）相比，新一代视频编码标准有更多的编码模式可以选择，与此同时也给编码器带来了更高难度的挑战。
[0003] 编码模式包括帧间编码，在帧间编码中由于当前视频图像和邻近视频图像中的景物存在着一定的相关性，因此，可以将当前视频图像分成若干块，并设法搜索出每个视频图像块在邻近视频图像中的位置，并得出两者之间的空间位置的相对偏移量，得到的相对偏移量就是通常所指的运动向量，任意一帧视频图像选择运动向量的过程则被称为运动向量估计。将运动向量和经过运动匹配后得到的预测误差，共同发送到编码器，在编码器按照运动向量指明的位置，从已经解码的邻近的参考视频图像中找到相应的视频图像块，和当前视频图像块相减得到预测误差，然后对预测误差执行变换和量化，然后将量化系数编入码流。当进行解码时，反量化反变换得到重构的残差视频图像块，和预测视频图像块相加后就可以得到重构的当前视频图像块。
[0004] 由于当前视频编码块的运动可能指向分像素位置，所以运动向量估计分为两个部分，第一部分是整像素运动向量估计，通过在一个设定区域中搜索，得到最佳的整像素匹配视频图像块，得到最佳的正像素匹配视频数据块对应的整像素运行向量。在执行完第一部分的正像素运动向量后，进行分像素运动估计即子像素运动向量估计，通过子像素运动估计确定最佳的子像素运动向量，则得到最终的运动向量。
[0005] 下面参照图1对现有的子像素运动向量估计方法进行说明，其中，图1中菱形代表整像素点，正方形代表半像素点，圆形代表四分之一像素点。
[0006] 假设经过上述第一部分的正像素运动向量估计后，得到的最佳整像素运动向量指向A像素点，现有的分像素运动向量估计过程，则首先对围绕在像素点A周围的8个半像素点K、L、M、N、P、Q、R、V及A共9个像素点进行匹配，对9个像素点进行匹配即求出每个像素点的像素匹配成本，选出匹配成本最小的像素点。其次，对选出的匹配成本最小的这个像素点周围的8个四分之一像素点再进行匹配（如果匹配成本最小的是像素点M，则M周围的 8个四分之一像素点即为a、b、c、d、e、f、g、h，如果匹配成本最小的是像素点A，那么A周围 8个四分之一像素点即为1」、厂!11、11、(1、？、1〇，计算每个像素点的匹配成本，将计算得到的匹配成本最小的像素点对应的向量确定为最终的最佳子像素运动向量。
[0007] 可见，现有的子像素运动向量估计过程需要进行17次匹配，由于匹配次数多，不仅匹配的复杂度高，并且还会影响对视频编码块的编码速度、增加视频编码器的处理负荷。

【发明内容】

[0008] 鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的子像素运动向量估计方法和装置。
[0009] 依据本发明的一个方面，提供了一种子像素运动向量估计方法，包括：确定当前视频编码块的最佳整像素运动向量对应的第一像素点，和预测的运动向量对应的第二像素点；判断所述第一像素点对应的运动向量与所述第二像素点对应的运动向量的水平分量、以及所述第一像素点对应的运动向量与所述第二像素点对应的运动向量的垂直分量之间的绝对差是否均在四分之一像素之内；若均在四分之一像素之内，则设定初始搜索中心为第二像素点，若至少有一个所述绝对差不在四分之一像素之内，则设定初始搜索中心为第一像素点；若均在四分之一像素之内，则计算所述第二像素点的像素匹配成本，并判断所述第二像素点的像素匹配成本是否小于设定像素匹配成本阈值；若小于设定阈值，则按照第一设定规则执行钻石搜索，根据钻石搜索结果确定当前视频编码块的子像素运动向量。
[0010] 根据本发明的另一方面，还提供了一种子像素运动向量估计装置，包括：确定模块，用于确定当前视频编码块的最佳整像素运动向量对应的第一像素点，和预测的运动向量对应的第二像素点；第一判断模块，用于判断所述第一像素点对应的运动向量与所述第二像素点对应的运动向量的水平分量、以及所述第一像素点对应的运动向量与所述第二像素点对应的运动向量的垂直分量之间的绝对差是否均在四分之一像素之内；第二判断模块，用于若第一判断模块的判断结果为所述绝对差均在四分之一像素之内，则设定初始搜索中心为第二像素点，若至少有一个所述绝对差不在四分之一像素之内，则设定初始搜索中心为第一像素点；当都在四分之一像素之内时，计算所述第二像素点的像素匹配成本，并判断所述第二像素点的像素匹配成本是否小于设定像素匹配成本阈值；第一执行模块，用于若所述第二判断模块的判断结果为小于设定阈值，则按照第一设定规则执行钻石搜索，根据钻石搜索确定当前视频编码块的子像素运动向量。
[0011] 与现有技术相比，本发明包括以下优点：
[0012] 本发明提供的子像素运动向量估计方案，在确定当前视频编码块的最佳整像素运动向量对应的第一像素点后，然后获得当前块的预测运动向量（即MVP，对于MVP的确定参见后面的【具体实施方式】中的相关介绍），并判断预测的运动向量对应的第二像素点是否为距第一像素点为四分之一像素的像素点，若是，则计算第二像素点的匹配成本，并将计算得到的匹配成本与设定的像素匹配成本阈值进行比较，若小于设定的像素匹配成本阈值，则以第二像素点为中心进行钻石搜索，确定像素匹配成本最小的像素点，将该像素点对应的运动向量确定为最佳子像素运动向量，以实现对当前视频编码块进行子像素运动向量的估计。通过本发明提供的子像素运动向量估计方案，由于在确定最佳子像素运动向量的过程中，仅是进行钻石搜索，而一次钻石搜索仅需要对中心点和中心点周围4个像素点进行5次匹配，便有可能确定出最佳子响度运动向量，相较于现有的需要进行17次匹配，能够大大缩减匹配次数。由于减少减了匹配次数，因此，能够降低匹配的复杂度，提高视频编码块的编码速度、减少视频编码器的处理负荷。
[0013] 上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的【具体实施方式】。
【附图说明】
[0014] 通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：
[0015] 图1是一个视频图像块的局部像素点的分布图；
[0016] 图2是一种HEVC的层次B编码的示意图；
[0017] 图3是根据本发明实施例一的一种子像素运动向量估计方法的步骤流程图；
[0018] 图4是根据本发明实施例二的一种子像素运动向量估计方法的步骤流程图；
[0019] 图5是根据本发明实施例三的一种子像素运动向量估计装置的结构框图。
【具体实施方式】
[0020] 下面将参照附图更详细地描述本发明公开的示例性实施例。虽然附图中显示了本发明公开的示例性实施例，然而应当理解，可以以各种形式实现本发明公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本发明公开的范围完整的传达给本领域的技术人员。
[0021] 为了获得较高的压缩编码效率，HEVC可以采用层次B编码。参照图2所示的一种 HEVC的层次B编码的示意图，在层次B编码中，HEVC主框架最多允许8层次。参照图2,时间轴以下数字是图像的显示时间，图像上的标记的数字是编码的顺序。
[0022] 编码器以8个图像为一组进行编码，编码顺序和显示顺序（简称POC)并不相同。层次B编码根据预测距离进行分层，以分层进行编码。例如，首先编码POC= 0的图像，然后编码POC= 8的图像，预测距离是8,是图像层次中的第一层；然后编码POC= 4的图像，其中POC= 4从POC= 8和POC= 0预测，预测距离是4,是图像层次中的第二层；然后POC =2从POC= 0及POC= 4预测，POC= 6从POC= 4及POC= 8预测，预测距离都是2,所以都是图像层次中的第三层；以此类推，POC= 1、3、5、7的图像预测距离都是1，所以都是图像层次中的第四层。
[0023] 综上可知，图2的层次B编码中，第一组编码顺序依次是POC= 0、P0C= 8、P0C= 4、POC= 2、POC= 1、POC= 3、POC= 6、POC= 5、POC= 7 的图像。这组编码完成后编码下一组 8 个图像，编码顺序依次是POC= 16、POC= 12、POC=KKPOC= 9、POC=IUPOC =14、POC= 13、POC= 15,这组完成后再编码下一组8个图像。
[0024] 对于每幅视频图像，编码器可以将其分割成CTU(CodingTreeUnit，编码树单元），然后逐CTU进行编码。CTU大小由编码器决定，为了获得最高编码效率，一般设定CTU 最大尺寸为64X64,其中，64X64即为长为64像素宽为63像素的视频图像块。编码器可以采用四叉树的形式将每一个CTU进一步划分为⑶即视频编码块（CodingUnit，编码单元）。具体地，⑶可以有64X64、32X32、16X16、8X8共4种大小，然后对⑶选择帧内或帧间模式进行编码。
[0025] CU有两种编码模式，具体包括帧间编码模式、帧内编码模式其中，帧内编码模式中包含35种不同的预测模式，帧间编码模式则有7种分割块预测方式。编码器从所有这些可能的组合中选择率失真最优的一种模式对块进行编码，以获得最佳的压缩编码效率。
[0026] 本发明中着重考虑采用帧间编码模式对视频编码块进行编码。对于帧间编码的视频编码块，一般有2个参考列，前向参考列（ListO)和后向参考

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱洪波;
技术所有人：北京奇艺世纪科技有限公司;
我是此专利的发明人

上一篇：一种基于子带加密的图像压缩方法
上一篇：对图像进行编码/解码的方法和设备的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。