一种子像素运动向量估计方法和装置的制造方法

文档序号:9251231阅读:430来源:国知局
一种子像素运动向量估计方法和装置的制造方法
【技术领域】
[0001] 本发明涉及视频图像处理的技术领域,特别是涉及一种子像素运动向量估计方法 和装置。
【背景技术】
[0002] 随着高分辨率拍摄设备的普及化,互联网视频量急速增长。为了高效地存储和传 输高清视频,业界势必采用具有更高压缩编码效率的新一代视频编码标准。例如,新一代视 频编码标准H. 265/HEVC(HighEfficiencyVideoCoding,高效视频编码标准),与上一代 视频编码标准H. 264/AVC(AdvancedVideoCoding,高阶视讯编码)相比,新一代视频编码 标准有更多的编码模式可以选择,与此同时也给编码器带来了更高难度的挑战。
[0003] 编码模式包括帧间编码,在帧间编码中由于当前视频图像和邻近视频图像中的景 物存在着一定的相关性,因此,可以将当前视频图像分成若干块,并设法搜索出每个视频图 像块在邻近视频图像中的位置,并得出两者之间的空间位置的相对偏移量,得到的相对偏 移量就是通常所指的运动向量,任意一帧视频图像选择运动向量的过程则被称为运动向量 估计。将运动向量和经过运动匹配后得到的预测误差,共同发送到编码器,在编码器按照运 动向量指明的位置,从已经解码的邻近的参考视频图像中找到相应的视频图像块,和当前 视频图像块相减得到预测误差,然后对预测误差执行变换和量化,然后将量化系数编入码 流。当进行解码时,反量化反变换得到重构的残差视频图像块,和预测视频图像块相加后就 可以得到重构的当前视频图像块。
[0004] 由于当前视频编码块的运动可能指向分像素位置,所以运动向量估计分为两个部 分,第一部分是整像素运动向量估计,通过在一个设定区域中搜索,得到最佳的整像素匹配 视频图像块,得到最佳的正像素匹配视频数据块对应的整像素运行向量。在执行完第一部 分的正像素运动向量后,进行分像素运动估计即子像素运动向量估计,通过子像素运动估 计确定最佳的子像素运动向量,则得到最终的运动向量。
[0005] 下面参照图1对现有的子像素运动向量估计方法进行说明,其中,图1中菱形代表 整像素点,正方形代表半像素点,圆形代表四分之一像素点。
[0006] 假设经过上述第一部分的正像素运动向量估计后,得到的最佳整像素运动向量指 向A像素点,现有的分像素运动向量估计过程,则首先对围绕在像素点A周围的8个半像素 点K、L、M、N、P、Q、R、V及A共9个像素点进行匹配,对9个像素点进行匹配即求出每个像 素点的像素匹配成本,选出匹配成本最小的像素点。其次,对选出的匹配成本最小的这个像 素点周围的8个四分之一像素点再进行匹配(如果匹配成本最小的是像素点M,则M周围的 8个四分之一像素点即为a、b、c、d、e、f、g、h,如果匹配成本最小的是像素点A,那么A周围 8个四分之一像素点即为1」、厂!11、11、(1、?、1〇,计算每个像素点的匹配成本,将计算得到的 匹配成本最小的像素点对应的向量确定为最终的最佳子像素运动向量。
[0007] 可见,现有的子像素运动向量估计过程需要进行17次匹配,由于匹配次数多,不 仅匹配的复杂度高,并且还会影响对视频编码块的编码速度、增加视频编码器的处理负荷。

【发明内容】

[0008] 鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上 述问题的子像素运动向量估计方法和装置。
[0009] 依据本发明的一个方面,提供了一种子像素运动向量估计方法,包括:确定当前 视频编码块的最佳整像素运动向量对应的第一像素点,和预测的运动向量对应的第二像素 点;判断所述第一像素点对应的运动向量与所述第二像素点对应的运动向量的水平分量、 以及所述第一像素点对应的运动向量与所述第二像素点对应的运动向量的垂直分量之间 的绝对差是否均在四分之一像素之内;若均在四分之一像素之内,则设定初始搜索中心为 第二像素点,若至少有一个所述绝对差不在四分之一像素之内,则设定初始搜索中心为第 一像素点;若均在四分之一像素之内,则计算所述第二像素点的像素匹配成本,并判断所述 第二像素点的像素匹配成本是否小于设定像素匹配成本阈值;若小于设定阈值,则按照第 一设定规则执行钻石搜索,根据钻石搜索结果确定当前视频编码块的子像素运动向量。
[0010] 根据本发明的另一方面,还提供了一种子像素运动向量估计装置,包括:确定模 块,用于确定当前视频编码块的最佳整像素运动向量对应的第一像素点,和预测的运动向 量对应的第二像素点;第一判断模块,用于判断所述第一像素点对应的运动向量与所述第 二像素点对应的运动向量的水平分量、以及所述第一像素点对应的运动向量与所述第二像 素点对应的运动向量的垂直分量之间的绝对差是否均在四分之一像素之内;第二判断模 块,用于若第一判断模块的判断结果为所述绝对差均在四分之一像素之内,则设定初始搜 索中心为第二像素点,若至少有一个所述绝对差不在四分之一像素之内,则设定初始搜索 中心为第一像素点;当都在四分之一像素之内时,计算所述第二像素点的像素匹配成本,并 判断所述第二像素点的像素匹配成本是否小于设定像素匹配成本阈值;第一执行模块,用 于若所述第二判断模块的判断结果为小于设定阈值,则按照第一设定规则执行钻石搜索, 根据钻石搜索确定当前视频编码块的子像素运动向量。
[0011] 与现有技术相比,本发明包括以下优点:
[0012] 本发明提供的子像素运动向量估计方案,在确定当前视频编码块的最佳整像素运 动向量对应的第一像素点后,然后获得当前块的预测运动向量(即MVP,对于MVP的确定参 见后面的【具体实施方式】中的相关介绍),并判断预测的运动向量对应的第二像素点是否为 距第一像素点为四分之一像素的像素点,若是,则计算第二像素点的匹配成本,并将计算得 到的匹配成本与设定的像素匹配成本阈值进行比较,若小于设定的像素匹配成本阈值,则 以第二像素点为中心进行钻石搜索,确定像素匹配成本最小的像素点,将该像素点对应的 运动向量确定为最佳子像素运动向量,以实现对当前视频编码块进行子像素运动向量的估 计。通过本发明提供的子像素运动向量估计方案,由于在确定最佳子像素运动向量的过程 中,仅是进行钻石搜索,而一次钻石搜索仅需要对中心点和中心点周围4个像素点进行5次 匹配,便有可能确定出最佳子响度运动向量,相较于现有的需要进行17次匹配,能够大大 缩减匹配次数。由于减少减了匹配次数,因此,能够降低匹配的复杂度,提高视频编码块的 编码速度、减少视频编码器的处理负荷。
[0013] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够 更明显易懂,以下特举本发明的【具体实施方式】。
【附图说明】
[0014] 通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通 技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明 的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0015] 图1是一个视频图像块的局部像素点的分布图;
[0016] 图2是一种HEVC的层次B编码的示意图;
[0017] 图3是根据本发明实施例一的一种子像素运动向量估计方法的步骤流程图;
[0018] 图4是根据本发明实施例二的一种子像素运动向量估计方法的步骤流程图;
[0019] 图5是根据本发明实施例三的一种子像素运动向量估计装置的结构框图。
【具体实施方式】
[0020] 下面将参照附图更详细地描述本发明公开的示例性实施例。虽然附图中显示了本 发明公开的示例性实施例,然而应当理解,可以以各种形式实现本发明公开而不应被这里 阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将 本发明公开的范围完整的传达给本领域的技术人员。
[0021] 为了获得较高的压缩编码效率,HEVC可以采用层次B编码。参照图2所示的一种 HEVC的层次B编码的示意图,在层次B编码中,HEVC主框架最多允许8层次。参照图2,时 间轴以下数字是图像的显示时间,图像上的标记的数字是编码的顺序。
[0022] 编码器以8个图像为一组进行编码,编码顺序和显示顺序(简称POC)并不相同。 层次B编码根据预测距离进行分层,以分层进行编码。例如,首先编码POC= 0的图像,然 后编码POC= 8的图像,预测距离是8,是图像层次中的第一层;然后编码POC= 4的图像, 其中POC= 4从POC= 8和POC= 0预测,预测距离是4,是图像层次中的第二层;然后POC =2从POC= 0及POC= 4预测,POC= 6从POC= 4及POC= 8预测,预测距离都是2,所 以都是图像层次中的第三层;以此类推,POC= 1、3、5、7的图像预测距离都是1,所以都是图 像层次中的第四层。
[0023] 综上可知,图2的层次B编码中,第一组编码顺序依次是POC= 0、P0C= 8、P0C= 4、POC= 2、POC= 1、POC= 3、POC= 6、POC= 5、POC= 7 的图像。这组编码完成后编码 下一组 8 个图像,编码顺序依次是POC= 16、POC= 12、POC=KKPOC= 9、POC=IUPOC =14、POC= 13、POC= 15,这组完成后再编码下一组8个图像。
[0024] 对于每幅视频图像,编码器可以将其分割成CTU(CodingTreeUnit,编码树单 元),然后逐CTU进行编码。CTU大小由编码器决定,为了获得最高编码效率,一般设定CTU 最大尺寸为64X64,其中,64X64即为长为64像素宽为63像素的视频图像块。编码器可 以采用四叉树的形式将每一个CTU进一步划分为⑶即视频编码块(CodingUnit,编码单 元)。具体地,⑶可以有64X64、32X32、16X16、8X8共4种大小,然后对⑶选择帧内或 帧间模式进行编码。
[0025] CU有两种编码模式,具体包括帧间编码模式、帧内编码模式其中,帧内编码模式中 包含35种不同的预测模式,帧间编码模式则有7种分割块预测方式。编码器从所有这些可 能的组合中选择率失真最优的一种模式对块进行编码,以获得最佳的压缩编码效率。
[0026] 本发明中着重考虑采用帧间编码模式对视频编码块进行编码。对于帧间编码的视 频编码块,一般有2个参考列,前向参考列(ListO)和后向参考
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1