一种适合于硬件实现的hevc运动估计方法

文档序号:7811156阅读:225来源:国知局
一种适合于硬件实现的hevc运动估计方法
【专利摘要】本发明针对HEVC运功估计单元先对LCU进行CU块分割再进行运动估计PU块分割的特点,提出了一种适合于硬件实现的HEVC运动估计的方法,该方法两种分割模式同时进行计算,将串行搜索改为并行搜索,极大简化了运动估计算法,并且计算过程中访问存储单元的数据规整,利于硬件的实现。
【专利说明】-种适合于硬件实现的HEVC运动估计方法

【技术领域】
[0001] 本发明属于数字视频编解码【技术领域】,特别涉及一种适于硬件实现的视频压缩的 整像素运动估计方法。

【背景技术】
[0002] HEVC(H. 265)是新一代的视频压缩标准,它大幅度提高了编码效率和图像质量,但 增加了运算复杂度,运动估计、帧内预测、变换/量化等需要大量运算,尤其是运动估计模 块的运算量占整个编码器运算量的70%以上,成为编码速度提高的瓶颈,因此必须在算法 实现中对其优化。运动估计由整像素运动估计和分数像素运动估计两部分组成,其中整像 素部分的运算量约占整个运动估计的90%。
[0003] 目前研究人员对HEVC运动估计算法优化的研究集中在三类。第一类是根据图像 帧间或者帧内的时空相关性从而减少出现概率较低的预测块,降低编码的复杂度。那么对 于一个未去除掉部分深度CU单元的LCU(64X64)而言,在最大深度为3的情况下,一共需 要循环计算1106次预测块的率失真代价。此类方法虽然减少了部分计算运动匹配代价循 环,但任然不利于运动估计算法的硬件实现。第二类是根据所要计算CU块的特征来减少预 测次数,从而达到提高预测速度的目的。第三类方法是依据在最佳匹配点周围,运动估计代 价存在单峰现象,减少运动估计过程中搜索的点数,从而在压缩率变化不大的同时降低运 算量,提高运动估计速度。有十字搜索,菱形搜索,子像素搜索等。同样方法应用于官方提 供的HEVC编码标准参考软件HM中,提供了钻石搜索与菱形搜索相结合的TZsearch搜索方 法。这些方法提高了搜索速度,减少了运算量,但由于采用串行搜索方式及读取搜索区域数 据不规则,导致此类方法不适合于硬件实现。


【发明内容】

[0004] 为了克服现有技术中的缺陷,针对HEVC运功估计单元先对LCU进行CU块分割再 进行运动估计PU块分割的特点,本发明提出两种分割模式同时进行的计算方法,将串行搜 索改为并行搜索,该方法极大简化了运动估计算法,并且计算过程中访问存储单元的数据 规整,利于硬件的实现。
[0005] 本发明通过一下技术方案实现:
[0006] 本发明提供了一种在整像素运动估计中运用的用于确定下一搜索像素块的中心 位置的方案,为了实现该方案,运用了以下技术:
[0007] 并行计算IXU块的所有⑶块的运动匹配参数;
[0008] 采用动态的运动搜索范围,将LCU等分为4块,以每块的预测运动向量为搜索中心 点进行搜索。
[0009] 对于当前的LCU像素块,计算各点的SAD值,采用累加器计算每种分割模式下的代 价,确定出最佳匹配点;然后根据当前块的最佳匹配点的位置确定下一个搜索块的中心点 位置的mv。
[0010] 一种适合于硬件实现的HEVC运动估计方法,通过将HEVC标准算法中每个IXU的 CU块运动匹配参数及相应的PU块参数计算并行执行,来降低运动估计的复杂度;所述方法 包括以下步骤:
[0011] a.运动估计模块先从内存单元读取整个IXU的像素值,输入计算单元中;
[0012] b.根据该IXU的左侧或上侧已有相邻块运动向量预测当前块的运动向量;
[0013] c.根据该预测向量及搜索范围,获取搜索区域的像素数据;
[0014] d.并行计算IXU块每层深度的⑶块的运动匹配参数的最优解,获得各个深度⑶ 块下各模式PU的最佳运动向量;
[0015] e.将IXU的全部像素值与搜索区域相应的像素值做差,然后把相应的各个⑶层下 各种预测模式PU块所包含的像素差值相加得到各个CU块下各个PU模式的SAD值;
[0016] f.根据SAD值得到每个PU块的最佳运动匹配向量,从而得到各个⑶层下的最佳 PU分割模式;
[0017] g.根据这些⑶和ro的参数以及求得的帧内PU参数和相对应的TU块的变换,计 算每层CU块的率失真代价,最终得到最小率失真所对应的一系列参数。
[0018] 所述步骤d具体为:首先以深度1将IXU划分为4个32X32的⑶,分别标记为 ⑶10、⑶11、⑶12、⑶13 ;先根据左侧与上侧及左上角已完成运动估计的块对⑶10进行运动 向量的预测;以CU10的预测向量为中心,以矩形搜索框为搜索范围,搜索当前LCU的所有深 度下CU的运动匹配参数,记录每种模式下的PU最佳匹配向量;然后判断每个PU块的最佳 匹配点是否在搜索区域的边界;如果任意一个PU块的最佳匹配点在边界上,那么将搜索区 域向外扩大一个像素宽度,特别地如果最佳匹配点在搜索区域的四角上,需要相应的两个 方向都向外扩大。扩大后计算新的搜索区域内各个匹配参数,更新最佳匹配点;如果最佳 匹配点仍然在边界上,那么继续扩大搜索区域,直到所有最佳匹配点都在搜索区域内部;将 LCU以CU10的预测向量为搜索中心的各个参数保存,接着再用同样的方法以CU1UCU12和 CU13的预测向量为中心,搜索新的搜索区域,从而确定LCU的各个运动估计的参数。

【专利附图】

【附图说明】
[0019] 图1是本发明的适合于硬件实现的HEVC运动估计方法的流程图;
[0020] 图2是同一 IXU块内各个运动模式SAD计算示例图;
[0021] 图3是本发明的适合于硬件实现的HEVC运动估计方法的动态搜索流程图。

【具体实施方式】
[0022] 下面结合【专利附图】
附图
【附图说明】及【具体实施方式】对本发明进一步说明。
[0023] 附图1是本发明适合于硬件实现的HEVC运动估计方法的流程图,通过将HEVC标 准算法中每个LCU的CU块编码参数及相应的PU块参数的计算并行执行,来降低运动估计 的复杂度,其具体流程如图3所示。
[0024] 附图1中,首先运动估计模块先从内存单元读取整个IXU(64X64)的像素值,输入 计算单元中,再根据该LCU的左侧或上侧已有相邻块运动向量预测当前块的运动向量。然 后根据该预测向量及搜索范围,获取搜索区域的像素数据。采用图3所示的方法计算每层 深度的⑶块的最优解,获得各个深度⑶块下各模式TO的最佳运动向量。将IXU的全部像 素值与搜索区域相应的像素值做差,然后把相应的各个CU层下各种预测模式PU块所包含 的像素差值相加得到各个CU块下各个PU模式的SAD值。再根据SAD值得到每个PU块的 最佳运动匹配向量,从而得到各个⑶层下的最佳PU分割模式。然后编码算法根据这些⑶ 和PU的参数以及求得的帧内PU参数和相对应的TU块的变换,计算每层CU块的率失真代 价,最终得到最小率失真所对应的一系列参数。这一系列的参数包括每个LCU(64X64)的 树分割成⑶单元的参数,即IXU的分割情况。每个⑶的最佳运动匹配参数包括:PU的分 割模式,每个PU的运动向量MV。
[0025] 运动估计搜索中,需要大量的计算当前TO块内像素与搜索区域像素的差。其计算 如公式(1)所示,Ik(m,n)是当前PU块的像素值,Ik(m+dx,n+dy)是搜索区域相对应的像素 值,SAD是该PU块所有像素值与相对应搜索块的像素值差的和。通过比较SAD值的大小, 可以确定PU块的最佳匹配块,从而得到运功向量,其计算如公式(2)所示,MV即所求PU块 的最佳匹配向量。计算各点的SAD值采用公式(3)。

【权利要求】
1. 一种适合于硬件实现的HEVC运动估计方法,通过将HEVC标准算法中每个IXU的 CU块运动匹配参数及相应的PU块参数计算并行执行,来降低运动估计的复杂度:其特征在 于:所述方法包括以下步骤: a. 运动估计模块先从内存单元读取整个LCU的像素值,输入计算单元中; b. 根据该LCU的左侧或上侧已有相邻块运动向量预测当前块的运动向量; c. 根据该预测向量及搜索范围,获取搜索区域的像素数据; d. 并行计算LCU块每层深度的CU块的运动匹配参数的最优解,获得各个深度CU块下 各模式PU的最佳运动向量; e. 将LCU的全部像素值与搜索区域相应的像素值做差,然后把相应的各个CU层下各种 预测模式PU块所包含的像素差值相加得到各个CU块下各个PU模式的SAD值; f. 根据SAD值得到每个PU块的最佳运动匹配向量,从而得到各个CU层下的最佳PU分 割模式; g. 根据这些CU和PU的参数以及求得的帧内PU参数和相对应的TU块的变换,计算每 层CU块的率失真代价,最终得到最小率失真所对应的一系列参数。
2. 根据权利要求1所述的方法,其特征在于:所述步骤d具体为:首先以深度1将LCU 划分为4个32X32的⑶,分别标记为⑶10、⑶11、⑶12、⑶13 ;先根据左侧与上侧及左上角 已完成运动估计的块对CU10进行运动向量的预测;以CU10的预测向量为中心,以矩形搜索 框为搜索范围,搜索当前IXU的所有深度下⑶的运动匹配参数,记录每种模式下的PU最佳 匹配向量;然后判断每个PU块的最佳匹配点是否在搜索区域的边界;如果任意一个TO块 的最佳匹配点在边界上,那么将搜索区域向外扩大一个像素宽度,特别地如果最佳匹配点 在搜索区域的四角上,需要相应的两个方向都向外扩大。
3. 扩大后计算新的搜索区域内各个匹配参数,更新最佳匹配点;如果最佳匹配点仍然 在边界上,那么继续扩大搜索区域,直到所有最佳匹配点都在搜索区域内部;将IXU以⑶10 的预测向量为搜索中心的各个参数保存,接着再用同样的方法以CU1UCU12和CU13的预测 向量为中心,搜索新的搜索区域,从而确定LCU的各个运动估计的参数。
4. 根据权利要求2所述的方法,其特征在于:新的搜索区域与已经搜索过的区域会有 重叠,通过重叠区域消除法来减少因重叠而引起的重复计算问题。
5. 根据权利要求1所述的方法,其特征在于:最小率失真所对应的一系列参数包括每 个LCU的树分割成CU单元的参数,即LCU的分割情况以及每个CU的最佳运动匹配参数包 括:PU的分割模式,每个TO的运动向量MV。
6. 根据权利要求1所述的方法,其特征在于:所述步骤f具体为:采用累加器计算每种 分割模式下的代价,确定出最佳匹配点;然后根据当前块的最佳匹配点的位置确定下一个 搜索块的中心点位置的运动向量MV。
【文档编号】H04N19/56GK104159123SQ201410392865
【公开日】2014年11月19日 申请日期:2014年8月11日 优先权日:2014年8月11日
【发明者】左石凯, 王明江 申请人:哈尔滨工业大学深圳研究生院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1