基于最优停止理论的高效视频快速编码方法

文档序号:8002369阅读:223来源:国知局
基于最优停止理论的高效视频快速编码方法
【专利摘要】本发明涉及一种基于最优停止理论的高效视频快速编码方法,该方法包括以下步骤:1)获取视频序列中的待编码帧和N个高效视频编码模式,并初始化待编码帧中每个PU的概率信息;2)计算当前待编码PU在每个编码模式下对应的概率^,k=1,2,...,N,并将N个编码模式按其概率降序排列;3)应用最优停止理论根据步骤2)的顺序依次检查各编码模式,计算并获得最佳编码模式和最优停止点;4)采用得到的最佳编码模式对当前待编码PU进行编码,并根据当前最佳编码模式和最优停止点更新参数,直至整个视频序列编码完成。与现有技术相比,本发明降低了HEVC在预测单元模式决定部分的计算量,提高编码速度,促进其在实际中的广泛应用。
【专利说明】基于最优停止理论的高效视频快速编码方法

【技术领域】
[0001] 本发明涉及视频压缩编码领域,尤其是涉及一种基于最优停止理论的高效视频快 速编码方法。

【背景技术】
[0002] 随着高清视频,甚至是超高清视频的兴起,大分辨率视频的应用在市场上愈发普 及,并且广受欢迎。超高清视频的分辨率可以达到4Kx2K,甚至8Kx4K,这对视频压缩效率提 出了新的挑战。目前广泛使用的视频压缩编码标准H. 264/AVC于1999年至2003年间初步 制定,并于2003年至2009年间又做了多次扩展和补充。迄今为止,H. 264/AVC标准已经广 泛应用于卫星视频广播、有线电视、视频会议、视频聊天和安保监控等众多领域。然而,针对 目前新兴的高清视频领域,H. 264/AVC标准的压缩效率和性能还不能很好地满足要求。在 这种情况下,高效视频编码标准(High Efficiency Video Coding, HEVC)应运而生。
[0003] HEVC是ITU-T视频编码专家组(VCEG)和IS0/IEC运动图像专家组(MPEG)组成 的联合视频编码组(JCT-VC)制定的,旨在H. 264/AVC的基础上进一步提高压缩效率,并且 在相同视频质量的情况下,达到2倍于H. 264/AVC的压缩比。和H. 264/AVC相比,HEVC编 码技术最大的不同在于其四叉树结构。H. 264/AVC中的宏块(MB)兼具预测和变换信息;在 HEVC中,基本的编码单元是Coding Tree Unit (CTU)。CTU和MB的功能类似,但是CTU的预 测信息携带单位是PU (Prediction Unit)。针对每一个⑶(Coding Unit),可进一步划分为 4个子PU。在HEVC中,CU的大小可以是以下值:64义64、32132、16116、818。当对(^进行帧 间(Inter)预测时,PU 的大小可以为 2Nx2N、2NxN、Nx2N、NxN、2NxnU、2NxnD、nLx2N、nRx2N。 在这里,2Nx2N代表不进行子划分的⑶大小,2NxN代表宽度为原⑶一半的PU,2NxnU中η 的大小为四分之一,各TO的大小如图1所示;当对CU进行帧内(Intra)预测时,PU的大小 可以是2Nx2N或NxN(对亮度分量,N=32、16、8、4)。相对于H. 264/AVC中最多有9种帧 内预测方式(分别是垂直预测、水平预测、平均预测、左对角预测、右对角预测、垂直右对角 预测、水平向下预测、垂直左对角预测和水平向上预测),HEVC的帧内预测方式最多可达35 种。当进行帧内预测时,每个PU都需要在35种预测方式中选择一种最佳模式进行预测编 码。在HEVC中,采用RQT(Residual QuadTree)技术对预测产生的残差进行量化;和PU类 似,HEVC采用TU(Transform Unit)对残差进行基于四叉树的量化和变换编码。对于亮度 分量,TU的大小可以是32x32、16xl6、8x8和4x4 ;对于色度分量,其TU的长宽分别是对应亮 度分量TU长宽的二分之一。
[0004] 和H. 264/AVC相似,HEVC采用了基于拉格朗日率失真优化策略RD0 (Rate Distortion Optimization)技术的模式选择算法,即通过遍历所有可能的模式,最后选择 率失真代价最小的模式作为最佳编码模式,公式为:
[0005] J(s,c,m|QP, λ m) = D (s, c, m | QP) + λ mR(s, c, m | QP)
[0006] 式中,QP是量化参数;λ m是拉格朗日常数,与QP有关;D是原始像素块s与重建 块c之间的失真;R是利用模式m进行编码后产生的比特数。
[0007] 相比于H. 264/AVC中仅仅需要对MB进行所有模式的遍历计算选择,HEVC需要分别 对每一层的CU、PU和TU进行最优选择,选择出最佳单元大小和模式进行编码。因此,HEVC 中模式选择的计算复杂度是巨大的,在移动设备和实时环境下很难应用HEVC进行高效编 码。这就需要快速算法来缩短编码时间以满足实际需要,同时又要在一定范围内满足视频 质量的要求。
[0008] 最优停止理论可以在某个适当的点停止,从而避免遍历待编码CU的所有模式来 达到缩短编码时间的目的。最优停止理论问题可以归结如下:存在一个联合分布已知的随 机变量的序列和一组实值奖励函数,决策者按照顺序一个个检查这些变量,同时获得相应 的奖励函数值,并且在合适的时间停止检查余下的变量,最终的目的是获得的奖励函数值 最大,这样获得最好的候选变量的概率也最大。通过把各种编码模式当作上面提到的变量, 并且研究各种模式相互之间的关系,最优停止理论就可以应用到模式决定的快速算法中。
[0009] Ferguson等又提出了名为持续问题的一种最优停止问题,简单叙述为:在决策 的过程中,如果某个变量比其他变量的观测值更好,那么它便成为是一个Relative Best Object (RB0)。持续问题的目标是在遇到下一个RB0之前,找到一个适当的时间停止观测, 同时获得观测值最大的变量。持续问题的期望值越大,表明在停止点之后遇到下一个RB0 的时间越长,同时能够节约的不必要时间也越多。换句话说,持续问题的解决方法在判定准 确性和时间减少比例上能够很好地进行权衡,这点可以借鉴到视频编码的快速算法中,相 对应的是既要尽可能选择到编码的最佳模式,同时又要尽量减少编码时间,这和持续问题 的目的很类似。


【发明内容】

[0010] 本发明的目的就是为了克服上述现有技术存在的计算量大、编码速度慢等缺陷提 供一种基于最优停止理论的高效视频快速编码方法,降低了 HEVC在预测单元模式决定部 分的计算量,提高编码速度,促进其在实际中的广泛应用。
[0011] 本发明的目的可以通过以下技术方案来实现:
[0012] 一种基于最优停止理论的高效视频快速编码方法,该方法包括以下步骤:
[0013] 1)获取视频序列中的待编码帧和N个高效视频编码模式,并初始化待编码帧中每 个PU的概率信息;
[0014] 2)计算当前待编码PU在每个编码模式下对应的概率pk,k = 1,2, . . .,N,并将N 个编码模式按其概率降序排列;
[0015] 3)应用最优停止理论根据步骤2)的顺序依次检查各编码模式,计算并获得最佳 编码模式和最优停止点;
[0016] 4)采用得到的最佳编码模式对当前待编码PU进行编码,并根据当前最佳编码模 式和最优停止点更新参数;
[0017] 5)返回步骤2),直至当前待编码帧的所有PU全部编码完成;
[0018] 6)返回步骤1),直至整个视频序列编码完成。
[0019] 所述的当前待编码PU在每个编码模式下对应的概率pk通过以下公式获取:
[0020]

【权利要求】
1. 一种基于最优停止理论的高效视频快速编码方法,其特征在于,该方法包括以下步 骤: 1) 获取视频序列中的待编码帧和N个高效视频编码模式,并初始化待编码帧中每个PU 的概率信息; 2) 计算当前待编码PU在每个编码模式下对应的概率pk,k = 1,2, . . .,N,并将N个编 码模式按其概率降序排列; 3) 应用最优停止理论根据步骤2)的顺序依次检查各编码模式,计算并获得最佳编码 模式和最优停止点; 4) 采用得到的最佳编码模式对当前待编码TO进行编码,并根据当前最佳编码模式和 最优停止点更新参数; 5) 返回步骤2),直至当前待编码帧的所有PU全部编码完成; 6) 返回步骤1),直至整个视频序列编码完成。
2. 根据权利要求1所述的一种基于最优停止理论的高效视频快速编码方法,其特征在 于,所述的当前待编码PU在每个编码模式下对应的概率p k通过以下公式获取: u(Ms,r) + T rml 其中,TU(MU,k)为当前待编码PU的上方PU最佳编码模式为Mu时,当前待编码PU最佳 编码模式为k的概率预测矩阵;1\ (Mp k)为当前待编码PU的左方PU最佳编码模式为吣时, 当前待编码PU最佳编码模式为k的概率预测矩阵。
3. 根据权利要求2所述的一种基于最优停止理论的高效视频快速编码方法,其特征在 于,所述的步骤3)具体为: 3. 1)依次检查各候选模式,在第k个模式停止检查,设在模式k后的下一个相对最佳目 标为Tk,则Tk = j的概率为: 取=Λ =汽美+| ;> 1,、重》 fmkU =Σρ,(ιτ-~) hPr r-i I 其中,j为自然数且j e (k,N],Xr(r = k+l,k+2,...,j-l)表示第k+l、k+2 -直到第 j_l个模式在所有N个模式中被选为最佳模式的概率排名,P (X」=1)表示第j个模式是N 个模式中的最佳模式的概率; Tk的位置由下式得到 m) = (N + l)· P(Tk =N .pg·^ = j,屠争I =Λ+Σ^Στ^~ ?1 Μ Λ 广 若E(Tk)大于设定的阈值τ,τ e [Ν,Ν+1),则当前的第k个模式为最佳编码模式; 3. 2)计算最优停止点K# : K* = max{Ka, K0} 式中 = mk {* > 1 ; I; Λ I; > r ^ w r*3 A, = rnin{/:>l:A+i2^i?^lK J相言 Mr f r*l
4. 根据权利要求3所述的一种基于最优停止理论的高效视频快速编码方法,其特征 在于,所述的更新参数是指根据当前的编码模式对各概率预测矩阵进行更新,更新公式如 下: (M, k) = T(M, k) · (l-y)+pm · y 其中,T(M,k)为更新前的概率预测矩阵,Τ' (M,k)为更新后的概率预测矩阵,γ为更 新参数,Pm表示在已编码PU的最佳模式为j,且满足j < K#的前提下,模式m成为最佳模式 的后验概率,由以下公式计算得到: 'κ. · YdPr,m = j rm\ pm /1 ^ pm,otherwise
【文档编号】H04N19/147GK104301723SQ201310297983
【公开日】2015年1月21日 申请日期:2013年7月16日 优先权日:2013年7月16日
【发明者】王瀚漓, 衡岳 申请人:同济大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1