基于最优停止理论的高效视频快速编码方法

文档序号：8002369阅读：223来源：国知局

基于最优停止理论的高效视频快速编码方法
【专利摘要】本发明涉及一种基于最优停止理论的高效视频快速编码方法，该方法包括以下步骤：1)获取视频序列中的待编码帧和N个高效视频编码模式，并初始化待编码帧中每个PU的概率信息；2)计算当前待编码PU在每个编码模式下对应的概率^，k＝1，2，...，N，并将N个编码模式按其概率降序排列；3)应用最优停止理论根据步骤2)的顺序依次检查各编码模式，计算并获得最佳编码模式和最优停止点；4)采用得到的最佳编码模式对当前待编码PU进行编码，并根据当前最佳编码模式和最优停止点更新参数，直至整个视频序列编码完成。与现有技术相比，本发明降低了HEVC在预测单元模式决定部分的计算量，提高编码速度，促进其在实际中的广泛应用。
【专利说明】基于最优停止理论的高效视频快速编码方法

【技术领域】
[0001] 本发明涉及视频压缩编码领域，尤其是涉及一种基于最优停止理论的高效视频快速编码方法。

【背景技术】
[0002] 随着高清视频，甚至是超高清视频的兴起，大分辨率视频的应用在市场上愈发普及，并且广受欢迎。超高清视频的分辨率可以达到4Kx2K，甚至8Kx4K，这对视频压缩效率提出了新的挑战。目前广泛使用的视频压缩编码标准H. 264/AVC于1999年至2003年间初步制定，并于2003年至2009年间又做了多次扩展和补充。迄今为止，H. 264/AVC标准已经广泛应用于卫星视频广播、有线电视、视频会议、视频聊天和安保监控等众多领域。然而，针对目前新兴的高清视频领域，H. 264/AVC标准的压缩效率和性能还不能很好地满足要求。在这种情况下，高效视频编码标准（High Efficiency Video Coding, HEVC)应运而生。
[0003] HEVC是ITU-T视频编码专家组（VCEG)和IS0/IEC运动图像专家组（MPEG)组成的联合视频编码组（JCT-VC)制定的，旨在H. 264/AVC的基础上进一步提高压缩效率，并且在相同视频质量的情况下，达到2倍于H. 264/AVC的压缩比。和H. 264/AVC相比，HEVC编码技术最大的不同在于其四叉树结构。H. 264/AVC中的宏块（MB)兼具预测和变换信息；在 HEVC中，基本的编码单元是Coding Tree Unit (CTU)。CTU和MB的功能类似，但是CTU的预测信息携带单位是PU (Prediction Unit)。针对每一个⑶(Coding Unit)，可进一步划分为 4个子PU。在HEVC中，CU的大小可以是以下值：64义64、32132、16116、818。当对(^进行帧间（Inter)预测时，PU 的大小可以为 2Nx2N、2NxN、Nx2N、NxN、2NxnU、2NxnD、nLx2N、nRx2N。在这里，2Nx2N代表不进行子划分的⑶大小，2NxN代表宽度为原⑶一半的PU，2NxnU中η 的大小为四分之一，各TO的大小如图1所示；当对CU进行帧内（Intra)预测时，PU的大小可以是2Nx2N或NxN(对亮度分量，N=32、16、8、4)。相对于H. 264/AVC中最多有9种帧内预测方式（分别是垂直预测、水平预测、平均预测、左对角预测、右对角预测、垂直右对角预测、水平向下预测、垂直左对角预测和水平向上预测），HEVC的帧内预测方式最多可达35 种。当进行帧内预测时，每个PU都需要在35种预测方式中选择一种最佳模式进行预测编码。在HEVC中，采用RQT(Residual QuadTree)技术对预测产生的残差进行量化；和PU类似，HEVC采用TU(Transform Unit)对残差进行基于四叉树的量化和变换编码。对于亮度分量，TU的大小可以是32x32、16xl6、8x8和4x4 ;对于色度分量，其TU的长宽分别是对应亮度分量TU长宽的二分之一。
[0004] 和H. 264/AVC相似，HEVC采用了基于拉格朗日率失真优化策略RD0 (Rate Distortion Optimization)技术的模式选择算法，即通过遍历所有可能的模式，最后选择率失真代价最小的模式作为最佳编码模式，公式为：
[0005] J(s,c,m|QP, λ m) = D (s, c, m | QP) + λ mR(s, c, m | QP)
[0006] 式中，QP是量化参数；λ m是拉格朗日常数，与QP有关；D是原始像素块s与重建块c之间的失真；R是利用模式m进行编码后产生的比特数。
[0007] 相比于H. 264/AVC中仅仅需要对MB进行所有模式的遍历计算选择，HEVC需要分别对每一层的CU、PU和TU进行最优选择，选择出最佳单元大小和模式进行编码。因此，HEVC 中模式选择的计算复杂度是巨大的，在移动设备和实时环境下很难应用HEVC进行高效编码。这就需要快速算法来缩短编码时间以满足实际需要，同时又要在一定范围内满足视频质量的要求。
[0008] 最优停止理论可以在某个适当的点停止，从而避免遍历待编码CU的所有模式来达到缩短编码时间的目的。最优停止理论问题可以归结如下：存在一个联合分布已知的随机变量的序列和一组实值奖励函数，决策者按照顺序一个个检查这些变量，同时获得相应的奖励函数值，并且在合适的时间停止检查余下的变量，最终的目的是获得的奖励函数值最大，这样获得最好的候选变量的概率也最大。通过把各种编码模式当作上面提到的变量，并且研究各种模式相互之间的关系，最优停止理论就可以应用到模式决定的快速算法中。
[0009] Ferguson等又提出了名为持续问题的一种最优停止问题，简单叙述为：在决策的过程中，如果某个变量比其他变量的观测值更好，那么它便成为是一个Relative Best Object (RB0)。持续问题的目标是在遇到下一个RB0之前，找到一个适当的时间停止观测，同时获得观测值最大的变量。持续问题的期望值越大，表明在停止点之后遇到下一个RB0 的时间越长，同时能够节约的不必要时间也越多。换句话说，持续问题的解决方法在判定准确性和时间减少比例上能够很好地进行权衡，这点可以借鉴到视频编码的快速算法中，相对应的是既要尽可能选择到编码的最佳模式，同时又要尽量减少编码时间，这和持续问题的目的很类似。

【发明内容】

[0010] 本发明的目的就是为了克服上述现有技术存在的计算量大、编码速度慢等缺陷提供一种基于最优停止理论的高效视频快速编码方法，降低了 HEVC在预测单元模式决定部分的计算量，提高编码速度，促进其在实际中的广泛应用。
[0011] 本发明的目的可以通过以下技术方案来实现：
[0012] 一种基于最优停止理论的高效视频快速编码方法，该方法包括以下步骤：
[0013] 1)获取视频序列中的待编码帧和N个高效视频编码模式，并初始化待编码帧中每个PU的概率信息；
[0014] 2)计算当前待编码PU在每个编码模式下对应的概率pk，k = 1，2, . . .，N，并将N 个编码模式按其概率降序排列；
[0015] 3)应用最优停止理论根据步骤2)的顺序依次检查各编码模式，计算并获得最佳编码模式和最优停止点；
[0016] 4)采用得到的最佳编码模式对当前待编码PU进行编码，并根据当前最佳编码模式和最优停止点更新参数；
[0017] 5)返回步骤2)，直至当前待编码帧的所有PU全部编码完成；
[0018] 6)返回步骤1)，直至整个视频序列编码完成。
[0019] 所述的当前待编码PU在每个编码模式下对应的概率pk通过以下公式获取：
[0020]

【权利要求】
1. 一种基于最优停止理论的高效视频快速编码方法，其特征在于，该方法包括以下步骤： 1) 获取视频序列中的待编码帧和N个高效视频编码模式，并初始化待编码帧中每个PU 的概率信息； 2) 计算当前待编码PU在每个编码模式下对应的概率pk，k = 1，2, . . .，N，并将N个编码模式按其概率降序排列； 3) 应用最优停止理论根据步骤2)的顺序依次检查各编码模式，计算并获得最佳编码模式和最优停止点； 4) 采用得到的最佳编码模式对当前待编码TO进行编码，并根据当前最佳编码模式和最优停止点更新参数； 5) 返回步骤2)，直至当前待编码帧的所有PU全部编码完成； 6) 返回步骤1)，直至整个视频序列编码完成。
2. 根据权利要求1所述的一种基于最优停止理论的高效视频快速编码方法，其特征在于，所述的当前待编码PU在每个编码模式下对应的概率p k通过以下公式获取： u(Ms,r) + T rml 其中，TU(MU，k)为当前待编码PU的上方PU最佳编码模式为Mu时，当前待编码PU最佳编码模式为k的概率预测矩阵；1\ (Mp k)为当前待编码PU的左方PU最佳编码模式为吣时，当前待编码PU最佳编码模式为k的概率预测矩阵。
3. 根据权利要求2所述的一种基于最优停止理论的高效视频快速编码方法，其特征在于，所述的步骤3)具体为： 3. 1)依次检查各候选模式，在第k个模式停止检查，设在模式k后的下一个相对最佳目标为Tk,则Tk = j的概率为：取=Λ =汽美+| ；> 1，、重》 fmkU =Σρ,(ιτ-~) hPr r-i I 其中，j为自然数且j e (k，N]，Xr(r = k+l，k+2，...，j-l)表示第k+l、k+2 -直到第 j_l个模式在所有N个模式中被选为最佳模式的概率排名，P (X」=1)表示第j个模式是N 个模式中的最佳模式的概率； Tk的位置由下式得到 m) = (N + l)· P(Tk =N .pg·^ = j，屠争I =Λ+Σ^Στ^~ ?1 Μ Λ 广若E(Tk)大于设定的阈值τ，τ e [Ν，Ν+1)，则当前的第k个模式为最佳编码模式； 3. 2)计算最优停止点K# : K* = max{Ka, K0} 式中 = mk {* > 1 ； I； Λ I； > r ^ w r*3 A, = rnin{/：>l：A+i2^i?^lK J相言 Mr f r*l
4. 根据权利要求3所述的一种基于最优停止理论的高效视频快速编码方法，其特征在于，所述的更新参数是指根据当前的编码模式对各概率预测矩阵进行更新，更新公式如下： (M, k) = T(M, k) · (l-y)+pm · y 其中，T(M，k)为更新前的概率预测矩阵，Τ' (M，k)为更新后的概率预测矩阵，γ为更新参数，Pm表示在已编码PU的最佳模式为j，且满足j < K#的前提下，模式m成为最佳模式的后验概率，由以下公式计算得到： 'κ. · YdPr,m = j rm\ pm /1 ^ pm,otherwise
【文档编号】H04N19/147GK104301723SQ201310297983
【公开日】2015年1月21日申请日期:2013年7月16日优先权日:2013年7月16日
【发明者】王瀚漓, 衡岳申请人:同济大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王瀚漓;衡岳
技术所有人：同济大学
我是此专利的发明人

上一篇：一种实现无源光网络光纤故障自动告警的方法及系统的制作方法
上一篇：一种路由方法和装置制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。