一种深度视频帧级比特分配方法与流程

文档序号:12730678阅读:335来源:国知局
一种深度视频帧级比特分配方法与流程

本发明属于3D视频编码领域,尤其涉及一种深度视频帧级比特分配方法。



背景技术:

3D视频数据量大,使得视频的传输和存储面临前所未有的困难与挑战。因此,如何实现高效的3D视频压缩编码具有重要的理论研究意义和实际应用价值。视频编码中需要在信道和编码器之间建立一个缓冲区,使得编码后的码流速率与传输信道速率相匹配。码率控制可以通过不断地调节编码参数来保证缓冲区变化平稳,防止缓冲区发生溢出现象。同时,码率控制通过调整视频编码输出的码率,使输出码率与传输带宽相匹配,同时保证解码视频的质量,在视频的高效传输中起到重要的作用。为了进一步提高视频编码效率,在码率控制过程中,实现准确的比特分配过程尤为重要。比特分配的基本原理是根据目标比特数逐级地向下分配比特,包括图片组(Group of Picture,GOP)级、图片级和基本单元级(对于H.264/AVC来说是宏块,对HEVC来说是编码单元CU)。在完成比特分配之后,利用码率控制模型计算最优的编码参数,以用于编码。

多视点视频加深度(Multi-view Video Plus Depth,MVD)是最常用的3D视频格式之一。MVD视频在彩色视频的基础上,增加了反映场景深度信息的深度视频,并且能够利用深度视频和DIBR(Depth-image Based Rendering)技术绘制出不同视角的虚拟视点。因此,MVD视频相关技术逐渐受到工业界及学术界的青睐。针对MVD视频,如何合理的分配深度视频和彩色视频之间的比特关系会影响视频的编码质量。在MVD视频编码中,由于以绘制虚拟视点的失真作为最终的衡量标准,许多研究者从绘制虚拟视点的角度出发探究彩色视频和深度视频之间最优的比特分配方案。Liu[1]等人提出了一种彩色视频和深度视频之间的固定比例分配方案,并提出了视点级、彩色视频和深度视频级、图片级三个级别的比特分配方案。Yuan[2]等人推导得到彩色视频、深度视频与绘制的虚拟视点失真之间的关系,并利用拉格朗日数乘法得到彩色视频和深度视频的最优比特分配方案。Shao[3]等人建立了彩色视频码率、深度视频码率与绘制虚拟视点的失真之间的关系模型,并依据此模型探究了深度视频和彩色视频之间最优的比特分配方案。

然而这些比特分配方法都没有考虑到深度视频的统计特性,因此需要获取深度视频帧级比特分配阶段准确的图片权重,以提高比特分配阶段的准确性。



技术实现要素:

本发明提供了一种深度视频帧级比特分配方法,本发明用于获取深度视频帧级比特分配阶段合适的图片权重,以提高深度视频比特分配阶段的准确性,详见下文描述:

一种深度视频帧级比特分配方法,所述方法包括以下步骤:

对于深度视频,当GOP的目标比特分配到每一帧图片时,第一时域层的图片权重小于彩色图片的权重,多时域层的图片权重大于彩色图片的权重;

根据获取到的图片权重,设定bpp范围;获取满足预设条件的深度视频的新的图片权重,该预设条件为:位于较小bpp范围的ωk,大于位于较大bpp范围内的ωk;位于TLk图片的权重大于TLk+1的图片的权重;

根据深度视频的新的图片权重分配帧级比特。

其中,所述bpp范围具体为(0,0.05],(0.05,0.1]和(0.1,∞)。

其中,根据深度视频的新的图片权重分配帧级比特具体为:

其中,TCurPic和TGOP分别为当前图片的目标比特数和当前GOP的目标比特数;RCoded为当前GOP中已编码的图片消耗的总码率,ωk为深度视频中第k幅图片的权重,ωCurPic为当前图片的权重,NGOP为当前GOP中图片的数目,CurPic表示当前图片。

本发明提供的技术方案的有益效果是:本发明基于深度视频统计特性的观察结果,通过统计获取针对深度视频的新的图片权重,有效提升了比特分配阶段的准确性,提升了深度视频的编码效率。

附图说明

图1为“Poznan_Street”视频序列的B帧编码比特数的对比示意图;

a)为彩色视频的示意图;b)为深度视频的示意图。

图2为随机接入结构的示意图;

图3为一种深度视频帧级比特分配方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步地详细描述。

实施例1

为了克服现有技术的不足,准确地获取深度视频帧级比特分配阶段合适的图片权重,本发明实施例提出了基于编码比特分布的深度视频帧级比特分配方法,该方法包括以下步骤:

101:对于深度视频,当GOP的目标比特分配到每一帧图片时,第一时域层的图片权重小于彩色图片的权重,多时域层的图片权重大于彩色图片的权重;

102:根据获取到的图片权重,设定bpp范围;获取满足预设条件的深度视频的新的图片权重,该预设条件为:位于较小bpp范围的ωk,大于位于较大bpp范围内的ωk;位于TLk图片的权重大于TLk+1的图片的权重;

其中,bpp范围具体为(0,0.05],(0.05,0.1]和(0.1,∞)。

103:根据深度视频的新的图片权重分配帧级比特。

综上所述,本发明实施例通过上述步骤101-步骤103统计获取针对深度视频的新的图片权重,有效提升了比特分配阶段的准确性,提升了深度视频的编码效率。

实施例2

下面结合具体的计算公式、图1、图2、图3以及实例对实施例1中的方案进行进一步地介绍,详见下文描述:

201:深度视频编码的统计特性观察;

其中,深度视频是由灰度图片组成,可看作一种特殊的彩色视频,因此可以使用基于R-λ模型[4]的码率控制方法对深度视频进行编码。图1表示深度视频和彩色视频在前31个B帧的编码比特的对比情况。从图1可以看出,深度视频的统计特性与彩色视频完全不同,深度视频在TL(时域)1层消耗的编码比特远小于彩色视频的消耗,同时,深度视频中TL4层消耗的比特数占整个GOP消耗比特数的比值要远大于彩色视频中TL4层所占的比值。

基于此观察结果,对于深度视频,当一个GOP的目标比特被分配到每一帧图片时,TL1层的图片的权重应该比彩色图片的图片权重小,同样地,TL4层的图片权重应该比彩色图片的权重大。

202:图片权重的统计;

为了获得比特分配阶段合适的图片权重,本方法通过分析深度视频在通用测试条件下的编码比特流,设计了一组新的图片权重。因为位于同一TL的图片具有相同的图片权重,本方法统计了位于同一个TL的所有图片的编码比特,计算该TL的所有图片的平均编码比特值。在随机接入编码结构中,一个GOP的8帧图片如图1所示,图片l8n属于第一个时域层(TL1),这一级消耗的比特数最多;图片l8n+1、l8n+3、l8n+5和l8n+7属于第四个时域层(TL4),这一级消耗的比特数最少;依据编码比特数目,图片l8n+4属于第二时域层(TL2),图片l8n+2和图片l8n+6属于第三时域层(TL3)。有1帧图片属于TL1,1帧图片属于TL2,2帧图片属于TL3,4帧图片属于TL4。因此,一个GOP内的图片权重为:

其中,Rk表示位于TLk的图片的平均编码比特。实验中通过改变量化参数(Quantitative Parameter,QP)的值获取不同Rk,进而获取不同bpp(bit per pixel,每像素比特率)范围内的ωk。实验对10个视频序列进行了分析。由实验结果可观察到,深度视频消耗的比特数非常小,即使编码器用较小的QP编码深度视频时,bpp的值均小于0.2。

203:bpp范围的设定;

为了得到帧级比特分配阶段合适的图片权重,根据统计结果,在深度视频比特分配的图片权重中,bpp的范围设定为三个,包括(0,0.05],(0.05,0.1]和(0.1,∞)。

204:图片权重的设定;

为了简单起见,将深度视频中的平均图片权重设置成为整数,并将位于TL4的图片权重归一化成1。另外,需要保证位于较小bpp范围的ωk,大于位于较大bpp范围内的ωk;位于TLk的图片的权重应该大于TLk+1的图片的权重。依据这两个条件,深度视频的新的图片权重如表1所示。

表1 深度视频的新的ωk

205:基于深度视频图片权重的帧级比特分配。

当深度视频的图片权重设定完成后,利用新的图片权重进行深度视频的帧级比特分配。帧级比特分配的目标是将当前GOP内剩余的比特数按照图片权重分配到GOP内未编码的每一帧图片中。如下公式所示。

其中,TCurPic和TGOP表示的是当前图片的目标比特数和当前GOP的目标比特数。RCoded表示当前GOP中已编码的图片消耗的总的码率,ωk是深度视频中第k幅图片的权重,由表1获取,ωCurPic表示当前图片的权重,NGOP表示的是当前GOP中图片的数目,在随机接入编码结构下通常设置为8;CurPic表示当前图片。

综上所述,本发明实施例通过上述步骤201-步骤205统计获取针对深度视频的新的图片权重,有效提升了比特分配阶段的准确性,提升了深度视频的编码效率。

参考文献

[1]Liu Y,Huang Q,Ma S,et al.A novel rate control technique for multiview video plus depth based 3D video coding[J].IEEE Transactions on Broadcasting,2011,57(2):562-571.

[2]Yuan H,Chang Y,Huo J,et al.Model-based joint bit allocation between texture videos and depth maps for 3-D video coding[J].IEEE Transactions on Circuits and Systems for Video Technology,2011,21(4):485-497.

[3]Shao F,Jiang G,Yu M,et al.View synthesis distortion model optimization for bit allocation in three-dimensional video coding[J].Opt Eng,2011,50(12):120502-1-120502-3.

[4]Li B,Li H,Li L,and Zhang J.λdomain rate control algorithm for high efficiency video coding.IEEE Transactions on Image Processing[J],2014,23(9):3841-3854.

本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1