用于Laplace-Makov源的约束熵的标量量化器的制作方法

文档序号:7854803阅读:362来源:国知局
专利名称:用于Laplace-Makov源的约束熵的标量量化器的制作方法
技术领域
本发明一般涉及可缩放(scalable)视频编码器,尤其是涉及一种结合有最优设计的系统和方法,用于约束熵的标量量化器(entropyconstrained scalar quantizer)(ECSQ),该量化器用于Laplace-Makov源模型。
由于使用压缩视频和数据信号的系统的持续普及,所以改进的压缩性能仍然是急待解决的问题。不同的压缩标准,包括MPEG-4(运动图象专家组)和H.263视频压缩,提供给包括基础层(base layer)和增强层(enhancement layer)编码的不同机构,来提高压缩效率。
一个具体的问题包括要求可缩放位流的应用,这对于许多编码和传输系统来说是通用的要求。许多应用,包括通过因特网的多方电视会议和多点传输,要求压缩信息通过不同的通信链路同时传送到多个接收端。可缩放位流允许以多种比特率(和相应的品质标准)进行解码,其中低速率信息流以最小化冗余的方式嵌入到高速率信息流中。不幸的是,完成这种系统所必需的可缩放性通常对整体的压缩效率有负面的影响。
最近,提出了一种新的高效可缩放视频编码算法,其中使用估算理论逼近能够增加编码效率。这种逼近在所有的速率上的工作性能优于现有的信噪比(SNR)可缩放视频编码器。在这种算法中,离散余弦变换(DCT)系数的演算模拟为Laplace-Makov过程,并且能够执行在当前技术水平的编码器上,这些编码器最佳地结合了基础层和增强层的量化器信息。不同于常用的可缩放视频编码器,当前技术水平的编码器使用来自于基础层和增强层的DCT系数的信息,以在估计理论(ET)框架中最优化的预测和再现(reconstruct)。由于量化器信息影响系统的失真和比特率,所以对量化器信息进行的更强控制潜在的导致了更好的性能。在2001年7月IEEE Trans.on Image Processing,Vol.10,No.7965中Kenneth Rose和Shankar L.Regunathan的文章“Toward Optimality in Scalable Predictive coding”中描述了这样一种方法,该篇文章在此引用作为参考。
虽然近来的当前技术水平的编码器使用了上述算法,清楚地表明了优于现有技术的可缩放视频编码器的优点,但是它们不能够进行量化器设计。更确切的说,这些系统目前使用一种具有“死区(deadzone)”的通用统一阈值量化器(UTQ)。(参见1996年9月IEEE Trans.on Information Theory,Vol.42,No.5,pp.1365-1374中G.Sullivan的文章“Efficient scalar quantization ofexponential and Laplacian random variables”,该篇文章在此引用作为参考。)由于这种类型的量化器不能为Laplace-Makov源模型而设计,所以可以导致编码效率的损失。因此,没有最优的编码器设计,使用Laplace-Makov源模型的编码器将不能提供最佳的合理性能。
本发明通过提供一种改进的编码器,来解决至少一个上述问题,该编码器结合了一导出的、计算最优的约束熵的标量量化器(ECSQ)的显示公式,该公式适合DCT系数的Laplace-Makov模型。
在第一方面中,本发明提供了一种可缩放视频编码系统,其中离散余弦变换(DCT)系数的演算(evolution)模拟为Laplace-Makov过程,该系统包括基础层处理系统,用于引起基础层再现;增强层处理系统,用于引起增强层再现;和约束熵的标量量化器(ECSQ)系统,该系统由适合DCT系数的Laplace-Makov模型的显示公式得出。
具体的,该可缩放视频编码系统使用一种ECSQ,该ECSQ包括具有死区尺寸的统一阈值量化器,死区尺寸由下列公式限定Γ(α,t*)=2(11-ρ2et*-1),]]>其中t*表示最优死区尺寸;ρ是在-1到1之间的一个值,α是步长,并且其中Γ(α,β)=(eα-1)exp{-α[d(α-δ(α))-d(-β)d(α-δ(α))-d(-δ(α))]}.]]>在第二方面中,本发明提供了一种程序产品,存储在可缩放编码器中使用的可读介质中,其中离散余弦变换(DCT)系数的演变模拟为Laplace-Makov过程,该程序产品包括用于引起基础层重建的装置;用于引起增强层重建的装置;和量化器装置,量化器装置由适合DCT系数的Laplace-Makov模型的显示公式得出。
在第三方面中,本发明提供了一种可缩放编码方法,其中离散余弦变换(DCT)系数的演算模拟为Laplace-Makov过程,该方法包括引起基础层再现;引起增强层再现;并且使用约束熵的标量量化器(ECSQ)处理(descritizing)一个在输入帧和估计理论(ET)预测输出之间的预测残留,该量化器由适合DCT系数的Laplace-Makov模型的显示公式得出。
参照附图,通过以下对本发明的各个方面的详细描述,将容易理解本发明的这些和其它特征。


图1根据本发明描述了一个当前技术水平的编码器,包括最优的约束熵的标量量化器(ECSQ);图2描述了对于Laplace源的ECSQ;图3描述了一张图,表示对于拉普拉斯算子(Laplacian)分布的最优死区标定因数;图4描述了一张图,表示对于Makov-Laplace源的最优死区标定因数。
本发明提供一种最优的约束熵的标量量化器(ECSQ),该量化器由适应DCT系数的Laplace-Makov模型的显示公式得出。该最优的ECSQ能够容易的结合到当前技术水平的编码器中,以提供一个更为有效的系统,来压缩可缩放视频。为了这个示例性实施例的目的,“当前技术水平的编码器”是使用来自于基础层和增强层的DCT系数的信息以在估计理论(ET)框架中最优化的预测和再现的一个编码器。如下所示,根据这个示例性实施例,最优的ECSQ包括具有较大死区尺寸的简单UTQ。
首先参照图1,示出了本发明改进的当前技术水平的可缩放视频编码器10,其中使用ECSQ块12替换了简单的量化器块。在引擎1中,BB表示基础位,EB表示增强位。编码器12接收原始帧14做为输入,并且输出基础再现16和增强再现18。如上所述,当前技术水平的可缩放视频编码器10使用来自于基础层和增强层的DCT系数的信息,以在估计理论(ET)框架中最优化地预测和再现。通过结合ECSQ块12,该块使用最优的ECSQ来处理(descritize)预测余量残留20,编码器10提供了一种更为有效的系统,用于压缩可缩放视频。
在当前技术水平的可缩放视频编码器中,通过一阶Markov过程模拟时序(从帧到帧)的DCT系数的演变xi,n=ρxi,n-1+zi,n,(1)其中xi,n是在帧n中的第i个DCT系数和xi,n-1是在前一帧中的DCT系数,xi,n-1通过运动位移补偿映射出xi,n,zi,n表示独立修正生成过程,ρ是绝对值小于1的AR系数。此外,如果假定DCT系数xi,n和xi,n-1是具有2μ2方差的Laplace算子,那么修正过程zi,n的密度给出如下p(z)=ρ2δ(z)+(1-ρ2)21μexp{-|z|/μ}---(2)]]>假设我们有 (xi,n-1的估计值),那么在编码器的残留信号给出如下ri,n=xi,n-ρx~i,n=ρ(xi,n-1-x~i,n-1)+zi,n---(3)]]>从而,残留信号ri,n的概率密度函数再次由等式(2)给出,位移(shift)ρ(xi,n-1-x~i,n-1)]]>的量。
现在,编码器在等式(3)中量化了残留ri,n,并且传输它的解析指数(index)。在高比特率的情况下,xi,n-1-x~i,n-1≅0,]]>从而残留ri,n在分布上收敛于zi,n。因此,为了在速率限制的情况下提供最好的视频质量,量化器应当设计成与等式(2)中的分布相匹配,这里称作“约束熵的标量量化器”(ECSQ)。
最优的ECSQ已经广泛地用于对Laplace源的研究。已经表明,具有有限定阶的、最优的ECSQ是如图2所示的、具有死区的统一阈值量化器(UTQ)。由图2可以看出,连续的源分隔成多个区域,包括步长为α的一系列步长和具有t*尺寸的死区或零区域(zero bin)。在每个间隔中的样本量化到点22、24、26、28、30。表示为t*的死区定义了量化为零的曲线部分。
能够从下面公式中计算得出优选的死区尺寸Γ(α,t*)=2(11-ρ2et*-1)---(4)]]>其中Γ(α,β)=(eα-1)exp{-α[d(α-δ(α))-d(-β)d(α-δ(α))-d(-δ(α))]}---(5)]]>和d(·)表示失真测量,和δ(α)是最优再现点。
来自等式(2)的分布与图2中的Laplace算子源之间的主要区别在于,存在德耳塔函数δ(z)和等式(2)中具有AR系数的两项的标定。由于该区别,具有等式(4)和(5)的图2中的UTQ,对于公式(2)(除了ρ=0的情况)不是最优的约束熵的量化器。
根据本发明,对于等式(2)中的分布已经成功的得出了最优ECSQ。具体的,最优的ECSQ始终是一个简单的UTQ,但具有由下面等式给出的死区尺寸Γ(α,t*)=2(11-ρ2et*-1)---(6)]]>注意ρ=0时,等式(6)化简为等式(4)。
对于Laplace算子源,用于均方误差失真测量的最优死区标定因数在图3中示出。在这种情况下,最优零区域尺寸t*与α-δ(α)的比值通常小于或等于1,对于低比特率和高比特率来说都接近1。
然而,如图4所示,对于等式(2)中的Markov-Laplace源,死区标定因数变大为ρ→1并且大于一(unity)。因此,最优的ECSQ应当是具有较宽死区的UTQ,该死区比Laplace算子源所要求的死区宽。此外,由于最优ECSQ是UTQ,所以通过使用具有最小复杂程度的简单查阅表和/或算术运算就能够容易的执行。更为具体的,对于不同的量化器αααα步长α,使用等式(6)能够预先计算出最优死区尺寸t*,并将其存储为查阅表,随后在量化器和逆量化器中使用。也就是,能够结合等式(5)和(6)根据α求出t*。
2(11-ρ2et*-1)=(eα-1)exp{-α[d(α-δ(α))-d(t*)d(α-δ(α))-d(-δ(α))]}]]>应当理解,虽然这个示例性实施例是在视频应用的环境中描述的,但是ECSQ设计能够应用到任一使用Laplace-Markov源模型的应用中。例如,由于音频信号的分布通常与Laplace-Markov源一致,所以能够使用该ECSQ来量化音频信号。
还应当理解,这里所说的系统、功能、机构、方法和模块能够在硬件、软件及硬件和软件的组合中执行。它们可以由任一类型的计算机系统或适于执行这里所述方法的其它装置执行。一个典型的硬件和软件的组合能够是带有计算机程序的通用计算机系统,当加载和执行计算机程序时,计算机程序控制计算机系统,这样来执行这里所述的方法。可选择的,能够使用特殊用途的计算机,该计算机包括专门的硬件,用于执行一个或多个本发明的功能任务。本发明还能够绑定到计算机程序产品中,包括有执行这里所述的方法和功能的所有特征,当该计算机程序产品载入到计算机系统中时,能够执行这些方法和功能。计算机程序、软件程序、程序、程序产品、或软件在当前环境中意味着任一语言、代码或符号形式的一组指令的任一表示,该组指令试图使具有信息处理能力的系统直接执行特定的功能,或在下述一个或两个过程之后执行特定的功能(a)转化为另一语言、代码或符号;和/或(b)以不同的物质形式再现。
本发明优选实施例的上述描述的提出是以说明和叙述为目的的。它们不是穷举的或试图限制本发明披露的更详细的结构,显然根据具上述教导,许多修改和变化是可能的。这些修改和变化对所属领域技术人员来说是显而易见的,并包括在所附权利要求所限定的本发明范围内。
权利要求
1.一种可缩放视频编码系统(10),其中离散余弦变换(DCT)系数的演算模拟为Laplace-Makov过程,该系统包括基础层处理系统,用于引起基础层再现(16);增强层处理系统,用于引起增强层再现(18);和约束熵的标量量化器(ECSQ)系统(12),由适合DCT系数的Laplace-Makov模型的显示公式得出所述系统(12)。
2.权利要求1的可缩放视频编码系统(10),其中该ECSQ系统使用一种ECSQ,该ECSQ包括具有死区尺寸的统一阈值量化器,该死区尺寸由下列公式限定Γ(α,t*)=2(11-ρ2et*-1),]]>其中t*表示最优死区尺寸;ρ是在-1到1之间的一个值,α是步长,并且其中Γ(α,β)=(eα-1)exp{-α[d(α-δ(α))-d(-β)d(α-δ(α))-d(-δ(α))]}.]]>
3.权利要求2的可缩放视频编码系统(10),其中该ECSQ做为查阅表来执行。
4.权利要求2的可缩放视频编码系统(10),其中该ECSQ做为数学公式来执行。
5.权利要求1的可缩放视频编码系统(10),其中ECSQ系统处理(descritize)一个在输入帧(14)和估计理论(ET)预测输出之间的预测残留
6.一种程序产品,存储在可缩放编码器中使用的可读介质中,其中离散余弦变换(DCT)系数的演算模拟为Laplace-Makov过程,该程序产品包括用于引起基础层再现(16)的装置;用于引起增强层再现(18)的装置;和量化器装置,由适合DCT系数的Laplace-Makov模型的显示公式得出该量化器装置。
7.一种可缩放译码方法,其中离散余弦变换(DCT)系数的演算模拟为Laplace-Makov过程,该方法包括引起基础层再现;引起增强层再现;并且使用约束熵的标量量化器(ECSQ)(12)处理(descritizing)一个在输入帧和估计理论(ET)预测输出之间的预测残留,该量化器由适合DCT系数的Laplace-Makov模型的显示公式得出。
8.权利要求7的方法,其中ECSQ(12)包括具有死区尺寸的统一阈值量化器,该死区尺寸由下列等式限定Γ(α,t*)=2(11-ρ2et*-1),]]>其中t*表示最优死区尺寸;ρ是在-1到1之间的一个值,α是步长,并且这里Γ(α,β)=(eα-1)exp{-α[d(α-δ(α))-d(-β)d(α-δ(α))-d(-δ(α))]}.]]>
9.权利要求8的方法,包括进一步为死区尺寸预先计算的多个值的步骤。
全文摘要
一种用于对输入帧编码的视频编码系统和方法,其中离散余弦变换(DCT)系数的演算模拟为“Laplace-Makov过程,该系统包括基础层处理系统,用于引起基础层再现(16);增强层处理系统,用于引起增强层再现(18);和约束熵的标量量化器(ECSQ)系统,用于处理(descritizing)一个在输入帧和估计理论(ET)预测输出之间的预测残留;其中ECSQ系统使用包括具有死区尺寸的统一阈值量化器的ECSQ,该死区尺寸由等式(公式I)限定,其中(公式II)如上。
文档编号H04N7/26GK1656820SQ03812203
公开日2005年8月17日 申请日期2003年6月4日 优先权日2002年5月29日
发明者J·C·叶, Y·陈 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1