减小量化噪音的方法

文档序号:2829228阅读:1656来源:国知局
专利名称:减小量化噪音的方法
技术领域
本发明涉及减小量化噪音的方法;例如,本发明特别涉及减小在多个信号量化级以串行布置连接在一起时引起的串接(tandem)量化噪音的方法。并且,本发明还涉及能够执行前述方法的设备。另外,本发明涉及通过执行该方法产生的量化输出数据。
背景技术
当量化器以串行布置连接时,发生串接编码假象。当例如译码多媒体信号时遭遇这样的编码假象,其中这些假象的主要部分称为“串接量化噪音”。
在图1中,示出了当前的音乐传递系统,其整体指示为10。该系统10包括数据存储装置20,其用于提供脉冲编码调制(PCM)的程序内容数据x,该数据用100来标示。另外,该系统还包括标示为30的第一量化编码器EN1(Q1),该编码器能够提供编码数据xb1,该数据标示为110。系统10包括标示为40的中间数据存储装置AAC,用来存储依照当前的AAC压缩标准压缩的数据。另外,系统10包括标示为50的解码器DEC1,其用于产生标示为120的解码数据x1。该系统10还包括标示为60的水印嵌入器WATMKEMB。最后,系统10包括标示为70的第二量化编码器EN2(Q2),其用于产生编码的输出比特流xb2,该输出比特流标示为130。
在操作中,数据存储装置20输出内容数据x100给编码器EN1(Q1)30,该编码器量化和编码数据x 100,以生成对应的编码数据xb1110,该编码数据存储在中间数据存储装置40中。响应于来自用户的对音乐的请求,该系统10能够指导中间存储装置AAC 40来输出存储的对应编码数据作为比特流给解码器DEC1 50。该解码器DEC1 50部分解码该比特流来产生数据x1120,该数据x1随后输入水印嵌入器WATMKEMB 60,该水印嵌入器输出对应的水印内容数据给第二量化编码器EN2(Q2)70。该编码器EN2(Q2)70处理从水印嵌入器WATMKEMB 60接收的数据,以生成编码的输出比特流xb2130提供给用户。
前述的系统10的操作涉及部分解码编码数据之后接着重新编码,其一个缺点是在输出比特流xb2130中引入了串接假象。这些假象是由级联两个或更多音频压缩算法,即当使用软件实施时级联编码器30,70而导致的误差。该串接假象,也称为串接误差,参考图2更容易理解,其中以200、210指示的两个图分别对应于编码器30、70。图200、210分别包括横坐标轴250、270和量化坐标轴260、280。另外,在该例子中,编码器30、70分别能够采用字长w1=3比特和w2=2比特。对于这些示例字长,系统10在产生输出数据xb2130时能够自动译码到较低比特率。
因而,由数据x 100表示的输入信号在第一编码器EN1(Q1)30中进行处理以生成编码数据Xb1110之后,被定义为x∈
。该编码数据xb1110可以,例如,直接(没有加水印)在第二编码器EN2(Q2)70中进一步编码来生成由公式1(Eq.1)定义的输出比特流y12y12=Q2(1(x))Eq.1对此输出比特流,N个样本的相关的平均量化误差e12由公式2(Eq.2)给定e12=1NΣ|y12-x|]]>Eq.2在比较中,通过处理数据x直接通过第二编码器EN2(Q2)60所产生的误差由公式3(Eq.3)给定,其中y2=Q2(x)e2=1NΣ|y2-x|]]>Eq.3一般来说,y2的量化误差小于y12的量化误差,即e2<e12。并且,y12和y2的量化误差之间的差对应于前述的串接误差et,即根据公式4(Eq.4)e1=e12-e2Eq.4重新参考图2,在系统10中,在图200的交叉阴影线区域中产生串接误差,例如在交叉阴影线区域290,即x∈
x∈[2.5,3] x∈[4.5,5]x∈[6.5,7]例如,通过第一编码器EN1(Q1)首先将具有幅度2.75的信号x量化为幅度3,即3=Q1(2.75),并且随后在第二编码器EN2(Q2)中量化为幅度4,即4=Q2(Q1(2.75))。得到的量化误差是4-2.75=1.25。比较看来,只使用第二编码器EN2(Q2)产生相当小的量化误差,即Q2(2.75)-2.75=0.75。
对应于串接噪音的量化误差的增长通常被认为是与译码相关的问题。除了减小信号的信噪比,串接噪音还能够模糊更精细的信号特征,例如,包括在音频信号中的音频水印信息。
当前技术中已经提出对串接噪音问题的至少部分解决方案。第一解决方案通过级联两个量化编码器,即第一编码器后顺序跟随第二编码器,来减小量化噪音。该第一编码器被安排采用明显高于第二编码器的比特率。从图2可以理解这样的减小,其中具有高比特率的编码器对应于具有较大字长和相关的较高分辨率的量化器,即增加编码器30的分辨率。尽管该方法是有效的,但是它具有如下缺点,即在中间数据存储装置AAC 40所需的用于xb1110的存储空间增加到比必须的要高。还已知其它技术,其中可以使用模型化技术来预测串接噪音并且应用该预测结果以至少部分补偿串接噪音从而减小它。
在公开的欧洲专利申请no.EP 1 359 762中,描述了一种在若干不同的量化级别编码和解码输入数据的编码器/解码器系统和方法。该不同的量化级别允许信噪比(SNR)保持稳定。该系统包括若干量化器单元,其中每个量化器单元操作用于在对应的量化级别量化输入数据。另外,每个量化器能够应用一量化函数。在该系统中,为了实现最优的SNR稳定性,该量化器单元以特定处理的顺序排列,以使预测误差的平均方差最小化,并且量化预测误差能够完美重构。
因而,发明人关注的是设计减少级联的量化器中的串接量化误差的方法的技术问题。
本发明的目标是提供减小级联的量化器或级联的量化编码器中的串接量化误差的方法。
依照本发明的第一方面,提供了减小在包括串行连接的多个量化设备的系统中的串接量化噪音的方法,该方法包括步骤(a)分析该系统的操作以确定串接噪音误差所发生的信号区域;并且(b)修改该系统中一个或多个具有后向校正的较前的量化设备,以减小从所述确定的信号区域引起的串接噪音,所述一个或多个较前的量化设备不包括该系统的串行的最后一个量化设备。
在该方法中,本发明的优点是能够减小在级联的量化配置中的串接量化噪音。
可选择地,该方法包括安排该系统处理通过该串量化设备的信号的另一步骤,所述信号包括音频信号、视频信号、图像信号、文本方位(bearing)信号中的一个和多个。该方法的优势在于能够应用到广泛的不同类型的信号。
可选地,该方法包括安排所述多个量化设备来实施压缩算法以压缩由所述量化设备处理过的数据的步骤。更具体的,所述压缩算法包括以下算法至少之一MPEG压缩算法,AAC压缩和MP3压缩。这样的压缩算法能够减小数据存储要求。
可选择地,该方法包括向通过所述多个量化设备处理的数据中添加水印数据的另一步骤。该方法的优势在于,能够结合水印数据内容使用,其中由该方法提供的减小的串接量化噪音至少部分防止了这样的串接噪音模糊添加的精细的水印数据的问题。
可选择地,该方法结合多媒体信号分发系统的实施来应用。然后,该方法的优点在于提高了通过这样的分发系统传递给用户的程序内容的质量。
可选择地,在该方法中,串行连接的多个量化设备中的最后一个量化设备也被修改以减小该系统内出现的串接噪音。
依照本发明的第二方面,提供使用依照本发明的第一方面的方法产生的量化的输出数据,所述数据能够通过传输网络和/或数据载体传送。
依照本发明的第三方面,提供处理输入信号以产生相应的编码输出信号的设备,其中所述设备在操作中配置用于减小其中发生的串接量化噪音,其通过以下操作(a)分析该设备以确定串接噪音误差所发生的信号区域;并且(b)修改该设备中一个或多个具有后向校正的较前的量化设备,以减小从所述确定的信号区域引起的串接噪音,所述一个或多个较前的量化设备不包括该设备中串行的最后一个量化设备。
依照本发明的第四方面,提供一种处理输入信号以产生相应的编码输出信号的系统,所述系统包括多个串行连接的量化设备,其中所述系统在操作中配置用于减小其中发生的串接量化噪音,其通过以下操作(a)分析该系统以确定串接噪音误差所发生的信号区域;并且(b)修改该系统中一个或多个具有后向校正的较前的量化设备,以减小从所述确定的信号区域引起的串接噪音,所述一个或多个较前的量化设备不包括该系统中串行的最后一个量化设备。
可选择地,该系统能够处理通过该串量化设备的信号,所述信号包括音频信号、视频信号、图像信号、文本方位(bearing)信号中的一个和多个。
可选地,该系统被安排使得所述多个量化设备能够实施压缩算法以压缩由所述量化设备处理过的数据。更具体的,所述压缩算法包括以下算法至少之一MPEG压缩算法,AAC压缩和MP3压缩。
可选择地,该系统能够向通过所述多个量化设备处理的数据中添加水印数据。
可选择地,该系统被安排用于实现多媒体信号分发系统。
可以理解,能设想本发明的特征包含在任何组合中而不偏离本发明的范围。


现在将结合下面附图,作为例子描述本发明的实施例,其中图1是已知的应用级联的量化编码器的程序内容分发系统的示意图,其中所述编码器在操作中展现出串接量化噪音;图2是在图1的系统中采用的两个示例编码器的量化步骤的表示,所述编码器是潜在的产生串接量化噪音的区域;图3是本发明的实施例,即能够基本没有串接噪音的双量化器的表示;图4是示出图3的实施例在第一量化编码器的字长(w1)和串接噪音(et)之间的折衷的图。
图5是示出在第一量化编码器的字长(w1)和比率et/eq2之间的折衷的图,其中eq2是第二量化编码器的量化噪音。
为了解决在用于分发程序内容数据的系统中应用级联的量化编码器时产生的串接量化噪音问题,所述数据属于音频和/或视频程序对象主题,发明人已经设计出一种称为“无串接噪音(tandem noise free)”(TNF)的量化器。这样的量化器能够应用在,例如图1所示的当前系统10中。
图3示出一个实施例,其结构整体表示为300,其中连接的两个量化器Q’1和Q2分别由350,370指示。该结构300优选配置有类似于图1的水印嵌入器WATMKEMB 60的水印嵌入器(未示出)。另外,该结构300可选地能够实施数据压缩算法,该算法包括MPEG压缩算法,AAC压缩和MP3压缩。
在结构300中,量化器350,370例如是用于分发程序内容数据的信号处理链的一部分,例如,类似于图1所示的用于多媒体目的的系统10。可选地,在量化器350,370之间插入,例如,数据存储装置。若不是第一量化器能够也在相反方向量化以340标示的输入信号x,以减小在该第一量化器350的操作中引起的串接量化噪音,该量化器350,370容易以类似于图2所示方式展现出串接量化噪音,下文将对此详述。
在图3中,对于具有前述的相反操作方向的一组两个量化器350,370,由380标示的输出Q2(Q’1(x)),与经过第二量化器370处理的输入信号x 340相同,如公式5所描述(Eq.5)Q2(Q′1(x))=Q2(x)Eq.5换句话说,该结构300在处理信号x340以生成输出380的过程中产生的整个串接噪音偏差对应于由第二量化器370产生的偏差。
为了示出这样的原理,再次参考图2。该输入信号x 340是,例如,x=2.75。在示例的当前系统10中,x 340的该值将会量化到4,产生误差1.25。与系统10不同,该结构300产生的输出380假定值Q’1(2.75)=2,之后是由第二量化器370获得Q2(2)=2,作为输出380。如果直接应用第二量化器370来处理信号x 340以产生输出380,即Q2(2.75)=Q2(2)=2,则得到类似结果。在图3中,量化器350配备有控制单元DTRD Q,1,其标示为330,以支持前述的与第一量化器相关的反向函数。“DTRD”是“导出串接区域和设计Q’1”的缩写,其表示第一量化器350的变换特性被修改,以预计在结构300中产生期望的串接噪音。
在更广泛意义上,可以分别分析与输出字长w1,w2相关的一组两个线性量化器的Q1,Q2行为。假定信号x340在0为最小xmax为最大的范围内,即x∈
,由公式6给出两个量化器350,370的量化步骤聚ΔQΔQ=(xmax+1)*2-wEq.6该区域的标号,例如图2中的区域290,标示为Nt,其中可能产生的串接量化偏差可以根据公式7计算N1=2w2Eq.7发明人已经认识到每个区域的平均串接误差,即eR只受到第一量化器350影响,如公式8所示eR=ΔQ12]]>Eq.8因而,对于使得x∈
的平均分布的信号x 340,在结构300中处理的每个信号样本的平均串接误差由公式9给定et=eR·Ntxmax*eR=(xmax+1)2xmax*2(w2-2w1-2)]]>Eq.9其中w2<w1。
例如,在w1=3,w2=2,xmax=7的情况下,在信号x 340的每个输入样本中发生的平均串接误差et=1/7。在图4中,该平均串接误差et由400标示。图400包括表示字长w1的横坐标410,和表示前述平均误差et的纵坐标轴420。箭头430表示,当字长w2从1增加到8时,平均误差et的趋势。
发明人已经认识到通过在结构300中相对于总的量化误差研究串接噪音误差,能有利的估计串接噪音误差。如其所述,当控制第一量化器350展现出最小的串接噪音,在结构300中引起的总的量化误差可以假定从第二量化器370引起。在这种情况下,在信号x 340中的每个输入值的平均误差eq2由公式10给出eq2=ΔQ24=(xmax+1)*2-(w2+2)]]>Eq.10在图5中,在标示为500的图中示出了总误差et和该误差eq2的曲线图。图500包括表示第一量化器350的字长的横坐标轴510,和表示前述的误差et和eq2的比率的纵坐标轴520。根据图2,发明人已经发现量化噪音的相对能量是第一和第二量化器350,370的字长w1和w2的差的函数,由箭头530表示。特别地,对于给定的常数β,串接能量et相对于量化噪音eq2的关系由公式11给出eteq2=β*2-2(w1-w2)]]>Eq.11从公式9和10,发现常数β具有数值β=2。随着字长w2接近w1,可辨别相对能量从纵坐标轴520增长。例如,当w2=w1-1,串接噪音et是量化噪音eq2的大约50%。另一个例子,当w2=w1-2,串接噪音et是量化噪音eq2的大约12.5%。
图3所示的结构300可以在图1所示的系统10中使用。在依照本发明修改的系统10中,音频信号在系统10中从128k字节每秒转换到64k字节每秒。例如,在44.1kHz的例子中,这样的转换对应于从3比特/样本到1.5比特/每样本。如果量化编码器30,70采用线性量化器,则相对串接噪音能量变为总量化噪音et的25%。这样,在系统10中引起的总的编码噪音可以减少25%。
从上述可以理解,系统10可以依照本发明修改,使得尽管有两个级联的量化编码器30,70,串接噪音仍可以充分减少,从而改善输出xb2130的质量。或者,对于给定的音频质量,本发明能够减少在数据存储装置AAC40中用于存储编码比特流xb1110的存储空间。
应理解,本发明的前述实施例能够在不偏离随附权利要求定义的范围的前提下进行修改。
在随附的权利要求中,括号中包括的标号和任何符号是为了帮助理解权利要求,而不是以任何方式限制权利要求的范围。
诸如“包括”、“包含”、“结合”、“具有”、“是”“有”等表达在说明书和权利要求中应该理解为非限制模式,即允许没有明确定义的其它项目或部件存在。对单数的引用也可以理解为对复数的引用,反之亦然。
权利要求
1.一种减小系统(10;300)中的串接量化噪音的方法,该系统包括多个串行连接的量化设备(30,70;350,370),该方法包括步骤(a)分析该系统(10;300)的操作以确定串接噪音误差所发生的信号区域(290);并且(b)修改该系统(10;300)中一个或多个具有后向校正的较前的量化设备(30;350),以减小从所述确定的信号区域引起的串接噪音,所述一个或多个较前的量化设备(30;350)不包括该系统(10;300)的串行的最后一个量化设备(70;370)。
2.如权利要求1所述的方法,所述方法包括安排该系统(10;300)处理通过该串量化设备(30,70;350,370)的信号的另一步骤,所述信号包括音频信号、视频信号、图像信号、文本方位信号中的一个和多个。
3.如权利要求1或2所述的方法,该方法安排所述多个量化设备(30,70;350,370)来实施压缩算法以压缩由所述量化设备(30,70;350,370)处理过的数据的步骤。
4.如权利要求3所述的方法,所述压缩算法包括以下算法至少之一MPEG压缩算法,AAC压缩和MP3压缩。
5.如权利要求1所述的方法,所述方法包括在通过所述多个量化设备处理的数据中添加水印数据的另一步骤。
6.如权利要求1所述的方法,所述方法结合实施多媒体信号分发系统(10;300)来应用。
7.如权利要求1所述的方法,其中也修改串联的所述多个量化设备中的最后一个量化器,以减小在该系统中引起的串接噪音。
8.使用如权利要求1所述的方法产生的量化的输出数据,所述数据可以通过通信网络和/或数据载体传送。
9.一种用于处理输入信号(340)以产生相应的编码输出信号(380)的设备(300),所述设备包括串行连接的多个量化设备(350,370),其中所述设备(300)在操作中通过以下操作减小其中引起的串接量化噪音(a)分析该设备的操作以确定串接噪音误差所发生的信号区域(290);并且(b)修改该设备中一个或多个具有后向校正的较前的量化设备(350),以减小从所述确定的信号区域引起的串接噪音,所述一个或多个较前的量化设备(350)不包括该设备的串行的最后一个量化设备(370)。
10.一种用于处理输入信号(340)以产生相应的编码输出信号(380)的系统,所述系统包括串行连接的多个量化设备(350,370),其中所述系统在操作中通过以下操作减小其中引起的串接量化噪音(a)分析该系统的操作以确定串接噪音误差所发生的信号区域(290);和(b)修改该系统中一个或多个具有后向校正的较前的量化设备(350),以减小从所述确定的信号区域引起的串接噪音,所述一个或多个较前的量化设备(350)不包括该系统(300)中的串行的最后一个量化设备(370)。
11.如权利要求10所述的系统,其中所述系统(300)能够处理通过该串量化设备(50,370)的信号,所述信号包括音频信号、视频信号、图像信号、文本方位信号中的一个和多个。
12.如权利要求10所述的系统,所述系统(300)被安排使得所述多个量化设备(350,370)能够实施压缩算法以压缩由所述量化设备(350,370)处理过的数据。
13.如权利要求12所述的系统,其中所述压缩算法包括以下算法至少之一MPEG压缩算法,AAC压缩和MP3压缩。
14.如权利要求10所述的系统(300),其中所述系统能够在通过所述多个量化设备处理的数据中添加水印数据。
15.如权利要求10所述的系统(300),其中所述系统(300)被安排用于实施多媒体数据分发系统(300)。
全文摘要
描述了一种用于处理输入信号(340)以产生相应的编码输出信号(380)的系统(10;300)。所述系统(10;300)包括串行连接的多个量化设备(30,70;350,370),其中所述系统在操作中通过以下操作减小其中引起的串接量化噪音(a)分析该系统(10;300)的操作以确定串接噪音误差所发生的信号区域(290);和(b)修改该系统(10;300)中一个或多个具有后向校正的较前的量化设备(30,350),以减小从所述确定的信号区域(290)引起的串接噪音,所述一个或多个较前的量化设备(30,350)不包括该系统(10,300)中的串行的最后一个量化设备(70,370)。
文档编号G10L19/16GK101073272SQ200580036091
公开日2007年11月14日 申请日期2005年10月14日 优先权日2004年10月20日
发明者M·范德维恩, A·N·莱马 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1