音频编码的制作方法

文档序号:2828990阅读:339来源:国知局
专利名称:音频编码的制作方法
技术领域
本发明涉及宽带信号特别是音频信号的编码和解码。
当传送宽带信号,例如,诸如语音的音频信号时,使用压缩或编码技术减小信号的带宽或比特率。
WO 01/69593公开了一种参量编码方案,特别是一种正弦编码器,其中输入音频信号被分割成数个(可能重叠的)时间段或帧,典型地每个时间段或帧持续时间为20ms。各个段被分解成暂态(transient)、正弦且随机的分量。还可能得到输入音频信号的其它分量,例如调和线丛(harmonic complex),尽管这些与本发明的目的没有关联。
在该编码器中,完成按序分析。首先,探测并合成暂态。从音频信号中减去这些合成的暂态。对残留信号执行正弦分析,并从残留信号中减去该合成信号,产生第二残留。该第二残留随后可以作为编码器内其它模块例如噪声模块的输入信号。为了产生第二残留,在正弦合成中使用了在暂态位置的修正开窗。
一旦评估某段的正弦信息,则初始化跟踪算法。这种算法使用代价函数以基于段至段地将不同段内的正弦信号相互链接,从而获得所谓的轨迹。该跟踪算法于是导致包含正弦轨迹的正弦代码,该正弦轨迹开始于特定时间,在多个时间段上的特定持续时间长度内进化,然后停止。
在这种正弦编码中,通常传输形成于编码器内的轨迹的频率信息。可以以简单的方式且相对低成本地实现该传输,因为这些轨迹只具有缓慢变化的频率。因此使用时间微分编码可以有效地传输频率信息。通常,也可以对振幅进行对时间微分的编码。
在正弦音频编码器中,对音频信号进行分析,并对多个分量进行识别和隔离,特别是正弦信号。通过重叠相加程序合成这些正弦信号。典型地,后续各帧重叠周期为50%。如果帧内存在暂态,则减小重叠周期,从而避免前向回波(pre-echo)。这被称为修正开窗。传统上,这种(小)重叠对于所有正弦信号都是相等的。对于低频,这会导致音频赝像。
在SSC(正弦音频和语音译码器)正弦音频编码器[1]中,输入信号被分解成数个参量分量。所述分量之一为暂态分量。如果发生的事件在时间上是非常局部的,则将部分音频信号标记成暂态。音乐示例为响板或爵士鼓(high-hat)的敲击。
在[1]中详细描述了暂态模型。这里将给出概括。在SSC编码器中,识别了两种类型的暂态台阶暂态(step transient)和Meixner暂态,见[1]第3页。暂态评估程序包括下述三个步骤1.评估暂态的时间位置,此处该暂态在音频信号中的位置被确定。此外还确定暂态的类型(台阶或Meixner)。
2.评估暂态包络在Meixner暂态的情况下,评估Meixner窗口,描述该暂态的时间包络。
3.评估正弦含量,此处使用被评估的Meixner窗口来评估若干正弦信号以描述该暂态。使用频率、相位和振幅来表示这些正弦信号。
台阶暂态的特征在于信号功率电平的突然改变,即,出现快速冲击而实际上没有衰减。台阶暂态的一个特性特征在于其位置,即其出现的时间,如所指的时间位置本身并不描述信号,而是用于控制正弦对象的分量被合成的方式。基于位置参数,对台阶暂态以及Meixner暂态应用相同或相似的程序。
另一种类型的分量为正弦信号。在正弦建模中,模型的形式典型地为Sn(t)=Σk=1Kuk(t)---(1)]]>其中uk为基础正弦或类似正弦的信号,n为段数目。例如,uk(t)可定义为uk(t)=A(t)·cos(ω(t)·t+φ(t)) (2)其中A(t)、ω(t)和φ(t)为正弦信号的振幅、频率和相位。为了减小比特率,优选地在段内保持这些参数不变,但如上所述这些参数可以随时间变化。
连续的段Sn相互重叠。因此,将这些段乘以窗口函数(例如Hanning窗口)。这些窗口被设计成是振幅补偿的,即,这些连续窗口的总和总是为1,特别是在重叠周期。

图1示出了这一点。U表示正弦参数的更新周期,O代表连续窗口W1和W2之间以及连续窗口W2和W3之间的重叠周期。U的典型值为大约8ms(或者使用采样频率为44.1kHz的360次采样)。
在图2中,在段中存在暂态,改变窗口以减小前向回波的影响。暂态位置用T表示。与图1相比,两个窗口W1m和W2m已经被修正。窗口的虚线部分对应于图1中未修正的窗口W1和W2。通过使用比图1中未修正窗口更陡的下降沿,在暂态位置“闭合”该窗口来修正包含暂态位置T的窗口W1m,该修正窗口的持续时间相应地缩短。通过使用比图1中未修正窗口更陡的上升沿,在暂态位置“打开”该窗口来相应地修正下一个窗口,该修正窗口的持续时间相应地延长。由于这些窗口的闭合及打开沿更陡峭,因而连续修正窗口W1m和W2m之间的修正后的重叠周期0m相应地缩短了。
实践中,通过减小在暂态位置的重叠周期(例如减小到10个采样)可以实现这一点。两个窗口的未重叠部分都设置为1,即最大值。这种用于正弦合成的开窗被用于台阶暂态以及Meixner暂态的情形,且可用于编码器和解码器中。
图3示出了信号包含其振幅呈台阶状增加的暂态的情形。虚垂直线标记了该暂态的位置。上部轨迹示出了使用360次采样重叠所合成的正弦信号的波形,下部轨迹示出了使用被缩减的10次采样重叠所合成的正弦信号的波形。上部轨迹明显具有前向回波,因此暂态结构丢失,而在下部轨迹中,由于使用了修正窗口而使暂态结构仍然保持完好。这种已知的在暂态位置处的修正窗口为避免暂态处的前向回波提供了解决方法。
然而,上述已知方法具有特定的缺点。在暂态的情形中,由于重叠周期的减小,用于正弦信号合成的修正窗口确实保留了暂态区域中的暂态结构。然而,这会导致低频正弦信号出现音频赝像。在图4中,示出了具有低频为100Hz和70Hz的、以小重叠周期合成的两个正弦信号。在暂态位置,两个正弦信号之间存在大的不连续。这种突变具有高频分量,这会被感知为咔嗒声(click)。如果延长重叠周期,波形的不连续将消失,但是暂态附近的暂时结构也将丢失,形成前向回波。本发明解决了这个问题。
已经观察到,在较高的频率下,小的重叠周期不会在波形中引入音频赝像。这是因为高频正弦的周期更短的缘故。另一方面,与高频正弦信号相比,低频正弦信号更能容许较大的周期。在高频区域,与低频区域相比,暂态结构更为重要。因此,根据本发明,使得暂态附近重叠周期的大小与频率相关。对于低频,重叠周期更大以防止咔嗒声。对于更高频率选用更小的重叠周期。人耳在低频的时间分辨率比在高频处更小。因此,从知觉的角度考虑,允许窗口之间的重叠周期更大。
通过参考附图并根据下述描述的优选实施例,本发明的上述目标和特征将更加显而易见,附图中图1为示出了使用常规开窗合成正弦信号的重叠相加程序的图示;图2为示出了使用修正开窗合成正弦信号的重叠相加程序的图示;图3示出了所合成正弦信号的波形轨迹;以及图4示出了具有低频的两个被合成正弦信号的波形轨迹。
在图中,相同的部分使用相同的附图标记表示。
本发明包括在编码和解码中用于修正包含暂态位置的连续段窗口之间重叠周期的上述已知方法。本发明的方法通过使连续段窗口之间的重叠周期依赖于正弦信号的频率,来改进该已知的方法。具体地,对于低频来讲重叠周期长于高频的重叠周期。
理论上,可以直接从正弦信号的频率中计算暂态附近重叠周期的大小。例如,在重叠周期内多个采样中测量的与频率相关的重叠周期O(f)可以定义为单位为Hz的频率f的递减函数,例如O(f)=round{a-b·{fFs/2|1/c}---(3)]]>其中Fs是单位为Hz的采样频率,例如为44.1kHz,a、b和c分别为通过实验确定以获得良好的感知声音质量的常数,特别是避免在高频出现前向回波以及在低频出现咔嗒声。在优选实施例中,a=100,b=96,c=7,这导致单位频率的重叠周期变化缓慢。可以定义不同的函数。
对于每个正弦信号,必须构造新的窗口以执行该重叠。这仅在暂态位置显著增大正弦合成的计算复杂度。
上述方法的简化是使用少数的离散数值来代替连续变化。在本发明的最简单实施例中,对于频率低于400Hz的正弦信号,重叠周期设置为100次采样,而对于频率高于400Hz的正弦信号,可以使用10次采样的重叠周期。于是仅仅需要两种类型的窗口。当然,可以选择任何合适数量的频率间隔以及相应的重叠周期。E.G.P.S chuijers,A.C.den Brinker和A.W.J.Oomen.Parametric Coding for High-Quality Audio,Preprint 5554,112thAES Convention,Munich,10-13May 2002。
权利要求
1.一种从编码数据合成包含正弦信号的信号的方法,所述编码数据包括用于各个多个连续时间段的代表正弦信号的一个或多个频率值(f)以及指示可能暂态的出现时间的数据,所述方法包括使用所述一个或多个频率值(f)中的每个值产生正弦信号,并跨越多个连续段链接正弦信号,此处使用具有常规上升沿和常规下降沿的常规窗口(W1、W2、W3)对没有暂态的段加权,此处所述连续各段分别具有其下降沿和上升沿的常规重叠周期(0),而且使用具有修正下降沿的第一修正窗口(W1m)对其中暂态发生时间被识别的段加权,并使用具有修正上升沿的第二修正窗口(W2m)对下一个段加权,以使得修正下降沿和修正上升沿具有修正的重叠周期(0m),所述修正重叠周期包含发生暂态的时间,并且所述修正重叠周期短于常规重叠周期(0),其中所述修正重叠周期(0m)依赖于所述频率值(f)。
2.根据权利要求1所述的方法,其中所述修正重叠周期(0m)随频率值(f)的增大而减小。
3.根据权利要求1或2所述的方法,其中所述修正重叠周期(0m)依赖于所述频率值(f),基本上依赖于f1/c。
4.根据权利要求1或2所述的方法,其中使用所述修正重叠周期(0m)的两个或更多固定数值用于相应的频率间隔。
5.一种从编码数据合成包含正弦信号的信号的音频解码器,所述编码数据包含用于各个多个连续时间段的代表正弦信号的一个或多个频率值(f)以及指示可能暂态的出现时间的数据,所述音频解码器适用于使用权利要求6至9中任一项所述的方法。
6.适用于使用权利要求1至4中任一项所述方法的用于编码信号的音频编码器。
全文摘要
所述方法产生包含跨越多个顺序时间段链接的正弦分量轨迹的音频流。使用常规窗口(W1、W2、W3)对各个轨迹中的段加权,其中各连续段分别具有其下降沿和上升沿的常规重叠周期(O)。使用具有修正下降沿的第一修正窗口(W1m)对其中暂态分量被确定的段加权,并使用具有修正上升沿的第二修正窗口(W2m)对轨迹中的下一个段加权,使得所述修正下降沿和修正上升沿具有被修正的重叠周期(Om),所述修正重叠周期包含暂态分量,并且所述修正重叠周期短于常规重叠周期(O),且其中所述音频流包含代表频率和暂态的正弦代码。根据本发明,所述被修正的重叠周期(Om)依赖于频率值(f)。
文档编号G10L19/02GK1934619SQ200580008566
公开日2007年3月21日 申请日期2005年3月8日 优先权日2004年3月17日
发明者A·J·格里特斯, A·C·登布林克 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1