延迟分组隐藏方法及设备的制作方法

文档序号:7585955阅读:149来源:国知局
专利名称:延迟分组隐藏方法及设备的制作方法
技术领域
本发明涉及使用延迟参数来改善延迟分组的隐藏的分组网络中延迟分组的隐藏方法及设备。
数字压缩的语音信号往往用分组传输,所述分组包含用以在接收端解码器中重构语音帧的语音参数。这样的分组网络的典型例子是IP和ATM网络。当分组延迟或丢失时,使用某种隐藏方法来顶替延迟的或丢失的参数(见[1])。一般这些隐藏方法从以前接收的参数来预估延迟分组或丢失分组的语音参数,并把预估的参数应用于解码过程,顶替延迟的或丢失的参数。第一个延迟的或丢失的分组的参数通常从前一个分组拷贝。若其他分组也延迟或丢失,则仍旧是用同样的参数,但是现在输出信号逐渐沉寂下来。这些方法的性能特征是,对延迟的和丢失的分组使用同样的策略。这些方法的缺点是简单地丢弃延迟分组中的信息,尽管与参数预估所用的信息相比它更新一些。
文献[2]描述了一种区分延迟的和丢失的分组的方法。在这个参考文献所描述的方法中,只要延迟的分组到达了,就用延迟分组的语音参数顶替预估参数。但是,这个方法的性能特征是它不考虑解码器是基于数字滤波这一事实。解码器中的数字滤波在一帧解码之后达到最后滤波状态。这种最后滤波状态用作下一帧解码用的初始滤波状态(采用新的语音参数)。若解码后的输出信号要像发射端编码器中综合分析过程中所产生的最优信号一样,则语音参数和初始滤波状态两者都必须是一样的。在文献[2]中描述的方法中,延迟的分组最后到达时,只使用正确的语音参数。但是,其间滤波状态在预估阶段上漂离了前一帧的最后状态,导致突然采用延迟的语音参数时出现令人懊恼的输出信号突变。
本发明的一个目的是提供一种使用延迟分组信息的延迟分组隐藏方法和设备,其中把这种令人懊恼的输出信号的突变减到最小或者甚至消除。
这个目的是按照后附的专利权利要求书达到的。
简而言之,本发明涉及利用在延迟的分组中接收的信息来不仅更新语音参数,而且更新解码器的初始状态。然后在延迟分组隐藏过程中,利用相同的语音参数产生两个解码后的输出信号,一个基于已经漂移的解码器状态,而另一个基于更新后的解码器状态。然后,这两个输出信号一起被加权,产生最后的输出信号。这个方法使从预估的到更新的语音参数的过渡比较平滑。
通过参照以下结合附图的描述,可以最充分地理解本发明连同它的其他目的和优点,附图中

图1是典型的语音解码器的方框图;图2是有限脉冲响应(FIR)滤波器的方框图;图3是另一个典型的语音解码器的方框图;图4是举例说明先有技术的延迟分组隐藏方法的定时图;图5是举例说明另一个先有技术的延迟分组隐藏方法的定时图;图6是举例说明按照本发明的延迟分组隐藏方法的定时图;图7是举例说明按照本发明的延迟分组隐藏方法的另一个定时图;图8是按照本发明的延迟分组隐藏设备的方框图;图9是适合于实现图8的延迟分组隐藏设备的解码器的最佳实施例;以及图10是举例说明按照本发明的延迟分组隐藏方法的流程图。
图1是典型的语音解码器10的方框图。固定码本12包含用来重构语音信号的激励向量。从固定码本12选出的激励向量用增益因数G加权。这种最终激励向量被送到长期预估器(数字滤波器)16。长期预估器16的输出信号被送到短期预估器(另一个数字滤波器)18,后者输出解码后的语音样值。所描述的解码器受所接收的语音参数控制。这些参数可以分成两组,就是激励参数20和滤波系数22。激励参数20控制固定码本向量的选择并设定增益因数G。滤波系数22确定长期预估器16和短期预估器18的转移函数。
为了解释本发明,首先将参照图2讨论数字滤波器的某些性能特征。
图2是FIR滤波器的方框图。这种类型的滤波器可以用于短期预估器20。该滤波器包括延迟元件D的链(该图只表示3个延迟元件,但更多元件当然是可以的)。一组乘法器M0,M1,M2,M3分接输入信号X(N)和延迟后的信号X(N-1),X(N-2),X(N-3),并将这些信号分别乘以滤波系数C0,C1,C2,C3。最后在加法器A1-A3中将这些相乘后的信号加起来,形成滤波器的输出信号Y(N)。这组信号X(N-1),X(N-2),X(N-3)构成了滤波器的状态。由上述清楚看出,滤波器输出信号Y(N)将不仅取决于这些滤波系数,而且取决于初始滤波器状态。这被说成是滤波器具有“记忆”。这种记忆是先有技术中只更新滤波系数时出现信号突变的原因。在FIR滤波器的情况下,错误的滤波器状态的影响取决于滤波器的长度。滤波器的抽头较少,记忆较短。另一方面,在通常用于长期预估器中的无限脉冲响应(ⅡR)滤波器的情况下,记忆是无穷的。
在图1的实施例中,已经通过以数字滤波器的形式实现长期预估器18来实现解码器10。如图3举例说明的,另一个实施例是以自适应码本的形式实现长期预估器的解码器。自适应码本完成与长期预估器相同的功能,但并不完全以数字滤波器的形式实现。相反,自适应码本16是长语音样值缓冲区,后者在解码过程进行时通过反馈线15不断更新。向量是通过指向所述长缓冲区的某些部分来选择的。在这个实施例中,激励参数将包含这样的指针以及所选择的自适应码本向量的增益因数GA。由于自适应码本随着解码进行而用新的样值更新,所以,应该指出,一帧解码后的语音样值将取决于自适应码本的初始状态。于是,自适应码本和数字滤波器一样,具有“记忆”。因此,为了涵盖这两个实施例,可以采用“初始解码器状态”这一术语。
图4是举例说明先有技术延迟分组隐藏方法的定时图。包括解码器的接收机接收分组1-9。从按时接收的分组中提取用于解码的语音参数P1-P3和P7-P9,而延迟的分组4-6则被简单地略去不计。所提取的参数P1-P3递送给解码器,并且与相应的初始解码器状态S1-S3一起产生帧1-3的语音信号。初始解码器状态之间的虚线,例如初始解码器状态S2和S3之间的虚线表示若所表示的语音参数(本例子中的P2)用于解码,则后来的初始解码器状态是从以前的初始解码器状态获得的。由于分组4延迟,所以无法获得帧4的语音参数。因此,从以前的语音参数P3预估这些语音参数。一种经常采用的预估方法就是简单地采用和前一帧相同的语音参数。为帧4预估的语音参数在图中表示为P4P。于是,帧4将使用正确的初始解码器状态S4,但使用预估的语音参数P4P进行解码。由于分组5也延迟,所以不得不也为帧5预估语音参数。但是,由于分组5被忽略,所以新的预估P5P必须在前一个预估P4P的基础上进行。一种常常使用的方法是再次使用来自前一帧的语音参数,但减小输出信号的能量。另外,由于帧4是用预估的语音参数P4P解码的,所以帧5的初始解码器状态将不是正确的初始解码器状态S5,而是错误的初始解码器状态S5E。由于分组6也是延迟的,所以对帧6重复像帧5一样的过程(从前一帧拷贝语音参数,减小能量,并使解码基于错误的初始解码器状态)。由于分组7按时到达,所以将其语音参数P7用于帧7的解码。但是,由于前一帧是用预估的语音参数解码的,所以初始解码器状态S7E将是错误的。这种情况再加上由于正确地接收到语音参数而使振幅突然增大,将产生解码后语音信号的突变。帧7解码之后,解码器中记忆的“影响”可以忽略(在某些类型的解码器的情况下;其他类型的解码器可能有较长的“记忆”),因此,若分组8按时到达,则帧8将被正确解码。
图5是举例说明文献[2]所描述的另一种先有技术延迟分组隐藏方法的定时图。因为以前的分组1-3都按时到达,所以都正常解码。帧4的语音参数是预估的,因为分组4延迟了。这些预估的语音参数用来开始帧4的解码。但是,当分组4到达时,它不像图4那样被忽略。而改为提取语音参数P4并立即用于解码。然后用基于正确语音参数P4但错误的初始解码器状态S4E的语音样值顶替尚未输出的预估的语音样值。但是,这导致了令人懊恼的输出信号突变。假定分组5也延迟,则从语音参数P4预估语音参数P5P。这些预估的参数P5P和错误的初始解码器状态S5E用于帧5的解码。一旦分组5到达,尚未输出的预估语音样值用基于后来到达的语音参数P5和错误的初始解码器状态S5E(都表示为S5E的这两个状态不必是同一个,这种表示法只是表示它们都是错误的)解码后的语音样值顶替。当分组6按时到达并用于帧6的解码时,这就导致另一次信号突变。此后解码再次正常,因为分组7-9按时到达。
图6是举例说明按照本发明的延迟分组隐藏方法的定时图。前3个正常帧按照与图4和5相同的方法处理。帧4是以与图4相同的方法在第一解码器中预估的。但是在该帧被解码之前,初始解码器状态S4被拷贝,并将这个拷贝保存起来以备将来之用。延迟的分组4一到达,就将其语音参数P4提取出来,并用于第二解码器中把初始解码器状态更新为校正的状态S5。这样解码本来会产生的实际的语音样值被忽略。这第二个解码过程的目的只是更新初始解码器状态。由于分组5也延迟了,所以它的语音参数将不得不预估。但是,由于现在已经知道较新的语音参数P4,所以这些参数将用于参数P5P的预估。另外,将进行帧5的两个解码过程,即,一个解码过程基于预估的语音参数P5P和错误的初始解码器状态S5E,而另一个解码过程基于同一语音参数和校正的初始解码器状态S5。解码之后,将这两个语音样值帧组合以形成最终输出信号。
如图6底部所示,对这两个解码后的信号进行加权,此后把加权后的信号加起来。加权是以这样方式进行的来自解码器1的信号1具有高的初始权重和低的最终权重(实线),而来自解码器2的信号2具有低的初始权重和高的最终权重(虚线)。例如,信号可以按照下式组合y(n)=k(n)y1(n)+(1-k(n))y2(n)式中n表示帧中的样值号,y1(n)表示信号1的解码样值n,y2(n)表示信号2的解码样值n,而k(n)是加权函数,例如,被定义为k(n)=1-log(n)log(N)]]>式中N表示帧的大小。加权因子k(n)当然也可以用其他方法计算。这个例子给出如图6所示的指数地减小的曲线。这样,从信号1到比较精确的信号2就有一个平滑的过渡。
回到图6,由于分组5延迟了,所以将正确的初始解码器状态S5拷贝并存储起来,用于以后在分组5到达时由解码器2更新。另外,由于信号2在帧5的尾部被加强(由于加权),所以在帧5解码之后从解码器2接受用于帧6解码的解码器1的初始解码器状态S6E。由于分组6也延迟了,所以从分组5预估的语音参数P6P分别与错误的和校正的初始解码器状态S6E和S6一起用于帧6的解码。此后,将所述两个输出信号加权并组合。由于分组6延迟,所以将正确的初始解码器状态S6拷贝并保存起来,以便后来分组6到达时由解码器2更新。和在以前的帧中一样,在帧6解码后从解码器2接受用于帧7解码的解码器1的初始解码器状态S7E。由于分组7按时到达,所以语音参数P7可以用于解码,而不必预估。此后,将所述两个输出信号加权并组合。由于分组8和9也都按时到达,所以已不再需要解码器2,解码在解码器1中正常进行。在帧8中,使用来自解码器2的初始解码器状态S8,因为这保证是正确的。
图7是举例说明按照本发明的延迟分组隐藏方法的另一个定时图。这个定时图与图6中的定时图相似,但举例说明另一种情况,也就是分组4延迟一个帧以上时的情况。这种情况与前一种情况不同之处在于,必须把传统的隐藏方法用于帧4和5两者,还在于由于分组4到达非常迟,所以在帧5中初始解码器状态被更新了两次。此后便进行与图6相同的步骤。
图8是按照本发明的延迟分组隐藏设备的方框图。语音参数分别递送给两个解码器30和32。从这两个解码器30和32输出的信号在加法器34上组合,以产生实际的语音样值。在解码器30和32之间,设置一个额外的存储器部分36,用来存储准备更新的初始解码器状态的拷贝。
图9是适合于实现图8的延迟分组隐藏设备的解码器的最佳实施例。这个实施例实现了按照参照图1描述的原理的解码器,亦即短期预估器和长期预估器两者中的数字滤波器。由于解码器2只在有延迟的分组时才使用,实际上不必要实现两个单独的解码器,在硬件上在大部分时间只使用其中的一个解码器。因此,在本发明的最佳实施例中,解码器基于微/信号处理器组合40,它实现解码器1和解码器2两者,但在不同的时刻。处理器40连接到含有增益G、固定码本12、激励参数20和滤波系数22的存储器部分。设置存储器部分42,用来存储和取出预估的滤波系数。解码器1和解码器2的当前解码器滤波器状态分别存储在存储器部分44和46中。分组延迟时,存储器部分36存储正确的初始解码器状态的拷贝。来自解码器1的解码后的语音存储在缓冲区48中,而来自解码器2解码后的语音存储在缓冲区50。来自每一个缓冲区的语音样值在加法器34中相加之前,分别由加权块52和54加权。受来自处理器40的控制信号C1,C2控制的两个开关SW1,SW2确定当前实现哪一个解码器。若这些开关处于图中所示的位置,则解码器1被实现,而在另一个位置上则实现解码器2。存储器部分46和44之间的线表示初始滤波器状态从解码器2向解码器1的传输,如图6中帧5和6开始处所表示的。这些操作以及滤波器状态从存储器部分44向存储器部分46的传输,以及滤波器状态从存储器部分44向存储器部分36及反过来的传输,也受处理器4控制,但是对应的控制信号被省略,以免使该图混乱。
有时分组可能以错误的次序到达。依解码器类型的不同,这样的情况可能要求几个存储器部分36来存储初始滤波器状态。存储初始滤波器状态所需的存储器部分的数目取决于解码器的存储器以及语音帧的尺寸。所述存储器应该能够存储解码器状态的历史以及在参数能够影响输出的时段内最后接收的参数,后者当然取决于解码方法。但是,对于利用前向预估方法来预估短期行为的语音解码器和20ms的帧尺寸,覆盖200ms的语音,约10个存储器部分可能是合适的。
图10是举例说明本发明的延迟分组隐藏方法的流程图。在步骤S1,测试下一个预期的分组是否延迟。若否,则在步骤S2把下一个帧作为正常帧在解码器1中解码,此后程序回到步骤S1。若分组延迟,则在步骤S3保存最新的正确滤波器状态,为以后更新用。由于分组延迟,所以解码器1分别在步骤S4和S5中通过预估语音参数和产生覆盖该延迟的语音帧来执行传统的隐藏法。步骤S6测试预期的分组是否仍旧延迟(像在图7中一样)。若是如此,则重复步骤S4-S6。若否,则程序进到步骤S7和S8,其中利用现在到达的分组更新语音参数和保存的滤波器状态。步骤S9测试下一个分组是否也延迟。若该分组延迟,则在步骤S10保存解码器2的滤波器状态的拷贝,以为将来更新之用。在步骤S11,从前一个帧预估语音参数,并用来在步骤S12和S13中分别从解码器1和解码器2产生输出信号。在步骤S14中,这些输出信号(最好加权后)组合成最后的语音帧。在步骤S15中,把解码器2的最后的滤波器状态传输给解码器1(如在图6中的帧5)。此后,程序回到步骤S7和S8。当分组最后再次按时到达时,步骤S9的测试把程序转移到步骤S16和S17,其中分别在解码器1和解码器2产生基于正确的语音参数的输出信号。在步骤S18中,(最好加权后)将这些信号组合。现在一切都回到正常状态,而程序则进到步骤S1。
已经参照语音信号和相应的语音参数描述了本发明。但是,应该指出,实际上这些参数不必仅仅代表语音。比较正确的术语应该是音频参数,因为用同样方法可表达例如音乐和背景声音。另外,同样的原理也可以应用于需要数字滤波来进行解码的其他分组信号,诸如视频信号。因此,比语音或音频参数更为一般的术语是权利要求书中使用的帧参数。因此,应该指出,本发明的隐藏方法可以应用于可预估的实时数据以分组方式传输和分组以无法预测的方式延迟的所有环境。
本专业的技术人员应该明白,在不脱离后附权利要求书所定义的精神和范围的情况下,对本发明可以做出各种各样的修改和改变。
参考文献[1]K.Cluver,“改进的丢失帧重构的ATM语音编码解码器”,Proceedings Eusipco,1996.美国专利5615214(Motorola Inc).
权利要求
1.一种在分组网络中利用延迟帧参数来改善延迟分组隐藏的延迟分组隐藏方法,其特征在于当分组延迟时执行以下步骤保存最后的非延迟分组解码之后存在的初始解码器状态的拷贝;利用预估帧参数和所述初始解码器状态进行解码并对分组延迟进行隐藏,从而产生错误的初始解码器状态;利用来自所述延迟分组的更新帧参数和所述保存的初始解码器状态进行解码,从而产生校正的初始解码器状态;利用一组帧参数和所述错误的初始解码器状态进行解码,从而产生第一输出信号和另一个错误的初始解码器状态;利用所述一组帧参数和所述校正的初始解码器状态进行解码,从而产生第二输出信号;以及把所述第一和第二输出信号组合起来。
2.权利要求1的方法,其特征在于所述一组帧参数是从不延迟的分组获得的。
3.权利要求1的方法,其特征在于当下一个分组延迟时,所述一组帧参数是根据前一个分组预估的。
4.权利要求3的方法,其特征在于保存所述校正的初始解码器状态的拷贝;利用从所述下一个延迟的分组和所述保存的校正的初始解码器状态更新的帧参数进行解码,从而产生下一个校正的初始解码器状态;利用下一组帧参数和所述下一个错误的初始解码器状态进行解码,从而产生第三输出信号;利用所述下一组帧参数和所述下一个校正的初始解码器状态进行解码,从而产生第四输出信号;以及组合所述第三和第四输出信号。
5.权利要求4的方法,其特征在于所述下一组帧参数是从不延迟的分组获得的。
6.权利要求4的方法,其特征在于当再下一个分组仍然延迟时,所述下一组帧参数是根据前一个分组预估的。
7.一种在分组网络中利用延迟的帧参数来改善延迟分组隐藏的解码方法,其特征在于包括以下步骤在分组延迟的情况下,保存正确的初始解码器状态的拷贝;利用从至少一个延迟的分组的隐藏获得的错误的初始解码器状态和一组帧参数产生第一解码输出信号;利用所述保存的初始解码器状态对延迟的分组进行解码以便更新所述保存的初始解码器状态;根据所述更新的初始解码器状态和所述一组帧参数产生第二解码输出信号;以及组合所述第一和第二输出信号。
8.一种在解码器上重新利用到达太晚的分组来进行正常解码的方法,其特征在于当分组延迟时,保存初始解码器状态;以及当所述延迟的分组最终到达时,更新所述保存的初始解码器状态。
9.权利要求8的方法,其特征在于所述初始解码器状态包括初始短期预估器状态。
10.权利要求9的方法,其特征在于所述初始解码器状态包括初始长期预估器状态。
11.权利要求9的方法,其特征在于所述初始解码器状态包括初始自适应码本状态。
12.一种在分组网络中利用延迟帧参数来改善延迟分组隐藏的延迟分组隐藏设备,其特征在于用以保存最后的非延迟分组解码之后存在的初始解码器状态的拷贝的装置(36);利用预估帧参数和所述初始解码器状态进行解码并对分组延迟进行隐藏、从而产生错误的初始解码器状态的装置(30);利用从所述延迟分组更新的帧参数和所述保存的初始解码器状态进行解码、从而产生校正的初始解码器状态的装置(32);利用一组帧参数和所述错误的初始解码器状态进行解码、从而产生第一输出信号和另一个错误的初始解码器状态的装置(30);利用所述一组帧参数和所述校正的初始解码器状态进行解码、从而产生第二输出信号的装置(32);以及用以组合所述第一和第二输出信号的装置(34)。
13.权利要求12的设备,其特征在于包括用以从不延迟的分组提取所述一组帧参数的装置(40)。
14.权利要求12的设备,其特征在于包括用以当下一个分组延迟时根据前一个分组预估所述一组帧参数的装置(40)。
15.权利要求13的设备,其特征在于用以保存所述校正的初始解码器状态的拷贝的装置(36);利用从所述下一个延迟的分组更新的帧参数和所述保存的校正的初始解码器状态进行解码、从而产生下一个校正的初始解码器状态的装置(32);利用下一组帧参数和所述下一个错误的初始解码器状态进行解码、从而产生第三输出信号用的装置(30);利用所述下一组帧参数和所述下一个校正的初始解码器状态进行解码、从而产生第四输出信号的装置(32);和用以组合所述第三和第四输出信号的装置(34)。
16.权利要求15的设备,其特征在于包括用以从不延迟的分组提取所述下一组帧参数的装置(40)。
17.权利要求15的设备,其特征在于包括用以当再一个分组延迟时根据前一个分组预估所述下一组帧参数的装置(40)。
18.一种在分组网络中利用延迟的帧参数来改善延迟分组隐藏的解码器,其特征在于用以在分组延迟的情况下保存正确的初始解码器状态的拷贝的存储器(36);利用从至少一个延迟分组的隐藏获得的错误的初始解码器状态和一组帧参数产生第一解码输出信号的第一解码器部分(30);利用所述保存的初始解码器状态对延迟的分组进行解码以便更新所述保存的初始解码器状态、并且根据所述更新的初始解码器状态和所述一组帧参数产生第二解码输出信号的第二解码器部分(32);和用以组合所述第一和第二输出信号的装置(34)。
19.权利要求18的解码器,其特征在于所述各解码器部分是利用微/信号处理器组合(40)实现的,后者在第一时间间隔过程中实现第一解码器部分(30),而在第二时间间隔过程中实现第二解码器部分(32)。
20.一种在解码器上重新利用到达太晚的分组来进行正常解码的设备,其特征在于包括用以当分组延迟时保存初始解码器状态的装置(36);以及用以当所述延迟的分组最后到达时更新所述保存的初始解码器状态的装置(32)。
全文摘要
一种解码器在分组网络中利用两个解码器部分来改善延迟分组隐藏。第一解码器部分(30)在隐藏阶段过程中基于错误的滤波器状态和一组语音参数进行解码,而第二解码器部分基于所保存(36)的和更新的滤波器状态以及相同的语音参数进行解码。此后组合这两个解码器部分的输出(34);以便形成最终语音信号。这种解码策略产生从延迟分组到非延迟分组平滑过渡的语音信号,并把来自最新分组的信息用于语音产生。
文档编号H04L12/56GK1300491SQ99806070
公开日2001年6月20日 申请日期1999年4月28日 优先权日1998年5月14日
发明者E·埃库登, T·斯文松, J·松德奎斯特 申请人:艾利森电话股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1