鉴别稳态信号和非稳态信号的制作方法

文档序号:2819557阅读:1052来源:国知局
专利名称:鉴别稳态信号和非稳态信号的制作方法
技术领域
本发明涉及用于鉴别稳态信号和非稳态信号的方法和装置。此方法和装置被用来检测移动无线通信系统中代表背景声音的信号帧是否稳态的。
许多现代语言编码器属于一大类称为LPC(线性预测编码器)的语言编码器。属于这类编码器的例子有美国国防部的4.8kbit/s CELP,欧洲数字蜂窝移动电话系统GSM的RPE-LTP编码器,相应的美国系统ADC的VSELP编码器以及太平洋数字蜂窝系统PDC的VSELP编码器。
这些编码器都利用了信号生成处理中的信源-滤波器的概念。滤波器被用来采集要被再生成的信号的短时间频谱的模型,而信源被假定为处理所有其它的信号变化。
这些信源-滤波器模型的共同特性是,要被再生成的信号由限定信源输出信号的参量和限定滤波器的滤波器参量来表示。术语“线性预测”就是指通常用来估算滤波器参量的方法。这样,要被再生成的信号部分地由一组滤波器参量来表示。
利用信源-滤波器的组合作为信号模型的方法已被证明对语言信号工作得很好。然而,当移动电话用户不发声和输入信号包含了背景声音时,目前熟知的编码器就难于对付这种情形,因为它只是对语言信号最优化。由于编码器的误处理,当熟悉的背景声音变得不能被识别时,在通信链路另一侧的收听者可能很容易变得不耐烦。
按照瑞典专利申请9300290-5,此处引用以供参考,该问题是藉助于检测编码器收到的信号中的背景声音的存在和如果信号以背景声音为主导时按照某种所谓反漩涡算法修改滤波器参量计算的方法来解决的。
然而,已发现不同的背景声音具有不相同的统计特性。一类背景声音,诸如汽车噪音,具有稳态的特征。另一类背景声音,诸如背景杂谈声音,具有非稳态的特征。实验表明,所提及的反漩涡算法对稳态声音工作得很好,但对非稳态背景声音不起作用。所以就希望能鉴别稳态信号和非稳态信号,这样如果背景声音是非稳态的,就可不通过反漩涡算法。
瑞典专利申请9301798-6,此处引用以供参考,描述了能鉴别稳态的和非稳态的表示背景声音的信号帧的鉴别器。然而,这种鉴别器使用了大量的信号处理器存储器,而这是很昂贵的资源。在它的一个实施例中,存储器的需要量虽然被减少了,但该实施例是次优的。
这样,本发明的一个目的是在移动无线通信系统中用于鉴别稳态的和非稳态的表示背景声音的信号帧的有效的方法和装置。
按照本发明,这样一种方法的特点为(a)对代表所述信号的各帧之间的频谱改变量进行一组第一次连贯性测量;(b)对由所述第一次测量得到的所述频谱改变速率进行第二次测量;以及(c)确定所述第二次测量值是否超过预定的稳态下限值γ。
按照本发明的装置的特点为(a)用于对代表所述信号的各帧之间的频谱改变量进行一组第一次连贯性测量的装置;(b)用于对由所述第一次测量得到的所述频谱改变速率进行第二次测量的装置;以及(c)用于确定所述第二次测量值是否超过预定的稳态下限值γ的装置。
藉助于参考结合附图所作的如下的描述,将可很好地理解本发明及其进一步的目的和优点,这些附图为

图1是带有用于实施按照本发明的方法的装置的语言编码器的方框图;图2是带有用于实施按照本发明的方法的装置的语言译码器的方框图;图3是按照本发明原理运行的装置的优选实施例的方框图;以及图4是按照本发明原理运行的装置的另一个优选实施例的方框图,该实施例特别适用于语音译码器。
现参考图1的语言编码器,在输入线10上,输入信号S(n)被送到滤波器估算器12,它按照标准程序估算滤波器参量(这些标准程序有Levinson-Durbin算法,Burg算法,Cholesky分解法(Rabiner,Schafer"Digital Processing of Speech Signals",语言信号的数字处理,Chapter8,Prentice-Hall,1978),Schur算法(Strobach"New Forms of Levinson and Schur Algorithms",IEEE SP Magazine,Jan 1991,PP12-36),Le Roux-Gueguen算法(Le Roux,Gueguen"A Fixed Point Computation of PartialCorrelation Coefficients",IEEE Transactions of Acoustics,Speech and Signal Processing",Vol ASSP-26,No.3,PP257-259,1977),以及转让给Motorola公司的美国专利4 544 919中所描述的所谓的FLAT-算法)。滤波器估算器12输出每一帧的滤波器参量。这些滤波器参量被送到激励分析器14,它也接收线10上的输入信号。激励分析器14按照标准程序确定最好的信源或激励参量。这种程序的实例是VSELP(Gerson,Jasiuk"Vector SumExcited Linear Prediction(VSELP)”,in Atal et al,eds,"Advances in Speech Coding",Kluwer Academic Publishers,1991,pp69-79),TBPE(Salami,"Binary Pulse ExcitationANovel Approach to Low Complexity CELP Coding",前一本参考书的pp 145-156),随机码手册(Camp bell et al"The DoD 4.8.KBPS Standard(Proposed Federal Standard 1016)",前一本参考书的pp121-134),以及ACELP(Adoul,Lambin"A Comparisonof Some Algebraic Structures for CELP Coding of Speech",International Conference on Acoustics,Speech and SignalProcessing 1987,pp1953-1956)。这些激励参量、滤波器参量和线10上的输入信号被送到语言检测器16。该检测器确定输入信号主要包含语言还是背景声音。可能采用的检测器,例如,是GSM系统中限定的话音活动性检测器(话音活动性检测,GSM-建议06.32,ETSI/PT 12)。一种适用的检测器被描述于ep,A,335 521(British Telecom PLC)。语言检测器产生输出信号S/B,它指示编码器输入信号主要包含的是否为语言。此输出信号和滤波器参量一起通过信号鉴别器24被送到参量修改器18。
按照瑞典专利申请93 00290-5,参量修改器18在送到编码器的输入信号中不存在语言信号的情况下,修改被确定的滤波器参量。如果存在语言信号,则滤波器参量直接通过修改器18而不被改变。可能被改变的滤波器参量和激励参量被送到信道编码器20,它产生在线22的信道上送出的位流。
由参量修改器18所作的参量修改可用几种方式完成。
一种可能的修改是滤波器的带宽扩展。这意味着滤波器的极点向复平面原点移动。假定原先滤波器H(z)=1/A(z)由下式给出A(z)=1+Σm=1Namz-m]]>当极点按因子r(0≤r≤1)进行移动,带宽扩展后的滤波器由A(z/r)确定,或A(zr)=1+Σm=1N(amrm)Z-m]]>另一个可能的修改是对一段区域内的滤波器参量进行的低通滤波。这就是,各帧间的滤波器参量的快速变化藉对至少若干个所述参量进行低通滤波的方法被衰减了。此方法的一个特例是把滤波器参量在几帧内,例如4-5帧内,进行平均。
参量修改器18也可使用这两种方法的组合,例如在执行带宽扩展后进行低通滤波。也可能先以低通滤波开始,然后加上带宽扩展。
在以上说明中,信号鉴别器末被考虑。然而,已经发现,把信号区分成表示为语言和背景声音的信号是不够的,因为背景声音可能有不同的统计特性,正如以上所解释的。这样,表示为背景声音的信号在信号鉴别器24中被区分成稳态的和非稳态的信号。这个过程将进一步参考图3予以描述。这样,信号鉴别器24发出的在线26上的输出信号表示,要被编码的帧是否包含稳态的背景声音或是包含语言/非稳态的背景声音,若是稳态背景声音,则参量修改器18进行以上的参量修改,若是语言/非稳态背景声音,则不进行修改。
在以上解释中,假定参量修改是在发射机的编码器中完成的。然而,可以看到,类似的程序也在接收机的译码器被执行。这可由图2所示的实施例说明。
在图2中,来自信道的位流在输入线30上被接收。此位流由信道译码器32进行译码。信道译码器32输出滤波器参量和激励参量。滤波器参量和激励参量被送到语言检测器34,它分析这些参量,以确定由这些参量重新生成的信号是否包含语言信号。语言检测器34的输出信号S/B通过信号鉴别器被送到参量修改器36,它同时也接收滤波器参量。
按照瑞典专利申请93 00290-5,如果语言检测器34已确定在接收信号中不存在语言信号,那么参量修改器36执行类似于图1的参量修改器18所执行的修改。如果语言信号不存在,那么就不进行修改。可能修改过的滤波器参量和激励参量被送到语言译码器38,它在线40上产生合成输出信号。语言译码器38使用激励参量以产生上述的信源信号和可能修改过的滤波器参量以便把滤波器限定在信源-滤波器模型中。
图3显示了说明本发明的信号鉴别过程的优选实施例的方框图。为了便于描述,假定此过程由图1的鉴别器24完成。鉴别器24接收输入信号S(n)和语言检测器16的输出信号S/B。信号S/B被送到开关SW。如果语言检测器16确定信号S(n)主要包含的是语言,那么开关SW将置在下面位置,在这种情况下,信号S/B被直接送到图1的鉴别器24的输出端。
如果信号S(n)主要包含的是背景声音,那么开关置在上面位置,它启动鉴别过程。信号S(n)被送到延时装置50,它把信号S(n)延时D个帧,其中D在典型情况下是4到5帧。
延时过的信号到达频谱分析器52,它确定包含预定个数的信号帧,例如,4-5个信号帧的样本的信号矢量的频谱。接着计算倒置的频谱。根据此倒置的频谱,计算倒置滤波器的滤波器系数。这些系数被送到倒置滤波器54。倒置滤波器54的性质是这样的,如果相应于信号S(n-D)的信号被送到其输入端,那么它的输出将不带自相关的信号,即所谓的白色(噪声)信号。
包含与信号矢量S(n-D)同样多个信号帧的未被延时的信号矢量S(n)被送到倒置滤波器54。如果该信号和S(n-D)具有相同的频谱分布,那么倒置滤波器54就输出白噪声。如果信号S(n)具有另外的频谱分布,那么滤波器54就给出不同的信号。
滤波器54的输出被送到用于计算其输入信号能量的装置56。优选地,倒置滤波器的输出矢量以输入矢量S(n)进行归一化以便使能量值与输入信号的电平无关。
能量值En被送到(离散的)微分电路58,其中当前的帧能量值En和前一帧的能量值之间差值幅度ΔEn被求出并与固定的阈值ST进行比较。如果所述幅度超过阈值ST,那么输入信号的频谱的变化比幅度低于所述阈值时的频谱变化快。
微分电路58的输出被送到计数器60,它对能量差值幅度低于阈值ST的连贯的帧数进行计数。当ST被超过时,计数器60被采样,并接着复位为零。这样,计数器60的输出藉助于对具有低频谱变化的连贯的帧数进行计数,表示了信号的稳态程度。计数器60输出的特征为数字(离散的)锯齿信号,但只对此信号的巅峰值进行采样。
然而,计数器60的输出不适合于作为信号稳态情况的测量,因为此输出不太稳定。替代地,计数器60的输出被送到平均值计算器62,在其中计算了预定的计数个数(例如32个)的平均值M。该平均值M被送到比较器64,在其中把此值与稳态下限值γ比较。如果M超过γ,那么,信号被认为是稳态的,这表示滤波器参量应当被修改。γ的合适值已被发现为8。
如果输入信号S(n)在非常长时期内是稳态的,那么计数器60将不被采样,并被复位到需要的次数(例如在前一段所述的,取32次),以便在合理的时间内求取平均值。为此,如果计数值达到预定的最大计数值,例如15,那么计数器60可自动被采样和复位。
使按照图3的本发明优选实施例变得很有吸引力的一个特征是图3的方框所完成的大多数功能事实上已由语言或话音活动性检测器本身完成。这样,按照GSM-建议06.32,ETSI/PT12的话音活动性检测器已完成了方框50、52、54、56和58的功能。这样,在优选实施例中,其中语言检测器的输出信号可被再用,信号鉴别器24只需要接收信号S/B和相应于图1的语言检测器中微分电路的单元的判决。那么鉴别器24将只包合计数器60、平均值计算器62和比较器64。
另一种解决方法是直接使用微分后的能量估算值ΔEn作为信号鉴别器24,24′的输入。这已在图2中被指出。事实上,在图2中,由于信号S(n)在接收机中未能被提供,必须使用除信号S(n)以外的其它信号作为信号鉴别器24′的输入。或者更确切地说只有滤波器参量和激励参量是能被提供的。无论如何,语言译码器34根据这些参量而不是信号S(n)产生能量估算值En。现在参考图4描述此处理过程。
由于实际信号S(n)在译码器中未被提供,自相关系数acf(k)根据发射机中编码器发送的参量一部分的反射系数来计算。此计算在计算装置68中完成。在延时单元70中,把计算的自相关系数acf(k)廷时D帧后,基本信号S(n)的功率谱在单元72中被计算。以后,相应的倒置滤波器的滤波器系数在单元74中被计算,单元74也计算了这些量r(k)=Σi=0k-1ai·ai+1]]>其中ai是所述倒置滤波器的滤波器系数,而K是该滤波器的阶数。以上计算的细节在例如GSM建议06.32中被描述,此处引用以供参考。
在GSM建议06.32中也显示了能量值En可按照以下公式计算,En=r(0)acf(0)+2Σi=0k-1r(i)acf(i)]]>此计算在方框76中完成。一旦得到了能量值En,余下的方框58、60、62和64就可完成和图3的实施例相同的功能。
由于自相关系数acf(k)也在发射机的编码器中被计算,可以看到,类似于图4实施例的一个实施例也可被用于编码器。
为了进一步节省存储器,可使用漏洩的(1eaky)积分器滤波器而不用平均值计算器62。这样一种滤波器也平滑了送到比较器64的输出信号。
在以上说明中,来自计数器60的采样输出被用来求得用于稳态判决的平均值。但是,也有可能直接积分|ΔEn|以求得用于与γ进行比较的测试变量。
在某些情形中,当已确定某帧包含非稳态背景声音时,宁愿稍微提高稳态下限值γ,以防止对后几帧的判决在稳态和非稳态之间来回切换。这样,如果发现是非稳态帧,将很容易把后几帧也归类到非稳态。当偶尔发现是稳态帧时,稳态下限值γ再次被降低。这种技术称之为“滞后的”。
另一种优选的技术是“释放延迟”。“释放延迟”意思是由信号鉴别器24所作的某种判决必须持续至少一定的帧数,例如5帧,才成为最终结果。优选地,可以把“滞后的”和“释放延迟”相结合。
对于按照本发明的处理的更进一步的细节可参照附图中的Pascal程序。
对于本领域技术人员,将可看到,对本发明可能进行各种修正和改变,而不背离本发明的精神和范围,而本发明范围由附加的权利要求所限定。
附录(无论什么地方的可能的变量和常数名称同于GSM建议06.32中所使用的名称。)<pre listing-type="program-listing"><![CDATA[PROCEDURE FLspectralComparison2 (ZFLav0 realAcfOldtype; {In}ZFLrav1REALACFVECTORTYPE;{In}ZFLthresh Real; {In}VAR ZPLlastDm Real; {In/Out}VAR Zstat Boolean); {Out} VARi Integer;difference,dm Real; BEGINIF ZFLav0
<= 0 THEN BEGIN dm=0;END ELSE BEGIN dm=ZFLrav1
*ZFLav0
; FOR i=1 TO nrOfAcflagsUsed DOdm=dm+2.0*ZFLrav1[i]*ZFLav0
; dm= dm/ZFLav0
;END;difference=dm-ZFLlastDm;Zstat=ABS(difference)<ZFLthresh;ZFLlastDm=dm; END; PROCEDURE FLvadThresh (ZFLacf realAcfVectorType;{In}ZFLrav1 REALACFVECTORTYPE;{In}ZstatBoolean; {In}ZptchBoolean; {In}ZFLpvad Double; {In}VAR ZFLstatCount Integer; {In/Out}VAR ZFLadaptCountInteger; {In/Out}VAR ZFLthvad Double; {In/Out}VAR ZFLrvad REALACFVECTORTYPE); {In/Out} VARiInteger; CONSTpth =300000;plev =800000;fac =3;adp =8;inc =16;dec =32;margin =80000000;BEGINIF NOT(zstat AND NOT Zptch)THEN BEGIN ZPLadaptcount:=0; ZFLstatCount:=0;END ELSE BEGIN ZFLadaptcount:=ZFLadaptcount1; ZFLstatCount:=ZFLstatCount1; IF ZFLadaptcount>adp THEN BEGIN ZFLthvad:=ZFLthvad-ZFLthvad/dec; IF ZFLthvad<ZFLpvad*fac THENZFLthvad:=MIN(ZFLthvadZFLthvad/inc,ZFLpvad*fac); FOR i:=0 To nrofAcflagsUsed DOZFLrvad[i]:=ZFLrav1[i]; IF ZFLadaptCount>100 THENZFLadaptCount:=100; IF ZFLstatCount>15 THENZFLstatCount:=0; IF ZFLthVad<245760 THENZFLthvad:=245760;END; END; END; PROCEDURE FLstatDet(ZFLSP : Boolean; {In}ZFLadaptCount   : Integer; {In}ZFLminThresh : Real; {In}ZFLmaxThresh : Real; {In}VAR ZFLoldAdapt : Integer; {In/Out}VAR ZFLstatCount : Integer; {In/Out}VAR ZFLcountPilterReal; {In/Out}VAR ZFLprelNoStat Boolean); {In/Out} VAR i Integer; oldnoStat Boolean; BEGIN oldNoStat=ZFLprelNoStat; ZFLprelNoStat=ZFLsp; IF NOT ZFLsp THEN BBGIN IF(ZFLstatCount=0)AND(ZFLoldAdapt>0)TBEN BEGINZFLcountFilter=0.95*ZFLcountFilter+ZFLoldAdapt; END;IF ZFLcountFilter<ZFLmaxThresh THEN ZFLprelNoStat=oldNoStat; IF ZFLcountFilter<ZFLminThresh THEN ZFLprelNoStat=True; END; ZFLoldAdapt=ZFLadaptCount;END;]]></pre>
权利要求
1.移动无线通信系统中,鉴别稳态的和非稳态的表示背景声音的信号帧的方法,其特征在于(a)对代表所述信号的各帧之间的频谱改变量进行一组第一次连贯性测量;(b)对由所述第一次测量得到的所述频谱改变速率进行第二次测量;以及(c)确定所述第二次测量值是否超过预定的稳态下限值γ。
2.权利要求1的方法,其特征在于进行每个所述第一次测量包括步骤(a1)确定由连贯的信号帧的第一时间窗口得到样本的第一信号矢量的频谱;(a2)确定代表在步骤(a1)中得到的频谱的倒置的倒置滤波器的系数。
3.权利要求2的方法,其特征在于进行每个所述第一次测量包括进一步的步骤(a3)供给通过所述倒置滤波器由连贯信号帧的第二时间窗口得到的样本的第二信号矢量,所述第二时间窗口相对于所述第一时间窗口具有预定的时间偏移,并具有和所述第一时间窗口相同的帧数;(a4)确定来自所述倒置滤波器的输出信号矢量的能量值。
4.权利要求2的方法,其特征在于进行每个所述第一次测量包括进一步的步骤(a3)求得由连贯信号帧的第二时间窗口得到的样本的第二信号矢量的自相关系数,所述第二时间窗口相对于所述第一时间窗口具有预定的时间偏移,并具有和所述第一时间窗口相同的帧数;(a4)按照下式求得能量值En=r(0)acf(0)+2&Sigma;i=1k-1r(i)acf(i)]]>其中acf(i)是所述自相关系数,K是所述倒置滤波器的滤波器系数的个数,以及r(i)=&Sigma;j=0k-1ajaj+1]]>其中a(j)是倒置滤波器的系数。
5.权利要求3或4的方法,其特征在于进一步的步骤为(a5)求得在代表所述第一测量的连贯的能量值之间的差值幅度。
6.权利要求5的方法,其特征在于进一步的步骤为(b1)确定在步骤(a5)得到的连贯的第一测量的个数没有超过预定的阈值;(b2)重复步骤(b1)预定的次数;(b3)求得在步骤(b1)和(b2)中得到的代表所述第二测量的个数的平均值。
7.移动无线通信系统中用于鉴别稳态的和非稳态的表示背景声音的信号帧的装置,其特征在于(a)用于对代表所述信号的各帧之间的频谱改变量进行一组第一次连贯性测量(ΔEn)的装置(50,52,54,56,58;68,70,72,74,76);(b)用于对由所述第一测量(ΔEn)得到的所述频谱改变速率进行第二测量(M)的装置(60,62);以及(c)用于确定所述第二测量值(M)是否超过预定的稳态下限值γ的装置(64)。
8.权利要求7的装置,其特征在于用于进行所述第一测量的所述装置包括用于确定由连贯信号帧的第一时间窗口得到样本的第一信号矢量的频谱装置(50,52;68,70,72);用于确定代表所述频谱的倒置的倒置滤波器(54;74)的系数的装置(52;72)。
9.权利要求8的装置,其特用于进行所述第一测量的装置还包括输入到所述倒置滤波器(54)的输入装置,用于供给通过所述倒置滤波器由连贯信号帧的第二时间窗口得到的样本的第二信号矢量,所述第二时间窗口相对于所述第一时间窗口具有预定的时间偏差,并具有和所述第一时间窗口相同的帧数;用于确定来自所述倒置滤波器(54)的输出信号矢量的能量值(En)的装置。
10.权利要求8的装置,其特征在于用于进行所述第一测量的装置也包括用于求得由连贯信号帧的第二时间窗口得到的样本的第二信号矢量的自相关系数的装置,所述第二时间窗口相对于所述第一时间窗口具有预定的时间偏移,并具有和所述第一时间窗口相同的帧数;用于按照下式求得能量值的装置(76),En=r(0)acf(0)+2&Sigma;i=1k-1r(i)acf(i)]]>其中acf(i)是自相关系数,K是所述倒置滤波器的滤波器系数的个数,以及r(i)=&Sigma;j=0k-1ajaj+1]]>其中a(j)是倒置滤波器的系数。
11.权利要求9或10的装置,其特征在于用于进行所述第一测量的装置也包括用于求得在代表所述第一测量的连贯的能量值之间的差值幅度的装置(58)。
12.权利要求11的装置,其特征在于用于对由所述幅度形成装置(58)求得的连贯的第一测量值不超过预定阈值的个数进行计数的计数装置(60);用于在每次所述预定门限值被超过时进行采样和使所述计数装置复位的装置;用于求得代表所述第二测量的由所述计数装置(60)得到的计数的平均值(M)的装置。
全文摘要
称动无线通信系统中包含背景声音的信号帧被测试以确定稳态性。对代表所述信号的各帧之间频谱改变量进行连贯性测量(50,52,54,56,58)。根据这些测量对频谱改变速率进行第二测量(M)(60,62)。最后,确定该第二测量(M)是否超过预定的稳态下限值γ。如果属于超过的情况,那么信号被认为是稳态的。
文档编号G10L25/78GK1116011SQ9419085
公开日1996年1月31日 申请日期1994年10月19日 优先权日1993年11月2日
发明者K·F·J·扬松 申请人:艾利森电话股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1