一种衰减因子的获取方法和获取装置的制作方法

文档序号:7664034阅读:94来源:国知局

专利名称::一种衰减因子的获取方法和获取装置的制作方法
技术领域
:本发明涉及信号处理领域,尤其涉及一种衰减因子的获取方法和获取装置。
背景技术
:在实时语音通信系统中,对语音数据的传输要求实时可靠,例如VoIP(VoiceoverIP,基于IP的语音)系统。4旦由于网络系统自身的不可靠特性,数据包在从发送端到接收端传输过程中有可能会被丟弃或者不能及时的达到目的地,而这两种情况都被接收端认为是网络丟包。而发生网络丟包是不可避免的,同时也是影响语音通话质量最主要因素之一,因此在实时通信系统中需要健壮的丟包隐藏方法来恢复丟失的数据包,使得在发生网络丢包的情况下仍获得良好的通话质量。G.722是ITU-T制定的应用于语音通信的语音编码算法。G.722编码器的原理示意图如图l所示在发送端,G722编码器把宽带语音分成高低两个子带,并使用ADPCM(AdaptiveDifferentialPulseCodeModulation,自适应差分脉沖编码调制)分别对两个子带进行编码并通过网络一起发送给接收端。在接收端,使用ADPCM解码器对两个子带分别解码,然后使用QMF(QuadratureMirrorFilter,正交镜像滤波)合成滤波器合成最终的信号。在现有技术中给出了适用于G..722的PLC(PacketLossConcealment,丟包隐藏)算法,对于两个不同的子带采用了不同的PLC算法,低带部分的PLC算法,即图1中的虚线框中①的部分,而对于高带的PLC算法,对应图l中的虚线框②。对于低带信号,x/(")对应当前收到的数据帧解码后对应的信号、而y/(w)对应当有丟包时利用z/(n),"=-289,...,-1合成的信号,z/(")对应进行完CROSS-FADING(交叉衰减)后最终输出的低带信号;对于高带信号,A(")为最终输出的高带信号。得到低带信号z/(")和高带信号后,对低带信号z/(n)和高带信号z/^)作QMF,合成最终要输出的宽带信号;Kw)。下面仅对低带信号做详细介绍在没有丟包的情况下,z/(n)=jc/("),即CROSS-FADING时不改变重构信号。在有丢包情况下,对于第一个丟失的数据帧,使用短时预测器和长时预测器对历史信号z/("),"<0进行分析,并提取出语音类别信息;接着使用上述预测器和类别信息,使用线性预测基音周期重复的方法生成信号^(w);然后重构丟失帧的信号z/(")=少/("),"=0,".,丄-1。另夕卜,ADPCM的状态也要随之同步更新,直到遇到一个好帧。注意到不仅要生成丢失的帧所对应信号,也要生成用于CROSS-FADING的10ms信号;;/("),"=,Z+79,那么一旦收至1」一个好巾贞,#尤对x/("),"=丄,.",丄+79,和y/("),"=二.-.,£+79估爻CROSS-FADING处理。注意到此类CROSS-FADING仅在发生丢帧后,接收端收到第一个好帧数据时才进行。图2为现有技术中给出的低带部分基于基音周期重复部分的LPC模块的更详细的框架。当数据帧是好帧时,z/(")被存储到一个緩沖区里面以备后用。当遇到第一个坏帧时,则需要分两步来合成最终的信号少/(w)。首先对历史信号z/(w),"=-297,...,-l进行分析,然后结合分析的结果合成信号少/0),"=0,.",丄—1,其中L是数据帧的帧长。该基于基音周期重复部分的LPC模块具体包括以下部分(1)LP(LinearPrediction,线性预测)分析短时分析和合成滤波器j(z)和l"(z)均是基于8阶LP的滤波器。LP分4斤滤波定义为=1+a,z一1+a2z-2+…+a88LP分析之后,使得历史信号z/(w)通过滤波器后得到残差信号,"=—289,…,-l:(2)历史数据分析现有技术中G,722使用基音周期重复方法对丟失的数据进行补偿。因此,首先需要估计出基因周期r。,首先对z/(")进行预处理,去除在LTP(LongTermPrediction,长时预测)分析中不需要的低频成分,然后通过LTP分析可以得到历史信号的基因周期r。,并结合信号分类模块得到语音的类别。在G,722附录A中把语音分成了如下几类,如下表所示<table>tableseeoriginaldocumentpage7</column></row><table>(3)基音周期重复基因周期重复模块用于估计丟失帧的LP残差信号e("),"-0,…,丄-l。在进行基因周期重复之前,如果语音的类别不是VOICED,则采用下面的公式来限制采样点的幅度<formula>formulaseeoriginaldocumentpage7</formula>其中,<formula>formulaseeoriginaldocumentpage7</formula>如果语音的类别是VOICED,则丟失信号所对应的残差e(n),"=0,...,丄-1采用重复历史数据对应的最后一个基音周期的残差数据获得,即<formula>formulaseeoriginaldocumentpage7</formula>而对于其它类型的语音,为了避免生成的数据周期性太强(对于非语音的数据,如果周期性太强,听起来就会有音乐噪声等不舒服噪声),则使用下面的7>式生成丟失信号所对应的残差信号,"=0,...,£-1:<formula>formulaseeoriginaldocumentpage7</formula>除了生成丟失帧对应的信号外,为了保证丢失帧和丟失帧之后的第一个好帧之间的平滑拼接,还要继续生成额外80个样点的数据e("),"=Z,…,丄+79,以生成用于CROSS-FADING的4言号。(4)LP合成在生成丢失帧和CROSS-FADING对应的残差信号e(")后,接着用下面的公式得到重构的丢失帧信号y/戸("),"=0,…,Z-1:其中,残差信号e("),"=0,...,丄-1,是^章节步骤3基音周期重复中得到的残差。除此之外,还要继续使用上述公式生成用于CROSS-FADING的80个样点K"),"=W+79。(5)Adaptivemuting为了实现平滑的能量过渡,在与高带信号进行QMF之前,还需要对低带信号进行CROSS-FADING处理,规则如下表所示<table>tableseeoriginaldocumentpage8</column></row><table>在上表中,z/(w)为对应最终输出的当前帧对应的信号;x/(")当前帧对应的好帧的信号;W(")对应当前帧同一时刻合成的信号,其中丄为帧长,80为进行CROSS-FADING样点的个数。G.722附录4还考虑到针对不同的语音类型,在进行CROSS-FADING之前对O)中的信号的能量进行控制。即少/(w)=g—w"&_/6xy/pre(w)w=0,".,丄+79其中,g—m她—/6为每个样点所对应的系数。它的取值根据语音类型的不同以及丢包情况而变化,如下图3所示。其中开始80个样点对应当前丢失帧的g_mute_lb。在实现本发明过程中,发明人发现现有技术中至少存在如下问题现有技术中使用如图3所示的静态的自适应衰减因子来控制合成信号的能量。虽然它所规定的衰减因子也是逐渐变化的,但它的衰减速度,即衰减因子的大小,对同一类型的语音,都是一样的。但人的发音的特点是很丰富多变的,如果衰减因子不匹配,重建后的信号就会有令人不舒适的噪声,特别是在稳定语音的末尾,使用静态的自适应衰减因子就不能适应人的语音丰富多变的特点。例如图4所示的情况,其中r。为历史信号的基音周期,上面的信号对应原始信号,即没有丢包情况下的波形示意图。下面的短划线信号为^^艮据现有G,722合成的信号。从图中可以发现合成的信号没有保持和原始信号一致的衰减速度,如果同一基音周期重复次数太多,则合成的信号就会出现明显得音乐噪声,与理想的情况差距很大。
发明内容本发明的实施例提供一种衰减因子的获取方法和装置,用于自适应的动态调整合成信号处理中所使用的衰减因子,实现历史数据和最新收到的数据的平稳过渡。为达到上述目的,本发明的实施例提供一种衰减因子的获取方法,用于丟包隐藏中的合成信号的处理,包括以下步骤获取信号的变化趋势;根据所述信号的变化趋势获取衰减因子。本发明的实施例还提供一种衰减因子获取装置,用于丟包隐藏中的合成信号的处理,包括以下步骤变化趋势获取单元,用于获取信号的变化趋势;衰减因子获取单元,用于根据所述变化趋势获取单元获取的变化趋势获取衰减因子。与现有技术相比,本发明的实施例具有以下优点使用历史信号的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。图1是现有技术中G722编码器的原理示意图2是现有技术中低带部分基于基音周期重复部分的LPC模块示意图;图3是现有技术中静音因子的取值与语音类型以及丟包情况的关系示意图4是现有技术中原始信号和根据现有G.722合成的信号的示意图5是本发明的实施例一中一种衰减因子的获取方法的流程图6是本发明的实施例一中动态衰减方法后输出信号的示意图7A和图7B是本发明的实施例二中衰减因子获取装置的结构示意图8是本发明的实施例二中衰减因子获取装置的应用场景示意图。具体实施例方式以下结合附图和实施例,对本发明的实施方式做进一步说明。本发明的实施例一中提供了一种衰减因子的获取方法,用于丟包隐藏中的合成信号的处理,如图5所示,包括以下步骤步骤sl01、获取信号的变化趋势。具体的,该变化趋势可以通过以下参数表示(l)信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值;(2)信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值。步骤sl02、根据该变化趋势获取衰减因子。以下结合具体的应用场景,描述本发明实施例一的具体处理方法。本发明的实施例一中,提供了一种衰减因子的获取方法,用于丟包隐藏中的合成信号的处理,主要针对图3中对衰减因子计算的改进。具体的,假设接收到的历史信号中最后两个基音周期的信号如图6中的原始信号所示,则根据上述历史信号最后两个基音周期的变化趋势来动态调整自适应动态衰减因子。具体的调整方法包括以下步骤步骤s201、获取信号的变化趋势。可以通过信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值表示信号的变化趋势,即计算历史信号最后两个基音周期信号的能量£/和£2,以及二能量的比值。<formula>formulaseeoriginaldocumentpage11</formula>其中,A为最后一个基音周期信号的能量,£2为前一个基音周期信号的能量,r。为历史信号对应的基音周期。或者也可以通过历史信号最后两个基音周期的峰值峰谷差的比值来表示信号的变化趋势《=maxO/(Z))-min(x/(力)(z',力=-r。1尸2=max,)-min(x/(力)力=-2r。,…,-(r。+1)其中,S为信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,i^为前一个基音周期信号的最大幅度值和最小幅度值的差值,然后计算其比值为及=丑户2步骤s202、根据该获取到的信号的变化趋势,对合成的信号进行动态衰减。计算公式如下=W戸(")*(1—C*("+1》"=O,."iV-1其中y;(")为重构的丟失帧信号,^为合成信号的长度,C为自适应衰减系数,其值为对于衰减因子1-C、〈0的情况下,需令1-0*"=0,以避免出现采样点对应衰减因子为负的情况。特殊的,为了避免在及>1的情况下,出现采样点对应幅值溢出的情况下,可以考虑仅在i<1的情况下,使用本实施例步骤s202的公式对合成的信号进行动态衰减。特殊的,为了避免能量比较小的信号衰减速度过快,则可以考虑仅在A超过某个限定值的情况下,使用本实施例步骤s202的公式对合成的信号进行动态衰减。特殊的,为了避免合成信号由于衰减速度过快,特别是在有连续丢帧的情况下,则给衰减系数C设定一个上限,当超过某个限定值时,则使得衰减系数为上限所设定的值。特殊的,在网络环境差,在有连续丟帧的情况下,为防止衰减速度过快,可以设定一定的条件,例如可以考虑当丟失帧的个数超过指定个数,例如2帧,或者丢失帧对应的信号超过指定长度,例如20ms,或者当前衰减因子(1-C*")到达指定的阀值后的一个或者多个条件后,则需要对衰减系数C进行调整,以防止衰减过快,导致输出信号为静音的情况。例如在8K采样,帧长为40个采样点的情况下,可以设定丟失帧个数为4,且衰减因子1-C^"小于0.9以后,则将衰减系数C调整为较小的值。其中所述较小的值的规则为假定预计依当前的衰减系数C和衰减因子的值V,那么衰减因子V将在"C个采样点后衰减为O,而比较理想的情况是在M(M^F/C)个采样点后衰减为0,那么调整衰减系数C为C=F/M如图6所示,最上信号为原始信号,中间的信号为合成的信号,从图中可以看到,该信号虽然有一定程度的衰减,但仍然保持了很强的浊音特征,如果持续时间过长,就会表现为音乐性的噪声,特别是在浊音的尾部。最下面信号为使用了本发明实施例中动态衰减之后的信号,可以看出和原始信号已经非常接近。通过使用上述实施例提供的方法,使用历史信号的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。本发明的实施例二中提供一种衰减因子获取装置,用于丟包隐藏中的合成信号的处理,包括变化趋势获取单元IO,用于获取信号的变化趋势。衰减因子获取单元20,用于根据变化趋势获取单元10获取的变化趋势获取衰减因子。该衰减因子获取单元20进一步包括衰减系数获取子单元21,用于根据变化趋势获取单元10获取的变化趋势生成衰减系数;衰减因子获取子单元22,用于根据衰减系数获取单元21生成的衰减系数获取衰减因子。还包括衰减系数调整子单元23,用于在满足特定条件时,将衰减系数获取子单元21获取的衰减系数的值调整为特定值,该特定条件包括衰减系数的值是否超过上限、是否存在连续丢帧的情况、衰减速度是否过快中的一种或多种。具体的,该变化趋势获取单元10获取的变化趋势可以通过以下参数体现(1)信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值;(2)信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值。该变化趋势使用上述(l)中能量的比值表示时,该衰减因子获取装置的结构如图7A所示,变化趋势获取单元10进一步包括能量获取子单元11,用于获取信号最后一个基音周期信号的能量与前一个基音周期信号的能量;能量比值获取子单元12,用于获取能量获取子单元11获取的信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值,以该比值表示所述信号的变化趋势。该变化趋势使用上述(2)中的幅度差值的比值表示时,该衰减因子获取装置的结构如图7B所示,所述变化趋势获取单元进一步包括幅度差值获取子单元13,用于获取信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,以及前一个基音周期信号的最大幅度值和最小幅度值的差值;幅度差值比值获取子单元14,用于获取信号最后一个基音周期信号的差值与前一个基音周期信号的差值的比值,以该比值表示所述信号的变化趋势。本发明的实施例二中一种衰减因子获取装置的应用场景示意图如图8所示,用于使用历史信号的变化趋势来动态调整自适应衰减因子。通过使用上述实施例提供的装置,使用历史信号的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用石更件平台的方式来实现,当然也可以通过石更件,但;f艮多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台设备执行本发明各个实施例所述的方法。以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。权利要求1、一种衰减因子的获取方法,用于丢包隐藏中的合成信号的处理,其特征在于,包括以下步骤获取信号的变化趋势;根据所述信号的变化趋势获取衰减因子。2、如权利要求1所述衰减因子的获取方法,其特征在于,所述获取信号的变化趋势具体为获取所述信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值;或获取所述信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值。3、如权利要求2所述衰减因子的获取方法,其特征在于,根据所述信号的变化趋势获取衰减因子前还包括判断所述比值是否大于l,大于1则结束所述信号处理,否则继续。4、如权利要求2所述衰减因子的获取方法,其特征在于,根据所述信号的变化趋势获取衰减因子前还包括判断所述最后一个基音周期信号的能量是否大于预先设定的限定值,大于则继续,否则结束所述信号处理。5、如权利要求2所述衰减因子的获取方法,其特征在于,根据所述信号的变化趋势获取衰减因子前还包括判断所述最后一个基音周期信号的最大幅度值和最小幅度值的差是否大于预先设定的限定值,大于则继续,否则结束所述信号处理。6、如权利要求2所述衰减因子的获取方法,其特征在于,所述信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值为<formula>seeoriginaldocumentpage2</formula>;其中,A为最后一个基音周期信号的能量,^为前一个基音周期信号的能量。7、如权利要求2所述衰减因子的获取方法,其特征在于,所述信号最后一个基音周期信号的最大幅度值和最小幅度值的差值与前一个基音周期信号的最大幅度值和最小幅度值的差值的比值为R=P1/P2;其中,P1为信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,P2为前一个基音周期信号的最大幅度值和最小幅度值的差值。8、如权利要求6或7所述衰减因子的获取方法,其特征在于,根据所述信号的变化趋势获取衰减因子具体为获取衰减因子为<formula>seeoriginaldocumentpage3</formula>"n=O,..,N-1,其中,C为衰减系数,c=(1-R)/T。,N为合成信号的长度,T。为基音周期的长度。9、如权利要求8所述衰减因子的获取方法,其特征在于,所述衰减因子1-C*(n+1)〈0时,令所述衰减因子1-C*(n+1)=0。10、如权利要求8所述衰减因子的获取方法,其特征在于,预先为衰减系数c设定一个上限值,当根据c=(1-R)/T。,获取的c值超过所述上限值时,使得衰减系数c为所述上限值。11、如权利要求8所述衰减因子的获取方法,其特征在于,连续丟失多个帧时,则将衰减系数c调整为较小的值。12、如权利要求11所述衰减因子的获取方法,其特征在于,所述将衰减系数C调整为较小的值具体为预设信号在M个样点后衰减为零;令调整后的衰减系数C=v/M,其中V为当前的衰减因子。13、一种衰减因子获取装置,用于丟包隐藏中的合成信号的处理,其特征在于,包括以下步骤变化趋势获取单元,用于获取信号的变化趋势;衰减因子获取单元,用于根据所述变化趋势获取单元获取的变化趋势获取衰减因子。14、如权利要求13所述衰减因子获取装置,其特征在于,所述变化趋势获取单元进一步包括能量获取子单元,用于获耳又信号最后一个基音周期信号的能量与前一个基音周期信号的能量;能量比值获取子单元,用于获取所述能量获取子单元获取的信号最后一个基音周期信号的能量与前一个基音周期信号的能量的比值,以所述比值表示所述信号的变化趋势。15、如权利要求13所述衰减因子获取装置,其特征在于,所述变化趋势获取单元进一步包括幅度差值获取子单元,用于获取所述信号最后一个基音周期信号的最大幅度值和最小幅度值的差值,以及前一个基音周期信号的最大幅度值和最小幅度值的差值;幅度差值比值获取子单元,用于获取幅度差值获取子单元获取的所述信号最后一个基音周期信号的差值与所述前一个基音周期信号的差值的比值,以所述比值表示所述信号的变化趋势。16、如权利要求13所述衰减因子获取装置,其特征在于,所述衰减因子获取单元进一步包括衰减系数获取子单元,用于根据所述变化趋势获取单元获取的变化趋势生成衰减系数;衰减因子获取子单元,用于根据所述衰减系数获取子单元生成的衰减系数获取衰减因子。17、如权利要求16所述衰减因子获取装置,其特征在于,所述衰减因子获取单元还包括衰减系数调整子单元,用于在满足特定条件时,将所述衰减系数获取子单元获取的衰减系数的值调整为特定值,所述特定条件包括衰减系数的值是否超过上限、是否存在连续丟帧的情况、衰减速度是否过快中的一种或多种。全文摘要本发明公开了一种衰减因子的获取方法和获取装置。该获取方法用于丢包隐藏中的合成信号的处理,包括以下步骤获取信号的变化趋势;根据所述信号的变化趋势获取衰减因子。通过使用本发明,使用历史信号最近的变化趋势来动态调整自适应衰减因子,实现历史数据和最新收到的数据的平稳过渡,使得补偿后的信号和原始信号尽量保持一致的衰减速度,适应人的语音丰富多变的特点。文档编号H04M7/00GK101207665SQ200710169618公开日2008年6月25日申请日期2007年11月5日优先权日2007年11月5日发明者清张,杜正中,毅杨,涂永峰,静王,王东琦,晨胡,磊苗,詹五洲,许剑峰,齐峰岩申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1