通话音量自适应调节方法

文档序号:2820211阅读:546来源:国知局
专利名称:通话音量自适应调节方法
技术领域
本发明属于通信领域,尤其涉及GSM信道传输,FR、EFR解码,噪声抑制中的通话音量调节方法。
背景技术
目前在GSM无线通信过程中,语音编解码(包括全速率语音(Full ratespeech,FR)和增强型全速率语音(Enhanced full rate speech,EFR))和数据接收是两个相对独立的过程,互不影响。对于语音编解码来说,当前空中信道的数据传输是否存在干扰,信号强度如何等信息都是不可知的,只能使用循环码校验(CRC)以及计算在解码过程中遇到的错误个数,判断其是否大于某个最大值的方法来分辩正确的数据包与错误的数据包。这两种方法都不是100%可靠的,存在一定的错判几率,这样,就可能把错误数据当成正确数据播放出来,从而出现变音。另外,由于在语音解码过程中,前面收到数据的值,会影响到后续数据解码时使用的参数,这样,当出现误判时,后来的解码过程也会由于当前的错误数据而受到影响。这样就可能导致错误累加,使得声音质量降低,严重时甚至形成正反馈,使得噪音被无限放大,也就是我们常说的话筒啸叫。

发明内容
本发明需要解决的技术问题在于提供一种通话音量自适应调节方法,可通过将当前音量与信道质量联系起来,在信道参数不变的情况下,减低啸叫和怪音的出现几率,使用户感觉舒适。
本发明的基本原理为由于信道质量下降时,语音数据出错的概率也会随之增加,而GSM标准中使用三位CRC码进行校验,也就是说只有8个有效的CRC结果。这样,就有1/8的可能把错误数据误判为正确数据并播放出来,从而产生不正常的噪声。而且由于解码器是有记忆的,这些错误数据会改变相关的参数,使后续数据的播放也受到影响。通过使用一个称为音量放缩因子BFI_factor的变量,对其进行调整,可以在信道质量差,数据出错概率高的时候,让输出的声音变小,降低用户的不舒适感,同时也减小错误数据对解码参数的影响,防止后续的声音播放出现问题。
本发明的技术方案包括以下步骤步骤1、初始化音量放缩因子BFI_factor为1;步骤2、接受数据包并判断当前包是否错误,也即判断音量放缩因子BFI_factor的值;步骤3、如果BFI_factor≠1,表示数据包正确,继续以下步骤,如果BFI_factor=1,表示数据包错误,则转向第8步骤;步骤4、判断BFI_factor是否小于1,如果BFI_factor<1,继续以下步骤,否则转向第6步;步骤5、将BFI_factor值加1/16;步骤6、用最新BFI_factor值乘以当前数据包的所有数据,以对音量进行放缩;步骤7、播放声音,并返回第2步;步骤8、判断BFI_factor是否大于1/4如果BFI_factor大于1/4,则继续下一步,否则跳转第10步;步骤9、将BFI_factor值降低1/16;步骤10、重放前一包数据,然后返回步骤2。
上述方法可以在FR和EFR解码过程中添加。
本发明的有益效果是,由于音量放缩因子BFI_factor的引入,使得音量可以根据当前的信道质量进行适应性缩放,在信道质量差时,可以使得噪音减小,避免啸叫和杂音,提高了听者的舒适感。


图1为本发明的方法流程图;图2为本发明在FR解码中的应用示意图;图3为本发明在EFR解码中的应用示意图。
具体实施例方式
以下结合附图和具体实施例对本发明作详细说明。
图1中的方法可以添加到图2所示的最常见的FR和EFR解码过程中,根据收到的数据包计算BFI_factor,再用得到的值在图中所示位置与语音数据相乘,实现放缩。之所以将这一操作放在这里进行,是由于通过短程滤波之后,声音的频率特性将被强化,错误数据被增强的话,会更严重的影响语音质量。如果收到一个错误的数据包,其值降低1/16,为了防止语音完全消失,导致正确的话音数据也无法听到,其值在任何状况下都不会降到0。在我们这里,最低值设为0.25,根据软硬件情况,该值可以作相应的调整。同样的,每收到一个正确的数据包,该值增加1/16,直至达到1为止。这样在信号较差,错误数据出现频繁的时候,BFI_factor会保持在一个较低的水平,即使有错误数据被误判为正确的情况,产生的杂音也会被大幅度减小,可以有效的防止信号差地区的杂音和啸叫声频繁出现。
和普通的FR解码过程一样,图1所示的解码过程也包括如下步骤1、RPE(Regular Pulse Excitation规则脉冲激励)解码收到的语音信号通过APCM(自适应脉码调制)反转生成RPE采样数据,对这些数据做解码和反归一化,并在其中插入适当数目的0值(RPE栅格定位),将采样率变为原来的3倍。由此所得的数据将作为下一步长程预测的输入值。
2、长程预测(LTPLong Term prediction)由上面步骤重建的长程余留信号(long term residual signal,图中的er′)通过长程合成滤波(由延迟器z^-n和LTP参数解码过程组成,前面收到的数据在这里会对新收到的数据产生影响)生成下一步骤的输入dr′。
本发明所述BFI_FACTOR值加在这一过程之后,短程合成滤波之前。
3、短程合成滤波短程合成滤波器所用的系数是通过与编码器对应的过程而得到的,由收到的LAR(Log.-Area Ratios)得到反射系数,再将其引入短程合成滤波器中得到输出。
4、后端处理前一步的输入送到后端处理进行去强化滤波,得到最后的输出。
和普通的EFR解码过程一样,图2所示的解码过程也包括如下步骤首先对线性预测(LP)滤波器参数解码,通过所得到的LSP(Line SpectralPair)量化索引取得相应的两个LSP向量,随后通过插值得到4个LSP向量(对应于一个EFR帧中所包含的4个子帧),并将每个LSP向量转化为相应子帧的LP滤波器参数,用于后面的解码过程。
使用插值方法,对每个子帧解码其自适应码本向量。
对每个子帧的自适应码本增益进行解码,由所得到的索引值在量化表中查找对应的量化增益。
对每个子帧解码其更新过的码本向量,使用所得到的代数码本索引值解出相应的冲击脉冲的位置和振幅。
对每个子帧解码其固定码本增益。
由以上得到的信息构造激励信号,本发明所述的BFI_FACTOR值加在这一过程之后,合成滤波之前。
合成滤波,得到基本的输出信号。
后端处理对最终输出进行处理,包含两个部分,自适应后端滤波与信号缩放,前者又包括构形滤波与斜度补偿两个滤波器。
另外,当手机在通话中发生小区切换(handover)时,由于接收有效数据的最小单位是由4帧组成的一个数据块(block),而handover是以帧为单位的,这样因为切换的时候不一定在block边界上,就可能出现一个block中的几帧在前一个cell接收,剩下几帧在另一个cell接收的情况,从而出现数据错误,产生杂音。这种情况下,可以在handover时人为将BFI_factor设为一个较低的值,同样可以达到降低杂音的效果。在我们的应用中,一旦发生handover,会把BFI_factor设为5,同样,根据软硬件不同,这个值可以作相应的调整。
权利要求
1.一种通话音量自适应调节方法,其特征在于包括如下步骤步骤1、初始化音量放缩因子BFI_factor为1;步骤2、接受数据包并判断当前包是否错误,也即判断音量放缩因子BFI_factor的值;步骤3、如果BFI_factor≠1,表示数据包正确,继续以下步骤,如果BFI_factor=1,表示数据包错误,则转向第8步骤;步骤4、判断BFI_factor是否小于1,如果BFI_factor<1,继续以下步骤,否则转向第6步;步骤5、将BFI_factor值加1/16;步骤6、用最新BFI_factor值乘以当前数据包的所有数据,以对音量进行放缩;步骤7、播放声音,并返回第2步;步骤8、判断BFI_factor是否大于1/4如果BFI_factor大于1/4,则继续下一步,否则跳转第10步;步骤9、将BFI_factor值降低1/16;步骤10、重放前一包数据,然后返回步骤2。
2.如权利要求1所述的一种通话音量自适应调节方法,其特征在于所述通话音量自适应调节方法可用于手机通话中,当手机在通话中发生小区切换时,可将BFI_factor值设为5。
3.如权利要求1所述的一种通话音量自适应调节方法,其特征在于所述通话音量自适应调节方法可添加到全速率语音解码过程中,添加位置为全速率语音解码过程的长程预测和短程合成滤波之间。
4.如权利要求1所述的一种通话音量自适应调节方法,其特征在于所述通话音量自适应调节方法可添加到增强型全速率语音解码过程中,添加位置为增强型全速率语音解码过程的构造激励信号和合成滤波之间。
全文摘要
本发明公开了一种通话音量自适应调节方法,包括初始化音量放缩因子为1;判断音量放缩因子值;若BFI_factor≠1,继续以下步骤,若BFI_factor=1,转向第8步;判断BFI_factor是否<1,BFI_factor<1,继续下步,否则转向第6步;将BFI_factor值加1/16;用最新BFI_factor值乘以当前数据包;播放声音,返回第2步;若BFI_factor>1/4,继续下一步,否则转第10步;将BFI_factor值降低1/16;重放前一包数据,返回步骤2。有益效果是使得噪音减小,避免啸叫和杂音,提高了听者的舒适感。
文档编号G10L21/02GK1780326SQ200510023110
公开日2006年5月31日 申请日期2005年1月5日 优先权日2005年1月5日
发明者张治 , 刘守华 申请人:展讯通信(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1