一种消除语音输入中背景噪声的方法及其装置的制作方法

文档序号:7953104阅读:225来源:国知局
专利名称:一种消除语音输入中背景噪声的方法及其装置的制作方法
技术领域
本发明涉及一种消除语音输入中背景噪声的方法及其装置。
背景技术
针对语音通话中的背景噪声问题,目前主要有两种解决方法采用模拟滤波器消除背景噪声和采用数字信号处理器(DSP)消除背景噪声,其中采用模拟滤波器的方法,如图1所示,模拟滤波器主要包括高通和低通两种滤波器。高通滤波器可以滤掉噪音中语音通话不关注的低频段部分,如低于200Hz以下的部分。低通滤波器可以滤掉噪音中语音通话不关注的高频段部分,如高于4kHz以上的部分。
采用模拟滤波器方法的优点在于实现简单,硬件成本低,功耗小。但它的明显缺点是效果非常有限,应用范围相当窄。因为它只能去除噪声中的低频和高频部分,对于跟语音同频段的噪声无能为力。然而不幸的是,背景噪声还主要集中在听觉比较敏感的中频段。
采用数字信号处理器(DSP)的方法,如图2所示,麦克输出的模拟信号经模数(AD)变换成数字信号;DSP根据一定算法处理后,将数字信号送到数模(DA)变换器;DA变换器将数字信号还原为模拟信号,并将此信号送入说话者的手机。
DSP方法的优点是灵活,应用范围广,它能根据噪声的特点(如频谱分布、幅度分布以及其它的一些统计特征)采用不同的软件算法,能实现相当好的噪声消除效果。但它的缺点是实现复杂,硬件成本高(需要AD,DA及DSP),功耗大。

发明内容
本发明要解决的技术问题是提供一种消除语音输入中背景噪声的方法及其装置,能实现更好的性能代价比。
为了解决上述技术问题,本发明提供一种消除语音输入中背景噪声的方法,包括以下步骤(a)系统在收到模拟输入的语音信号后,将所述信号变换成为数字语音信号采样点序列;(b)计算出当前采样块各采样点的能量值并进行统计,得到一统计值;(c)如果所述统计值低于一设定噪声门限,对当前采样块的采样点进行噪声衰减,然后再将衰减后的采样点序列转换为模拟语音信号输出,否则,直接将原采样点序列转换为模拟语音信号输出。
进一步地,上述方法还可具有以下特点所述步骤(a)中,将所述信号变换为数字语音信号时,先将输入的模拟语音信号变换成为1位的过采样率信号,再对该信号进行频段压缩滤波处理,变成1倍采样率的多位数字信号,从而滤除噪声中的高频段部分。
进一步地,上述方法还可具有以下特点所述步骤(a)中,在得到变成1倍采样率的多位数字信号后,还让该信号经过一高通滤波器,以滤除噪声中的低频段部分。
进一步地,上述方法还可具有以下特点所述采样点的能量值是用采样点的幅度值或者功率值来表示的。
进一步地,上述方法还可具有以下特点所述步骤(b)中得到的所述统计值是指当前采样块各采样点的幅度或功率中的统计最大值。
进一步地,上述方法还可具有以下特点所述步骤(c)中对当前采样块的采样点进行噪声衰减时,是将输出采样点的幅度调整为其原幅度乘以所述幅度或功率中的统计最大值再除以所述噪声门限值。
进一步地,上述方法还可具有以下特点所述设定的噪声门限为10~20mV。
本发明还提供一种消除语音输入中背景噪声的装置,包括模数变换模块,幅度统计模块,噪声消除模块以及数模变换模块,其特征在于
所述模数变换模块,用于将输入的模拟语音信号变换为数字语音信号,并分别输出给噪声消除模块和幅度统计模块;所述幅度统计模块,用于计算出当前采样块各采样点的能量值并进行统计,得到一统计值,输出到噪声消除模块;所述噪声消除模块,用于判断所述统计值是否低于一设定噪声门限,如果是,对当前采样块的采样点进行噪声衰减,然后输出到所述数模变换模块,否则,直接将原采样点序列输出到所述数模变换模块;所述数模变换模块,用于输入的衰减后的采样点序列或者未经衰减的采样点序列变换成为模拟语音信号输出。
进一步地,上述装置还可具有以下特点所述模数变换模块进一步包括西格码-得尔塔变换模块和频段压缩滤波模块,其中所述西格码-得尔塔变换模块,用于将输入的模拟语音信号经过西格码-得尔塔变换成为1位的过采样率的数字信号输出给频段压缩滤波模块;所述频段压缩滤波模块,用于将上述1位信号变成1倍采样率的多位数字信号输出。
进一步地,上述装置还可具有以下特点所述模数变换模块进一步包括高通滤波模块,用于接收所述频段压缩滤波模块输出的数字信号,滤除噪声中的低频段部分。
进一步地,上述装置还可具有以下特点所述幅度统计模块得到的所述统计值是指当前采样块各采样点的幅度或功率中的统计最大值。
进一步地,上述装置还可具有以下特点所述噪声消除模块在进行噪声衰减时,是将输出采样点的幅度调整为其原幅度乘以所述幅度或功率中的统计最大值再除以所述噪声门限值。
综上所述,采用本发明消除语音输入中背景噪声的方法及其装置,本发明性能代价均处于现有两种方案之间,但在本发明指定的范围内能实现比原方案更好的性能代价比。


图1是现有采用模拟滤波器消除背景噪声的装置示意图;图2是现有采用DSP消除背景噪声的装置示意图;图3是本发明实施例装置所应用的系统的示意图;图4是本发明实施例AD变换模块的示意图。
具体实施例方式
本发明的目的主要是滤除人不说话时的环境噪声,因为一般情况下背景噪音的幅度小于语音信号的幅度,因此认为幅度很小的信号为背景噪声,对小幅度信号进行幅度衰减,从而达到消除噪声的目的。
本实施例采用数字技术,用硬件的方法实现噪声的消除。如图3所示,本实施例装置包括AD变换模块,幅度统计模块,噪声消除模块以及DA变换模块,其中AD变换模块,用于将输入的模拟语音信号变换为数字语音信号,并分别输出给噪声消除模块和幅度统计模块。
幅度统计模块,用于计算出当前采样块各采样点的幅值,统计出其中幅度的统计最大值(该最大值并不一定是实际的最大值,故称为统计最大值),输出到噪声消除模块。
噪声消除模块,用于比较幅度的统计最大值是否低于一设定噪声门限,如果是,对当前采样块的采样点进行幅度衰减,然后输出到所述数模变换模块,否则,直接将原采样点序列输出到所述数模变换模块;数模变换模块,用于将输入的衰减后的采样点序列或者未经衰减的采样点序列变换成为模拟语音信号输出。
如图4所示,本实施例的AD变换模块还具有滤除噪声中的低频段部分和高频段部分的功能,进一步包括以下单元西格码-得尔塔(SIGMA-DELTA)变换单元,用于将输入的模拟语音信号经过SIGMA-DELTA变换成为1位(BIT)的128倍过采样率(也可以是64倍,256倍等等)的数字信号输出给频段压缩滤波模块;频段压缩滤波单元,用于将上述1BIT信号变成1倍采样率的16BIT(可以根据需要设定,例如24BIT等)的数字信号输出给高通滤波模块;高通滤波单元,用于滤除噪声中的低频段部分。
语音信号经上述西格码-得尔塔变换单元和频段压缩单元处理后,能将高频段噪声压缩到大于0.5倍采样率的频段,并将它滤除,因此使得AD变换模块具有良好的低通特性。
本实施例中消除背景噪声的方法,应用于如图3所示的语音处理系统,包括以下步骤步骤一,系统收到输入的模拟语音信号后,对其进行AD变换,得到数字语音信号采样点序列,并滤除噪声中的高频段和低频段部分;在本实施例中,先将输入的模拟语音信号经过SIGMA-DELTA变换成为1BIT的过采样率(128倍采样率)的数字信号,在将该1BIT信号变成1倍采样率的16BIT的数字信号。
步骤二,计算出当前采样块中采样点幅度,并进行统计,得到幅度的统计最大值Emax;在本实施例中,利用以下算法获得当前采样块的幅度统计最大值Emax,但也可以采用任何其它算法。
假设e(n)为对应于采样点序列x(n)的幅度序列,x(n)为当前的16BIT数据,n=0,1,......,L-1,L为采样块包含的采样点个数,本实施例L=1024。
令e(0)=α|x(0)|,e(n)=α|x(n)|+(1-α)e(n-1);当|x(n)|>e(n-1)为迅速上升段,α采用迅速上升段系数α_attack(用户可通过寄存器来设置此系数),否则,α采用非迅速上升段系数α_non_attack(用户可通过寄存器来设置此系数);然后计算该采样块各采样点幅度中的统计最大值Emax=Max(e(n))。
步骤三,如果得到的Emax低于一设定门限值noise_threshold,对当前采样块的采样点进行幅度衰减,然后再将衰减后的采样点序列转换为模拟语音信号输出,否则,直接将原采样点序列转换为模拟语音信号输出。
在本实施例中,如果Emax<noise_threshold(noise_threshold为设定的噪声门限,该门限可由用户自行设定,范围较佳在10~20mV。则调整输出的采样点的幅度为其原幅度乘以Emax再除以noise_threshold。从而达到衰减噪声的目的。
在本发明的另一个实施例中,当Emax<noise_threshold时,可以令噪音消除后的数字信号为0,但是这种处理使得说话者的尾音突然中断,令听者感觉不好,而上述衰减噪声的方法,则可以令说话者的尾音逐渐变小,是更为人性化的设计。
在上述实施例的基础上,也可以各种其它的变换方式,如改为计算采样点的功率,用信号功率代替信号幅度进行判决,效果是一样的,事实上反映的都是信号的能量。另外,本发明也不局限于实施例中的判断规则,例如,可以取数字语音信号采样点序列中幅度最大的M个采样点的幅度(或功率)进行平均后,再来与一个门限比较,如大于该门限,再进行信号幅度的衰减,也是可以的,M可以取固定数,或者采样块长度的比值,等等。而在衰减时,也可以将幅度降为原幅度的其它小于1的值,如1/4等,不过自适应性相对要差一点。
权利要求
1.一种消除语音输入中背景噪声的方法,包括以下步骤(a)系统在收到模拟输入的语音信号后,将所述信号变换成为数字语音信号采样点序列;(b)计算出当前采样块各采样点的能量值并进行统计,得到一统计值;(c)如果所述统计值低于一设定噪声门限,对当前采样块的采样点进行噪声衰减,然后再将衰减后的采样点序列转换为模拟语音信号输出,否则,直接将原采样点序列转换为模拟语音信号输出。
2.如权利要求1所述的方法,其特征在于,所述步骤(a)中,将所述信号变换为数字语音信号时,先将输入的模拟语音信号变换成为1位的过采样率信号,再对该信号进行频段压缩滤波处理,变成1倍采样率的多位数字信号,从而滤除噪声中的高频段部分。
3.如权利要求2所述的方法,其特征在于,所述步骤(a)中,在得到变成1倍采样率的多位数字信号后,还让该信号经过一高通滤波器,以滤除噪声中的低频段部分。
4.如权利要求1所述的方法,其特征在于,所述采样点的能量值是用采样点的幅度值或者功率值来表示的。
5.如权利要求4所述的方法,其特征在于,所述步骤(b)中得到的所述统计值是指当前采样块各采样点的幅度或功率中的统计最大值。
6.如权利要求5所述的方法,其特征在于,所述步骤(c)中对当前采样块的采样点进行噪声衰减时,是将输出采样点的幅度调整为其原幅度乘以所述幅度或功率中的统计最大值再除以所述噪声门限值。
7.如权利要求5所述的方法,其特征在于,所述设定的噪声门限为10~20mV。
8.一种消除语音输入中背景噪声的装置,包括模数变换模块,幅度统计模块,噪声消除模块以及数模变换模块,其特征在于所述模数变换模块,用于将输入的模拟语音信号变换为数字语音信号,并分别输出给噪声消除模块和幅度统计模块;所述幅度统计模块,用于计算出当前采样块各采样点的能量值并进行统计,得到一统计值,输出到噪声消除模块;所述噪声消除模块,用于判断所述统计值是否低于一设定噪声门限,如果是,对当前采样块的采样点进行噪声衰减,然后输出到所述数模变换模块,否则,直接将原采样点序列输出到所述数模变换模块;所述数模变换模块,用于输入的衰减后的采样点序列或者未经衰减的采样点序列变换成为模拟语音信号输出。
9.如权利要求8所述的装置,其特征在于,所述模数变换模块进一步包括西格码-得尔塔变换模块和频段压缩滤波模块,其中所述西格码-得尔塔变换模块,用于将输入的模拟语音信号经过西格码-得尔塔变换成为1位的过采样率的数字信号输出给频段压缩滤波模块;所述频段压缩滤波模块,用于将上述1位信号变成1倍采样率的多位数字信号输出。
10.如权利要求9所述的装置,其特征在于,所述模数变换模块进一步包括高通滤波模块,用于接收所述频段压缩滤波模块输出的数字信号,滤除噪声中的低频段部分。
11.如权利要求8所述的方法,其特征在于,所述幅度统计模块得到的所述统计值是指当前采样块各采样点的幅度或功率中的统计最大值。
12.如权利要求8所述的方法,其特征在于,所述噪声消除模块在进行噪声衰减时,是将输出采样点的幅度调整为其原幅度乘以所述幅度或功率中的统计最大值再除以所述噪声门限值。
全文摘要
本发明公开一种消除语音输入中背景噪声的方法及其装置,其中模数变换模块在收到模拟输入的语音信号后,将所述信号变换成为数字语音信号采样点序列;幅度统计模块计算出当前采样块各采样点的能量值并进行统计,得到一统计值;如果所述统计值低于一设定噪声门限,噪声消除模块对当前采样块的采样点进行噪声衰减,然后再将衰减后的采样点序列经数模变换模块转换为模拟语音信号输出,否则,噪声消除模块直接将原采样点序列经数模变换模块转换为模拟语音信号输出。采用本发明方法消除语音输入中的背景噪声,能实现更好的性能代价比。
文档编号H04M9/08GK1822092SQ20061001157
公开日2006年8月23日 申请日期2006年3月28日 优先权日2006年3月28日
发明者杨作兴 申请人:北京中星微电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1