使用bark频带weiner滤波器和线性衰减的噪声降低和舒适噪声增益控制的制作方法

文档序号:2829254阅读:365来源:国知局
专利名称:使用bark频带weiner滤波器和线性衰减的噪声降低和舒适噪声增益控制的制作方法
技术领域
本发明涉及音频信号处理,更具体地,涉及用来改善电话中的噪声抑制和舒适噪声的产生的电路。
正如这里使用的那样,“电话”是直接或间接利用得到许可的服务提供商的拨号音的通信设备的通称。同样,“电话”包括桌式电话机(见图1),无绳电话(见图2),扬声器电话(见图3),免持套件(见图4),以及蜂窝电话(见图5)等。为了简单起见,以电话的上下文描述本发明,但是本发明具有更广的应用;例如,不使用拨号音的通信设备,如射频收发器或内部通话设备。
电话系统中有许多噪声源。某些噪声的起源是有关声音的,而其它噪声源是电子的,如电话网络。正如这里使用的那样,“噪声”指任何无用声,无论无用声是周期的,纯随机的,还是在某处之间。同样,噪声包括背景音乐,除了期望的讲话人的其它人的声音,轮胎噪声,风噪声等。特别地,汽车是噪声环境。
正如广泛定义的那样,噪声包括讲话人的声音的回声。然而,在电话系统中,回声消除是独立处理的,需要建立信号通道的传输特性的模型。此外,当例如频率响应和延迟或相移之类的通道特性改变时,需要改变或修改模型。
尽管并不普遍适用,但是现有技术通常把噪声“抑制”和减少联系起来,把噪声“降低”和衰减或减少增益联系起来。正如这里使用的那样,噪声抑制包括从另一个信号中减去某个信号以降低噪声量。
现有技术的自适应回声消除算法本身不足以完全消除回声。回声消除器引起的建模误差将导致回声消除处理后的残留回声。对于听者而言,残留回声是令人讨厌的。不论是否有背景噪声,残留噪声总是一个问题。即使背景噪声级超过残留回声,残留回声也是令人讨厌的,这是因为在残留噪声到来或离开时,听者很容易感觉得到。在大多数情况中,残留回声与背景噪声的频谱特性不同,从而更容易感觉到残留回声。
人们使用诸如残留回声抑制器和非线性处理器之类的各种技术来消除残留回声。即使残留回声抑制器能够在无噪声的环境中很好地工作,但是需要某些附加信号处理以使此种技术在噪声环境中起作用。在噪声环境中,残留回声抑制器的非线性处理产生所谓的噪声抽吸。在抑制残留噪声时,也会抑制附加的背景噪声,从而导致噪声抽吸。为了减少噪声抽吸引起的令人讨厌的影响,在启用回声抑制器时插入与背景噪声匹配的舒适噪声。
尽管有用于降低噪声并增加舒适噪声的改进系统,但是在长的非语音间隔期间,如在超过300毫秒的间隔期间,问题依然存在。在长的非语音间隔期间,使用基于Bark频带的改进Weiner滤波器的噪声抑制系统不能在不引起音调非自然信号的情况下充分降低噪声。此外,当采用补充方式启用残留回声抑制器和噪声抑制器时,在舒适噪声生成处理期间需要当心,因为舒适噪声是在噪声抑制处理之前进行估计的并且其噪声级与噪声抑制之后的噪声级不同。因此,需要更鲁棒的方法来跟踪噪声抑制算法引起的频谱和噪声级的变化。
利用实际背景噪声的舒适噪声发生器需要花费时间来调整频谱内容,在该时间期间的噪声可能与长的非语音间隔期间的实际背景噪声有着明显的不同。当启动噪声降低时,合成舒适噪声与实际背景噪声不匹配。当改变噪声抑制算法内的增益参数时,很难调整舒适噪声的增益。
本领域的熟练技术人员认识到,在把模拟信号转换成数字形式之后,所有后续操作均可以在一个或多个经过适当编程的微处理器内进行。例如,所用单词“信号”意指模拟信号或数字信号。存储器中的数据,即使是一个比特,也可以是一个信号。同样地,“存储器”涉及功能而不涉及形式。数据是存储在微处理器的寄存器中,还是存储在随机存取存储器中,抑或存储在只读存储器或任何其它类型的存储介质中并不重要。
因此,考虑到上述问题,本发明的目的是增加长的非语音间隔期间的噪声抑制。
本发明的另一个目的是改进舒适噪声和背景噪声的频谱匹配。
本发明的又一个目的是提供基本消除噪声抽吸的舒适噪声发生器。
本发明的另一个目的是提供依赖于噪声降低调整参数的舒适噪声级的动态调整,从而可以消除实时调整。

发明内容
上述目的是在本发明中实现的,其中音频处理电路包括基于Bark频带的改进Weiner滤波器和线性噪声降低电路。当检测到长的非语音间隔时,用于检测长的非语音间隔的检测器从Bark频带Weiner滤波切换到线性噪声降低。线性噪声降低提供比Bark频带Weiner滤波更大的噪声降低,并且不产生音乐般的非自然信号。当使用线性噪声降低时,增益平滑滤波器具有一个长的时间常数,并且提供从一个增益级到另一个增益级的逐渐转变。当有长的非语音间隔时,检测器控制用于舒适噪声生成的背景噪声的估计,从而改善舒适噪声的生成。通过基于来自线性噪声降低电路或Bark频带Weiner滤波器的频谱增益计算电路的数据调整舒适噪声的增益,可以进一步改善舒适噪声。


通过结合附图考虑以下详细说明书,将更全面地理解本发明,其中图1是桌式电话机的透视图;图2是无绳电话的透视图;图3是会议电话或扬声器电话的透视图;图4是免持套件的透视图;图5是蜂窝电话的透视图;
图6是电话中的音频处理电路的通用框图;图7是根据本发明构建的噪声抑制器的框图;图8是用于在频域中计算噪声的电路的框图;图9是说明信号中的语音和非语音间隔的波形;图10说明具有语音部分和非语音部分的波形;图11是用于检测长的非语音间隔的电路的框图;图12说明本发明的一个方面;以及图13说明本发明的另一方面。
由于信号可以是模拟的或数字的,所以可以把框图解释为硬件,软件(如流程图),或硬件和软件的混合。对处理器进行编程在本领域的一般技术人员的能力内,无论是一个一个地还是采用分组方式。
具体实施例方式
本发明可以用在其内部电路基本相同但设备的外观可能不同的许多应用中。图1说明桌式电话机,包括底座10,键区11,显示屏13和电话听筒14。正如图1所示,电话机具有扬声器电话能力,包括扬声器15和麦克16。图2所示的无绳电话是类似的,只是底座20和电话听筒21是通过天线23和24用射频信号而不是用电线连接起来的。内部电池(未示出)为电话听筒21供电,当把电话听筒放到托架29上时,通过底座20上的端子26和27对内部电池充电。
图3说明例如在商业事务所看到的会议电话或扬声器电话。电话30包括用刻纹装饰的外壳上的麦克31和扬声器32。正如在美国专利5,138,651(Sudo)中描述的那样,电话30可以包括几个麦克,如麦克34和35,以改善声音收听或者提供多个输入用于回声抑制或噪声抑制。
图4说明通常所说的用于提供到图5所示的蜂窝电话的音频连接的免持套件。免持套件可以有多种实现方式,但是通常包括与插头37相连的电动扬声器36,其中插头37适合附属电源插座或车辆中的点烟器插座。免持套件还包括在插头39终止的电缆38。插头39适合蜂窝电话上的耳机插口,如蜂窝电话42上的插口41(图5)。就像无绳电话一样,某些套件使用RF信号连接到电话。免持套件通常还包括一个音量控制和某些控制开关,如应答呼叫的“摘机”。免持套件通常还包括可以插入到套件中的头戴式麦克(未示出)。免持套件或蜂窝电话可以包含根据本发明构造的音频处理电路。
各种各样的电话都可以从本发明中受益。图6是蜂窝电话的主要部件的框图。通常,该框图与实现所示功能的集成电路相对应。麦克51、扬声器52和键区53与信号处理电路54相连。电路54执行许多功能并且有许多名称,因生产商的不同而不同。例如,英飞凌把电路54叫做“单片基带IC”。高通把电路54叫做“移动台调制解调器”。显然,来自不同厂商的电路其细节是不同的,但是通常都包括所示的功能。
蜂窝电话同时包括音频和射频电路。双工器55把天线56连接到接收处理器57。双工器55把天线56连接到功率放大器58并且在发射期间隔离接收处理器57和功率放大器。发射处理器59利用来自电路54的音频信号调制射频信号。在诸如扬声器电话的非蜂窝应用中,没有射频电路,所以可以在某种程度上简化信号处理器54。回声消除和噪声问题依然存在,需要在音频处理器60中进行处理。因此,需要修改音频处理器60以包括本发明。
大部分的现代噪声降低算法是以称为谱相减的技术为基础的。如果干净的语音信号因附加的非关联的噪声信号而变坏,则含有噪声的信号只不过是各个信号的总和。如果噪声源的功率谱密度(PSD)是已知的,则通过使用Weiner滤波器可以去除含有噪声的语音信号中的噪声从而生成干净的语音;例如,参见J.S.Lim and A.V.Oppenheim,″Enhancement and bandwidth compression of noisy speech,″Proc.IEEE,vol.67,pp.1586-1604,Dec.1979。通常,噪声源是未知的,所以谱相减算法的关键是估计噪声信号的功率谱密度(PSD)。
图7是包含有根据本发明构造的噪声抑制器的音频处理器60的一部分的框图。除噪声抑制之外,音频处理器60还包括回声消除、附加滤波以及不作为本发明的一部分的其它功能。在虚线79表示的线路输入66和扬声器输出68之间的接收信道上连接第二个噪声抑制电路和舒适噪声发生器。
通过以组的方式一起处理输入信号的多个采样执行噪声降低处理。数据组通常称为“块”。为了避免与附图中的插图中的块混淆,把32个采样的组叫做“帧”,把4个帧(128个采样)的组叫做“超帧”。由于四个帧是一起处理的,所以必须对输入数据进行缓冲以便进行处理。使用128个字的缓冲区大小来存储采样,以便对输入数据进行加窗口处理。
对缓冲的数据进行加窗口处理,用框71表示,以降低频域中的分组处理引起的非自然信号。可以使用不同的窗口选项。窗口选择基于各种因素,如主波瓣宽度、旁瓣电平以及重叠大小。在预处理中使用的窗口的类型影响主波瓣宽度和旁瓣电平。例如,与矩形窗口相比,Hanning窗口具有较宽的主波瓣和较低的旁瓣电平。几种窗口类型是技术人员熟知的,并且通过调整诸如增益和平滑系数的某些参数,可以使用几种已知的窗口类型。
如果使用小的重叠,则频域处理引起的非自然信号会加重。大的重叠将导致计算需求的增加。使用合成窗口可以降低重构阶段引起的非自然信号。考虑到所有上述因素,在本发明的优选实施例中,使用重叠率为25%的平滑梯形分析窗口和平滑梯形合成窗口。对于128点离散傅立叶变换,25%的重叠意味着使用前一个超帧的最后32个采样作为当前超帧的最初的(最老的)32个采样。因此,对于8kHz的工业标准采样率,每帧代表4毫秒的信号,每个超帧代表16ms的信号。因为重叠,所以每12ms产生一个超帧。
通过使用离散傅里叶变换72,把加窗口的时域数据变换到频域。计算噪声抑制电路的频率响应,其频率响应具有图8的框图所示的几个方面。信噪比检测器96和舒适噪声发生器98接入频域处理电路中,目的是共享背景噪声估计生成的频谱数据。下面详细描述这些功能。
在框81中,采用当前超帧的移动平均值和前一个超帧的平均值的方式,通过适当加权,逼近噪声语音的功率谱密度。次能带噪声估计85使用Bark频带(也称为“临界频带”),后者建立人的耳朵的感觉模型。把噪声语音帧的DFT分成17个频带。在框82中估计次能带能量,在框85中估计次能带噪声。
技术人员知道,基于广义Weiner滤波作为信噪比的函数计算频谱增益;参见L.Arslan,A.McCree,V.Viswanathan,″New methodsfor adaptive noise suppression,″Proceedings of the 26th IEEEInternational Conference on Acoustics,Speech,and Signal Processing,ICASSP-Ol,Salt Lake City,Utah,pp.812-815,May 2001。对于含有噪声的帧,滤波器应用较强的抑制,在浊音语音(voiced speech)帧期间,应用较弱的抑制。
在框86中,计算每个帧内的每个频带的信噪比。最后,通过使用改进的Weiner解决方案中的Bark频带SNR,在框89中计算频谱增益值。基于谱相减方法的一个缺点是引起乐音非自然信号。由于噪声估计的不准确性,所以在谱相减后某些频谱峰值会作为残余留下来。这些频谱峰值是以乐音方式表现的。为了减少这些非自然信号,噪声抑制因子必须要比计算的值更高。然而,更高的值将导致更多浊音语音失真。调整参数是语音振幅衰减和乐音非自然信号之间的一个折衷。这导致用来控制谈话期间的噪声降低量的一种全新机制。
技术人员熟知利用信号在噪声频谱分量中出现的不确定性来实现语音提高的想法;参见R.J.McAulay and M.L.Malpass,″Speechenhancement using a soft-decision noise suppression filter,″IEEETrans.Acoust.,Speech,Signal Processing,vol ASSP-28,pp.137-145,April 1980。在计算出谈话在噪声环境中出现的概率后,使用计算的概率来调整噪声抑制因子。
检测浊音语音的一种方法是计算语音能谱和噪声能谱的比率。如果该比率很大,则可以设想浊音语音存在。利用一阶指数平均(平滑)滤波器87计算语音存在概率。在频谱增益计算器89中,通过比较语音存在概率与阈值,确定噪声抑制因子。具体地,如果超过阈值,则把噪声抑制因子设置为比不超过该阈值时的值更小的值。为每个频带计算该因子。
对频谱增益进行限制,目的是防止增益低于最小值,如-20dB。该系统能够具有更少的增益,但是不允许把增益降低到最小值以下。该值不是临界值。限制增益能够减少由于频谱增益的有限精度、定点计算产生的乐音非自然信号和语音失真。
利用频谱增益计算过程调整增益的下限。如果Bark频带内的能量小于某个阈值Eth,则把最小增益设置为-1dB。如果某个段被分类为浊音语音,亦即,概率超过pth,则把最小增益设置为-1dB。如果两个条件均不满足,则把最小增益设置为允许的最低增益,如-20dB。在本发明的一个实施例中,Eth的相配值为0.01。pth的相配值为0.1。对每个频带重复该过程,以调整每个频带内的增益。
在所有基于组变换的处理中,加窗口和重叠相加是用来降低由于在频域中采用分组方式处理信号而引起的非自然信号的公知技术。非自然信号的减少受几个因素的影响,如窗口的主波瓣的宽度,窗口中的旁瓣的斜率,以及从组到组的重叠量。主波瓣的宽度受所使用的窗口的类型的影响。例如,与矩形窗口相比,Hanning(升余弦)窗口具有较宽的主波瓣和较低的旁瓣电平。
为了避免横跨频率的增益突变,使用指数平均平滑滤波器92沿频率轴的方向对频谱增益进行平滑处理。通过计算每个Bark频带内的频谱增益的平均值(框95),进一步减少频谱增益的突变。在快速变化的噪声环境中,会在增强输出语音中引入低频噪声颤动(flutter)。颤动是大部分基于谱相减的噪声降低系统的副产品。如果背景噪声快速变化并且噪声估计能够适合该快速变化,则频谱增益也会快速变化,从而生成颤动。在一阶指数平均平滑滤波器94中,通过计算时间轴上的频谱增益的平均值,可以减少低频颤动。
在框75(图7)中,通过计算噪声语音频谱和频谱增益函数的乘积,获得干净的语音频谱。利用逆变换76把频谱转换到时域,利用合成窗口77进行加窗口处理以减少分组非自然信号。最后,正如在框78中那样,对经过加窗口处理的干净语音和前一个帧进行重叠和相加处理。
图9是根据本发明的优选实施例构造的舒适噪声发生器的框图。背景噪声估计器84(图8)生成与背景噪声频谱相匹配的高分辨率的舒适噪声数据。舒适噪声是通过调制伪随机相位谱在频域内生成的,通过使用逆DFT变换到时域。正向DFT 72和PSD估计81(图8)按上述方式运行以便进行噪声抑制。
发生器101生成具有单位大小的随机相位频谱。用来生成舒适噪声的相位谱的一种方法是使用在区域[-p,p]上均匀分布的伪随机数发生器。利用相位谱,通过计算相位谱的实部和虚部,获得单位大小的随机相位频谱。然而,该方法是计算密集的。
另一种方法是,首先,通过使用伪随机数发生器生成该频谱的实部和虚部,生成随机频谱(其大小和相位都是随机的),然后把该频谱归一化为单位大小。因为随机频谱的实部和虚部是均匀分布的,所以导出的相位谱不是均匀的。通过选择均匀分布的随机数的适合边界值,能够生成更均匀的相位谱。与前一个方法相比,该方法需要一个额外的随机数发生器和一次小数分频,但是可以避免计算超越函数。
生成单位大小的随机相位谱的更简单更有效的方法是使用八相位查找表。通过使用均匀分布的随机数,从该查找表内的八个值的一个中选择相位谱。具体地,随机数在区域
上均分分布,将其量化为8个不同的值。(把处在区域0-0.125内的随机数量化为1。把处在区域0.126-0.250内的随机数量化为2,等等。)经过量化处理的值也是均匀分布的,并且与特定相移相对应,特定相移如45°,90°,等等。相位的数目是任意的。业已发现八个相位足以生成没有能够听得见的非自然信号的舒适噪声。与第一种技术相比,该技术更容易实现,因为它不包含除法也不计算三角函数。
在框102中,作为背景噪声级和噪声降低级的函数计算舒适噪声增益。VAD_OUTPUT控制信号控制该框的操作,打开或关闭。如果启用噪声降低,则设置舒适噪声增益,最好依据查找表进行设置,并且与噪声降低级成反比。
在电路103中,通过计算来自发生器101的单位大小的频谱和来自计算102的舒适噪声增益的乘积,生成舒适噪声的频谱匹配的、高分辨率的频谱。通过使用逆DFT 104,把频谱匹配的频谱变换到时域。
因为生成的舒适噪声是随机的,所以会在帧边界上引起能够听得见的非自然信号。为了降低边界非自然信号,在框105中使用任意窗口对舒适噪声进行加窗口处理。缓冲经过加窗口处理的舒适噪声,并使其输出速率与噪声降低算法的输出速率同步。
连同图7和图8一起描述的噪声降低算法可以减少长的非语音间隔期间的噪声降低量。另外,经过处理的信号也许包含长的非语音间隔期间的音乐般的非自然信号。为了解决该问题,使用语音脉冲串检测器来检测长的非语音间隔。检测时,在噪声信号上应用线性噪声降低,其噪声降低大于从Bark频带Weiner滤波获得的噪声降低,这是因为Bark频带Weiner滤波引起如上所述的非自然信号。通过切换到线性噪声降低可以消除经过改进的Weiner滤波器在长的非语音间隔期间引起的音调非自然信号。
在图10中,波形100代表具有语音部分107和非语音部分108的信号。这些部分的持续时间不是按比例绘制的。正如这里使用的那样,“长的”非语音部分的持续时间的数量级为300ms(约75个帧或约25个超帧)或更多。该改进取决于检测长的非语音间隔。
图11是用于检测长的非语音间隔的电路的框图。该检测器以基于简单能量的方法为基础。比较超帧中的信噪比(SNR)111和预先确定的阈值th。如果SNR大于阈值,则指定超帧为语音帧,否则,则指定超帧为非语音帧。对于某个数目的相邻帧,如两个相邻帧,仅当SNR大于阈值时,才宣布超帧是语音帧。在寄存器114中,对每个周期的语音帧的数目进行计数,然后在比较器115中与阈值进行比较。
在本发明的一个实施例中,把长间隔的阈值持续时间设置为31个超帧。使用正逻辑,亦即,″0″代表“假”或非语音,″1″代表“真”或语音。这些并非关键设计选择。也可以使用其它值或负逻辑。
对于前n个帧内的至少一个帧,如果宣布超帧为语音帧,则把语音检测标记VAD_OUTPUT设置为1。如果VAD_OUTPUT为0,意味着有长的非语音间隔。
根据本发明,正如图12所示,利用受VAD_OUTPUT控制的切换电路交替选择Bark频带Weiner滤波器121和线性噪声降低电路122。当VAD_OUTPUT为0时使用线性噪声降低。在从噪声抑制电路中的改进Weiner滤波器切换到线性噪声降低或相反时,如果电路增益突然变化,则背景噪声会有使人不愉快的变化。为了避免这种影响,可以使用缓慢衰减的滤波器来非常缓慢地改变增益,以平滑噪声降低电路中的增益。该滤波器具有加权,游动平均形式,G(k,m)=α*G(k,m-l)+(l-α)γ其中G(k,m)是用于帧m的指标(bin)k的增益,γ是与频率无关的线性增益,α是平滑常数。在本发明的一个实施例中,对于缓慢衰减而言,α的值为.992。对于快速衰减,使用的值为0.300。这些值仅仅是示例而已。
在本发明的优选实施例中,在计算SNR时使用来自图8的平滑噪声估计。依据背景噪声的数量限制基于简单能量的检测器的性能,在SNR的计算中进行某些修改以改进低输入SNR条件下的VAD性能。如果SNR是在噪声消除框之后计算的,则可以显著改善性能。亦即,如果框111(图11)与框75(图7)的输出相连,则可以改善性能。这是因为基于Bark频带的改进Weiner滤波器可以改善含有噪声的语音信号的SNR,所以可以实现性能改善。根据Parseval定理,在频域中计算所有频带的SNR等价于在时域中计算SNR。SNR计算是在频域中进行的,这是因为噪声估计在频域中是可用的。
根据基于Bark频带的倍减因子调整舒适噪声增益。使用全局(相对于频谱指标数(bin number))参数来匹配舒适噪声级。这种方法的一个缺点是,当启用线性噪声降低时,合成舒适噪声的频谱与实际的背景噪声不匹配。此外,当改变噪声降低算法中的最小增益时,很难调整舒适噪声级。正如图13所示,为了解决这些问题,基于频谱(噪声降低)增益调整舒适噪声增益。这种增强可以减轻调整作用并且可以改善舒适噪声的频谱品质。请注意,即使不使用线性噪声降低,频谱增益也会影响舒适噪声生成。
高估语音期间的背景噪声会危害舒适噪声的品质。根据本发明,为了改善舒适噪声的品质,使用长间隔检测器(图11)来阻止估计语音期间的背景噪声。仅当VAD_OUTPUT为0时,才更新用于舒适噪声发生器98的背景噪声估计(框84,图8)。基于改进的Doblinger噪声估计算法更新背景噪声。在计算SNR时,使用如上所述的平滑噪声估计。
如果使用来自噪声抑制器的频谱增益,则生成的舒适噪声级和减少的背景噪声级非常接近。这导致从噪声降低模式到舒适噪声插入模式的平滑转变。平滑转变产生令人愉快的声音效果。然而,用来控制舒适噪声增益的这种技术的缺点是,如果需要在语音段之后立即插入舒适噪声,则会夸大舒适噪声增益,这是因为语音段期间的噪声降低量较少。被夸大的舒适噪声增益将导致噪声抽吸。为了避免噪声抽吸,仅在语音不出现时,亦即,只有在输入上有背景噪声时,才更新舒适噪声增益。这是因为噪声降低增益与信噪比成正比。因此,当在SNR比较高的帧期间更新舒适噪声时,因为高估舒适噪声增益,所以会听到噪声抽吸。为了减轻这种影响,使用VAD_OUTPUT和平滑滤波器来控制舒适噪声增益。可以使用来自滤波器94(图8)的过滤输出或使用独立滤波器。
因此,本发明提供长的非语音间隔期间的增强噪声抑制,以及舒适噪声和背景噪声的改进的频谱匹配。另外,这种改进基本消除了噪声抽吸,并且能够采用完全依赖于噪声降低参数的方式来调整舒适噪声级。
通过描述本发明,本领域的熟练技术人员显然能够在本发明的范围内做出各种修改。例如,通过使用信号的完整频谱或缩减频谱,可以在时域内检测长的非语音间隔。
权利要求
1.一种具有音频处理电路的电话,该音频处理电路包括把音频信号划分成多个帧的分析电路,噪声抑制电路和噪声降低电路,其中每个帧包含多个采样,该改进包括用于检测长的非语音间隔的装置;以及在检测到长的非语音间隔时,用于从噪声抑制切换到噪声降低的装置。
2.如权利要求1所述的电话进一步包括所述噪声抑制电路中的增益平滑滤波器,其中在从噪声抑制切换到噪声降低时,所述增益平滑滤波器具有一个长的时间常数,以便提供从一个增益级到另一个增益级的逐渐转变。
3.如权利要求2所述的电话,其中在短的非语音间隔期间所述滤波器具有一个短的时间常数。
4.如权利要求1所述的电话,其中用于检测的所述装置与所述噪声抑制电路的输出相连,以便在低信噪比时改善用于检测的装置的性能。
5.一种包含有噪声抑制电路的电话,该噪声抑制电路具有用于估计背景噪声的电路和与所述噪声抑制电路相连的舒适噪声发生器,该舒适噪声发生器基于来自估计背景噪声的所述电路的数据生成舒适噪声,该改进包括用于检测长的非语音间隔的装置;以及与所述电路相连的装置,当用于检测长的非语音间隔的所述装置检测到长的非语音间隔时,该电路用于推迟估计。
6.如权利要求5所述的电话,其中所述电话还包括频谱增益计算电路,并且所述改进进一步包括基于来自所述频谱增益计算电路的数据调整该舒适噪声的增益的装置。
7.如权利要求6所述的电话,其中计算所述数据的平均值。
8.如权利要求5所述的电话,其中用于检测的所述装置与所述噪声抑制电路的输出相连,以便在低信噪比时改善用于检测的装置的性能。
全文摘要
使用基于Bark频带的改进Weiner滤波器(121)和线性噪声降低(122)的噪声抑制的组合消除电话中的噪声。用于检测长的非语音间隔的检测器与噪声抑制器的输出相连,并且控制噪声抑制或噪声降低的选择。当使用噪声降低时,增益平滑滤波器具有长的时间常数,并且提供从一个增益级到另一个的渐变。通过仅在检测的长的非语音间隔期间更新用于生成舒适噪声的数据,平滑地插入舒适噪声。
文档编号G10L15/00GK101080766SQ200580043503
公开日2007年11月28日 申请日期2005年10月17日 优先权日2004年11月3日
发明者塞谬尔·帕瓦玛·埃比尼则 申请人:声学技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1