低比特率语音编码器的噪声抑制的制作方法

文档序号:2822004阅读:314来源:国知局
专利名称:低比特率语音编码器的噪声抑制的制作方法
背景技术
本发明提供了一种噪声抑制技术,适合用作低比特率语音编码器的前端。创造的技术特别适合在蜂窝电话的应用中使用。
下面的已有技术文献提供了本发明的技术背景“ENHANCED VARIABLE RATE CODEC,SPEECH SERVICE OPTION 3 FORWIDEBAND SPREAD SPECTRUM DIGITAL SYSTEMS(宽带扩频数字系统的语音服务选项3,增强型可变速率编解码器)”,TIA/EIA/IS-127标准。
“THE STUDY OF SPEECH/PAUSE DETECTORS FOR SPEECH ENHANCEMENTMETHODS(语音增强方法的语音/暂停检测器的研究)”,P.Sovka和P.Pollk,Eurospeech 95 Madrid,1995,p.1575-1578。
“SPEECH ENHANCEMENT USING A MINIMUM MEAN-SQUARE ERRORSHORT-TIME SPECTRAL AMPLITUDE ESTIMATOR(使用最小均方差的短时频谱幅度估计器的语音增强)”,Y.Ephraim,D.Malah,IEEETransactions on Acoustics Speech and Signal Processing(关于语声和信号处理的IEEE汇刊),Vol.ASSP-32,No.6,Dec.1984,pp.1109-1121。
“SUPPRESSION OF ACOUSTIC NOISE USING SPECTRAL SUBTRACTION(使用频谱减法的语音噪声的抑制)”,S.Boll,IEEE Transactionson Acoustics Speech and Signal Processing(关于语声和信号处理的IEEE汇刊),Vol.ASSP-27,No.6,April.1979,pp.113-120。
“STATISTICAL-MODEL-BASED SPEECH ENHANCEMENT SYSYTEMS(基于统计模型的语音增强系统)”Proceedings of the IEEE(IEEE会刊),Vol.80,No.10,October.1992,pp.1526-1544。
噪声抑制的一种低复杂性的方法是频谱修正(也称作频谱减法)。使用频谱修正的噪声抑制算法首先把有噪语音信号分成几个频带。一般根据每个频带中估计的信噪比计算该频带的增益。应用这些增益并重建信号。此类方案必须从观察的有噪语音信号来估计信号和噪声的特性。频谱修正技术的几个实施方案可见于美国专利5,687,285; 5,680,393;5,668,927;5,659,622;5,651,071; 5,630,015;5,625,684;5,621,850;5,617,505; 5,617,472;5,602,962;5,577,161;5,555,287; 5,550,924;5,544,250;5,539,859;5,533,133; 5,530,768;5,479,560;5,432,859;5,406,635; 5,402,496;5,388,182;5,388,160;5,353,376; 5,319,736;5,278,780;5,251,263;5,168,526; 5,133,013;5,081,681;5,040,156;5,012,519; 5,908,855;5,897,878;5,811,404;4,747,143; 4,737,976;4,630,305;4,630,304;4,628,529; 和4,468,804。
频谱修正具有几个合乎需要的特性。首先,可使其自适应并因此可处理变化的噪声环境。其次,大量的计算可在离散傅里叶变换(DET)域中进行。因此可以使用快速算法(如快速傅里叶变换(FFT))。
但是,目前的技术水平存在几个缺点;它们包括(i)在中到高噪声电平中的想要的语音信号的不良失真(这种失真有几个原因,其中一些原因将在下面详述);和(ii)过分复杂的计算。
最好提供一种能够克服已有技术缺陷的噪声抑制技术。具体来说,最好提供一种解释通常在基于块的噪声抑制技术中的时域不连续性的噪声抑制技术。另外最好提供一种技术可减少因频谱减法固有的频域不连续性所引起的失真。而且最好在噪声抑制时降低频谱整形操作的复杂性,并增加噪声抑制技术中的估计的噪声统计的可靠性。
本发明提供了一种具有这些和其它优点的噪声抑制技术。
根据本发明的一种方法,它抑制带有噪声与语音的组合的输入信号中的噪声。输入信号被分为信号块,这些信号块被处理以提供输入信号的短时感知带谱的估计。在各个不同的时间点确定输入信号是仅带有噪声还是带有噪声和语音的组合。当输入信号仅带有噪声时,相应估计的输入信号的短时感知带谱被用于更新噪声的长期感知带谱的估计。随后根据噪声的长期感知带谱和输入信号的短时感知带谱的估计确定噪声抑制频率响应,并根据该噪声抑制频率响应整形(shape)输入信号的当前块。
该方法还可包括对输入信号进行前置滤波以加重其高频分量的步骤。在所示的实施例中,输入信号的处理包括把离散傅里叶变换应用到信号块以提供每个块的复数值的频域表示。把信号块的频域表示转换为仅有幅度的信号,它们在分离的频带之间被平均以提供一个长期感知带谱估计。该感知带谱中的时间变化被平滑以提供短时感知带谱估计。
通过使用一种用以对输入信号的当前块进行整形的全极点滤波器可以模型化(model)噪声抑制频率响应。
本发明提供了用于抑制带有噪声和语音的组合的输入信号中的噪声的设备。可前置滤波输入信号以加重其高频分量的信号预处理器把输入信号分成块。随后,快速傅里叶变换处理器处理这些块以提供输入信号的复数值的频域谱。累加器用于把复数值的频域谱累加为包括宽度不等的频带的长期感知带谱。该长期感知带谱被滤波以产生一个短时感知带谱,它包括所述长期感知带谱的当前段外加噪声。语音/暂停检测器确定在一个给定时间点的输入信号是仅带有噪声还是带有语音和噪声的组合。当输入信号仅是噪声时,响应语音/暂停检测电路的噪声谱估计器根据短时感知带谱来更新噪声的长期感知带谱的估计。响应噪声谱估计器的频谱增益处理器确定噪声抑制频率响应。响应频谱增益处理器的频谱整形处理器则整形输入信号的当前块以抑制其中的噪声。频谱整形处理器可包括如全极点滤波器。
本发明还公开了一种用于抑制输入信号中的噪声的方法,其中输入信号带有噪声和音频信息如语音的组合。在频域中计算输入信号的噪声抑制频率响应。计算的噪声抑制频率响应随后被应用到时域中的输入信号以抑制输入信号中的噪声。这种方法还可包括在计算输入信号的噪声抑制频率响应之前把输入信号分成块的步骤。在所示的实施例中,噪声抑制频率响应借助于全极点滤波器而应用到了输入信号,它是通过确定噪声抑制频率响应的自相关函数而产生的。
图9示出了分段常数的频率响应;并且

图10示出了图9的分段常数频率响应的平滑处理。
发明详细描述根据本发明,一种噪声抑制算法计算时变滤波响应,并将其应用到有噪语音。该算法的框图在图1中示出,其中标有“AR参数计算” 和“AR频谱整形”的方框涉及到时变滤波响应的应用,并且“AR”表示“自回归”。图1中的其它所有方框均对应于通过有噪语音计算时变滤波响应。
在信号预处理器10中,通过使用一种简单的高通滤波器来预处理有噪输入信号以便略微加重其高频分量。预处理器随后把滤波的信号分成块,这些块则传送到快速傅里叶变换(FFT)模块12。FFT模块12把一个窗口应用到信号块并把离散傅里叶变换应用到信号。由此产生的复数值的频域表示被处理产生一个只有幅度的信号。这些只有幅度的信号的值在分离的频带中平均,得到一个“感知带谱”。该平均可以使必须处理的数据量减少。
在信号及噪声谱估计模块14中,感知带谱中的时间变化被平滑,从而产生输入信号的短时感知带谱的估计。该估计被传送到语音/暂停检测器16、噪声谱估计器18和频谱增益计算模块20。
语音/暂停检测器16确定当前的输入信号是只有噪声还是具有语音和噪声组合。该确定通过下面的步骤得出,即测量输入语音信号的几个性能;使用这些测量结果更新输入信号的模型;并利用该模型的状态做出最终的语音/暂停判定。该判定随后传送到噪声谱估计器。
当语音/暂停检测器16确定输入信号只是由噪声组成时,则噪声谱估计器18使用当前的感知带谱来更新噪声的感知带谱估计。另外,噪声谱估计器的某些参数在此模块中被更新并回传到语音/暂停检测器16。噪声的感知带谱估计则传送到频谱增益计算模块20。
利用当前信号和噪声的感知带谱估计,频谱增益计算模块20确定噪声抑制频率响应。这个噪声抑制频率响应是图9所示的分段常数。每个分段常数的段对应于临界带谱的一个单元。该频率响应传送到AR参数计算模块22。
AR参数计算模块利用全极点滤波器模型化噪声抑制频率响应。由于噪声抑制频率响应是分段常数,所以其自相关函数能够以闭合式容易地确定。通过自相关函数则可以有效地计算全极点滤波器参数。分段常数谱的全极点模型化具有平滑噪声抑制谱中的不连续性的效果。可以理解,目前已知或随后公开的其它模型化技术也可代替全极点滤波器的使用,并且本发明的权利要求书涵盖了所有的这些等效装置。
AR频谱整形模块24使用AR参数来把输入信号的当前块进行滤波。通过在时域中执行频谱整形,可以降低由于块处理而产生的时间的不连续性。而且,由于噪声抑制频率响应可使用低阶全极点滤波器进行模化,所以时域整形可能会在某些处理器上产生更有效的在信号预处理模块10中,首先使用H(z)=1-0.8z-1形式的高通滤波器预加重信号。这种高通滤波器被选择来部分补偿语音固有的频谱倾斜。如此预处理信号将产生更精确的噪声抑制频率响应。
如图2所示,输入信号30以八十个样本的块为单位(对应于8KHz取样率的10ms)进行处理。这在分析块34中示出,如图所示,它在长度上是八十个样本。具体来说,在图示的典型实施例中,输入信号被分成具有128个样本的块,每个块由前个块的最后24个样本(参考数字32)、分析块34的80个新样本和为零的24个样本(参考数字36)组成。每个块利用汉明窗口开窗并且进行傅里叶变换。
在块结构中含有的零填充字符应当进行进一步的解释。具体来说,从信号处理的观点来说,零填充字符并不是必需的,因为频谱整形(随后描述)并不使用离散傅里叶变换来执行。但是,包括零填充字符将易于把此算法结合到现有的由本发明的受托方SolanaTechnology Development Corporation提供的EVRC话音编解码器中。这种块结构要求在现有EVRC代码的整个缓冲器管理策略中没有变化。
每个噪声抑制帧可被看作是一个128-点的序列。以g[n]表示这个序列,信号块的频域表示被定义为离散傅里叶变换 ,式中的C是归一化常数。信号频谱则被累加为如下所示的宽度不等的频带S[k]=1fh[k]-fl[k]+1Σi=f[lk]fh[k]|G[i]|2]]>式中fl[k]={2,4,6,8,10,12,14,17,20,23,27,31,36,42,49,56}fh[k]={3,5,7,9,11,13,16,19,22,26,30,35,41,48,55,63}这被称作感知带谱。图3示出了一般以50表示的频带。如图所示,噪声谱的频带(NS频带)具有不同的宽度,并且与离散傅里叶变换(DFT)块有关。
信号加噪声的感知带谱的估计在模块14(图1)中通过使用诸如单极点递归滤波器过滤感知带谱而产生。信号加噪声的功率谱的估计是
Su[k]=β·Su[k]+(1-β)·S[k]。
因为语音的特性仅仅在较短的时间周期内稳定,所以滤波器参数β被选择仅仅在几个(例如,2-3个)噪声抑制块上执行平滑处理。该平滑被称作“短时”平滑,并提供“短时感知带谱”的估计。
噪声抑制系统要求精确的噪声统计估计以便于适当地发挥作用。此功能由语音/暂停检测模块16提供。在一个可能的实施例中,提供了一种既测量语音又测量噪声的单话筒。因为噪声抑制算法需要噪声统计估计,所以需要一种区分有噪语音信号和只有噪声的信号的方法。这种方法必须基本上检测到有噪语音中的暂停。此任务的执行由于下面的几个因素而变得更加困难1.暂停检测器必须在可接受的低信噪比(0-5dB)下执行。
2.暂停检测器必须不易受背景噪声统计的缓慢变化的影响。
3.暂停检测器必须准确区别出类噪声语音(例如磨擦的)和背景噪声。
图4提供了语音/暂停检测器16的一个可能实施例的框图。
暂停检测器在有噪语音信号正在通过有限数目的信号模型之间的转换产生时将其模型化。有限状态机(FSM)64控制模型之间的转换。语音/暂停判定是FSM的当前状态以及对当前信号的测量结果以及其它适当的状态变量的函数。状态间的转换是当前FSM状态和对当前信号的测量结果的函数。
下述的被测量被用于确定驱动信号状态状态机64的二进制值的参数。总之,这些二进制值的参数是通过比较适当的实数值的测量结果和自适应阈值来确定的。测量模块60提供的信号测量结果量化下面的信号性能1.能量测量确定信号是高能量还是低能量。这个以E[i]表示的信号能量被定义为Ei=logΣk=063|G[k]|2]]>。有噪语音发声的一个能量测量实例在图5中示出,其中各个语音样本的振幅由曲线70指示,并且相应的NS块的能量测量以曲线72表示。
2.频谱转换测量确定信号频谱在一个短时间窗口之中是稳态还是瞬态。此测量是通过确定感知带谱的每个频带的经验均值和方差来计算的。感知带谱的所有频带的方差之和用作频谱转换的测量结果。具体来说,以Ti表示的转换测量计算如下感知频谱的每个频带的均值通过单极点递归滤波器计算Si[κ]=αSi-1[κ]+(1-α)Si[κ]。感知频谱的每个频带的方差通过递归滤波器计算S^i[k]=αS^i-1[k]+(1-α)(Si[k]S-i[k])2]]>。滤波器参数α被选择在一个较长的时间周期期间,即在10-20个噪声抑制块间执行平滑处理。总方差被计算为每个频带的方差之和σi2=Σi=015S^i[k]]]>。应当指出,当感知带谱与其长期均值没有特别大的不同时,σi2本身的方差将是最小的。因此,频谱转换的合理测量结果是σi2的方差,它计算如下σi2=ωiσi-12+(1-ωi)σi2Ti=ωiTi-1+(1-ωi)(σi2-σi2)2。自适应时间常数如下给出ωi=(0.25σi2≤σ-i-120.875σi2>σ-i-12]]>通过采用该时间常数,该频谱转换测量可适当地跟踪信号稳定的部分。有噪语音发声的一个频谱转换测量实例在图6中示出,其中各个语音样本的振幅由曲线74指示,并且相应NS块的能量测量结果由曲线75表示。
3.以SSi表示的频谱相似性测量可以测量当前信号频谱与估计的噪声谱的相似程度。为了定义该频谱相似性测量,假定我们可以得到以Ni[k]表示的噪声的感知带谱的算法的估计(Ni[k]的定义在下面结合噪声谱估计器的讨论来提供)。频谱相似性测量则被定义为SSi=Σk=015|logSi[k]-NI[k]|]]>。有噪发声的频谱相似性测量的一个实例在图7中示出,其中各个语音样本的振幅由曲线76表示,并且相应NS块的能量测量结果由曲线78表示。需要指出的是,频谱相似性测量的小数值对应于高度相似的频谱,而较高的频谱相似性测量结果对应于不相似的频谱。
4.能量相似性测量确定当前信号能量Ei=logΣk=063|G[k]|2]]>是否类似于估计的噪声能量。这是通过比较信号能量和由阈值应用模块62应用的阈值来确定的。实际的阈值由阈值计算处理器66计算,处理器66可包括一个微处理器。
通过以S[k]表示信号频谱的当前估计,以Ei表示信号能量的当前估计,以Ni[k]表示对数噪声谱的当前估计,以Ni表示噪声能量的当前估计,并以 表示噪声能量估计的方差,二进制参数被定义。
参数high_low-energy指示出信号是否具有高能量内容,高能量是相对于背景噪声的估计能量来定义的。它通过估计当前信号帧中的能量并应用一个阈值来计算。它定义为high_low-energy={0Ei≤Et1Ei>Et]]>式中E是由Ei=logΣk=063|G[k]|2]]>定义,并且Ei是自适应阈值。
参数transition指示出信号频谱何时经过转换。它是通过观察当前短时频谱相对于频谱平均值的偏差来测量的。它在数学上定义为transition={0Ti≤Tt1Ti>Tt]]>式中的T是在前面章节中定义的频谱变换测量结果,且Ti是将在随后更详细描述的自适应计算的阈值。
参数spectral_similarity测量当前信号频谱和估计的噪声谱之间的相似性。它可通过计算当前信号频谱的对数和估计的噪声频的对数之间的距离来测量。spectral_similarity={0SSi≤SSt1SSi>SSt]]>式中SSi已在上面描述,SSt是下面要讨论的一个阈值(例如一个常数)。
参数energy_similarity测量当前信号能量和估计的噪声能量之间的相似性。energy_similarity={0Ei≤ESt1E>ESt]]>式中的E由Ei=logΣk=063|G[k]|2]]>定义,且ESt是下面定义的自适应计算的阈值。
上述变量全部是通过比较一个数和一个阈值来计算。前三个阈值反映了动态信号的特性,并且将根据噪声的特性而定。这三个阈值是标准偏差的和积与估计均值的和。用于频谱相似性测量的阈值不是根据噪声的特定性能确定的,而是可设置为一个常数值。
高/低能量阈值是由阈值计算处理器66(图4)计算为Ei=E-i-1+2Ei-1^]]>的,式中的 是定义为E^i=γiE^i-1+(1-γi)(Ei-E-i-1)2]]>的经验方差,而Ei是定义为Ei=γE^i-1+(1-γ)Ei]]>的经验均值。
能量相似性阈值定义为 应当指出,能量相似性阈值的增长速率受限于本实例中的因数1.05。这确保高噪声能量对阈值没有不成比例的影响。
频谱转换阈值计算为Ti=2N^i]]>。频谱相似性阈值是SSi=10的常数。
可模型化有噪语音信号的信号状态状态机64在图8中更详细的示出。其状态转换由前面段落中描述的信号测量结果来控制。信号状态是示作单元80的稳态低能量、示作单元82的瞬态和示作单元84的稳态高能量。在稳态低能量期间,没有频谱转换发生,并且信号能量低于一个阈值。在瞬态期间发生频谱转换。在稳态高能量期间,不发生频谱转换,并且信号能量高于一个阈值。状态之间的转换由上述信号测量结果来管理。
状态机的转换在表1中定义。
表1
在这个表中,“X”表示“任何值”。应当指出,针对任意测量结果,状态转换被确定。
由检测器16(图1)提供的语音/暂停判定根据信号状态状态机的当前状态和结合图4描述的信号测量结果而定。语音/暂停判定由下面的伪码管理(暂停dec=0;语音dec=1);dec=1;if spectral_similarity==1dec=0;elseif current_state==1if energy_similarity==1dec=0;endend噪声谱是由噪声参数估计模块68(图4)在归类为暂停的帧期间利用公式Ni[κ]=βNi[κ]+(1-β)log(Si[κ])来估计的,式中的β是0和1之间的常数。噪声能量的当前估计Ni,和噪声能量估计的方差 定义如下Ni=λNi-1[κ]+(1-λ)log(Ei)N^i=λN^i-1[k]+(1-λ)(N-i-log(Ei))2]]>式中的滤波器常数λ被选择以平均10-20个噪声抑制常数。
频谱增益可利用已有技术中熟知的各种方法来计算。一种非常适合当前实施方案的方法包括定义信噪比为SNR[k]=c*(1og(Su[k]-Ni[k])),式中的C是一个常数并且Su[k]和Ni[k]已在上面定义。与噪声有关的增益的分量定义为γN=-10ΣkN[k]]]>。一旦计算了瞬时增益,则必须将其应用到有噪语音。这对应于用以修正有噪语音信号的短时频谱的(时变)滤波操作。结果则是噪声抑制的信号。与当前实践相反,这种频谱修正不必应用到频域中。事实上,频域实施方案可能具有下面的缺陷1.它可能是不必要的复杂。
2.它可能引起质量较低的噪声抑制语音。
频谱整形的时域实施方案具有增加的优点在于整形滤波器的冲激响应不必是线性相位。而且,时域实施方案消除了因循环卷积引起的某些产物(artifacts)的可能性。
这里描述的频谱整形技术包括一种用于设计用以执行噪声抑制频率响应的低复杂性滤波器以及该波器的应用的方法。这种滤波器由AR频谱整形模块24(图1)根据AR参数计算处理器22提供的参数来提供。
由于希望的频率响应是图9所示的具有较少段的分段常数,因此其自相关函数能够以闭合式来有效地确定。已知自相关系数,则可确定用以逼近分段常数频率响应的全极点滤波器。这种方法具有几个优点。第一,与分段常数频率响应相关的频谱不连续性可以消除。第二,与FFT块处理相关的时间不连续性可以消除。第三,由于整形处理在时域中应用,所以不需要逆DFT。若有低阶的全极点滤波器,那么这可以在固定点实施方案中提供计算上的优势。
这种频率响应在数学上可表达为H(ω)=Σi=1NCGs[k]I(ω,ωk1,ωk),]]>式中的Gs[k]是平滑的信道增益,它设置第i个分段常数段的振幅,并且I(ω,ωi-1,ωi)是由频率ωi-1,ωi限定的间隔的指示函数,即当ωi-1<ω<ωi时,I(ω,ωi-1,ωi)=1,否则为0。自相关函数是H2(ω)的傅里叶逆变换,即 式中γi=(ωi-ωi-1),并且βi=(ωi-1-ωi)/2。这可以通过使用值 的查表来容易地实施。
已知上述的自相关函数,则通过求解标准方程可以确定频谱的全极点模型。通过使用诸如Levinson/Durbin递归可有效地计算所需的矩阵求反。
图10示出了使用十六阶滤波器的全极点模型化的例子。应当指出,频谱的不连续性已经消除。显然,通过增加全极点滤波器的阶数可以更精确地制作该模型。但是,十六阶滤波器在合理的计算成本下提供了良好的性能。
通过AR参数计算处理器22计算的参数所提供的全极点滤波器应用到AR频谱整形模块24中的有噪输入信号的当前块,以便提供频谱整形的输出信号。
现在应当理解,本发明提供了一种具有各种独特特征的噪声抑制方法和设备。具体来说,提供了一种话音活动性检测器,它由输入信号的状态机模型构成。这个状态机由通过输入信号得到的各种测量结果来驱动。这种结构得出了低复杂性但高准确性的语音/暂停判定。另外,噪声抑制频率响应在频域中计算但应用于时域中。这具有消除时域不连续性的效果。其中时域不连续性会在把噪声抑制频率响应应用到频域的“基于块”的方法中发生。而且,噪声抑制滤波器使用用以确定噪声抑制频率响应的自相关函数的新颖方法来设计。这种自相关序列则用于产生全极点滤波器。在某些情况下,全极点滤波器可具有更小的复杂性来实施该频域法。
尽管结合本发明的特定实施例已经对本发明进行了描述,但应当理解,在不背离权利要求书所述的本发明范围的情况下可以对本发明进行各种改进和适应。
权利要求
1.一种用于抑制带有噪声和语音组合的输入信号中的噪声的方法,包括的步骤是;把所述输入信号分成信号块;处理所述信号块以提供所述输入信号的短时感知带谱的估计;在各个不同的时间点确定所述输入信号是仅带有噪声还是带有噪声和语音的组合,并且当输入信号仅带有噪声时,则使用相应估计的输入信号的短时感知带谱来更新噪声的长期感知带谱的估计;根据噪声的长期感知带谱的所述估计和估计的输入信号的短时感知带谱确定噪声抑制频率响应;并且根据所述噪声抑制频率响应整形输入信号的当前块。
2.根据权利要求1的方法,包括的其它步骤是在所述处理步骤之前对所述输入信号进行前置滤波以加重其高频分量。
3.根据权利要求2的方法,其中所述处理步骤包括的步骤是把离散傅里叶变换应用到信号块以提供每个块的复数值的频域表示;把信号块的频域表示转换为仅有幅度的信号;在分离的频带之间平均仅有幅值的信号以提供所述长期感知带谱的估计;并且消除感知带谱中的时间变化以提供所述短时感知带谱的估计。
4.根据权利要求3的方法,其中通过在所述整形步骤期间使用一种全极点滤波器可以模型化所述噪声抑制频率响应。
5.根据权利要求1的方法,其中通过在所述整形步骤期间使用一种全极点滤波器可以模型化所述噪声抑制频率响应。
6.根据权利要求1的方法,其中所述处理步骤包括的步骤是把离散傅里叶变换应用到信号块以提供每个块的复数值的频域表示;把信号块的频域表示转换为仅有幅度的信号;在分离的频带之间平均仅有幅度的信号以提供所述长期感知带谱的估计;并且消除感知带谱中的时间变化以提供所述短时感知带谱的估计。
7.一种用于抑制带有噪声和语音组合的输入信号中的噪声的设备,包括信号预处理器,用于把所述输入信号分成块;快速傅里叶变换处理器,用于处理所述块以提供所述输入信号的复数值的频域谱;累加器,用于把所述复数值的频域谱累加为包括长度不等的频带的长期感知带谱;滤波器,把长期感知带谱滤波以产生短时感知带谱的估计,它包括所述长期感知带谱的当前段外加噪声;语音/暂停检测器,用于确定所述输入信号当前是仅带有噪声还是带有语音和噪声的组合;响应所述语音/暂停检测电路的噪声谱估计器,当输入信号仅是噪声时,用于根据输入信号的短时感知带谱来更新噪声的长期感知带谱的估计;响应所述噪声谱估计器的频谱增益处理器,用于确定噪声抑制频率响应;和响应所述频谱增益处理器的频谱整形处理器,用于整形输入信号的当前块以抑制其中的噪声。
8.根据权利要求7的设备,其中所述频谱整形处理器包括全极点滤波器。
9.根据权利要求8的设备,其中所述信号预处理器预先过滤所述输入信号以加重其高频分量。
10.根据权利要求7的设备,其中所述信号预处理器预先过滤所述输入信号以加重其高频分量。
11.一种用于抑制带有噪声和音频信息组合的输入信号中的噪声的方法,包括的步骤是;在频域中计算所述输入信号的噪声抑制频率响应;并且把所述噪声抑制频率响应应用到时域中的所述输入信号以抑制输入信号中的噪声。
12.根据权利要求11的方法,包括的其它步骤是在计算所述输入信号的噪声抑制频率响应之前把所述输入信号分成块
13.根据权利要求12的方法,其中所述噪声抑制频率响应借助于通过确定噪声抑制频率响应的自相关函数产生的全极点滤波器而应用到了所述输入信号。
14.根据权利要求11的方法,其中所述噪声抑制频率响应借助于通过确定噪声抑制频率响应的自相关函数产生的全极点滤波器而应用到了所述输入信号。
全文摘要
带有噪声与语音的组合的输入信号中的噪声得到抑制。输入信号被分为(10)信号块,这些信号块被处理(14)以提供输入信号的短时感知带谱的估计。在各个不同的时间点确定(16)输入信号是仅带有噪声还是带有噪声和语音的组合。当输入信号仅带有噪声时,相应估计的输入信号的短时感知带谱被用于更新噪声的长期感知带谱的估计(18)。随后根据噪声的长期感知带谱和输入信号的短时感知带谱的估计确定(20)噪声抑制的频率响应,并根据该噪声抑制频率响应整形(24)输入信号的当前块。
文档编号G10L21/02GK1326584SQ99813506
公开日2001年12月12日 申请日期1999年9月15日 优先权日1998年9月23日
发明者史蒂文·H·艾沙贝里 申请人:索拉纳技术开发公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1