对语音信号进行自适应谱减消噪处理的方法和装置制造方法

文档序号:2827703阅读:548来源:国知局
对语音信号进行自适应谱减消噪处理的方法和装置制造方法
【专利摘要】本发明实施例提供了一种对语音信号进行自适应谱减消噪处理的方法和装置,该方法主要包括:根据带噪信号、噪声信号和语音信号建立语音信号的加性模型;计算出所述语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值;对所述语音信号的功率估计值进行逆傅立叶变换,得到消除了噪声的语音信号。本发明有效地解决了电话会议中的语音信号的背景噪声问题,并且不会带来其他的“音乐噪声”等噪声。
【专利说明】对语音信号进行自适应谱减消噪处理的方法和装置

【技术领域】
[0001]本发明涉及语音信号处理【技术领域】,尤其涉及一种对语音信号进行自适应谱减消噪处理的方法和装置。

【背景技术】
[0002]在我国武警、公安、铁路、电力、石油石化等行业的大型企业中,经常召开生产调度会议,需要支持大容量全交互式的电话会议系统。在这些电话会议系统中,存在大量的异种语音资源终端,这些异种语音资源终端之间需要通过转换设备进行相互语音通信,如公众通信网、数字集群系统、卫星网和有线网中的模拟终端(电话)之间通过程控交换机实现互通;VoIP语音电话终端之间通过软交换实现互通;超短波网和短波网终端分别通过IP无线网关和综合接入设备实现向IP体制的转换,然后再通过软交换机和IP电话等终端实现互通,或通过中继接口和程控交换机连接,实现和其他模拟终端的互通。
[0003]上述异种语音资源终端和转换设备在实际应用中的噪声干扰通常是随机的,其背景噪声来源和种类各不相同,需要对带噪信号进行噪声消除处理,以消除背景噪声,改善语音质量,提高语音的清晰度、可懂度和舒适度,提高语音处理系统的性能。
[0004]现有技术中的电话会议系统的噪声消除方法的缺点为:对不同背景噪声来源和种类采用单一降噪方法,只改善部分或对某类噪声有效,如减谱法降噪,本身还会带入“音乐噪声”。


【发明内容】

[0005]本发明的实施例提供了一种对语音信号进行自适应谱减消噪处理的方法和装置,以有效地消除了电话会议中的语音信号的噪声。
[0006]本发明提供了如下方案:
[0007](和权利要求书相互对应)
[0008]由上述本发明的实施例提供的技术方案可以看出,本发明实施例通过建立语音信号的加性模型,根据语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值,再根据语音信号的功率估计值得到消除了噪声的语音信号,有效地解决了电话会议中的语音信号的背景噪声问题,并且不会带来其他的“音乐噪声”等噪声。

【专利附图】

【附图说明】
[0009]为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0010]图1为本发明实施例一提供的一种语音资源处理和交换服务平台的结构示意图;
[0011]图2为本发明实施例一提供的一种语音增强处理板采用自适应谱减法对带噪信号进行消噪处理的原理示意图;
[0012]图3为本发明实施例一种语音增强处理板对语音信号进行自适应谱减消噪处理的方法的处理流程图;
[0013]图4为本发明实施例二提供的一种语音增强处理板对语音信号进行自适应谱减消噪处理的装置的结构示意图,图中,语音信号的加性模型获取模块41、语音信号的功率估计值获取模块42和消噪语音信号获取模块43。

【具体实施方式】
[0014]为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
[0015]实施例一
[0016]本发明实施例提供的一种语音资源处理和交换服务平台的结构示意图如图1所示,该平台主要完成语音增强、音频媒体流的转码、多路混音、录音、放音、回音消除等功能。该平台具备码流转发功能,能够把前端音频流转发到调度台、存储设备;具备强大的流媒体处理能力,单台支持1440路语音无阻塞调度并发、转发处理,单场会议支持480方混音。
[0017]上述语音资源处理和交换服务平台中的I/O板:主要实现交换机与硬件平台的外部连接,同时将外部中继线信息用前后板针脚的形式,实现与数字中继板的中继互连。
[0018]数字中继板:主要在CPU板的控制下将中继信息转换成H.110总线背板总线形式,为各资源板进行功能服务提供信息来源。
[0019]语音导航板:对背板总线上需要提供语音收发、双音频收号、FSK(Frequency-shift Keying:频移键控)发号等各类语音增值服务的话路信息进行处理。
[0020]会议桥板:通过对背板总线数据进行处理,提供多方电话会议的建立。
[0021]CPU 板:通过 PCI (Peripheral Component Interconnect:外设部件互连标准)总线控制各语音资源板之间的协调工作能力。
[0022]语音增强处理板:主要采用自适应谱减法完成带噪信号的降噪处理和语音增强处理,改善语音质量,提高语音的清晰度、可懂度和舒适度,提高电话会议系统的语音性能。
[0023]该实施例提供的一种语音增强处理板采用自适应谱减法对带噪信号进行消噪处理的原理示意图如图2所示,基于上述图2所示的自适应谱减法消噪处理的原理,该实施例提供的一种上述语音增强处理板对语音信号进行自适应谱减消噪处理的方法的处理流程如图3所示,包括如下的处理步骤:
[0024]步骤S310、通过高通滤波器对带噪信号进行低通过滤处理。
[0025]高通滤波器是一个使高频率比较容易通过而阻止低频率通过的系统。它去掉了信号中不必要的低频成分或者说去掉了低频干扰。
[0026]本发明实施例中的高通滤波器的基准频率可以设置为50Hz,该高通滤波器不允许比50Hz低的语音信号通过,而允许比50Hz高的语音信号通过,该高通滤波器对带噪信号进行低通过滤处理,抑制带噪信号的50Hz电源工频干扰。
[0027]步骤S320、根据低通过滤处理后的带噪信号、噪声信号和语音信号建立语音信号的加性模型。
[0028]由于语音信号是短时平稳的,所以在短时谱幅度估计中认为语音信号是平稳随机信号,假设s(m)、n(m)和y(m)分别代表语音信号、噪声信号和低通过滤处理后的带噪信号。
[0029]假设噪声n(m)是与语音s(m)不相关的加性噪声,于是,建立语音信号的加性模型:
[0030]y (m) =s (m) +n (m)公式 I
[0031]步骤S330、计算出所述语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值。
[0032]对信号y(m)、s(m)、n(m)分别进行加窗处理后,得到信号yw(m), sw(m), nw(m),Ss(co)、Sn(co)和Sy(co)分别表示语音信号、噪声信号和低通过滤处理后的带噪信号的短时谱,上述加窗处理表示取傅立叶变换的帧长数。
[0033]则有
[0034]yw(m) = sw(m)+nw(m)公式 2
[0035]对公式2的两端分别做傅立叶变换,得到
[0036]Yw(CO) = Sw(co)+Nw(co)公式 3
[0037]公式3中的ω表示频率
[0038]对公式3的两端分别作功率谱,该功率谱表示研究信号在频域中的各种特征。
[0039]得到:
[0040]IYw(CO)I2= Sw(W) |2+|Ν¥(ω) |2+Sw(?)N*w(?)+S*w(?)Nw(?) 公式 4
[0041]其中,Ν\(ω)表示噪声信号的功率谱,S*w(?)表示语音信号的功率谱。
[0042]IYw(CO) I2表示带噪信号的功率估计值,可以根据带噪信号y(m)采用随机分析方法求均值估计出|yw(?) I2。
[0043]其余各项必须近似为统计均值,由于S(m)和n(m)独立,则互相的统计均值为0,所以语音信号的功率估计值I I2的计算公式为:
[0044]I ^(ω) |2=| ΥΗ,(ω) \2 -Ε[\ Ν'ν{ω) |2]公式 5
[0045]其中E[|Nw(gj) I2 = Νψ(ω) 12+Sw ( ω ) N*w ( ω )+S*w ( ω ) Nw ( ω ) = Νψ(ω) |2
[0046]由于s (m)和η (m)独立,则互相的统计均值为O。
[0047]采用VAD(Voice Activity Detect1n,语音激活检测法)估计噪声信号的功率估计值INw(Co) I2,利用输入信号的前50ms “寂静段”来估计噪声,在语音信号中,说话人由于呼吸会不断产生语音间歇,利用这些间歇估计背景噪声,利用VAD检测到“寂静段”后,再利用下列公式对噪声信号的功率估计值INw(CO) I2进行更新:
[0048]I Νιν(ω) |2=α| N'、'—人ω) |2 +(I — a) | Sw ,(ω) \2 公式 6
[0049]其中O < α < 1,Nw^1 ( ω ) |是前一帧的噪声信号的功率估计值,| (O) |是前一帧的语音信号的功率估计值。
[0050]因为噪声是局部平稳的,故可以认为发音前的噪声与发音期间的噪声功率谱相同,因而可以利用发语音前的“寂静帧”来估计噪声。
[0051]从公式5中可以看出,语音信号的功率估计值15w(w) I2不能保证是非负的,这是因为在估计噪声时存在误差,当噪声信号的功率估计值大于某帧带噪信号的功率估计值时,该帧语音信号的功率估计值I1L(W)I2就会出现为负的情况,这些负值我们可以通过改变它们的符号使之变为正值,也可以直接给它们置零,本发明实施例采用后种处理方式。
[0052]步骤S340、对语音信号的功率估计值进行逆傅立叶变换,得到消除了噪声的语音信号。
[0053]只要在频域用公式5得到带噪信号的功率估计值,就可以根据公式7得到消除了噪声的语音信号:
[0054]ψ? = ZFFr[|5?,(ωγφ{ω}^公式 7
[0055]上述公式中的X?)表不语音信号的相位
[0056]上述IFFT表示逆傅立叶变换。
[0057]利用人耳对相位不敏感的特点,在公式7中可利用原带噪信号的相位恢复到时域语音信号,从而得到消除了噪声后的语音信号,完成整个基于谱减法的语音增强过程。
[0058]实施例二
[0059]该实施例提供了一种对语音信号进行自适应谱减消噪处理的装置,其具体结构如图4所示,包括如下的模块:
[0060]语音信号的加性模型获取模块41,用于根据带噪信号、噪声信号和语音信号建立语音信号的加性模型;
[0061]语音信号的功率估计值获取模块42,用于计算出所述语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值;
[0062]消噪语音信号获取模块43,用于对所述语音信号的功率估计值进行逆傅立叶变换,得到消除了噪声的语音信号。
[0063]进一步地,所述的语音信号的加性模型获取模块41,具体用于通过高通滤波器对带噪信号进行低通过滤处理;
[0064]设s(m)、n(m)和y(m)分别代表语音信号、噪声信号和低通过滤处理后的带噪信号,建立语音信号的加性模型为:
[0065]y (m) =s (m) +n (m)公式 I。
[0066]进一步地,所述的语音信号的功率估计值获取模块42,具体用于对信号y(m)、s (m)、n(m)分别进行加窗处理后得到信号yw(m), sw(m),nw(m),所述Ss(co),Sn(ω)和Sy(co)分别表示语音信号、噪声信号和低通过滤处理后的带噪信号的短时谱;
[0067]yw(m) = sw(m)+nw(m)公式 2
[0068]对所述公式2的两端分别做傅立叶变换,得到:
[0069]Yw(CO) = Sw(co)+Nw(co)公式 3
[0070]所述公式3中的ω表示频率
[0071]对所述公式3的两端分别作功率谱,得到:
[0072]IYw(CO)I2= Sw(?) |2+|Ν¥(ω) |2+Sw(?)N*w(?)+S*w(?)Nw(?) 公式 4
[0073]其中,Ν\(ω)表示噪声信号的功率谱,S*w(?)表示语音信号的功率谱;
[0074]根据带噪信号y(m)采用随机分析方法求均值估计出带噪信号的功率估计值|yw(?) I2,采用语音激活检测法估计出噪声信号的功率估计值Inw(Co) I2,得到语音信号的功率估计值1I2的计算公式为:
[0075]I Sw(CU) I2H };⑷ I2 -EU Nw(W) I2]公式 5
[0076]其中Ε[|Νν(ω)2 = Νψ(ω) 12+Sw ( ω ) N*w ( ω )+S*w ( ω ) Nw ( ω ) = Νψ(ω) |20 由于s(m)和n(m)独立,则互相的统计均值为O。
[0077]进一步地,所述的语音信号的功率估计值获取模块42,具体用于采用语音激活检测法检测到带噪信号的寂静段后,再利用下列公式6对噪声信号的功率估计值Inw(Co) I2进行更新:
[0_ I ⑷ I2= α I U?) I2 +(1-α) 11—? I2 公式 6
[0079]其中ο< α < I, Inw^1(W)是前一帧的噪声信号的功率估计值,|§^(?)|是前一帧的语音信号的功率估计值。
[0080]进一步地,所述的消噪语音信号获取模块43,具体用于设消除了噪声的语音信号为Hm)
[0081 ] s(m) = IFFT[j夂' (ω)\β}ψ(ω)] 公式 7
[0082]所述公式7中的如(《>)表示语音信号的相位,所述IFFT表示逆傅立叶变换。
[0083]用本发明实施例的装置进行对语音信号进行自适应谱减消噪处理的具体过程与前述方法实施例类似,此处不再赘述。
[0084]综上所述,本发明实施例通过建立语音信号的加性模型,根据语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值,再根据语音信号的功率估计值得到消除了噪声的语音信号,有效地解决了电话会议中的语音信号的背景噪声问题,并且不会带来其他的“音乐噪声”等噪声。
[0085]本发明实施例提高了电话会议的音质效果,音质更清晰且流畅,在满足大容量、全交互电话会议要求的同时,语音增强处理后,音质更接近于现场会议。
[0086]本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
[0087]通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如R0M/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
[0088]本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0089]以上所述,仅为本发明较佳的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本【技术领域】的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
【权利要求】
1.一种对语音信号进行自适应谱减消噪处理的方法,其特征在于,包括: 根据带噪信号、噪声信号和语音信号建立语音信号的加性模型; 计算出所述语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值; 对所述语音信号的功率估计值进行逆傅立叶变换,得到消除了噪声的语音信号。
2.根据权利要求1所述的对语音信号进行自适应谱减消噪处理的方法,其特征在于,所述的根据带噪信号、噪声信号和语音信号建立语音信号的加性模型,包括: 通过高通滤波器对带噪信号进行低通过滤处理; 设s(m)、n(m)和y(m)分别代表语音信号、噪声信号和低通过滤处理后的带噪信号,噪声n(m)是与语音s (m)不相关的加性噪声,建立语音信号的加性模型为:y (m) =s (m) +n (m)公式 I。
3.根据权利要求2所述的对语音信号进行自适应谱减消噪处理的方法,其特征在于,所述的计算出所述语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值,包括: 对所述信号y (m)、s (m)、n (m)分别进行加窗处理后得到信号yw (m),sw (m),nw (m),所述Ss(co)、Sn(co)和Sy(co)分别表示语音信号、噪声信号和低通过滤处理后的带噪信号的短时谱; yw(m) = sw(m)+nw(m)公式 2 对所述公式2的两端分别做傅立叶变换,得到: Yw(CO) = Sw(co)+Nw(co)公式 3 所述公式3中的ω表示频率 对所述公式3的两端分别作功率谱,得到:
Yw(O)I2= Sw(GJ) |2+|Nw(gj) |2+Sw(gj)N*w(co)+S*w(co)Nw(co)公式 4
其中,Ν\(ω)表示噪声信号的功率谱,S*w(?)表示语音信号的功率谱; 根据带噪信号y(m)采用随机分析方法求均值估计出带噪信号的功率估计值|γ¥(ω) I2,采用语音激活检测法估计出噪声信号的功率估计值Inw(CO) I2,得到语音信号的功率估计值I I2的计算公式为: 丨 L⑷ I2=I Υη,(ω) I2 -Ε[\ Νη,(ω) |2]公式 5
其中 Ε[|Νψ(ω) I2 = Nw(GJ) 2+Sw(gj)N*w(co)+S*w(co)Nw(co) = Νψ(ω) 2。
4.根据权利要求3所述的对语音信号进行自适应谱减消噪处理的方法,其特征在于,所述的采用语音激活检测法估计出噪声信号的功率估计值Inw(Co) I2,包括: 采用语音激活检测法检测到带噪信号的寂静段后,再利用下列公式6对噪声信号的功率估计值Inw(CO) I2进行更新: I Κ(ω) I2= α I N? \2 +(I — a) 11—扣)|2 公式 6 其中O < α < 1,Nw^1(Q) |是前一帧的噪声信号的功率估计值,| ,(w)i是前一帧的语音信号的功率估计值。
5.根据权利要求3或4所述的对语音信号进行自适应谱减消噪处理的方法,其特征在于,所述的对所述语音信号的功率估计值进行逆傅立叶变换,得到消除了噪声的语音信号,包括: 设消除了噪声的语音信号为〗(m) 和) = □之⑷卜崩] 公式7 所述公式7中的表示语音信号的相位,所述IFFT表示逆傅立叶变换。
6.一种对语音信号进行自适应谱减消噪处理的装置,其特征在于,包括: 语音信号的加性模型获取模块,用于根据带噪信号、噪声信号和语音信号建立语音信号的加性模型; 语音信号的功率估计值获取模块,用于计算出所述语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值; 消噪语音信号获取模块,用于对所述语音信号的功率估计值进行逆傅立叶变换,得到消除了噪声的语音信号。
7.根据权利要求6所述的对语音信号进行自适应谱减消噪处理的装置,其特征在于: 所述的语音信号的加性模型获取模块,具体用于通过高通滤波器对带噪信号进行低通过滤处理; 设s(m)、n(m)和y(m)分别代表语音信号、噪声信号和低通过滤处理后的带噪信号,建立语音信号的加性模型为: y(m) = s(m)+n(m)公式 I。
8.根据权利要求7所述的对语音信号进行自适应谱减消噪处理的装置,其特征在于: 所述的语音信号的功率估计值获取模块,具体用于对信号y(m)、s (m)、n(m)分别进行加窗处理后得到信号yw (m),sw (m),nw (m),所述Ss (ω)、Sn (ω)和Sy (ω)分别表示语音信号、噪声信号和低通过滤处理后的带噪信号的短时谱;yw(m) = sw(m)+nw(m)公式 2 对所述公式2的两端分别做傅立叶变换,得到: Yw(CO) = Sw(co)+Nw(co)公式 3 所述公式3中的ω表示频率 对所述公式3的两端分别作功率谱,得到:
Yw(O)I2= Sw(GJ) |2+|Nw(gj) |2+Sw(gj)N*w(co)+S*w(co)Nw(co) 公式 4
其中,Ν\(ω)表示噪声信号的功率谱,S*w(?)表示语音信号的功率谱; 根据带噪信号y(m)采用随机分析方法求均值估计出带噪信号的功率估计值|γ¥(ω) I2,采用语音激活检测法估计出噪声信号的功率估计值Inw(CO) I2,得到语音信号的功率估计值I I2的计算公式为: I ⑷ I2H Κ,(ω) I2 -Ε[\ Ν'ν{ω) |2] 公式 5
其中 Ε[|Νψ(ω) I2 = Nw(GJ) 2+Sw(gj)N*w(co)+S*w(co)Nw(co)。
9.根据权利要求8所述的对语音信号进行自适应谱减消噪处理的装置,其特征在于: 所述的语音信号的功率估计值获取模块,具体用于采用语音激活检测法检测到带噪信号的寂静段后,再利用下列公式6对噪声信号的功率估计值Inw(Co) I2进行更新:
I Κ(ω) I2 = α I Niv , (ω) |2 +(I — a) | SH., (ω) \2 公式 6 其中0 < α < 1,!Κω) I是前一帧的噪声信号的功率估计值,I^1(O) I是前一帧的语音信号的功率估计值。
10.根据权利要求3或4所述的对语音信号进行自适应谱减消噪处理的装置,其特征在于: 所述的消噪语音信号获取模块,具体用于设消除了噪声的语音信号为 =公式 7 所述公式7中的._(?)表示语音信号的相位,所述IFFT表示逆傅立叶变换。
【文档编号】G10L21/0216GK104200811SQ201410390734
【公开日】2014年12月10日 申请日期:2014年8月8日 优先权日:2014年8月8日
【发明者】张金明, 刘宇 申请人:华迪计算机集团有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1