一种适用于非平稳噪声环境下的在线语音增强方法与流程

文档序号:18618936发布日期:2019-09-06 22:18阅读:572来源:国知局
一种适用于非平稳噪声环境下的在线语音增强方法与流程

本发明涉及语音增强领域,尤其是指一种适用于非平稳噪声环境下的在线语音增强方法。



背景技术:

在语音识别前端处理过程中,语音信号总是被各种噪声干扰和淹没,由于干扰的随机性,只能信号处理技术去尽可能的增强语音质量。语音增强的主要目的是从带噪语音中提取出纯净的原始语音。

常见的语音增强算法主要有以下几种:

1、噪声对消法:该方法是根据在时域或频域中,直接从带噪语音中将噪声分量减去的方法实现的。该方法的最大特点是需要采用背景信号作为参考信号,参考信号准确与否直接决定该方法的性能。

2、谐波增强法:由于语音中的浊音具有明显的周期性,这种周期性反映到频域中则为一系列分别对应基频(基音)及其谐波的一个个峰值分量,这些频率分量占据了语音的大部分能量,可利用这种周期性来进行语音增强,采用梳状滤波器来提取基音及其谐波分量,抑制其他周期性噪声和非周期的宽带噪声。

3、基于语音生成模型的增强算法:语音的发声过程可以建模为一个线性时变滤波器。对不同类型的语音采用不同的激励源。在语音的生成模型中,应用最广泛的是全极点模型。基于语音生成模型可以得到一系列的语音增强算法,比如时变参数维纳滤波及卡尔曼滤波方法。

4、基于短时谱估计的增强算法:基于语音短时谱估计的增强算法种类很多,如谱相减法、维纳滤波法、最小均方误差法等。该类方法具有适应信噪比范围大、方法简单、易于实时处理等优点。

5、基于小波分解的增强算法:小波分解法是随着小波分解这一数学分析工具的发展而发展起来的,同时它又结合了谱相减法的一些基本原理。

6、基于听觉屏蔽的增强算法:听觉屏蔽法是利用人耳的听觉特性的一种增强算法。

基于卡尔曼滤波的语音增强算法属于上面第三种,传统卡尔曼滤波在进行语音增强时有两个重要假设:过程噪声和量测噪声均服从高斯分布。传统卡尔曼滤波在实际语音增强中表现出以下两方面的局限性:①AR参数的估计必须准确。然而在实际语音采集环境中,噪声是不断变化的,这就要求语音模型中AR参数的估计应具有实时性,同时应在AR参数估计过程中考虑各种噪声的影响,否则会导致语音增强性能的下降。②传统卡尔曼滤波算法仅考虑高斯噪声的情况不符合实际应用。语音信号采集过程中会被一种非平稳噪声(具有稀疏性,服从拉普拉斯分布)污染,它不常见,但确实存在且对语音质量影响较大。如果在语音增强中,将非平稳噪声当作高斯噪声处理时,将会严重降低语音增强质量,不利于后续语音语义的识别。

基于上述问题,提供一种能够实时处理高斯噪声和非平稳噪声同时存在情况下的在线语音增强技术是非常必要的。



技术实现要素:

本发明所要解决的技术问题是针对现有卡尔曼滤波方法无法处理语音模型中AR参数无法实时更新、量测过程中存在非平稳噪声的问题,结合凸优化技术,提供一种适用于非平稳噪声环境下的在线语音增强方法,能够在线估计AR参数和非平稳噪声。

为实现上述目的,本发明所提供的技术方案为:一种适用于非平稳噪声环境下的在线语音增强方法,包括以下步骤:

1)建立非平稳噪声环境下的系统模型

1.1)建立高斯噪声和稀疏噪声共同存在情况下的自回归AR模型

语音信号的产生过程为一个由白噪声激励,经全极点线性系统输出的自递归过程,即当前的输出等于现在时刻的激励信号与过去p个时刻输出的加权和,这是一个自回归AR模型,表示如下:

其中,u(k)为k时刻的高斯白噪声激励值;s(k-i)为第(k-i)时刻的语音信号;s(k)为第k时刻的语音信号;ai为第i个线性预测系数,也称为AR模型参数;p为AR模型参数的阶数;

建立符合实际量测过程的语音信号模型,语音信号量测过程描述如下:

Y(k)=s(k)+n(k)+v(k) (2)

其中,Y(k)为k时刻语音信号量测序列;s(k)为k时刻的语音信号;n(k)为k时刻高斯白噪声;v(k)为k时刻非平稳噪声,服从拉普拉斯分布,具有稀疏性;

1.2)建立语音信号状态空间模型

将公式(1)和公式(2)转换为状态空间模型,描述如下:

X(k)=FX(k-1)+p(k) (3)

Y(k)=CX(k)+n(k)+v(k) (4)

其中,

C=[0 0 … 0 1] (6)

X(k)=[S(k-p+1) … S(k)]T (7)

在语音信号状态方程(3)和语音信号量测方程(4)中,X(k)为k时刻语音信号状态估计序列,即语音信号的最优状态估计;X(k-1)为(k-1)时刻语音信号状态估计序列;Y(k)为k时刻语音信号量测序列;F为线性预测系数构成的状态转移矩阵,F中的最后一行[ap(k) … a1(k)]称为AR参数;C=[0 0 … 0 1]为量测转移矩阵;p(k)是k时刻状态噪声,服从高斯分布;n(k)是k时刻量测噪声,服从高斯分布;v(k)是k时刻的非平稳噪声,服从拉普拉斯分布;

语音信号的状态和量测噪声p(k)和n(k)的统计特性为:

E(p(k))=q,E(n(k))=r

E(p(k)p(j)T)=Qδkj,E(n(k)n(j)T)=Rδkj (8)

其中,q和r分别为噪声p(k)和n(k)的均值;Q和R分别为噪声p(k)和n(k)的协方差;δkj为Kronecker函数;语音增强问题是在已知量测语音信号Y(k)的前提下去估计最优语音信号X(k);

2)分帧和加窗

语音信号具有短时平稳性,10--30ms内认为语音信号不变,这样就能够把语音信号分为一些短段来来进行处理,这就是分帧,语音信号的分帧是采用可移动的有限长度的窗口进行加权的方法来实现的;通常每秒的帧数为33~100帧,分帧方法为交叠分段的方法,前一帧和后一帧的交叠部分称为帧移,帧移与帧长的比值为0~0.5;

3)系统初始化

3.1)改进型卡尔曼滤波器参数初始化

初始化语音信号状态估计序列X(0/0)、协方差矩阵P(0/0),保证协方差矩阵是正定的;

3.2)AR参数初始化

初始化AR参数状态估计序列θ(0/0);

4)估计AR参数

AR参数是指公式(3)中状态转移矩阵F中的最后一行[ap(k) … a1(k)],主要用来描述语音生成过程,其准确性对语音增强的结果有着直接的影响;提出在AR参数的估计中综合考虑语音信号状态估计序列X(k-1)、状态噪声q(k)、量测噪声n(k)、非平稳噪声v(k),建立新的AR参数估计状态空间模型,实现AR参数在线鲁棒估计,而对AR参数的实时估计过程如下:

4.1)建立AR参数的参数估计模型

高斯噪声和非平稳噪声混下环境下的AR参数模型描述如下:

其中,θ(k)=[ap(k) … a1(k)]T为k时刻AR参数状态序列;q(k)为k时刻状态噪声,服从高斯分布,其协方差矩阵为Q(k);r(k)为k时刻量测噪声,服从高斯分布,其协方差矩阵为R(k);v(k)为k时刻非平稳噪声,服从拉普拉斯分布,具有稀疏性,其协方差矩阵为W(k);A=X(k-1)T=[S(k-p) … S(k-1)]为量测矩阵;Y(k)为k时刻语音信号量测序列;状态和量测噪声q(k)和r(k)的统计特性为:

E(q(k))=d,E(r(k))=l

E(q(k)q(j)T)=Dδkj,E(r(k)r(j)T)=Lδkj (10)

其中,d和l分别为噪声q(k)和r(k)的均值;D和L分别为噪声q(k)和r(k)的协方差;δkj为Kronecker函数;

4.2)从凸优化角度重构传统卡尔曼滤波问题

为了能够方便地对稀疏噪声进行估计,需要从凸优化的角度重构卡尔曼滤波问题,传统卡尔曼滤波的状态空间模型,不含非平稳噪声v(k),如下:

θ(k)=θ(k-1)+q(k)

Y(k)=Aθ(k)+r(k) (11)

根据贝叶斯原理,AR参数估计问题表述为在量测数据Y(k)已知的前提下,估计最优AR参数序列θ(k),即:

根据最大似然估计理论,建立p(Y(k)|θ(k))和p(θ(k))的似然函数:

其中,Ψ为在已知的情况下条件概率p(θ(k)|Y(k))的协方差矩阵Ψ(k)=Pθ(k|k)+D(k),其中Pθ(k|k)为协方差更新值;当似然函数条件L1(Y(k),θ(k))和L2(θ(k))取得极大值时,条件概率p(Y(k)|θ(k))取得最优估计值;观察式(13)和式(14)发现最大化似然函数条件L1(Y(k),θ(k))和L2(θ(k))相当于最小化似然函数中幂指数的指数部分与因此得到如下优化形式:

subjiect to Y(k)=Aθ(k)+r(k) (15)

其中,θ(k)和r(k)为变量,Ψ(k)=Pθ(k|k)+D(k)是高斯噪声的协方差矩阵;θ(k)的估计值即是r(k)就是对高斯噪声的估计;Pθ(k|k)为协方差更新矩阵:

Pθ(k|k)=(I-Kθ(k)A(k))Pθ(k|k-1) (16)

Pθ(k|k-1)为协方差预测矩阵:

Pθ(k|k-1)=Pθ(k-1|k-1)+D(k-1) (17)

Kθ(k)为协方差增益:

Kθ(k)=Pθ(k|k-1)AT(APθ(k|k-1)AT+L(k-1))-1 (18)

4.3)从凸优化角度构建对非平稳噪声估计的优化问题

非平稳噪声服从拉普拉斯分布,具有稀疏特性,非平稳噪声估计的核心思想是利用噪声的稀疏特性,经过步骤4.2)将传统卡尔曼滤波问题转化为凸优化问题后,能够在优化中增加非平稳噪声v(k)的稀疏性约束来完成对稀疏噪声的估计,新的优化形式为:

其中,v(k)即为稀疏噪声,通过对上述优化问题求解,能够得到对AR参数的最优估计θ(k),式(17)表示的优化问题为一个凸优化问题,能够使用工程中的内点法进行求解;

5)估计语音信号状态序列

5.1)从凸优化角度重构传统卡尔曼滤波问题

为了能够方便地对稀疏噪声进行估计,需要从凸优化的角度重构卡尔曼滤波问题,传统卡尔曼滤波的状态空间模型如下:

X(k)=FX(k-1)+p(k) (20)

Y(k)=CX(k)+n(k) (21)

根据贝叶斯原理,卡尔曼滤波问题表述为在量测数据Y(k)已知的前提下,估计最优语音状态序列X(k),即:

根据最大似然估计理论,建立p(Y(k)|X(k))和p(X(k)的似然函数:

其中,Θ为在已知的情况下条件概率p(X(k)|Y(k-1))的协方差矩阵Θ=FP(k-1|k-1)FT+Q(k-1),其中P(k-1|k-1)为协方差更新值;当似然函数条件L1(Y(k),X(k))和L2(X(k))取得极大值时,条件概率p(X(k)|Y(k))取得最优估计值;观察式(23)和式(24)发现最大化似然函数条件L1(Y(k),X(k))和L2(X(k))相当于最小化似然函数中幂指数的指数部分与因此得到如下优化形式:

subjiect to Y(k)=CX(k)+n(k) (25)

其中,X(k)和n(k)为变量,Θ是高斯噪声的协方差矩阵;X(k)的估计值即是n(k)就是对高斯噪声的估计;

P(k|k)为协方差更新矩阵:

P(k|k)=(I-K(k)C(k))P(k|k-1) (26)

P(k|k-1)为协方差预测矩阵:

P(k|k-1)=F(k-1)P(k-1|k-1)F(k-1)T+Q(k-1) (27)

Kθ(k)为协方差增益:

K(k)=P(k|k-1)CT(CP(k|k-1)CT+R(k-1))-1 (28)

5.2)从凸优化角度构建对稀疏噪声的估计问题

稀疏噪声的估计的核心思想是利用噪声的稀疏特性,经过步骤5.1)将传统卡尔曼滤波问题转化为凸优化问题后,能够在优化中增加稀疏噪声v(k)的稀疏性约束来完成对稀疏噪声的估计,新的优化形式为:

subjiect to Y(k)=CX(k)+n(k)+v(k) (29)

其中,v(k)即为稀疏噪声,通过对上述优化问题求解,得到对熔池质心位置的最优估计X(k),X(k)为传统卡尔曼滤波中对状态值的最优估计式(29)表示的优化问题为一个凸优化问题,能够使用工程中的内点法进行求解;

5.3)完成对k时刻语音信号的增强之后,增强结果将返回到步骤4),用于更新k+1时刻的AR参数θ(k+1),之后再继续进行k+1时刻的语音增强,估计X(k+1),直至将所有语音信号处理完。

本发明与现有技术相比,具有如下优点与有益效果:

1、本发明针对语音模型(尤其指自回归AR模型)中AR参数不能随噪声变化实时更新的问题,提出了双卡尔曼滤波框架,两个卡尔曼滤波器并行运算,语音信号状态估计和AR参数估计互相更新,状态估计过程和参数估计过程交替进行,使得参数估计过程能够适应噪声变化过程,以提高系统模型的准确性,进而提高语音增强的性能。

2、本发明针对传统卡尔曼滤波算法无法处理非平稳噪声的问题,结合凸优化技术,提出了改进型卡尔曼滤波框架。新算法在语音增强模型中对量测过程同时加入了高斯噪声和非平稳噪声项,通过利用凸优化技术建立合理的优化模型,能够对高斯噪声和非平稳噪声进行准确估计,提高了语音增强的准确性。

附图说明

图1为非平稳噪声下的语音增强方法的流程图。

图2a为原始语音信号示意图。

图2b为带高斯白噪声的语音信号示意图。

图2c为带高斯白噪声与非平稳噪声的语音信号示意图。

图3为基于双重改进型卡尔曼滤波的语音增强算法流程图。

图4a为原始语音信号。

图4b为语音增强结果示意图。

具体实施方式

下面结合具体实施例对本发明作进一步说明。

如图1所示,本实施例所述的适用于非平稳噪声环境下的在线语音增强方法,包括以下步骤:

1)建立非平稳噪声环境下的系统模型

1.1)建立高斯噪声和稀疏噪声共同存在情况下的自回归AR模型

语音信号的产生过程可以描述为一个由白噪声激励,经全极点线性系统输出的自递归过程,即当前的输出等于现在时刻的激励信号与过去p个时刻输出的加权和,这是一个自回归AR模型,表示如下

其中,u(k)为k时刻的高斯白噪声激励值;s(k-i)为第(k-i)时刻的语音信号;s(k)为第k时刻的语音信号;ai为第i个线性预测系数,也称为AR模型参数;p为AR模型参数的阶数。

如图2a、2b、2c所示,现实环境中观测到的语音信号会被各种噪声污染,尤其是非平稳噪声,本发明中提出在语音信号量测过程中同时考虑高斯噪声和非平稳噪声,建立更符合实际量测过程的语音信号模型。本发明中的语音信号量测过程可以描述如下:

Y(k)=s(k)+n(k)+v(k) (2)

其中,Y(k)为k时刻语音信号量测序列;s(k)为k时刻的语音信号;n(k)为k时刻高斯白噪声;v(k)为k时刻非平稳噪声,服从拉普拉斯分布,具有稀疏性。

1.2)建立语音信号状态空间模型

将公式(1)和公式(2)转换为状态空间模型,可以描述如下:

X(k)=FX(k-1)+p(k) (3)

Y(k)=CX(k)+n(k)+v(k) (4)

其中

C=[0 0 … 0 1] (6)

X(k)=[S(k-p+1) … S(k)]T (7)

在语音信号状态方程(3)和语音信号量测方程(4)中,X(k)为k时刻语音信号状态估计序列,即语音信号的最优状态估计;X(k-1)为(k-1)时刻语音信号状态估计序列;Y(k)为k时刻语音信号量测序列;F为线性预测系数构成的状态转移矩阵,F中的最后一行[ap(k) … a1(k)]称为AR参数。;C=[0 0 … 0 1]为量测转移矩阵;p(k)是k时刻状态噪声,服从高斯分布;n(k)是k时刻量测噪声,服从高斯分布;v(k)是k时刻的非平稳噪声,服从拉普拉斯分布。

语音信号的状态和量测噪声p(k)和n(k)的统计特性为:

E(p(k))=q,E(n(k))=r

E(p(k)p(j)T)=Qδkj,E(n(k)n(j)T)=Rδkj (8)

其中,q和r分别为噪声p(k)和n(k)的均值;Q和R分别为噪声p(k)和n(k)的协方差。δkj为Kronecker函数。语音增强问题是在已知量测语音信号Y(k)的前提下去估计最优语音信号X(k)。

2)分帧和加窗

语音信号具有短时平稳性(10~30ms内可以认为语音信号近似不变),这样就可以把语音信号分为一些短段来来进行处理,这就是分帧,语音信号的分帧是采用可移动的有限长度的窗口进行加权的方法来实现的。一般每秒的帧数约为33~100帧。一般的分帧方法为交叠分段的方法,前一帧和后一帧的交叠部分称为帧移,帧移与帧长的比值一般为0~0.5。本发明中帧长为25ms,帧移为10ms。

3)系统初始化

3.1)改进型卡尔曼滤波器参数初始化

初始化语音信号状态估计序列X(0/0)、协方差矩阵P(0/0),保证协方差矩阵是正定的。

3.2)AR参数初始化

初始化AR参数状态估计序列θ(0/0),本发明中AR参数的阶数为13(根据经验设定)。

4)估计AR参数

AR参数是指公式(3)中状态转移矩阵F中的最后一行[ap(k) … a1(k)],主要用来描述语音生成过程,其准确性对语音增强的结果有着直接的影响。实际应用中AR参数估计受语音信号本身、各种噪声影响较大,因此本发明中提出在AR参数的估计中综合考虑语音信号状态估计序列X(k-1)、状态噪声q(k)、量测噪声n(k)、非平稳噪声v(k)等,建立新的AR参数估计状态空间模型,实现AR参数在线鲁棒估计,这是本发明的一个核心点。如图3所示,对AR参数的实时估计过程如下:

4.1)建立AR参数的参数估计模型

高斯噪声和非平稳噪声混下环境下的AR参数模型描述如下:

其中θ(k)=[ap(k) … a1(k)]T为k时刻AR参数状态序列;q(k)为k时刻状态噪声,服从高斯分布,其协方差矩阵为Q(k);r(k)为k时刻量测噪声,服从高斯分布,其协方差矩阵为R(k);v(k)为k时刻非平稳噪声,服从拉普拉斯分布,具有稀疏性,其协方差矩阵为W(k);A=X(k-1)T=[S(k-p) … S(k-1)]为量测矩阵;Y(k)为k时刻语音信号量测序列。状态和量测噪声q(k)和r(k)的统计特性为:

E(q(k))=d,E(r(k))=l

E(q(k)q(j)T)=Dδkj,E(r(k)r(j)T)=Lδkj (10)

其中,d和l分别为噪声q(k)和r(k)的均值;D和L分别为噪声q(k)和r(k)的协方差。δkj为Kronecker函数。

4.2)从凸优化角度重构传统卡尔曼滤波问题

为了能够方便地对稀疏噪声进行估计,需要从凸优化的角度重构卡尔曼滤波问题。传统卡尔曼滤波的状态空间模型(不含非平稳噪声v(k))如下:

θ(k)=θ(k-1)+q(k)

Y(k)=Aθ(k)+r(k) (11)

根据贝叶斯原理,AR参数估计问题可以表述为在量测数据Y(k)已知的前提下,估计最优AR参数序列θ(k),即:

根据最大似然估计理论,建立p(Y(k)|θ(k))和p(θ(k))的似然函数:

其中,Ψ为在已知的情况下条件概率p(θ(k)|Y(k))的协方差矩阵Ψ(k)=Pθ(k|k)+D(k)(其中Pθ(k|k)为协方差更新值)。当似然函数条件L1(Y(k),θ(k))和L2(θ(k))取得极大值时,条件概率p(Y(k)|θ(k))取得最优估计值。观察式(13)和式(14)发现最大化似然函数条件L1(Y(k),θ(k))和L2(θ(k))相当于最小化似然函数中幂指数的指数部分与因此可以得到如下优化形式:

subjiect to Y(k)=Aθ(k)+r(k) (15)

其中,θ(k)和r(k)为变量,Ψ(k)=Pθ(k|k)+D(k)是高斯噪声的协方差矩阵。θ(k)的估计值即是r(k)就是对高斯噪声的估计。Pθ(k|k)为协方差更新矩阵:

Pθ(k|k)=(I-Kθ(k)A(k))Pθ(k|k-1) (16)

Pθ(k|k-1)为协方差预测矩阵:

Pθ(k|k-1)=Pθ(k-1|k-1)+D(k-1) (17)

Kθ(k)为协方差增益:

Kθ(k)=Pθ(k|k-1)AT(APθ(k|k-1)AT+L(k-1))-1 (18)

4.3)从凸优化角度构建对非平稳噪声估计的优化问题

非平稳噪声服从拉普拉斯分布,具有稀疏特性,非平稳噪声估计的核心思想是利用噪声的稀疏特性,经过步骤4.2)将传统卡尔曼滤波问题转化为凸优化问题后,可以在优化中增加非平稳噪声v(k)的稀疏性约束来完成对稀疏噪声的估计,新的优化形式为:

subjiect to Y(k)=Aθ(k)+r(k)+v(k)

其中,v(k)即为稀疏噪声,通过对上述优化问题求解,可以得到对AR参数的最优估计θ(k)(注:),式(17)表示的优化问题为一个凸优化问题,可以使用工程中较为成熟的内点法进行求解。

5)估计语音信号状态序列。

语音信号采集过程中,非平稳噪声对语音质量影响较大。为了能够提高语音质量,语音增强算法必须能够同时应对高斯噪声和非平稳噪声混合的情况。非平稳噪声一般服从拉普拉斯分布,具有稀疏特性,对非平稳噪声的估计主要利用了噪声的稀疏特性。为了方便在优化问题中引入噪声稀疏性约束,首先采用凸优化技术将传统卡尔曼滤波问题重构为一个凸优化问题,然后在新构建的优化中引入对稀疏噪声的稀疏性约束,最终完成语音增强任务,这是本发明的另一个核心点。

5.1)从凸优化角度重构传统卡尔曼滤波问题

为了能够方便地对稀疏噪声进行估计,需要从凸优化的角度重构卡尔曼滤波问题。传统卡尔曼滤波的状态空间模型如下:

X(k)=FX(k-1)+p(k) (20)

Y(k)=CX(k)+n(k) (21)

根据贝叶斯原理,卡尔曼滤波问题可以表述为在量测数据Y(k)已知的前提下,估计最优语音状态序列X(k),即:

根据最大似然估计理论,建立p(Y(k)|X(k))和p(X(k)的似然函数:

其中,Θ为在已知的情况下条件概率p(X(k)|Y(k-1))的协方差矩阵Θ=FP(k-1|k-1)FT+Q(k-1)(其中P(k-1|k-1)为协方差更新值)。当似然函数条件L1(Y(k),X(k))和L2(X(k))取得极大值时,条件概率p(X(k)|Y(k))取得最优估计值。观察式(23)和式(24)可以发现最大化似然函数条件L1(Y(k),X(k))和L2(X(k))相当于最小化似然函数中幂指数的指数部分与因此可以得到如下优化形式:

subjiect to Y(k)=CX(k)+n(k) (25)

其中,X(k)和n(k)为变量,Θ是高斯噪声的协方差矩阵。X(k)的估计值即是n(k)就是对高斯噪声的估计。

P(k|k)为协方差更新矩阵:

P(k|k)=(I-K(k)C(k))P(k|k-1) (26)

P(k|k-1)为协方差预测矩阵:

P(k|k-1)=F(k-1)P(k-1|k-1)F(k-1)T+Q(k-1) (27)

Kθ(k)为协方差增益:

K(k)=P(k|k-1)CT(CP(k|k-1)CT+R(k-1))-1 (28)

5.2)从凸优化角度构建对稀疏噪声的估计问题

稀疏噪声的估计的核心思想是利用噪声的稀疏特性,经过步骤5.1)将传统卡尔曼滤波问题转化为凸优化问题后,可以在优化中增加稀疏噪声v(k)的稀疏性约束来完成对稀疏噪声的估计,新的优化形式为:

subjiect to Y(k)=CX(k)+n(k)+v(k) (29)

其中,v(k)即为稀疏噪声,通过对上述优化问题求解,可以得到对熔池质心位置的最优估计X(k)(注:X(k)即为传统卡尔曼滤波中对状态值的最优估计),式(29)表示的优化问题为一个凸优化问题,可以使用工程中较为成熟的内点法进行求解。

5.3)完成对k时刻语音信号的增强之后,增强结果将返回到步骤4),用于更新k+1时刻的AR参数θ(k+1),之后再继续进行k+1时刻的语音增强,估计X(k+1),直至将所有语音信号处理完。

如图4a和4b所示,经过本发明提出的方法能够比较准确地对高斯噪声和非平稳噪声进行滤除,并对原语音信号进行增强。

使用本发明,可以准确的估计并滤除白噪声和非平稳噪声,实现白噪声和非平稳噪声混合下的语音增强,同时给出较为纯净的估计语音信号,为语音识别准确率的提高提供前端支持。

由于本发明建立了两个鲁棒卡尔曼滤波模型,对语音信号的发生过程模型进行了数学建模,在语音的短时特性和时变特性上都做了针对性的考虑,AR参数估计采取动态实时更新迭代,满足了参数时变特性的要求,又能够每帧通过状态估计去估计语音信号利用了语音短时平稳特性,使得滤波效果在结果上优于传统的卡尔曼滤波,值得推广。

以上所述实施例子只为本发明之较佳实施例子,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1