用于增强混合信号中的语音的方法

文档序号:2825868阅读:220来源:国知局
用于增强混合信号中的语音的方法
【专利摘要】从包括噪声和语音的混合信号中产生增强的语音。利用矢量泰勒级数来估计混合信号中的噪声。估计的噪声依据最小均方差。然后,从混合信号中减去噪声以获得增强的语音。
【专利说明】用于增强混合信号中的语音的方法

【技术领域】
[0001] 本发明总体上涉及一种用于增强包括语音和噪声的信号的方法,更具体地,涉及 利用模型来增强语音信号的方法。

【背景技术】
[0002] 诸如基于矢量泰勒级数(VTS)的方法的基于模型的语音增强方法使用语音和噪 声二者的统计学模型,以从有噪信号中产生增强的语音的估计。在基于模型的方法中,在给 定噪声的情况下,通常根据模型通过确定语音的期望值直接估计增强的语音。
[0003] 基于直接矢量泰勒级数的方法
[0004] 在高分辨率噪声补偿技术中,通过在短时对数谱域而非具有降低的谱分辨率的特 征域(诸如通常用于语音识别的梅尔频谱)中的高斯分布或高斯混合模型将混合的语音和 噪声信号模型化。为了从频谱中完美地重构信号,通过利用合适的互补分析和综合窗来实 现这一点,这在减小的特征集中是不可能的。
[0005] 这里,将帧t的短时语音对数频谱xt置于离散状态st。噪声为似稳定,因此仅单 个高斯分布用于噪声对数频谱Μ :
[0006]

【权利要求】
1. 一种用于增强混合信号中的语音的方法,其中,所述混合信号包括噪声信号和语音 信号,该方法包括以下步骤: 确定混合信号中的噪声的估计,其中,所述确定使用所述语音信号、所述噪声信号和所 述混合信号的概率模型,其中,在基于对数频谱的域中定义所述概率模型;以及 从所述混合信号中减去所述噪声的所述估计以获得增强的语音, 其中,上述步骤在处理器中执行。
2. 根据权利要求1所述的方法,其中,所述噪声的所述估计基于后验最小均方误差标 准。
3. 根据权利要求1所述的方法,其中,所述噪声的所述估计基于最大后验(MAP)概率标 准。
4. 根据权利要求1所述的方法,其中,所述确定利用基于矢量泰勒级数(VTS)的方法。
5. 根据权利要求4所述的方法,其中,所述噪声的所述估计是
其中,s是所述语音的状态,y是有噪语音对数频谱,是所述基于VTS的方法的展开 点,μ是均值,并且
是考虑了所述有噪语音对数频谱和所述展 开点的语音状态的条件概率。
6. 根据权利要求1所述的方法,其中,所述减去产生复谱
其中,t是时间帧,yt是有噪语音对数频谱,&是所述噪声的所述估计,并且Θ t是所述 有噪语音对数频谱的相位。
7. 根据权利要求1所述的方法,该方法还包括: 针对所述噪声中的各个频率f赋予声学模型权重a f,以有区别地强调声学似然分数。
8. 根据权利要求1所述的方法,其中,从所述混合信号中的非语音段估计所述噪声模 型的充分统计数据。
9. 根据权利要求8所述的方法,其中,根据下式在对数频谱域中估计所述噪声模型的 均值
其中,I是用于假定的非语音帧的时间索引的集合,yt是有噪语音对数频谱,并且η是 所述集合I中的索引的数量。
10. 根据权利要求8所述的方法,其中,根据下式在功率域中估计所述噪声模型的均值
其中,I是用于假定的非语音帧的时间索引的集合,yt是有噪语音对数频谱,并且η是 所述集合I中的索引的数量。
【文档编号】G10L21/0216GK104067340SQ201280067875
【公开日】2014年9月24日 申请日期:2012年12月11日 优先权日:2012年1月27日
【发明者】J·R·赫尔歇, J·勒鲁克斯 申请人:三菱电机株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1