基于统计语音和噪声模型的有噪声语音的增强的制作方法

文档序号:12629535阅读:来源:国知局

技术特征:

1.用于增强噪声环境中的语音的方法,所述方法包括:

-提供多个子频带(k)的有噪声输入信号(23);

-对于每一所述子频带,提供对应于可观测有噪声信号样本序列[X(k,m'-D+1)…X(k,m')]的时频系数X(k,m),其中k和m分别为频率指数和时间指数,及D大于1;

-增强(25)所述时频系数X(k,m),从而提供增强的时频系数

-提供语音统计模型(30);

-提供噪声统计模型(31,33);

-在考虑可观测有噪声信号样本序列[X(k,m'-D+1)…X(k,m')]的同时,使用所述语音统计模型和所述噪声统计模型提供所述增强的时频系数

2.根据权利要求1所述的方法,其中所述语音统计模型包括表示同一子频带内跨时间的第一多个频谱样本序列的统计模型字典,每一序列表示特征语音元素。

3.根据权利要求1所述的方法,其中所述噪声统计模型包括表示同一子频带内跨时间的第二多个不同的频谱样本序列的统计模型字典,每一序列表示特征噪声元素。

4.根据权利要求2所述的方法,其中所述语音统计模型包括第一多个协方差矩阵CS,i(k),其中i=1,...I为语音字典指数。

5.根据权利要求3所述的方法,其中所述噪声统计模型包括第二多个协方差矩阵CW,j(k),其中j=1,...J为噪声字典指数。

6.根据权利要求3所述的方法,其中同一子频带内的噪声统计数字假定随时间恒定不变。

7.根据权利要求3所述的方法,其中所述噪声统计模型包括单一元素。

8.根据权利要求3所述的方法,其中所述时频系数X(k,m)的增强通过下述步骤实现:

-对于每一相应的子频带中的每一相继样本,估计时频系数X(k,m)的协方差矩阵CX(k,m);

-用对应的与协方差矩阵CX(k,m)表示的有噪声观测信号最佳匹配的正换算因子αs*和αw*选择字典元素Cs,i*(k)和Cw,i*(k)。

9.根据权利要求8所述的方法,包括应用所述分量Cs,i*(k),αs*和Cw,i*(k),αw*的最佳线性组合以增强(25)时频系数X(k,m),从而提供增强的时频系数

10.根据权利要求1所述的方法,其中有噪声输入信号为传声器(8)或传声器系统的输出信号。

11.一种数据处理系统,包括处理器和程序代码,所述程序代码使得所述处理器执行根据权利要求1所述的方法的步骤。

12.一种用于增强噪声环境中的语音的系统,所述系统包括:

-输入单元(24),配置成提供多个子频带的有噪声输入信号,及对于每一所述子频带,提供可观测有噪声信号样本序列[X(k,m'-D+1)…X(k,m')]的时频系数X(k,m),其中k和m分别为频率指数和时间指数,及D大于1;

-增强处理单元(25),配置成接收所述时频系数X(k,m)并提供增强的时频系数

-包括语音统计模型(30)的存储器;

-包括噪声统计模型(31)的存储器;

-优化单元,配置成使用语音统计模型和噪声统计模型提供增强的时频系数同时考虑可观测有噪声信号样本序列[X(k,m'-D+1)…X(k,m')]。

13.根据权利要求12所述的系统,包括:

-分析滤波器组(24),配置成接收有噪声输入信号(23)并将该输入信号的频谱再分为多个子频带,及对每一子频带提供可观测有噪声信号样本序列[X(k,m'-D+1)…X(k,m')]的时频系数X(k,m);

-合成滤波器组(26),配置成接收增强的时频系数并提供增强的时域信号(27)。

14.根据权利要求13所述的系统,其中输入单元包括一个或多个提供有噪声输入信号的传声器。

15.一种助听器,包括根据权利要求12所述的系统。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1