改进的语音可懂度的制作方法

文档序号：12485347阅读：来源：国知局

技术特征：

1.一种装置，其特征在于，包括：

处理器；

存储器，其中，所述存储器包括：

噪声频谱估计器，其从采样环境噪声计算噪声频谱估值；

语音频谱估计器，其从输入语音计算语音频谱估值；

共振峰信噪比(SNR)估计器，其使用在所述输入语音中所检测的每个共振峰内的所述噪声频谱估值和语音频谱估值计算SNR估值；以及

共振峰提升估计器，其计算一组增益因数并将所述组增益因数应用到所述输入语音的每个频率分量，使得在每个共振峰内的所得SNR达到预选的目标值。

2.根据权利要求1所述的装置，其特征在于，所述噪声频谱估计器被配置成通过使用通过采样噪声的离散傅里叶变换获得的平滑参数和过去频谱幅值求平均值来计算噪声频谱估值。

3.根据权利要求1或2所述的装置，其特征在于，所述语音频谱估计器被配置成使用低阶线性预测滤波器计算所述语音频谱估值。

4.根据权利要求3所述的装置，其特征在于，所述低阶线性预测滤波器使用莱文森-德宾算法。

5.根据在前的任一项权利要求所述的装置，其特征在于，所述共振峰SNR估计器被配置成使用中心定在共振峰中心频率上的关键波段上的语音与噪声的频谱幅度估值平方的总和的比率计算所述共振峰SNR估值，其中所述关键波段是听觉滤波器的频率带宽。

6.根据在前的任一项权利要求所述的装置，其特征在于，所述组增益因数通过在所述输入语音中的每个共振峰分段乘以预选因数计算。

7.根据在前的任一项权利要求所述的装置，其特征在于，另外包括输出限制混频器，其中所述共振峰提升估计器产生滤波器以过滤所述输入语音并且与所述输入语音组合的所述滤波器的输出被传递通过所述输出限制混频器。

8.根据权利要求7所述的装置，其特征在于，另外包括共振峰解遮蔽滤波器，其过滤所述输入语音并向将所述共振峰解遮蔽滤波器的输出输入到所述输出限制混频器。

9.根据权利要求6所述的装置，其特征在于，在所述语音输入中的所述每个共振峰通过共振峰分段模块检测，其中所述共振峰分段模块将所述语音频谱估值分割成共振峰。

10.一种用于执行改进语音可懂度的操作的方法，其特征在于，包括：

接收输入语音信号；

从采样环境噪声计算噪声频谱估值；

从所述输入语音计算语音频谱估值；

计算在所述计算的噪声频谱估值和所述语音频谱估值中的共振峰信噪比(SNR)；

分割在所述语音频谱估值中的共振峰；以及

基于所述计算的共振峰提升估值计算用于所述共振峰中的每个共振峰的共振峰提升因数。

11.根据权利要求10所述的方法，其特征在于，所述噪声频谱估值通过使用通对采样环境噪声的离散傅里叶变换获得的平滑参数和过去频谱幅值求平均值的过程来计算。

12.根据权利要求10或11所述的方法，其特征在于，所述计算所述噪声频谱估值包括使用低阶线性预测滤波器计算所述语音频谱估值。

13.根据权利要求12所述的方法，其特征在于，所述低阶线性预测滤波器使用莱文森-德宾算法。

14.根据权利要求10至13中任一项权利要求所述的方法，其特征在于，所述计算所述共振峰SNR估值包括使用中心定在共振峰中心频率上的关键波段上的语音与噪声的频谱幅度估值平方的总和的比率计算所述共振峰SNR估值，其中所述关键波段是听觉滤波器的频率带宽。

15.根据权利要求10至14中任一项权利要求所述的方法，其特征在于，所述组增益因数通过在所述输入语音中的每个共振峰分段乘以预选因数计算。

完整全部详细技术资料下载

当前第2页1 2 3