一种语音处理方法与流程

文档序号：34621483发布日期：2023-06-29 12:42阅读：38来源：国知局

本申请属于语音处理的，尤其涉及一种语音处理方法及处理装置、终端设备、计算机可读存储介质。

背景技术：

1、在一些特定的场景比如厨房、生产车间中，噪声的来源主要来自于各种生产或加工设备，鉴于语音和/或背景噪声的非平稳性质，目前普遍使用的语音处理降噪算法往往需要考虑宽频范围内的各类噪声，其使用的降噪算法往往较为复杂，对处理器算力的要求较高，这限制了在特定场景中使用语音控制的范围，提高设备智能化语音控制的成本。

技术实现思路

1、有鉴于此，本申请实施例的第一方面提供了一种语音处理方法及处理装置、终端设备、计算机可读存储介质，以解决在特定场景下应用语音识别的技术问题。

2、本申请实施例的第一方面提供了一种语音处理方法，包括：

3、获取音源设备运行参数，并根据所述运行参数采集对应的噪音信号，包括：

4、通过多组麦克风获取音源设备在不同运行参数下的频谱噪声数据，所述噪声数据包括频谱的维度和采样点数，并将所述噪声数据表示为一个m×n的矩阵；所述音源设备运行参数包括转速、风速、功率中的一个或多个。

5、进一步地，对获取的噪声信号进行预处理，进行预处理主要是为了去除噪声中的dc偏置，以及进行归一化处理。

6、对所述信号进行去除dc偏置，在噪声信号中减去直流分量，所述直流分量通过计算所述噪声信号的平均值获得；预处理后的数据可以表示为矩阵x0，其计算公式如下：

7、

8、其中，μ表示矩阵x0中每一列的均值，σ表示矩阵x0中每一列的标准差；

9、进一步地，还包括归一化处理，将去除dc偏置后的噪声信号缩放到一定范围。

10、进一步地，使用ica算法对预处理后的噪声信号进行分离以获得分离噪声信号，包括将原始数据x0转化为独立信号s，其中：

11、s＝w×x0

12、

13、其中kurt表示峰度函数，w*表示最优的转换矩阵。

14、进一步地，对分离噪声信号进行降噪处理以获得降噪信号，包括：

15、xde＝idwt(tλdwt(s))

16、其中，dwt表示离散小波变换，idwt表示离散小波反变换，tλ表示阈值函数，用于去除小于某个阈值λ的小波系数，从而降低噪声的影响。

17、进一步地，将所述降噪信号与语音信号进行混合后获得混合信号，其计算公式为：

18、y＝αxsp+(1-α)xde

19、其中，y表示混合信号，xsp表示原始的语音信号，xde表示降噪后的ica分离信号，α表示加权系数，用于平衡两个信号的比重。

20、进一步地，还包括滤波器，所述滤波器用于对混合信号进行语音增强处理，所述滤波器为fir滤波器，所述滤波器阶数为40阶，采样频率为8khz，步长因子为0.04。

21、本申请实施例的第二方面提供了一种语音处理装置，包括：

22、采集单元，用于获取音源设备运行参数，并根据所述运行参数采集对应的噪音信号；

23、分离单元，用于对获取的噪声信号进行预处理，并使用ica算法对预处理后的噪声信号进行分离以获得分离噪声信号；

24、降噪单元，用于对分离噪声信号进行降噪处理以获得降噪信号，并将所述降噪信号与所述运行参数相关联；

25、混合单元，用于获取环境语音信号与所述音源设备运行参数，并将所述降噪信号与语音信号进行混合后获得混合信号，并对所述混合信号进行语音识别。

26、本申请实施例的第三方面提供了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述方法的步骤。

27、本申请实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面所述方法的步骤。

28、本申请实施例与现有技术相比存在的有益效果是：本申请通过获取音源设备的运行参数和对应的噪音信号，并据此生成对应的降噪信号，从而可以高效的对语音信号进行降噪处理，并通过进一步的滤波实现对语音进行增强，提高了在具有特定背景噪声情景下的语音识别度，有利于语音识别技术的大规模推广与应用。

技术特征：

1.一种语音处理方法，其特征在于，所述语音处理方法包括：

2.如权利要求1所述的语音处理方法，其特征在于：

3.如权利要求1所述的语音处理方法，其特征在于：对获取的噪声信号进行预处理，包括：

4.如权利要求3所述的语音处理方法，其特征在于：使用ica算法对预处理后的噪声信号进行分离以获得分离噪声信号，包括将原始数据x0转化为独立信号s，其中：

5.如权利要求4所述的语音处理方法，其特征在于：对分离噪声信号进行降噪处理以获得降噪信号，包括：

6.如权利要求5所述的语音处理方法，其特征在于：将所述降噪信号与语音信号进行混合后获得混合信号，其计算公式为：

7.如权利要求1所述的语音处理方法，其特征在于：还包括滤波器，所述滤波器用于对混合信号进行语音增强处理，所述滤波器为fir滤波器，所述滤波器阶数为40阶，采样频率为8khz，步长因子为0.04。

8.一种语音处理装置，其特征在于，所述语音处理装置包括：

9.一种终端设备，包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

技术总结
本申请适用于语音处理的技术领域，提供了提供了一种语音处理方法及处理装置、终端设备、计算机可读存储介质，包括：获取音源设备运行参数，并根据所述运行参数采集对应的噪音信号，对获取的噪声信号进行预处理，对分离噪声信号进行降噪处理以获得降噪信号，获取环境语音信号与所述音源设备运行参数，并将所述降噪信号与语音信号进行混合后获得混合信号，本方案提高了在具有特定背景噪声情景下的语音识别度，有利于语音识别技术的大规模推广与应用。

技术研发人员：汪张龙,徐俊,沈毅飞,巫庭虎,邹月荣
受保护的技术使用者：广州讯飞易听说网络科技有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汪张龙徐俊沈毅飞巫庭虎邹月荣
技术所有人：广州讯飞易听说网络科技有限公司
我是此专利的发明人