一种语音数据的处理方法及处理装置与流程

文档序号：35964195发布日期：2023-11-09 03:12阅读：来源：国知局

技术特征：

1.一种语音数据的处理方法，其特征在于，所述处理方法包括：

2.如权利要求1所述的语音数据的处理方法，其特征在于，所述将多个待处理语音数据进行预处理和子带分解，得到子带频谱的步骤，包括：

3.如权利要求2所述的语音数据的处理方法，其特征在于，所述将多个所述第三语音数据进行短时傅里叶变换，并进行子带分解，得到子带频谱的步骤，包括：

4.如权利要求1所述的语音数据的处理方法，其特征在于，所述编码模块包括多个第一卷积模块，所述第一卷积模块包括依次连接的卷积层、批量归一化层和激活层；多个所述第一卷积模块之间通过最大池化层连接。

5.如权利要求1所述的语音数据的处理方法，其特征在于，所述将所述第一特征数据输入自注意力模块，得到由所述自注意力模块输出的第一处理结果的步骤，包括：

6.如权利要求1所述的语音数据的处理方法，其特征在于，在所述将多个待处理语音数据进行滤波处理，得到多个第一语音数据的步骤之前，还包括：

7.如权利要求6所述的语音数据的处理方法，其特征在于，所述根据所述样本处理结果和标准处理结果计算对数均方误差和多分辨率短时傅里叶变换误差的步骤，包括：

8.一种语音数据的处理装置，其特征在于，所述处理装置包括：

9.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

技术总结
本发明适用于语音处理的技术领域，提供了一种语音数据的处理方法及处理装置，所述处理方法包括：将多个待处理语音数据进行预处理和子带分解，得到子带频谱；将所述子带频谱输入编码模块，得到第一特征数据；将所述第一特征数据输入自注意力模块，得到由所述自注意力模块输出的第一处理结果；将所述第三处理结果进行短时傅里叶变换，得到第四处理结果；将所述第三处理结果和所述第四处理结果进行点乘运算，得到增益结果；将所述增益结果进行逆短时傅里叶变换、加窗以及信号重构，得到语音增强结果，并基于所述语音增强结果进行语音识别。增强后的语音信号可能更清晰、可辨认度更高，提高了语音识别的准确性和性能。

技术研发人员：韦伟才,邓海蛟,马健莹,潘晖
受保护的技术使用者：深圳市龙芯威半导体科技有限公司
技术研发日：
技术公布日：2024/1/16

完整全部详细技术资料下载

当前第2页1 2