语音信号处理方法、装置、设备、存储介质及计算机程序产品与流程

文档序号:43039741发布日期:2025-09-16 17:34阅读:22来源:国知局

本申请涉及语音通信,尤其涉及一种语音信号处理方法、装置、设备、存储介质及计算机程序产品。


背景技术:

1、随着语音通信、语音识别、智能助理等应用领域的快速发展,语音信号的传输质量对系统性能和用户体验的影响越来越突出。然而,在实际应用环境中,语音信号往往受到各种背景噪声的干扰,例如白噪声、脉冲噪声及环境噪声,导致语音清晰度下降、识别率降低以及通信质量不稳定的问题。传统的语音降噪技术通常基于静态参数设计,缺乏对复杂噪声环境中不同类型噪声的实时识别与针对性处理,导致降噪效果有限;另外,在降噪过程中,常常伴随有语音信号的频谱失真或高频细节丢失,进一步影响了语音信号的自然度和清晰度,导致语音信号的传输质量欠佳。因此,如何提升语音信号的传输质量成为一个亟待解决的技术问题。


技术实现思路

1、本申请的主要目的在于提供了一种语音信号处理方法、装置、设备、存储介质及计算机程序产品,旨在解决如何提升语音信号的传输质量的技术问题。

2、为实现上述目的,本申请提供了一种语音信号处理方法,所述方法包括以下步骤:

3、基于预设深度神经网络噪声识别模型,对接收到的原始语音信号进行实时噪声分类;

4、根据噪声分类结果,选择对应的组合式降噪模型对所述原始语音信号进行多级降噪处理,得到降噪语音信号,所述组合式降噪模型包括基于深度神经网络的降噪模块、维纳滤波模块及谱减法模块中的一个或多个;

5、基于时域特征提取与频域特征提取,对所述降噪语音信号进行语音特征增强处理,得到目标语音信号。

6、在一实施例中,在所述基于时域特征提取与频域特征提取,对所述降噪语音信号进行语音特征增强处理,得到目标语音信号的步骤之后,还包括:

7、基于预设语音质量预测模型对目标语音信号进行质量评估,得到多维度质量指标,所述多维度质量指标包括清晰度、自然度及噪声残留率;

8、基于所述多维度质量指标,采用逆滤波补偿算法对频率损失区域进行重建,生成修复后的目标语音信号。

9、在一实施例中,所述方法还包括:

10、获取当前噪声变化趋势;

11、基于所述当前噪声变化趋势,对当前降噪效果进行实时评估;

12、基于实时评估结果,动态调整所述组合式降噪模型中各模块的权重参数。

13、在一实施例中,所述基于实时评估的结果,动态调整所述组合式降噪模型中各模块的权重参数的步骤,包括:

14、基于所述实时评估结果,结合所述清晰度,采用强化学习方法分别对所述基于深度神经网络的降噪模块、所述维纳滤波模块及所述谱减法模块的权重进行在线学习和更新。

15、在一实施例中,所述根据噪声分类结果,选择对应的组合式降噪模型对所述原始语音信号进行多级降噪处理,得到降噪语音信号的步骤,包括:

16、根据所述噪声分类结果,基于所述深度神经网络的降噪模块对所述原始语音信号进行高维语音特征提取;

17、基于所述维纳滤波模块,对所述原始语音信号的中频噪声进行平滑抑制;

18、基于所述谱减法模块,对所述原始语音信号中的低频残留噪声进行动态抑制;

19、根据高维语音特征提取结果、平滑抑制结果以及动态抑制结果,得到所述降噪语音信号。

20、在一实施例中,所述基于时域特征提取与频域特征提取,对所述降噪语音信号进行语音特征增强处理,得到目标语音信号的步骤,包括:

21、基于时域特征提取,对所述降噪语音信号执行自适应加权滤波,得到滤波信号;

22、基于频域特征提取,对所述滤波信号进行频谱分析,识别高频信息缺失区域;

23、采用非线性增益映射算法对所述高频信息缺失区域进行频域补偿,得到所述目标语音信号。

24、此外,为实现上述目的,本申请还提出一种语音信号处理装置,所述语音信号处理装置包括:

25、识别分类模块,用于基于预设深度神经网络噪声识别模型,对接收到的原始语音信号进行实时噪声分类,识别噪声类型包括白噪声、脉冲噪声和环境噪声;

26、降噪模块,用于根据噪声分类结果,选择对应的组合式降噪模型对所述原始语音信号进行多级降噪处理,得到降噪语音信号,所述组合式降噪模型包括基于深度神经网络的降噪模块、维纳滤波模块及谱减法模块中的一个或多个;

27、目标模块,用于基于时域特征提取与频域特征提取,对所述降噪语音信号进行语音特征增强处理,得到目标语音信号。

28、此外,为实现上述目的,本申请还提出一种语音信号处理设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音信号处理程序,所述语音信号处理程序配置为实现如上文所述的语音信号处理方法的步骤。

29、此外,为实现上述目的,本申请还提出一种存储介质,所述存储介质上存储有语音信号处理程序,所述语音信号处理程序被处理器执行时实现如上文所述的语音信号处理方法的步骤。

30、此外,为实现上述目的,本申请还提出一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上文所述的语音信号处理方法的步骤。

31、本申请基于预设深度神经网络噪声识别模型,对接收到的原始语音信号进行实时噪声分类;根据噪声分类结果,选择对应的组合式降噪模型对原始语音信号进行多级降噪处理,得到降噪语音信号,组合式降噪模型包括基于深度神经网络的降噪模块、维纳滤波模块及谱减法模块中的一个或多个;基于时域特征提取与频域特征提取,对降噪语音信号进行语音特征增强处理,得到目标语音信号。本申请基于预设的深度神经网络噪声识别模型,对接收到的原始语音信号进行实时噪声分类,为后续降噪处理提供针对性依据,从源头上降低噪声干扰;随后,根据噪声分类结果,选择对应的组合式降噪模型对原始语音信号进行多级降噪处理,组合式降噪模型能够根据不同噪声特性灵活应用多种降噪手段,有效提升降噪效果并减少残余噪声;基于时域特征提取与频域特征提取,对降噪后的语音信号进行语音特征增强处理,在时域和频域两个维度修复和强化语音细节,缓解降噪过程中产生的失真问题,提高语音信号的清晰度和完整度,提升了语音信号的传输质量。



技术特征:

1.一种语音信号处理方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,在所述基于时域特征提取与频域特征提取,对所述降噪语音信号进行语音特征增强处理,得到目标语音信号的步骤之后,还包括:

3.如权利要求2所述的方法,其特征在于,所述方法还包括:

4.如权利要求3所述的方法,其特征在于,所述基于实时评估的结果,动态调整所述组合式降噪模型中各模块的权重参数的步骤,包括:

5.如权利要求1所述的方法,其特征在于,所述根据噪声分类结果,选择对应的组合式降噪模型对所述原始语音信号进行多级降噪处理,得到降噪语音信号的步骤,包括:

6.如权利要求1所述的方法,其特征在于,所述基于时域特征提取与频域特征提取,对所述降噪语音信号进行语音特征增强处理,得到目标语音信号的步骤,包括:

7.一种语音信号处理装置,其特征在于,所述装置包括:

8.一种计算机设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音信号处理程序,所述语音信号处理程序配置为实现如权利要求1至6中任一项所述的语音信号处理方法的步骤。

9.一种存储介质,其特征在于,所述存储介质上存储有语音信号处理程序,所述语音信号处理程序被处理器执行时实现如权利要求1至6任一项所述的语音信号处理方法的步骤。

10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的语音信号处理方法的步骤。


技术总结
本申请涉及语音通信技术领域,尤其涉及一种语音信号处理方法、装置、设备、存储介质及计算机程序产品。该方法基于预设深度神经网络噪声识别模型,对接收到的原始语音信号进行实时噪声分类;根据噪声分类结果,选择对应的组合式降噪模型对原始语音信号进行多级降噪处理,得到降噪语音信号,组合式降噪模型包括基于深度神经网络的降噪模块、维纳滤波模块及谱减法模块中的一个或多个;基于时域特征提取与频域特征提取,对降噪语音信号进行语音特征增强处理,得到目标语音信号,提升了语音信号的传输质量。

技术研发人员:徐晔,曹丞相,黄金鑫
受保护的技术使用者:深圳鼎信通达股份有限公司
技术研发日:
技术公布日:2025/9/15
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1