本公开涉及信号处理,尤其涉及一种音频信号处理方法、装置、介质及电子设备。
背景技术:
1、目前,由于音频信号中掺杂着背景噪声,需要对音频信号进行降噪处理。但是,音频信号降噪处理的过程复杂,不能及时的进行处理,导致音频信号处理的效率低。
技术实现思路
1、为克服相关技术中存在的问题,本公开提供一种音频信号处理方法、装置、介质及电子设备。
2、根据本公开实施例的第一方面,提供一种音频信号处理方法,所述方法包括:
3、确定初始音频信号对应的初始频域信息,所述初始频域信息包括第一预设频段内的第一频域信息和第二预设频段内的第二频域信息;
4、基于预设的降噪模型以及所述第一频域信息,确定第一降噪信息;
5、根据所述第一降噪信息,确定所述第二频域信息的第二降噪信息;
6、根据所述第一降噪信息和所述第二降噪信息,对所述初始频域信息进行处理得到目标音频信号对应的目标频域信息。
7、本公开的一些实施例中,所述基于预设的降噪模型以及所述第一频域信息,确定第一降噪信息,包括:
8、将所述第一频域信息输入所述降噪模型;
9、所述降噪模型对所述第一频域信息进行特征提取,输出第一增益系数,将所述第一增益系数确定为所述第一降噪信息。
10、本公开的一些实施例中,所述降噪模型对所述第一频域信息进行特征提取,输出第一增益系数,包括:
11、对所述第一频域信息进行卷积处理,得到第一特征信息;
12、将所述第一特征信息输入反馈神经网络进行特征提取,得到第二特征信息;
13、基于所述卷积处理,对所述第二特征信息进行转置卷积处理,得到所述第一增益系数。
14、本公开的一些实施例中,所述反馈神经网络包括第一长短期记忆网络和第二长短期记忆网络,所述将所述第一特征信息输入反馈神经网络进行特征提取,得到第二特征信息,包括:
15、将所述第一特征信息输入所述第一长短期记忆网络,得到第一子特征信息;
16、将所述第一子特征信息进行第一维度转换,得到转换信息;
17、将所述转换信息输入所述第二长短期记忆网络,得到第二子特征信息;
18、对所述第二子特征信息进行第二维度转换,得到所述第二特征信息。
19、本公开的一些实施例中,所述根据所述第一降噪信息,确定所述第二频域信息的第二降噪信息,包括:
20、根据所述第一增益系数,确定第一增益均值;
21、将所述第一增益均值确定为第二增益系数,将所述第二增益系数确定为所述第二降噪信息。
22、本公开的一些实施例中,所述第一频域信息包括初始实部信息和初始虚部信息,所述第一降噪信息包括与所述初始实部信息对应的第一实部降噪信息以及与所述初始虚部信息对应的第一虚部降噪信息,所述第二降噪信息包括根据所述第一实部降噪信息确定的第二实部降噪信息以及根据所述第一虚部降噪信息确定的第二虚部降噪信息。
23、本公开的一些实施例中,所述根据所述第一降噪信息和所述第二降噪信息,对所述初始频域信息进行处理得到目标音频信号对应的目标频域信息,包括:
24、根据所述第一实部降噪信息和所述第二实部降噪信息,确定目标实部降噪信息;
25、根据所述第一虚部降噪信息和所述第二虚部降噪信息,确定目标虚部降噪信息;
26、根据所述初始实部信息、所述初始虚部信息、所述目标实部降噪信息和所述目标虚部降噪信息,分别确定目标实部信息和目标虚部信息;
27、根据所述目标实部信息和所述目标虚部信息,确定所述目标频域信息。
28、本公开的一些实施例中,所述确定初始音频信号对应的初始频域信息,包括:
29、以预设窗长信息和预设帧移信息,对所述初始音频信号进行加窗分帧处理得到第一音频信号;
30、将所述第一音频信号进行转换,得到所述初始频域信息。
31、本公开的一些实施例中,所述音频信号处理方法还包括:
32、将所述目标频域信息进行转换,得到第二音频信号;
33、将所述第二音频信号进行叠加去重,得到目标音频信号。
34、根据本公开实施例的第二方面,提供一种音频信号处理装置,所述装置包括:
35、第一确定模块,被配置为用于确定初始音频信号对应的初始频域信息,所述初始频域信息包括第一预设频段内的第一频域信息和第二预设频段内的第二频域信息;
36、第二确定模块,被配置为用于基于预设的降噪模型以及所述第一频域信息,确定第一降噪信息;
37、第三确定模块,被配置为用于根据所述第一降噪信息,确定所述第二频域信息的第二降噪信息;
38、第一处理模块,被配置为用于根据所述第一降噪信息和所述第二降噪信息,对所述初始频域信息进行处理得到目标音频信号对应的目标频域信息。
39、本公开的一些实施例中,所述装置还包括:
40、转换模块,被配置为用于将所述目标频域信息进行转换,得到第二音频信号;
41、第二处理模块,被配置为用于将所述第二音频信号进行叠加去重,得到目标音频信号。
42、根据本公开实施例的第三方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由终端的处理器执行时,使得所述终端能够执行如上所述的方法。
43、根据本公开实施例的第四方面,提供一种电子设备,所述电子设备包括:
44、处理器;
45、用于存储所述处理器可执行指令的存储器;
46、其中,所述处理器被配置为执行如上所述的方法。
47、本公开的实施例提供的技术方案可以包括以下有益效果:
48、在音频信号处理的过程中,确定与初始音频信号对应的初始频域信息,以在频域范围内进行初始音频信号的降噪处理。选择第一预设频段内的第一频域信息作为降噪的基准,基于降噪模型确定第一降噪信息。当处理第二预设频段内的噪声时,根据第一降噪信息确定第二频域信息的第二降噪信息。根据第一降噪信息和第二降噪信息,对初始频域信息进行处理得到与目标音频信号对应的目标频域信息,从而实现对初始频域信息的降噪处理。如此,无需对第二频域信息进行复杂的降噪信息的确定过程,降低了音频信号处理过程的复杂度,从而提高了音频信号处理的效率。
49、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
1.一种音频信号处理方法,其特征在于,所述音频信号处理方法包括:
2.根据权利要求1所述的音频信号处理方法,其特征在于,所述基于预设的降噪模型以及所述第一频域信息,确定第一降噪信息,包括:
3.根据权利要求2所述的音频信号处理方法,其特征在于,所述降噪模型对所述第一频域信息进行特征提取,输出第一增益系数,包括:
4.根据权利要求3所述的音频信号处理方法,其特征在于,所述反馈神经网络包括第一长短期记忆网络和第二长短期记忆网络,所述将所述第一特征信息输入反馈神经网络进行特征提取,得到第二特征信息,包括:
5.根据权利要求2至4任一项所述的音频信号处理方法,其特征在于,所述根据所述第一降噪信息,确定所述第二频域信息的第二降噪信息,包括:
6.根据权利要求1至4任一项所述的音频信号处理方法,其特征在于,所述第一频域信息包括初始实部信息和初始虚部信息,所述第一降噪信息包括与所述初始实部信息对应的第一实部降噪信息以及与所述初始虚部信息对应的第一虚部降噪信息,所述第二降噪信息包括根据所述第一实部降噪信息确定的第二实部降噪信息以及根据所述第一虚部降噪信息确定的第二虚部降噪信息。
7.根据权利要求6所述的音频信号处理方法,其特征在于,所述根据所述第一降噪信息和所述第二降噪信息,对所述初始频域信息进行处理得到目标音频信号对应的目标频域信息,包括:
8.根据权利要求1至4任一项所述的音频信号处理方法,其特征在于,所述确定初始音频信号对应的初始频域信息,包括:
9.根据权利要求1至4任一项所述的音频信号处理方法,其特征在于,所述音频信号处理方法还包括:
10.一种音频信号处理装置,其特征在于,所述装置包括:
11.根据权利要求10所述的风速确定装置,其特征在于,所述装置还包括:
12.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由终端的处理器执行时,使得所述终端能够执行如权利要求1至9中任意一项所述的方法。
13.一种电子设备,其特征在于,所述电子设备包括: