本申请涉及语音通信,特别是涉及一种语音带宽扩展方法及相关装置。
背景技术:
1、在基于网际协议的语音传输(voice over internet protocol,voip)的语音通信系统中,例如通过即时通信软件等进行多人音视频通话的时候,可能由于一些情况导致接收端接收到窄带语音信号,进而感受到明显的音质下降。
2、为了能够在接收端提升收听语音的主观体验,最自然的方法就是对窄带语音信号进行语音带宽扩展,进而人工合成宽带语音信号。
3、然而,目前的语音带宽扩展方式仅仅是将丢失的高频信息尽量恢复,合成的宽带语音信号给用户的听感较为生硬、机械,难以体现说话人的语言特色,其在逼真度上表现较差,进而导致语音质量较差。
技术实现思路
1、为了解决上述技术问题,本申请提供了一种语音带宽扩展方法及相关装置,可以得到听感类似人类发声的宽带语音信号帧,可以体现出说话人的语言特色,从而提高宽带语音信号帧的逼真度,以及提高语音质量。
2、本申请实施例公开了如下技术方案:
3、第一方面,本申请实施例提供一种语音带宽扩展方法,所述方法包括:
4、根据待处理窄带语音信号帧进行高频功率谱预测,得到所述待处理窄带语音信号帧对应的高频功率谱;
5、将所述高频功率谱和所述待处理窄带语音信号帧对应的低频功率谱进行拼接得到宽带功率谱;
6、对所述宽带功率谱进行谱包络计算,并根据计算结果确定滤波器参数;
7、基于所述待处理窄带语音信号帧和所述滤波器参数进行分析滤波,生成所述待处理窄带语音信号帧对应的低频激励信号,所述分析滤波用于滤除所述待处理窄带语音信号帧中的音色信息和声道形状信息;
8、对所述低频激励信号进行扩展得到高频激励信号;
9、根据所述低频激励信号和所述高频激励信号进行合成得到宽带激励信号;
10、基于所述宽带激励信号和所述滤波器参数进行合成滤波得到宽带语音信号帧,所述合成滤波用于为所述宽带激励信号添加音色信息和声道形状信息。
11、第二方面,本申请实施例提供一种语音带宽扩展装置,所述装置包括预测单元、拼接单元、确定单元、生成单元和滤波单元:
12、所述预测单元,用于根据待处理窄带语音信号帧进行高频功率谱预测,得到所述待处理窄带语音信号帧对应的高频功率谱;
13、所述拼接单元,用于将所述高频功率谱和所述待处理窄带语音信号帧对应的低频功率谱进行拼接得到宽带功率谱;
14、所述确定单元,用于对所述宽带功率谱进行谱包络计算,并根据计算结果确定滤波器参数;
15、所述生成单元,用于基于所述待处理窄带语音信号帧和所述滤波器参数进行分析滤波,生成所述待处理窄带语音信号帧对应的低频激励信号,所述分析滤波用于滤除所述待处理窄带语音信号帧中的音色信息和声道形状信息;
16、所述确定单元,还用于对所述低频激励信号进行扩展得到高频激励信号;根据所述低频激励信号和所述高频激励信号进行合成得到宽带激励信号;
17、所述滤波单元,用于基于所述宽带激励信号和所述滤波器参数进行合成滤波得到宽带语音信号帧,所述合成滤波用于为所述宽带激励信号添加音色信息和声道形状信息。
18、第三方面,本申请实施例提供一种用于语音带宽扩展的设备,所述设备包括处理器以及存储器:
19、所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
20、所述处理器用于根据所述程序代码中的指令执行第一方面所述的方法。
21、第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所述的方法。
22、第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面所述的方法。
23、由上述技术方案可以看出,在获取到待处理窄带语音信号帧后,根据待处理窄带语音信号帧进行高频功率谱预测,得到待处理窄带语音信号帧对应的高频功率谱,将高频功率谱和待处理窄带语音信号帧对应的低频功率谱进行拼接得到宽带功率谱,从而在一定程度上对待处理窄带语音信号帧进行带宽扩展。基于对人类语音产生的分析,人类的声道(口腔、喉咙)相当于一个滤波器,声道产生的震动经过不同形状的声道产生不同音色的语音信号。为此,本申请对宽带功率谱进行谱包络计算,并根据计算结果确定滤波器参数,通过滤波器参数仿真人类的声道。然后基于待处理窄带语音信号帧和滤波器参数进行分析滤波,滤除待处理窄带语音信号帧中的音色信息和声道形状信息生成待处理窄带语音信号帧对应的低频激励信号,对低频激励信号进行扩展得到高频激励信号,进而根据低频激励信号和高频激励信号进行合成确定宽带激励信号,该宽带激励信号相当于人类语音产生过程中声道产生的震动。由于滤波器参数仿真人类的声道,因此基于宽带激励信号和滤波器参数进行合成滤波,为宽带激励信号添加音色信息和声道形状信息得到宽带语音信号帧,相当于对声道产生的震动通过对应的声道进行处理,进而得到类似人类发声的宽带语音信号帧。可见本方案提供的语音带宽扩展方法可以得到听感类似人类发声的宽带语音信号帧,可以体现出说话人的语言特色,从而提高宽带语音信号帧的逼真度,以及提高语音质量。
1.一种语音带宽扩展方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,对所述宽带功率谱进行谱包络计算,并根据计算结果确定滤波器参数,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述低频激励信号和所述高频激励信号进行合成得到宽带激励信号,包括:
4.根据权利要求1所述的方法,其特征在于,所述将所述高频功率谱和所述待处理窄带语音信号帧对应的低频功率谱进行拼接得到宽带功率谱之前,所述方法还包括:
5.根据权利要求1-4任一项所述的方法,其特征在于,获取所述待处理窄带语音信号帧,包括:
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1-4任一项所述的方法,其特征在于,获取所述待处理窄带语音信号帧,包括:
8.根据权利要求1-4任一项所述的方法,其特征在于,所述根据待处理窄带语音信号帧进行高频功率谱预测,得到所述待处理窄带语音信号帧对应的高频功率谱,包括:
9.根据权利要求8所述的方法,其特征在于,所述对所述待处理窄带语音信号帧进行特征提取得到对应的特征向量,包括:
10.根据权利要求8所述的方法,其特征在于,所述基于所述特征向量和预测模型得到所述待处理窄带语音信号帧对应的高频功率谱,包括:
11.一种语音带宽扩展装置,其特征在于,所述装置包括预测单元、拼接单元、确定单元、生成单元和滤波单元:
12.一种用于语音带宽扩展的设备,其特征在于,所述设备包括处理器以及存储器:
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-10任一项所述的方法。
14.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-10任一项所述的方法。