语音变声方法、装置、设备及存储介质与流程

文档序号:36511944发布日期:2023-12-29 14:25阅读:51来源:国知局
语音变声方法与流程

本技术涉及语音处理领域,尤其涉及语音变声方法、装置、设备及存储介质。


背景技术:

1、语音伪装设备,又称为变声器,被广泛应用于社会的各个领域中。例如,变声器可以应用于对举报人的声音进行变声,防止打击报复;又如,变声器还可以应用于对独居女士和小孩的声音进行变声,以应对骚扰电话和陌生人来访;又如,变声器还可以应用于需要变声的小游戏中,等等。

2、目前,大多数的变声器主要是通过改变人声声调来实现变声,变声效果不够好。


技术实现思路

1、本技术提供语音变声方法、装置、设备及存储介质,以解决通过改变人声声调来实现变声带来的变声效果不够好的技术问题。

2、第一方面,提供一种语音变声方法,包括:

3、获取待处理的原始语音信号;

4、对所述原始语音信号进行变调处理,得到所述原始语音信号对应的变调语音信号;

5、对所述变调语音信号进行清浊音检测,得到所述变调语音信号中的清音信号和初始浊音信号;

6、调整所述初始浊音信号的共振峰频率,得到目标浊音信号;

7、对所述清音信号和所述目标浊音信号进行合成,得到所述原始语音信号对应的变声语音信号。

8、在该技术方案中,在获取到待处理的原始语音信号并对原始语音信号进行变调处理后,得到原始语音信号对应的变调语音信号之后,通过对变调语音信号进行清浊音检测,得到变调语音信号中的清音信号和初始浊音信号,然后调整初始浊音信号的共振峰频率,得到目标浊音信号,最后对清音信号和目标浊音信号进行合成,得到原始语音信号对应的变声语音信号;由于在对原始语音信号进行变调后,还对变调后的语音信号中的浊音信号进行共振峰频率调整,不仅改变了声音音调,还通过调整共振峰频率改变了声音音色,从而可以使得变声得到的声音更加自然协调,改善变声效果。

9、结合第一方面,在一种可能的实现方式中,所述调整所述初始浊音信号的共振峰频率,得到目标浊音信号,包括:对所述初始浊音信号进行共振峰频谱包络提取,得到所述初始浊音信号的共振峰频谱包络;对所述初始浊音信号的共振峰频谱包络进行伸缩处理,得到所述初始浊音信号对应的包络调整信号;根据所述包络调整信号,确定所述目标浊音信号。通过对初始浊音信号进行共振峰包络提取并对提取得到的共振峰频谱包络进行伸缩处理,能够实现对浊音信号的共振峰频率调整。

10、结合第一方面,在一种可能的实现方式中,所述对所述初始浊音信号进行共振峰频谱包络提取,得到所述初始浊音信号的共振峰频谱包络,包括:对所述初始浊音信号进行倒谱估计,得到所述初始浊音信号对应的频谱包络;将所述初始浊音信号的幅度更新为第一幅度与第二幅度中的最大值,返回执行所述对所述初始浊音信号进行倒谱估计,得到所述初始浊音信号对应的频谱包络,直至所述初始浊音信号的幅度更新次数达到预设次数,所述第一幅度为所述初始浊音信号的幅度,所述第二幅度为所述频谱包络对应的幅度;将最后一次得到的频谱包络,确定为所述初始浊音信号的共振峰频谱包络。基于迭代的优化倒谱法来提取浊音信号的共振峰频谱包络,能更加准确地提取反映共振峰的频谱包络。

11、结合第一方面,在一种可能的实现方式中,所述对所述初始浊音信号进行倒谱估计,得到所述初始浊音信号对应的频谱包络,包括:对所述初始浊音信号的幅度谱进行倒谱计算,得到所述初始浊音信号对应的初始倒谱信号;通过矩形窗对所述初始倒谱信号进行加窗,得到所述初始浊音信号对应的加窗倒谱信号;对所述加窗倒谱信号进行快速傅里叶变换,并对快速傅里叶变换得到的信号取实部,得到所述加窗倒谱信号对应的实部信号;对所述实部信号进行指数运算,得到初始浊音信号对应的频谱包络。

12、结合第一方面,在一种可能的实现方式中,所述对所述初始浊音信号的共振峰频谱包络进行伸缩处理,得到所述初始浊音信号对应的包络调整信号,包括:对所述初始浊音信号的共振峰频谱包络进行重采样或插值处理,得到所述初始浊音信号对应的包络调整信号。通过对浊音信号进行重采样或者插值处理来进行包络调整,能够不改变频谱包络的整体形状,使得变声语音信号更加自然。

13、结合第一方面,在一种可能的实现方式中,所述根据所述包络调整信号,确定所述目标浊音信号,包括:对所述包络调整信号的共振峰频谱包络进行幅度倾斜差异补偿,得到所述初始浊音信号对应的共振峰幅度倾斜调整信号;根据所述共振峰幅度倾斜调整信号,确定所述目标浊音信号。通过对包络调整信号的共振峰频谱包络进行幅度倾斜差异补偿,能够使得调整后的浊音信号更加自然。

14、结合第一方面,在一种可能的实现方式中,所述对所述包络调整信号的共振峰频谱包络进行幅度倾斜差异补偿,得到所述初始浊音信号对应的共振峰幅度倾斜调整信号,包括:基于角度旋转补偿,对所述包络调整信号的共振峰频谱包络进行幅度倾斜差异补偿,得到所述初始浊音信号对应的共振峰幅度倾斜调整信号。

15、结合第一方面,在一种可能的实现方式中,所述根据所述共振峰幅度倾斜调整信号,确定所述目标浊音信号,包括:对所述共振峰幅度倾斜调整信号进行能量补偿,得到所述目标浊音信号。通过对共振峰幅度倾斜调整信号进行能量补偿,能够使得调整后的浊音信号的能量与调整前的浊音信号的能量保持一致。

16、结合第一方面,在一种可能的实现方式中,所述对所述共振峰幅度倾斜调整信号进行能量补偿,得到所述目标浊音信号,包括:根据所述共振峰幅度倾斜调整信号的共振峰频谱包络和所述初始浊音信号的共振峰频谱包络,确定能量补偿因子;根据所述能量补偿因子,对所述共振峰幅度倾斜调整信号的共振峰频谱包络进行包络重塑,得到所述目标浊音信号。

17、结合第一方面,在一种可能的实现方式中,所述对所述变调语音信号进行清浊音检测,得到所述变调语音信号中的清音信号和初始浊音信号,包括:计算所述变调语音信号对应的每帧变调语音信号帧的短时过零率;根据所述短时过零率,确定所述变调语音信号中的清音信号和初始浊音信号。

18、第二方面,提供一种语音变声装置,包括:

19、语音信号获取模块,用于获取待处理的原始语音信号;

20、变调模块,用于对所述原始语音信号进行变调处理,得到所述原始语音信号对应的变调语音信号;

21、清浊音检测模块,用于对所述变调语音信号进行清浊音检测,得到所述变调语音信号中的清音信号和初始浊音信号;

22、共振峰频率调整模块,用于调整所述初始浊音信号的共振峰频率,得到目标浊音信号;

23、信号合成模块,用于对所述清音信号和所述目标浊音信号进行合成,得到所述原始语音信号对应的变声语音信号。

24、第三方面,提供一种计算机设备,包括存储器以及一个或多个处理器,所述存储器连接至所述一个或多个处理器,一个或多个处理器用于执行存储在存储器中的一个或多个计算机程序,一个或多个处理器在执行一个或多个计算机程序时,使得该计算机设备实现上述第一方面的语音变声方法。

25、第四方面,提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,上述程序指令当被处理器执行时使上述处理器执行上述第一方面的语音变声方法。

26、本技术可以实现如下技术效果:由于在对原始语音信号进行变调后,还对变调后的语音信号中的浊音信号进行共振峰频率调整,不仅改变了声音音调,还通过调整共振峰频率改变了声音音色,从而可以使得变声得到的声音更加自然协调,改善变声效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1