本技术涉及语音技术、人工智能、智慧交通等等,本技术涉及一种信号处理方法、装置、计算机设备、存储介质及程序产品。
背景技术:
1、语音编解码技术在现代通讯系统中占有重要的地位。例如,语音通话过程中,在语音编码时,发送端通过麦克风采集语音信号、并通过模数转换电路将语音信号由模拟信号转换为数字信号后,采用编码器对语音信号压缩再传输给接收端。在语音解码时,接收端通过解码器还原出语音信号,并通过扬声器进行播放。
2、语音编码技术可降低语音信号传输过程所占用的资源。并且,在一些业务场景中,存在通话带宽对运营成本影响较大或传输资源非常有限等情况,尤其需要减少语音信信号传输过程的传输成本。因而,在本领域中,如何在语音编解码过程中更有效的降低传输成本,一直是本领域技术人员的重点研究问题。
技术实现思路
1、本技术提供了一种信号处理方法、装置、计算机设备、存储介质及程序产品。所述技术方案如下:
2、一方面,提供了一种信号处理方法,所述方法包括:
3、获取待传输的目标语音信号;
4、基于所述目标语音信号的带宽、以及预设的目标频率阈值,将所述目标语音信号分解为至少两个子带信号,任一子带信号的带宽低于所述目标语音信信号的带宽;
5、对于第一子带信号,通过第一语音编码器,获取所述第一子带信号的第一编码码流,所述第一子带信号是指所述至少两个子带信号中语谱频率高于目标频率阈值的子带信号,所述第一语音编码器是基于深度学习模型的编码器;
6、对于第二子带信号,通过第二语音编码器,获取所述第二子带信号的第二编码码流,所述第二子带信号是指所述至少两个子带信号中语谱频率不高于目标频率阈值的子带信号,所述第二语音编码器是基于人声语音模型的非深度学习编码器;
7、向接收端传输所述第一编码码流和所述第二编码码流。
8、另一方面,提供了一种信号处理方法,所述方法包括:
9、接收发送端所传输的第一编码码流和第二编码码流;
10、通过第一语音解码器对所述第一编码码流进行解码,得到第一子带信号,所述第一语音解码器是与第一语音编码器对应的解码器,所述第一语音编码器是基于深度学习模型的编码器;
11、通过第二语音解码器对所述第二编码码流进行解码,得到第二子带信号,所述第二语音解码器是与第二语音编码器对应的解码器,所述第二语音编码器是基于人声语音模型的非深度学习编码器;
12、将所述第一子带信号和所述第二子带信号合成为目标语音信号,并播放所述目标语音信号。
13、另一方面,提供了一种信号处理装置,所述装置包括:
14、目标语音信号获取模块,用于获取待传输的目标语音信号;
15、分解模块,用于基于所述目标语音信号的带宽、以及预设的目标频率阈值,将所述目标语音信号分解为至少两个子带信号,任一子带信号的带宽低于所述目标语音信信号的带宽;
16、第一编码码流获取模块,用于对于第一子带信号,通过第一语音编码器,获取所述第一子带信号的第一编码码流,所述第一子带信号是指所述至少两个子带信号中语谱频率高于目标频率阈值的子带信号,所述第一语音编码器是基于深度学习模型的编码器;
17、第二编码码流获取模块,用于对于第二子带信号,通过第二语音编码器,获取所述第二子带信号的第二编码码流,所述第二子带信号是指所述至少两个子带信号中语谱频率不高于目标频率阈值的子带信号,所述第二语音编码器是基于人声语音模型的非深度学习编码器;
18、传输模块,用于向接收端传输所述第一编码码流和所述第二编码码流。
19、在一个可能实现方式中,所述第二编码码流获取模块,用于:
20、通过所述第二语音编码器,对所述第二子带信号进行线性预测分析,得到线性预测滤波参数,并基于所述线性预测滤波参数和第一码本参数,确定所述第二子带信号的预测滤波信号;
21、确定所述预测滤波信号与所述第二子带信号的原始信号之间的残差信号;
22、重复执行线性预测分析、确定预测滤波信号以及确定残差信号的步骤,以将所述第一码本参数迭代调整为第二码本参数;
23、将线谱对系数、基音周期、自适应码本增益参数和固定码本参数,确定为所述第二编码码流;
24、其中,所述线谱对系数用于表征所述线性预测滤波参数,所述基音周期用于表征所述第二码本参数对应的自适应码本,所述固定码本参数用于表征所述第二码本参数对应的固定码本及固定码本增益参数。
25、在一个可能实现方式中,所述第一编码码流包括基音周期、互相关值以及倒谱系数;所述第一编码码流是通过所述第一语音编码器对所述第一子带信号进行特征提取得到的。
26、在一个可能实现方式中,所述分解模块,用于基于所述接收端的播放支持采样率,通过正交镜像滤波器组基于所述目标语音信号的带宽对所述目标语音信号进行至少一次带宽分解,得到所述至少两个子带信号;
27、其中,所述至少两个子带信号包括不高于所述目标频率阈值的子带信号,所述播放支持采样率与所述至少两个子带信号的数量正相关,每次带宽分解将一个第一信号分解为两个第二信号,第二信号的带宽为第一信号的带宽的一半。
28、另一方面,提供了一种信号处理装置,所述装置包括:
29、接收模块,用于接收发送端所传输的第一编码码流和第二编码码流;
30、第一解码模块,用于通过第一语音解码器对所述第一编码码流进行解码,得到第一子带信号,所述第一语音解码器是与第一语音编码器对应的解码器,所述第一语音编码器是基于深度学习模型的编码器;
31、第二解码模块,用于通过第二语音解码器对所述第二编码码流进行解码,得到第二子带信号,所述第二语音解码器是与第二语音编码器对应的解码器,所述第二语音编码器是基于人声语音模型的非深度学习编码器;
32、合成模块,用于将所述第一子带信号和所述第二子带信号合成为目标语音信号;
33、播放模块,用于播放所述目标语音信号。
34、在一个可能实现方式中,所述第二编码码流包括线谱对系数、基音周期、自适应码本增益参数和固定码本参数;
35、所述第二解码模块,用于:
36、通过所述第二语音解码器,对所述线谱对系数进行内插得到线性预测滤波系数;
37、基于所述固定码本参数所表征的固定码本及固定码本增益参数,生成固定码本激励信号;
38、基于所述自适应码本增益参数、以及所述基音周期所表征的自适应码本,生成自适应码本激励信号;
39、通过所述线性预测滤波系数对应的滤波器,对所述固定码本激励信号和所述自适应码本激励信号的合成信号进行滤波,得到所述第二子带信号。
40、在一个可能实现方式中,所述合成模块,用于基于所述接收端的播放支持采样率,从所述第一子带信号选择至少一个第一目标信号,从所述第二子带信号中选择至少一个第二目标信号;通过正交镜像滤波器组,将所述至少一个第一目标信号和第二目标信号合成为第一信号,所述第一信号的采样率不高于所述播放支持采样率;
41、所述播放模块,用于将所述第一信号作为所述目标语音信号进行播放。
42、在一个可能实现方式中,所述装置还包括:
43、时延码流添加模块,用于基于所述第一语音编码器的第一时延和第二语音编码器的第二时延,在所述第一编码码流或所述第二编码码流中添加时延码流,所述时延码流用于将所述第一编码码流和所述第二编码码流之间的时延对齐。
44、在一个可能实现方式中,所述第一编码码流包括基音周期、互相关值以及倒谱系数;
45、所述第一解码模块,用于:
46、将所述基音周期、互相关值以及倒谱系数输入所述第一语音解码器,并通过所述第一语音解码器中的帧率网络,获取条件向量,以及,通过所述第一语音解码器中的线性预测模块,获取线性预测滤波系数;
47、通过所述第一语音解码器中的采样频率网络,基于所述线性预测滤波系数和所述条件向量,生成第一子带信号。
48、另一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现上述的信号处理方法。
49、另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的信号处理方法。
50、另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述的信号处理方法。
51、本技术实施例提供的技术方案带来的有益效果是:
52、本技术实施例提供的信号处理方法,可基于该目标语音信号的带宽、以及预设的目标频率阈值,将该目标语音信号分解为至少两个子带信号;并分别通过第一语音编码器,获取语谱频率高于目标频率阈值的第一子带信号的第一编码码流,可得到低码率的编码码流;以及通过第二语音编码器,获取语谱频率不高于目标频率阈值的第二子带信号的第二编码码流,可得到高质量的编码变流;通过针对语音信号中不同语谱频率的子带信号采用不同编码方式,对具备大部分信息量的第二子带信号进行高质量编码,保证了语音编码的质量;同时对第一子带信号进行低码率的编码方式,降低了低质量需求的高频子带信号所需的传输带宽,从而在保证编码质量的前提下,尽可能的降低了所需的传输成本。