语音信号处理方法、装置、电子设备及存储介质与流程

文档序号:18515515发布日期:2019-08-24 09:25阅读:249来源:国知局
语音信号处理方法、装置、电子设备及存储介质与流程

本申请涉及信号处理技术领域,具体而言,本申请涉及一种语音信号处理方法、装置、电子设备及存储介质。



背景技术:

随着移动通讯的发展,各类应用程序应运而生,例如一些具备通信功能的应用程序。用户与用户之间可以通过这些具备通信功能的应用程序进行语音交互,即将用户通过语音格式输入的信息发送至对端用户,以实现信息交互。

在用户与用户之间通过语音方式进行信息交互的过程中,为了增加信息交互过程中趣味性,可以将用户输入的语音信息进行变声处理后发送至对端,以使得对端接收到的语音信息区别于用户输入的语音信息。

但是如何对用户输入的语音进行变声成为一个关键问题。



技术实现要素:

本申请提供了一种语音信号处理方法、装置、电子设备及存储介质,可以解决以上至少一种技术问题。所述技术方案如下:

第一方面,提供了一种语音信号处理方法,该方法包括:

获取原始语音信号;

对原始语音信号进行线性预测分析,确定原始语音信号对应的原始激励以及第一滤波器;

调整第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息中的至少一项,得到调整后的第一滤波器;

基于原始语音信号对应的原始激励以及调整后的第一滤波器,确定目标语音信号。

在一个可能的实现方式中,对原始语音信号进行线性预测分析,确定原始语音信号对应的原始激励以及第一滤波器,包括:

对原始语音信号进行线性预测分析,确定原始语音信号对应的预测误差信息;

基于原始语音信号对应的预测误差信息,确定原始语音信号对应的原始激励以及第一滤波器。

在另一个可能的实现方式中,基于原始语音信号对应的预测误差信息,确定原始语音信号对应的原始激励以及第一滤波器,包括:

基于原始语音信号对应的预测误差信息,确定第二滤波器,第二滤波器为线性预测分析对应的滤波器;

基于原始语音信号以及第二滤波器确定原始语音信号对应的原始激励,以及基于第二滤波器确定第一滤波器。

在另一个可能的实现方式中,调整第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息中的至少一项,得到调整后的第一滤波器,包括:

若第一滤波器对应的极点角度信息满足预设条件,则按照预设方式调整第一滤波器对应的极点角度信息以及极点幅度信息中的至少一项。

在另一个可能的实现方式中,第一滤波器对应的极点角度信息包括:至少一个极点对应的极点角度值;

按照预设方式调整第一滤波器对应的极点角度信息,包括以下至少一项:

将至少一个极点对应的极点角度值增加第一预设阈值;

将至少一个极点对应的极点角度值减少第二预设阈值。

在另一个可能的实现方式中,第一滤波器对应的极点幅度信息包括:至少一个极点对应的极点幅度值;

按照预设方法调整第一滤波器对应的极点幅度信息,包括:

将至少一个极点对应的极点幅度值按照预设倍数进行调整。

在另一个可能的实现方式中,获取原始语音信号,之前还包括:

获取用户输入的语音信号;

对用户输入的语音信号进行去噪处理,并将去噪处理后的语音信号作为原始语音信号。

第二方面,提供了一种语音信号处理装置,该装置包括:

第一获取模块,用于获取原始语音信号;

第一确定模块,用于对原始语音信号进行线性预测分析,确定原始语音信号对应的原始激励以及第一滤波器;

调整模块,用于调整第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息中的至少一项,得到调整后的第一滤波器;

第二确定模块,用于基于原始语音信号对应的原始激励以及调整后的第一滤波器,确定目标语音信号。

在一个可能的实现方式中,第一确定模块包括第一确定单元和第二确定单元,其中,

第一确定单元,用于对原始语音信号进行线性预测分析,确定原始语音信号对应的预测误差信息;

第二确定单元,用于基于原始语音信号对应的预测误差信息,确定原始语音信号对应的原始激励以及第一滤波器。

在另一个可能的实现方式中,第二确定单元,具体用于基于原始语音信号对应的预测误差信息,确定第二滤波器,第二滤波器为线性预测分析对应的滤波器;

第二确定单元,具体还用于基于原始语音信号以及第二滤波器确定原始语音信号对应的原始激励,以及基于第二滤波器确定第一滤波器。

在另一个可能的实现方式中,调整模块,具体用于当第一滤波器对应的极点角度信息满足预设条件时,按照预设方式调整第一滤波器对应的极点角度信息以及极点幅度信息中的至少一项。

在另一个可能的实现方式中,第一滤波器对应的极点角度信息包括:至少一个极点对应的极点角度值;调整模块包括:增加单元以及减少单元中的至少一项,其中,

增加单元,用于将至少一个极点对应的极点角度值增加第一预设阈值;

减少单元,用于将至少一个极点对应的极点角度值减少第二预设阈值。

在另一个可能的实现方式中,第一滤波器对应的极点幅度信息包括:至少一个极点对应的极点幅度值;

调整模块,具体用于将至少一个极点对应的极点幅度值按照预设倍数进行调整。

在另一个可能的实现方式中,语音信号处理装置还包括:第二获取模块和去噪处理模块,其中,

第二获取模块,用于获取用户输入的语音信号;

去噪处理模块用于对用户输入的语音信号进行去噪处理,并将去噪处理后的语音信号作为原始语音信号。

第三方面,提供了一种电子设备,该电子设备包括:

一个或多个处理器;

存储器;

一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行第一方面或者第一方面任一可能的实现方式所示的语音信号处理方法对应的操作。

第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面或者第一方面任一可能的实现方式所示的语音信号处理方法。

本申请实施例提供的技术方案带来的有益效果是:

本申请提供了一种语音信号处理方法、装置、电子设备及存储介质,与现有技术相比,本申请通过对原始语音信号进行线性预测分析,确定原始语音信号对应的原始激励和第一滤波器,并通过调整第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息中的至少一项,得到调整后的第一滤波器,然后利用原始语音信号对应的原始激励以及调整后的第一滤波器确定目标语音信号,即可以实现对原始语音信号对应的共振峰频率以及共振峰锐度中的至少一项进行调整,得到目标语音信号,从而可以实现对用户输入的语音进行变声,进而可以提升用户体验。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。

图1为本申请实施例提供的一种语音信号处理方法的流程示意图;

图2为本申请实施例提供的变声显示界面示意图;

图3为本申请实施例提供的原始语音信号变声成感冒声音的流程示意图;

图4为本申请实施例提供的原始语音信号对应的语谱图示意图;

图5为本申请实施例提供的变声为感冒声音后的语谱图示意图;

图6为本申请实施例提供的一种语音信号处理装置的结构示意图;

图7为本申请实施例提供的一种语音信号处理的电子设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

首先对本申请涉及的几个名词进行介绍和解释:

qr分解法:将矩阵分解成一个正规正交矩阵q与上三角形矩阵r。具体地,qr分解法为求一般矩阵全部特征值的最有效并广泛应用的方法,一般矩阵先经过正交相似变化成为海森堡(hessenberg)矩阵,然后再应用qr方法求特征值和特征向量;

首一多项式:首项系数为1的多项式。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。

本申请实施例提供了一种语音信号处理方法,如图1所示,该方法包括:

步骤s101,获取原始语音信号。

对于本申请实施例,获取预设时间段内原始语音信号。例如,预设时间段25毫秒、20毫秒或者15毫秒。

步骤s102,对原始语音信号进行线性预测分析,确定原始语音信号对应的原始激励以及第一滤波器。

对于本申请实施例,线性预测分析(linearpredictionanalysis,lpa),是进行语音信号分析的一种技术手段,通过将信号看成一个模型的输出,并用模型参数描述信号。在本申请实施例中,对原始语音信号进行线性预测分析主要借助线性预测误差滤波器来实现。

具体地,步骤s102具体可以包括:利用原始语音信号和线性预测误差滤波器确定原始语音信号对应的原始激励以及第一滤波器。

步骤s103,调整第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息中的至少一项,得到调整后的第一滤波器。

对于本申请实施例,声音在经过共振腔时,受到腔体的滤波作用,使得频域中不同频率的能量被重新分配,一部分因为共振腔的共振作用得到强化,另一部分则受到衰减。由于能量分布不均匀,强的部分犹如过山峰一般,故而称之为共振峰。其中,共振峰与话音音色密切相关。在本申请实施例,通过对第一滤波器对应的极点角度信息以及极点幅度信息中的至少一项进行调整,从而调整第一滤波器对应的极点位置,进而调整第一滤波器,以使得原始语音信号对应的原始激励在通过调整后的第一滤波器后可以修改原始语音对应的共振峰,以实现变声效果。

具体调整第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息中的至少一项的方式详见下述实施例,在此不再赘述。

步骤s104,基于原始语音信号对应的原始激励以及调整后的第一滤波器,确定目标语音信号。

对于本申请实施例,原始语音信号对应的原始激励经过调整后的第一滤波器进行滤波处理后,得到目标语音信号。

本申请实施例提供了一种语音信号处理方法,与现有技术相比,本申请实施例通过对原始语音信号进行线性预测分析,确定原始语音信号对应的原始激励和第一滤波器,并通过调整第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息中的至少一项,得到调整后的第一滤波器,然后利用原始语音信号对应的原始激励以及调整后的第一滤波器确定目标语音信号,即可以实现对原始语音信号对应的共振峰频率以及共振峰锐度中的至少一项进行调整,得到目标语音信号,从而可以实现对用户输入的语音进行变声,进而可以提升用户体验。

本申请实施例的一种可能实现方式,步骤s102具体可以包括:对原始语音信号进行线性预测分析,确定原始语音信号对应的预测误差信息;基于原始语音信号对应的预测误差信息,确定原始语音信号对应的原始激励以及第一滤波器。

对于本申请实施例,利用线性预测误差滤波器对原始语音信号进行线性预测分析,确定原始语音信号对应的预测误差信息。

对于本申请实施例,线性预测误差滤波器的传递函数可以通过下述公式(1-1)来表示:

其中,a(z)表征线性预测误差滤波器的传递函数,z为一个复数,p表征线性预测误差滤波器的阶数,αi表征线性预测误差滤波器的第i个系数,i表征参数的序列号,“∑”为求和符号。

对于本申请实施例,将原始语音信号输入至线性预测误差滤波器,得到原始语音信号对应的预测误差信息。即将原始语音信号s(n)输入至公式(1-1)中,得到预测误差信息。

其中,预测误差信息可以通过下述公式(1-2)来表示:

其中,e(n)表征预测误差信息,n表征以采样周期为单位的时间参数,s(n)表征第n个采样周期的原始语音信号,p表征线性预测误差滤波器的阶数,αi表征线性预测误差滤波器的第i个系数,n-i表征第n个采样周期之前的第i个采样周期,s(n-i)表征第n个采样周期之前的第i个采样周期的原始语音信号,令为s(n)的预测值,其中,“^”为预测值符号,“∑”为求和符号。

对于本申请实施例,基于原始语音信号对应的预测误差信息,确定原始语音信号对应的原始激励以及第一滤波器的具体实现方式如下所示:

本申请实施例的另一种可能实现方式,基于原始语音信号对应的预测误差信息,确定原始语音信号对应的原始激励以及第一滤波器具体可以包括:基于原始语音信号对应的预测误差信息,确定第二滤波器;基于原始语音信号以及第二滤波器确定原始语音信号对应的原始激励,以及基于第二滤波器确定第一滤波器。

其中,第二滤波器为线性预测分析对应的滤波器。

对于本申请实施例,预测误差信息可以通过公式(1-2)来表示,对公式(1-2)进行处理,以计算得到线性预测误差滤波器的系数{αi}i=1,2,…p,然后基于线性预测误差滤波器的系数{αi}i=1,2,…p,确定第二滤波器,然后基于原始语音信号以及第二滤波器确定原始语音信号对应的原始激励,以及基于第二滤波器确定第一滤波器。

具体如何对公式(1-2)进行处理以计算得到线性预测误差滤波器的系数{αi}i=1,2,…p,如下所示:

对于本申请实施例,基于上述公式(1-2),通过使预测误差信息e(n)在某个准则下最小,计算得到线性预测误差滤波器的系数。在本申请实施例中,使预测误差信息e(n)在某个准则下最小,可以采用使预测误差信息的均方误差值e[e2(n)]最小,预测误差信息的均方误差值e[e2(n)]可以通过下述公式(1-3)来表示:

其中,e[e2(n)]表征预测误差信息的均方误差值,也叫预测误差信息的数学期望值,“e”为数学期望符号,e(n)表征预测误差信息,n表征以采样周期为单位的时间参数,e2(n)表征预测误差信息的平方,s(n)表征第n个采样周期的原始语音信号,p表征线性预测误差滤波器的阶数,αi表征线性预测误差滤波器的第i个系数,n-i表征第n个采样周期之前的第i个采样周期,s(n-i)表征第n个采样周期之前的第i个采样周期的原始语音信号,“∑”为求和符号。

对于本申请实施例,一方面对公式(1-3)进行求导运算并使求导结果为0,即:

得到下述公式(1-4):

其中,为求导运算符号,e[e2(n)]表征预测误差信息的均方误差值,也叫预测误差信息的数学期望值,“e”为数学期望符号,e(n)表征预测误差信息,n表征以采样周期为单位的时间参数,e2(n)表征预测误差信息的平方,αj表征线性预测误差滤波器的第j个系数,p表征线性预测误差滤波器的阶数,s(n-j)表征第n个采样周期之前的第j个采样周期的原始语音信号,“∑”为求和符号。

将公式(1-2)代入公式(1-4)中,得到下述公式(1-5):

其中,“e”为数学期望符号,s(n)表征第n个采样周期的原始语音信号,n表征以采样周期为单位的时间参数,s(n-j)表征第n个采样周期之前的第j个采样周期的原始语音信号,n-j表征第n个采样周期之前的第j个采样周期,p表征线性预测误差滤波器的阶数,αi表征线性预测误差滤波器的第i个系数,s(n-i)表征第n个采样周期之前的第i个采样周期的原始语音信号,n-i表征第n个采样周期之前的第i个采样周期,r(j)=e[s(n)s(n-j)],r(j)表征s(n)的自相关函数的第j个值,r(j-i)表征s(n)的自相关函数的第j-i个值,“∑”为求和符号。

其中,公式(1-5)是一个多元一次方程,被称为尤尔-沃克方程(yule-walkerequation)。

对于本申请实施例,另一方面使预测误差信息的均方误差值最小,即计算e[e2(n)]的最小值。在本申请实施例中,预测误差信息的均方误差值的最小值可以通过下述公式(1-6)来表示:

其中,ep表征预测误差信息的均方误差值的最小值,e[e2(n)]表征预测误差信息的均方误差值,也叫预测误差信息的数学期望值,“e”为数学期望符号,e(n)表征预测误差信息,e2(n)表征预测误差信息的平方,n表征以采样周期为单位的时间参数,s(n)表征第n个采样周期的原始语音信号,p表征线性预测误差滤波器的阶数,αi表征线性预测误差滤波器的第i个系数,s(n-i)表征第n个采样周期之前的第i个采样周期的原始语音信号,n-i表征第n个采样周期之前的第i个采样周期,r(0)表征s(n)的自相关函数的第0个值,r(i)表征s(n)的自相关函数的第i个值,“∑”为求和符号。

对于本申请实施例,一方面对公式(1-3)进行求导运算并使求导结果为0,得到公式(1-4),并将公式(1-2)代入公式(1-4)得到公式(1-5);另一方面使公式(1-3)中e[e2(n)]最小,得到公式(1-6)。在本申请实施例中,基于公式(1-5)和公式(1-6)得到线性预测分析对应的求解表达式,其中,线性预测分析对应的求解表达式可以通过下述公式(1-7)来表示:

其中,r(j)表征s(n)的自相关函数的第j个值,p表征线性预测误差滤波器的阶数,αi表征线性预测误差滤波器的第i个系数,r(j-i)表征s(n)的自相关函数的第j-i个值,r(0)表征s(n)的自相关函数的第0个值,r(i)表征s(n)的自相关函数的第i个值,ep表征预测误差信息的均方误差值的最小值,“∑”为求和符号。

对于本申请实施例,对公式(1-7)进行计算处理,可以得到线性预测误差滤波器的系数{αi}i=1,2,…p。在本申请实施例中,对公式(1-7)进行计算处理的关键是对公式(1-7)中的r(j)进行求解,而对公式(1-7)中的r(j)进行求解涉及到集平均。在本申请实施例中,针对的信号是语音信号,通常情况下,语音信号被认为是短时平稳的信号,即在短时间内,认为语音信号对应的随机信号是各态遍历的平稳随机信号,因此,集平均等于时间平均。在本申请实施例中,对r(j)进行求解时可以利用对其进行估值。

对于本申请实施例,利用对r(j)进行估值时涉及到集平均,由于本申请实施例针对的是语音信号,而语音信号被认为是短时间内各态历经的随机信号,因此,可以利用对r(j)进行估值,由于不影响对r(j)的求解,因此,去掉又由于n取值为无穷大,因此,预设一个较大的值n来对r(j)进行估值,具体如下:

假定原始语音信号s(n)在0≤n≤n范围以外都是0,则r(j)的估计值可以通过下述公式(1-8)来表示:

其中,r(j)表征s(n)的自相关函数的第j个值,p表征线性预测误差滤波器的阶数,n表征以采样周期为单位的时间参数,n为预设的一个值,s(n)表征第n个采样周期的原始语音信号,s(n-j)表征第n个采样周期之前的第j个采样周期的原始语音信号,“∑”为求和符号。

对于本申请实施例,公式(1-8)保留了偶函数特性r(j)=r(-j),利用该偶函数特性重写公式(1-7),可以得到下述公式(1-9):

其中,r(0)表征s(n)的自相关函数的第0个值,r(1)表征s(n)的自相关函数的第1个值,r(2)表征s(n)的自相关函数的第2个值,r(p-2)表征s(n)的自相关函数的第p-2个值,r(p-1)表征s(n)的自相关函数的第p-1个值,r(p)表征s(n)的自相关函数的第p个值,α1表征线性预测误差滤波器的第1个系数,α2表征线性预测误差滤波器的第2个系数,αp1表征线性预测误差滤波器的第p1个系数,ep表征预测误差信息的均方误差值的最小值。

对于本申请实施例,公式(1-9)为托布利兹矩阵,可以采用莱文森德宾(levinson-durbin)算法对公式(1-9)进行求解后可以得到线性预测误差滤波器的系数{αi}i=1,2,…p。

对于本申请实施例中,将得到的线性预测误差滤波器的系数{αi}i=1,2,...p代入公式(1-1),确定第二滤波器,第二滤波器可以通过公式(1-1)来表示。

对于本申请实施例,原始语音信号为s(n),将s(n)输入至确定的第二滤波器进行白化处理,得到原始语音信号对应的原始激励,原始激励可以通过公式(1-2)来表示。

对于本申请实施例,第二滤波器对应的表征公式的倒数即为第一滤波器对应的表征公式。在本申请实施例中,第一滤波器可以通过下述公式(1-10)来表示:

其中,h(z)表征第一滤波器,z为一个复数,p表征线性预测误差滤波器的阶数,αi表征线性预测误差滤波器的第i个系数,i表征参数的序列号,“∑”为求和符号。

本申请实施例的另一种可能的实现方式,在步骤s103之前还可以包括:确定第一滤波器对应的极点,并基于第一滤波器对应的极点确定第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息。

具体地,第一滤波器可以通过公式(1-10)来表示,对公式(1-10)进行相关计算,可以得到第一滤波器对应的极点,任一极点均包括极点角度信息和极点幅度信息。在本申请实施例中,求解公式(1-10)的分母为0的所有根。在本申请实施例中,采用qr分解法求解公式(1-10)的分母为0的所有根,以得到第一滤波器对应的全部极点,进而得到第一滤波器的全部极点分别对应的极点角度值以及极点幅度值。

具体通过公式(1-10)得到第一滤波器对应的全部极点,进而得到第一滤波器的全部极点分别对应的极点角度值以及极点幅度值如下所示:

对于本申请实施例,利用qr分解法求解公式(1-10)的分母为0的所有根的方式具体可以包括:

首先,将公式(1-10)的分母化为n的首一多项式方程,并使该首一多项式方程等于0。首一多项式方程等于0可以通过下述公式(1-11)来表示:

qn(x)=xn+bn-1xn-1+…+b1x+b0=0(1-11)

其中,qn(x)表征关于x的n次多项式,n表征自变量x的次数,x表征自变量,b0,b1,…,bn-1表征方程qn(x)的系数。

对于本申请实施例,公式(1-11)可以看作某实数矩阵的特征方程,求解公式(1-11)的全部根可以转化为求解该实数矩阵的全部特征值。在本申请实施例中,对公式(1-11)进行重写,可以得到下述公式(1-12)所示的实数矩阵:

其中,b表征实数矩阵,b0,b1,…,bn-1均为实数矩阵b的元素。

对于本申请实施例,公式(1-12)为上h矩阵,可以用qr分解法直接求出实数矩阵b的全部特征值,这里不再详述。在本申请实施例中,得到实数矩阵b的全部特征值即得到第一滤波器对应的全部极点,任一极点均包括极点角度值和极点幅度值。

例如,极点1可以通过下述公式(1-13)来表示:

其中,z1表征极点1,r1表征极点1对应的极点幅度信息,ω1表征极点1对应的极点角度信息。

本申请实施例的另一种可能实现方式,s103具体可以包括:若第一滤波器对应的极点角度信息满足预设条件,则按照预设方式调整第一滤波器对应的极点角度信息以及极点幅度信息中的至少一项。

对于本申请实施例,第一滤波器对应的极点角度信息具体可以包括:至少一个极点对应的极点角度值;第一滤波器对应的极点幅度信息具体可以包括:至少一个极点对应的极点幅度值。

进一步地,第一滤波器对应的极点角度信息满足预设条件可以包括:第一滤波器对应的至少一个极点对应极点角度值中各个极点角度值是否满足预设条件。在本申请实施例中,将满足预设条件的所有极点,按照预设方式调整各自对应的极点角度值以及极点幅度值中的至少一项。

对于本申请实施例,当任一极点对应的极点角度值属于[-a,a]时,可以按照预设方式调整第一滤波器对应的极点角度信息以及极点幅度信息中的至少一项。

对于本申请实施例,当对任一极点对应的极点角度值属于[-a,a]时,可以仅调整该极点对应的极点角度值,而不调整该极点对应的极点幅度值。

以第一极点为例来介绍,即可以仅调整ω1,而r1不变。

本申请实施例的一种可能的实现方式,按照预设方式调整第一滤波器对应的极点角度信息,包括:将至少一个极点对应的极点角度值增加第一预设阈值,以及将至少一个极点对应的极点角度值减少第二预设阈值中的至少一项。

对于本申请实施例,第一预设阈值与第二预设阈值可以相同,也可以不同。在本申请实施例中不做限定。

对于本申请实施例,当第一滤波器对应的极点包括至少两个时,将至少两个极点中极点角度值属于(0,a]的极点角度值增加第一预设阈值,将极点角度中属于[-a,0)极点角度值减少第二预设阈值。

对于本申请实施例,当第一滤波器对应的极点包括一个时,若该极点的极点角度值属于(0,a],则将该极点的极点角度值增加第一预设阈值,若该极点的极点角度值属于[-a,0),则该极点的极点角度值减少第二预设阈值。

以第一极点为例来介绍,当ω1属于(0,3]时,ω1增加x,当ω1属于[-3,0)时,ω1减少x,其中,r1可以均不变。

其中,x∈[0.07,0.11]。

对于本申请实施例,当任一极点对应的极点角度值属于[-a,a]时,可以同时调整该极点对应的极点角度值以及极点幅度值。

其中,针对极点对应的极点角度值的调整方式如上所述,在此不再赘述。

本申请实施例的另一种可能的实现方式,按照预设方法调整所述第一滤波器对应的极点幅度信息,包括:将所述至少一个极点对应的极点幅度值按照预设倍数进行调整。

对于本申请实施例,将极点角度值属于[-a,a]的所有极点对应的极点角度值调整至各自对应的y倍。

以第一极点为例来介绍,当ω1∈[-3,3]时,将r1可以调整至其对应的y倍。

其中,y∈[0.8,1.2]。

对于本申请实施例,当任一极点对应的极点角度值属于[-a,a]时,仅可以仅调整该任一极点对应的极点幅度值,而不调整极点角度值。在本申请实施例中,针对极点幅度值的调整如上所示,在此不再赘述。

对于本申请实施例,通过对第一滤波器对应的极点角度信息以及极点幅度信息中的至少一项进行调整,即对原始语音信号对应的共振峰频率和原始语音信号对应的共振峰锐度中的至少一项进行调整。

例如,目标语音信号为感冒声音对应的信号,则原始语音信号对应的语谱图如图4所示,变声为感冒声音后的语谱图如图5所示,图4与图5中横轴均表示时间,纵轴均表示频率,语谱图中一个点的亮度表明该点对应的频率成分的幅度,一个点越亮表明该点对应的频率成分的幅度越大,一个点越暗表明该点对应的频率成分的幅度越小,当某一点对应的频率成分的幅度大于周围各点对应的频率成分的幅度时,该点为一个共振峰。在本申请实施例中,如图4所示区域1中共振峰集中在频率0至1000之间,如图5所示区域2中共振峰集中在频率1000至3000之间,因此,由图4与图5对比表明进行调整后的语音信号对应的共振峰频率上移(提高);图4与图5中亮度的差别表征共振峰的锐度,如图4所示,共振峰亮度差别较大表明共振峰较锐(共振峰锐度较大),如图5所示,共振峰亮度差别较小表明共振峰较缓(共振峰锐度较小),因此,由图4与图5对比表明进行调整后的语音信号对应的共振峰锐度降低。

对于本申请实施例,通过对第一滤波器对应的极点角度信息以及极点幅度信息中的至少一项进行调整,即对原始语音信号对应的共振峰频率和原始语音信号对应的共振峰锐度中的至少一项进行调整,以使得通过上述调整后得到的目标语音和原始语音不同,实现了变声效果,进一步可以提升用户体验。

本申请实施例的另一种可能实现方式,s101之前还可以包括:获取用户输入的语音信号;对用户输入的语音信号进行去噪处理,并将去噪处理后的语音信号作为原始语音信号。

对于本申请实施例,用户输入的语音信号可以包括用户实时输入的语音信号,也可以包括本地存储的语音信号。在本申请实施例中不做限定。

对于本申请实施例,在实际应用的过程中可以将获取到的用户输入的语音信号进行去噪处理,将去噪处理后的语音信号作为原始语音信号,也可以不对用户输入的语音信号进行去噪处理,即将用户输入的语音信号作为原始语音信号。在本申请实施例中不做限定。

对于本申请实施例,可以通过多种可行的去噪方式对用户输入的语音信号进行去噪处理。例如,将用户输入的语音信号输入训练好的噪声分离神经网络模型中进行去噪处理。

对于本申请实施例,上述实施例可以由终端设备执行,也可以由服务器执行,也可以部分由终端设备执行,部分由服务器执行。在本申请实施例中不做限定。

上述实施例详细介绍了对原始语音信号进行语音信号处理,得到目标语音信号(变声后的语音信号),下述结合具体的应用场景(即将原始语音信号变声为感冒声音信号),介绍本申请的具体实现方式,具体如下所示:

若将用户输入的语音变声为感冒声音,获取原始语音信号(该原始语音信号可以为将用户输入的语音进行去噪处理后得到的语音信号,还可以为用户输入的语音对应的语音信号),然后将原始语音信号通过变声处理,得到变声处理后的语音信号,并将变声处理后的语音信号进行编码后通过互联网发送至对端,对端在对接收到的信息进行解码后播放,即播放的语音即为感冒声音,具体如图3所示。

对于本申请实施例,用户可以触发操作界面中显示目标对象(“歪果人”、“感冒”、“困兽”以及“网红女”)中的任意一个,如图2所示,若目标语音信号为感冒声音对应的语音信号,则用户可以触发如图2所示的操作界面中的“感冒”对象。

对于本申请实施例,将原始语音信号通过变声处理包括:即通过原始语音信号确定其对应的原始激励,以及第一滤波器,并将第一滤波器对应的极点中极点角度值∈(0,3]的所有极点的极点角度值增加x(x∈[0.07,0.11]),将第一滤波器对应的极点中极点角度值∈(-3,0]的所有极点中的极点角度值降低x(x∈[0.07,0.11]);和/或,将第一滤波器对应的极点中极点角度值∈[-3,3]的所有极点的极点幅度值调整为其对应的0.8~1.2倍,得到调整后的第一滤波器,然后原始激励通过调整后的第一滤波器进行变声处理。

上述从方法步骤的角度具体阐述了语音信号处理方法,下面从虚拟模块或者虚拟单元的角度介绍语音信号处理装置,具体如下所示:

本申请实施例提供了一种语音信号处理装置,如图6所示,该语音信号处理装置60包括:第一获取模块601、第一确定模块602、调整模块603以及第二确定模块604,其中,

第一获取模块601,用于获取原始语音信号。

第一确定模块602,用于对原始语音信号进行线性预测分析,确定原始语音信号对应的原始激励以及第一滤波器。

调整模块603,用于调整第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息中的至少一项,得到调整后的第一滤波器。

第二确定模块604,用于基于原始语音信号对应的原始激励以及调整后的第一滤波器,确定目标语音信号。

本申请实施例的一种可能实现方式,第一确定模块602具体可以包括第一确定单元和第二确定单元,其中,

第一确定单元,用于对原始语音信号进行线性预测分析,确定原始语音信号对应的预测误差信息。

第二确定单元,用于基于原始语音信号对应的预测误差信息,确定原始语音信号对应的原始激励以及第一滤波器。

本申请实施例的另一种可能实现方式,第二确定单元,具体用于基于原始语音信号对应的预测误差信息,确定第二滤波器,第二滤波器为线性预测分析对应的滤波器。

第二确定单元,具体还用于基于原始语音信号以及第二滤波器确定原始语音信号对应的原始激励,以及基于第二滤波器确定第一滤波器。

本申请实施例的另一种可能实现方式,调整模块603,具体用于当第一滤波器对应的极点角度信息满足预设条件时,按照预设方式调整第一滤波器对应的极点角度信息以及极点幅度信息中的至少一项。

本申请实施例的另一种可能实现方式,第一滤波器对应的极点角度信息包括:至少一个极点对应的极点角度值;调整模块603包括增加单元以及减少单元中的至少一项,其中,

增加单元,用于将至少一个极点对应的极点角度值增加第一预设阈值。

减少单元,用于将至少一个极点对应的极点角度值减少第二预设阈值。

本申请实施例的另一种可能实现方式,第一滤波器对应的极点幅度信息包括:至少一个极点对应的极点幅度值。

调整模块603,具体用于将至少一个极点对应的极点幅度值按照预设倍数进行调整。

本申请实施例的另一种可能实现方式,语音信号处理装置60还包括:第二获取模块和去噪处理模块:

第二获取模块,用于获取用户输入的语音信号。

去噪处理模块,用于对用户输入的语音信号进行去噪处理,并将去噪处理后的语音信号作为所述原始语音信号。

对于本申请实施例,第一获取模块和第二获取模块可以为同一个获取模块,也可以为两个不同的获取模块。在本申请实施例中不做限定。

本申请实施例提供的语音信号处理装置可执行上述方法实施例所示的语音信号处理方法对应的操作,其实现原理相类似,此处不再赘述。

本申请提供了一种语音信号处理装置,与现有技术相比,本申请通过对原始语音信号进行线性预测分析,确定原始语音信号对应的原始激励和第一滤波器,并通过调整第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息中的至少一项,得到调整后的第一滤波器,然后利用原始语音信号对应的原始激励以及调整后的第一滤波器确定目标语音信号,即可以实现对原始语音信号对应的共振峰频率以及共振峰锐度中的至少一项进行调整,得到目标语音信号,从而可以实现对用户输入的语音进行变声,进而可以提升用户体验。

上述从虚拟模块或者虚拟单元的角度介绍本申请的语音信号处理装置,下面从实体装置的角度介绍一种电子设备,本申请实施例中的电子设备可以为终端设备,也可以为服务器,在本申请实施例中不做限定。

本申请实施例提供了一种电子设备,如图7所示,图7所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本申请实施例的限定。

处理器4001可以是cpu,通用处理器,dsp,asic,fpga或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。

总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是pci总线或eisa总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

存储器4003可以是rom或可存储静态信息和指令的其他类型的静态存储设备,ram或者可存储信息和指令的其他类型的动态存储设备,也可以是eeprom、cd-rom或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。

存储器4003用于存储执行本申请方案的应用程序代码,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的应用程序代码,以实现前述任一方法实施例所示的内容。

本申请实施例提供了一种电子设备,本申请实施例中的电子设备包括:一个或多个处理器;存储器;一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行前述方法实施例或者其任一种可能实现方式所示的语音信号处理方法对应的操作,与现有技术相比可实现:本申请通过对原始语音信号进行线性预测分析,确定原始语音信号对应的原始激励和第一滤波器,并通过调整第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息中的至少一项,得到调整后的第一滤波器,然后利用原始语音信号对应的原始激励以及调整后的第一滤波器确定目标语音信号,即可以实现对原始语音信号对应的共振峰频率以及共振峰锐度中的至少一项进行调整,得到目标语音信号,从而可以实现对用户输入的语音进行变声,进而可以提升用户体验。

上述从实体装置的角度介绍一种语音信号处理电子设备,下面从存储介质的角度介绍一种计算机可读存储介质。

本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时,实现前述方法实施例或者任一可能的实现方式所示的语音信号处理方法。与现有技术相比,通过对原始语音信号进行线性预测分析,确定原始语音信号对应的原始激励和第一滤波器,并通过调整第一滤波器对应的极点角度信息以及第一滤波器对应的极点幅度信息中的至少一项,得到调整后的第一滤波器,然后利用原始语音信号对应的原始激励以及调整后的第一滤波器确定目标语音信号,即可以实现对原始语音信号对应的共振峰频率以及共振峰锐度中的至少一项进行调整,得到目标语音信号,从而可以实现对用户输入的语音进行变声,进而可以提升用户体验。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1