语音增强方法、装置、计算机设备及存储介质与流程

文档序号:15697371发布日期:2018-10-19 19:16阅读:204来源:国知局
语音增强方法、装置、计算机设备及存储介质与流程

本发明涉及语音信号处理技术领域,尤其涉及一种语音增强方法、装置、计算机设备及存储介质。



背景技术:

随着语音识别技术的广泛使用,语音信号处理技术的需求也随之扩大。目前,在语音识别或声纹识别过程中,由前端设备采集到的语音信号一般都带有噪声,包括背景环境中的噪声以及前端设备录音过程中产生的噪声。这些携带噪声的语音信号在进行语音识别时,会影响语音识别的准确性,因此,需要对语音信号进行语音增强处理(即对语音信号进行降噪处理),以从该语音信号中尽可能提取到更纯净的语音信号,以使语音识别更加准确。当前对语音信号进行语音增强处理后提取的语音信号精度不高,不利于后续进行语音识别。



技术实现要素:

基于此,有必要针对上述技术问题,本发明实施例提供一种语音增强方法、装置、计算机设备及存储介质。

一种语音增强方法,包括:

对原始语音信息进行转换,获取数字语音信号;

采用eemd算法对所述数字语音信号进行分解,获取第一信号分量;

采用相关性计算公式对所述数字语音信号和所述第一信号分量进行相关性计算,获取第一相关性系数;

选取所述第一相关性系数大于预设阈值的第一信号分量,作为所述第二信号分量;

对所述第二信号分量进行集成处理,获取目标语音信息。

一种语音增强装置,包括:

数字语音信号获取模块,用于对原始语音信息进行转换,获取数字语音信号;

第一信号分量获取模块,用于采用eemd算法对所述数字语音信号进行分解,获取第一信号分量;

第一相关性系数获取模块,用于采用相关性计算公式对所述数字语音信号和所述第一信号分量进行相关性计算,获取第一相关性系数;

第二信号分量获取模块,用于选取所述第一相关性系数大于预设阈值的第一信号分量,作为所述第二信号分量;

目标语音信息获取模块,用于对所述第二信号分量进行集成处理,获取目标语音信息。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语音增强方法的步骤。

一种非易失性存储介质,所述非易失性存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述语音增强方法的步骤。

上述语音增强方法、装置、计算机设备及存储介质,先对原始语音信息进行转换,获取数字语音信号,以便采用eemd算法对数字语音信号进行分解,获取第一信号分量。然后,采用相关性计算公式对数字语音信号和第一信号分量进行相关性计算,获取第一相关性系数,以便通过对相关系数进行判断,获取与数字语音信号相关性较大的第一信号分量。可以理解地,通过选取第一相关性系数大于预设阈值的第一信号分量,作为第二信号分量以减少噪声干扰,达到语音增强的目的。最后,对第二信号分量进行集成处理,获取目标语音信息。该语音增强方法的实现过程简单,并能够有效对语音信号进行降噪,获取纯净的语音信号,使得采用纯净的语音信号进行声纹识别的识别准确率更高。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例中语音增强方法的一应用环境图

图2是本发明一实施例中语音增强方法的一流程图;

图3是图2中步骤s20的一具体流程图;

图4是图3中步骤s22的一具体流程图;

图5是本发明一实施例中语音增强方法的另一流程图;

图6是本发明一实施例中语音增强装置的一示意图;

图7是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请提供的语音增强方法,可应用在如图1的应用环境中,其中,计算机设备通过网络与服务器进行通信。计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器来实现。

该语音增强方法可应用在银行、证券、保险等金融机构或者其他机构配置的计算机设备上,用于进行声纹识别之前对语音数据进行语音增强,以提高识别准确率。

在一个实施例中,如图2所示,以该语音增强方法应用于图1中的服务器为例进行说明,包括如下步骤:

s10:对原始语音信息进行转换,获取数字语音信号。

其中,原始语音信息是前端设备的录音模块(如麦克风)采集到的说话人的语音信息。该原始语音信息可以是wav、mp3或其他格式的语音信息。数字语音信号是指将原始语音信息进行转换所获取的离散数字信号。由于计算机设备是不能直接处理原始语音信息的,它只能处理二进制数据,因此需要将原始语音信息转换为数字语音信号。

具体地,服务器接收前端设备发送的原始语音信息,并采用python模块中的读取音频文件的命令函数对该原始语音信息读取,获取数字语音信号。例如,该读取音频文件的命令函数可以为wave.open(file(原始语音信息),rb(读取文件操作)),通过该读取音频文件的命令函数对原始语音信息进行读取,获取到的音频文件的一维数组即为数字语音信号。python模块是一种由面向对象的解释型计算机程序设计语言编写的包含大量的封装函数的模块。本实施例中,采用python模块中的读取音频文件的命令函数直接读取原始语音信息,即可获取数字语音信号,实现简单。

s20:采用eemd算法对数字语音信号进行分解,获取第一信号分量。

其中,第一信号分量是指采用eemd算法对数字语音信号进行分解,获取的imf(intrinsicmodefunction,本征模态函数)分量。eemd(ensembleempiricalmodedecomposition,集合经验模态分解)算法是一种噪声辅助数据分析算法,可有效解决模态混叠现象,使得分解结果(第一信号分量)能清晰反映出数字语音信号在不同时间尺度或不同频率的振荡变化。模态混叠是指不能依据时间尺度有效的分离出不同的模态分量,使原本不同的模态出现在一个模态之中的现象。

由于数字语音信号是非平稳的,为了使数字语音信号更加平稳,需采用eemd算法对数字语音信号进行分解,以使通过数字语音信号分解出的第一信号分量更加平稳,可有助于抑制噪声干扰,使得语音信号的精度较高。具体地,服务器采用eemd算法对数字语音信号进行分解会获取n(n为正整数)个第一信号分量,每个第一信号分量表征数字语音信号在不同时间尺度或不同频率的振荡变化。

s30:采用相关性计算公式对数字语音信号和第一信号分量进行相关性计算,获取第一相关性系数。

其中,第一相关性系数是对数字语音信号和第一信号分量进行相关性计算所获取的计算结果。第一相关性系数可以反映数字语音信号和第一信号分量的相关程度,并且也可以反映第一信号分量包含数字语音信号中的有效信息量(语音信息)的程度。

具体地,相关性计算公式为其中,x为数字语音信号,y为第一信号分量,cov(x,y)为x与y的协方差,var[x]为x的方差,var[y]为y的方差,r为第一相关性系数。其中,cov(x,y)的计算公式为:var[x]的计算公式为var[x]=e(x2)-e2(x);var[y]的计算公式为var[y]=e(y2)-e2(y);其中,e(x)表示数字语音信号的期望,e(y)表示第一信号分量的期望,n表示第一信号分量的数量,xj表示时间尺度上的第j个数字语音信号。yj表示同一时间尺度上的第j个第一信号分量。本实施例中,第一相关性系数可以为0到1之间的实数,第一相关性系数越接近1,则数字语音信号和第一信号分量的相关性越大;反之,第一相关性系数越接近0,则数字语音信号和第一信号分量的相关性越小。

s40:选取第一相关性系数大于预设阈值的第一信号分量,作为第二信号分量。

其中,预设阈值是预先定义好的用于筛选第一信号分量的阈值。第二信号分量是利用预设阈值对第一信号分量进行筛选操作后获取的的信号分量。

由于第一相关性系数是0到1之间的实数,因此,该预设阈值也是0到1之间的实数。若第一相关性系数大于预设阈值,则表示第一信号分量与数字语音信号的相关性大,第一信号分量中包含数字语音信号的有效信息量较多。若第一相关性系数不大于预设阈值,则表示第一信号分量与数字语音信号的相关性小,第一信号分量中包含数字语音信号的有效信息量较少,可默认为噪声。本实施例中,通过对第一信号分量进行筛选,以获取与数字语音信号的相关性较大的第一信号分量作为第二信号分量,以减少噪声干扰,进一步提高语音信号的精度。并且,该第二信号分量的筛选方法实现简单,可提高语音增强处理的效率。

s50:对第二信号分量进行集成处理,获取目标语音信息。

其中,目标语音信号是对原始语音信息进行集成处理后得到的较纯净的语音信息。集成处理是将信号分量还原为语音信息的处理。

具体地,服务器采用公式(n为正整数)对第二信号分量进行集成处理,获取目标语音信号,其中,sn表示第n个第二信号分量,n表示第二信号分量的总数量,z表示目标语音信息。即服务器在对第二信号分量进行集成处理时,需先对每一第二信号分量进行平方运算,然后进行求均值运算,即可获取目标语音信息。

本实施例中,先采用python模块中的读取音频文件的命令函数直接读取原始语音信息,即可获取数字语音信号,使得数字语音信号的获取过程实现简单,可提高语音增强的效率。然后,采用eemd算法对数字语音信号进行分解,获取第一信号分量,并采用相关性计算公式对数字语音信号和第一信号分量进行相关性计算,获取第一相关性系数,然后选取第一相关性系数大于预设阈值的第一信号分量,以获取与数字语音信号的相关性较大的第一信号分量作为第二信号分量,以减少噪声干扰,达到语音增强的目的。最后,对第二信号分量进行集成处理,获取精度较高的目标语音信息。该语音增强方法的实现过程简单,可提高语音增强的处理效率,并保证获取到的目标语音信息的精度较高。

在一实施例中,如图3所示,步骤s20中,即采用eemd算法对数字语音信号进行分解,获取第一信号分量,具体包括如下步骤:

s21:向数字语音信号中加入不同的正态分布的白噪声序列,获取待处理语音信号。

其中,待处理语音信号是加入不同的正态分布的白噪声序列的数字语音信号。本实施例中,正态分布的白噪声序列具体是指高斯白噪声序列。高斯白噪声,是指噪声的瞬时值服从高斯分布,而它的功率谱密度又是正态分布的,则称它为高斯白噪声。瞬时值指的是概率密度函数,高斯分布即为正态分布。

本实施例中,通过向每一数字语音信号中加入不同的正态分布的白噪声序列,获取待处理语音信号,以使白噪声均匀分布在整个数字语音信号的时频空间,即当数字语音信号加上正态分布的白噪声序列时,不同时间尺度的信号区域将自动映射到与白噪声相关的适当时间尺度上去,有效解决模态混叠现象,并且利用高斯分布的白噪声零均值的特性,使数字语音信号得到保留,提高语音增强的精度。

s22:对待处理语音信号进行emd分解,获取待处理语音信号对应的中间信号分量。

其中,中间信号分量是对每一待处理语音信号进行emd分解所得到的imf分量。emd(empiricalmodedecomposition,经验模态分解)方法是基于信号的局部时间尺度特征来进行信号分解的方法。具体地,采用emd方法对每一待处理语音信号进行emd分解,获取与每一待处理语音信号对应的中间信号分量,可有效避免分解过程中容易出现的模态混叠现象,使得emd分解的准确率较高,进一步提高语音增强的精度。

s23:对中间信号分量进行取均值运算,获取第一信号分量。

具体地,服务器对每一待处理语音信号对应的中间信号分量进行取均值运算,获取第一信号分量。具体地,服务器采用均值运算公式对中间信号分量进行计算,获取第一信号分量,其中,mj为第j个第一信号分量,m为中间信号分量,n为第一信号分量的数量,t为时间尺度,i为中间信号分量的下标值。

本实施例中,通过向数字语音信号中加入不同的正态分布的白噪声序列,获取待处理语音信号,以使白噪声均匀分布在整个数字语音信号的时频空间,有助于解决模态混叠现象,并利用高斯分布的白噪声零均值的特性,使真实数字语音信号得到了保留,提高了语音增强的精度。然后,对待处理语音信号进行emd分解,获取待处理语音信号对应的中间信号分量,由于通过向数字语音信号中加入不同的正态分布的白噪声序列可解决emd分解的不足(即存在模态混叠现象),因此,可提高emd分解的准确率。最后,对中间信号分量进行取均值运算,获取第一信号分量,该计算过程简单,可提高语音信息的处理效率。

在一实施例中,如图4所示,步骤s22中,即对待处理语音信号进行emd分解,获取待处理语音信号对应的中间信号分量,具体包括如下步骤:

s221:获取待处理语音信号的局部极值点,每个局部极值点包括极大值点和极小值点。

其中,待处理语音信号中包括多个局部极值点,该局部极值点是指待处理语音信号在整个时域上的任意时间范围内的极值点。该局部极值点包括极大值点和极小值点。具体地,对不同时间范围内的待处理语音信号形成的函数进行求导,导数为0时对应的函数的值即为局部极值点。例如,不同时间范围内的待处理语音信号为x(t),t∈t,t为整个时域,x'(t)=0时,t对应x(t)的值即为局部极值点。

s222:基于所有局部极值点中的极大值点构建上包络线,并基于所有局部极值点中的极小值点构建下包络线。

其中,包络线是指把高频调幅信号的峰点连接起来得到一个与低频调制信号相对应的曲线。高频调幅信号是指高频调幅信号的幅度是按低频调制信号的变化而变化的信号。低频调制信号为调制信号,调制信号是由原始信息转换而来的低频信号。上包络线是采用样条函数将所有极大值点进行拟合得到的一条平滑的曲线。下包络线是采用样条函数将所有极小值点进行拟合得到的一条平滑的曲线。样条函数通常是指分段定义的多项式参数曲线,采用样条函数对所有极大值点或所有极小值点进行拟合,具有构造简单、使用方便和拟合准确的优点。具体地,采用matlab中内置的样条函数(spline函数)对所有极大值点进行拟合即可得到上包络线,采用matlab中内置的样条函数(spline函数)对所有极小值点进行拟合即可得到下包络线,通过绘制包络线能够使待处理语音信号在时域上的曲线更加平滑和清晰。matlab是在数学科技应用领域中数值计算方面的应用软件。

s223:基于上包络线和下包络线,获取上包络线和下包络线对应的均值。

具体地,采用公式对上包络线和下包络线进行计算,获取对应的均值,其中,p为均值,s1(t)表示随时间t变化的上包络线,s2(t)表示随时间t变化的下包络线。本实施例中,基于上包络线和下包络线,获取对应的均值,为后续对初始信号分量进行筛选,提供技术支持。

s224:基于待处理语音信号和均值,获取初始信号分量,若初始信号分量符合预设条件,则初始信号分量为中间信号分量。

其中,预设条件是预先设置用于筛选信号分量的条件。该预设条件具体为:一是信号的极值点数目和过零点数目相等或最多相差一个。二是上下包络线的均值为零。具体地,极值点数目包括局部极大值和局部极小值的数目。本实施例中,只有符合上述两个预设条件的初始信号分量,才能作为中间信号分量,该过程能够有效将夹杂噪声的语音信号进行分解,以得到较纯净的语音信号,实现语音增强的目的。

具体地,采用公式h0(t)=s(t)-m0(t)对待处理语音信号和均值进行处理,获取初始信号分量,其中,h0(t)为初始信号分量,s(t)为待处理语音信号,m0(t)为均值,t为时间尺度。若初始信号分量符合预设条件,则将初始信号分量作为第一个中间信号分量,若初始信号分量不符合预设条件,则将初始信号分量作为新的待处理语音信号(即将h0(t)作为s(t))重复进行步骤s221-s223的步骤,直至得到满足预设条件的第一个中间信号分量。然后,设r1(t)=s(t)-c1(t),其中,r1(t)为新的待处理语音信号,c1(t)为第一个中间信号分量,重复执行步骤ss221-s224,得到第二个中间信号分量。经过上述步骤的多次循环处理,直至得到的初始信号分量是一个单调信号或者初始信号分量的值小于第一阈值的初始信号分量,结束循环。其中,第一阈值是预先定义的用于中止上述循环的阈值。最后,经过多次循环可得到n个中间信号分量,则待处理语音信号可表示为其中,ck(t)为第k个中间信号分量,rn(t)为单调信号的初始信号分量或者初始信号分量的值小于给定阈值初始信号分量。

本实施例中,通过获取待处理语音信号的局部极值点,每个局部极值点包括极大值点和极小值点,以便基于所有局部极值点中的极大值点构建上包络线,并基于所有局部极值点中的极小值点构建下包络线,以使待处理语音信号在时域上的曲线更加平滑和清晰。然后,基于上包络线和下包络线,获取上包络线和下包络线对应的均值,并基于待处理语音信号和均值,获取初始信号分量;若初始信号分量符合预设条件,则初始信号分量为中间信号分量,以使信号变得平稳;若初始信号分量不符合预设条件,则将初始信号分量作为新的待处理语音信号,然后基于新的待处理语音信号进行多次循环处理,获取n个中间信号分量。该分解过程能够有效将夹杂噪声的语音信号进行分解,以得到较纯净的语音信号,实现语音增强的目的。

在一实施例中,如图5所示,该语音增强方法还包括如下步骤:

s411:采用eemd算法对第二信号分量进行分解,获取二分解信号分量。

为了更细微的降噪,达到更好的语音增强效果,使得语音识别更加准确,本实施例中,采用eemd算法对第二信号分量进行二次分解,获取二分解信号分量。具体地,采用eemd算法对第二信号分量进行分解的分解过程与步骤s20相同,在此不再赘述。

s412:对数字语音信号和二分解信号分量进行相关性计算,获取第二相关性系数。

其中,第二相关性系数是对数字语音信号和二分解信号分量进行相关性计算所获得的反映二分解信号分量与数字语音信号的相关程度的系数。具体地,

相关性计算公式为其中,a为数字语音信号,b为二分解信号分量,cov(a,b)为a与b的协方差,var[a]为a的方差,var[b]为b的方差,r2为第二相关性系数。其中,协方差的计算公式与方差的计算公式与步骤s30相同,为避免重复,在此不再赘述。本实施例中,为了筛选出与数字语音信号相关性较大的二分解信号分量,更加细致的对数字语音信号进行降噪,因此,需要计算第二相关性系数以便通过第二相关性系数选取二分解信号分量,以提高语音信号的精度。

s413:选取第二相关性系数大于预设阈值的二分解信号分量,作为更新的第二信号分量。

其中,预设阈值是预先定义好的用于筛选二分解信号分量的阈值。该预设阈值与步骤s40的预设阈值相同。

具体地,第二相关性系数是0到1之间的实数。若第一相关性系数大于预设阈值,则表示二分解信号分量与数字语音信号的相关性大,信号分量中包含数字语音信号的有效信息量多。若第二相关性系数小于预设阈值,则表示二分解信号分量与数字语音信号的相关性小,信号分量中包含的有效信息量少,可默认为噪声。本实施例中,通过对二分解信号分量进行筛选,以获取与数字语音信号的相关性较大的二分解信号分量作为更新的第二信号分量,以减少噪声干扰,进一步提高语音信号的精度。并且,该二分解信号分量的筛选方法实现简单,提高语音增强的效率。

本实施例中,先采用eemd算法对第二信号分量进行分解,获取二分解信号分量,以便对数字语音信号和二分解信号分量进行相关性计算,获取第二相关性系数。通过选取第二相关性系数大于预设阈值的二分解信号分量,作为更新的第二信号分量,以便后续对更新的第二信号分量进行集成处理,以获取目标语音信息。该过程能够更加细致的对语音信号进行降噪处理,以获取纯度更高的语音信息,使得声纹识别更加准确。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

在一个实施例中,图6示出与上述实施例中语音增强方法一一对应的语音增强装置的示意图。如图6所示,该语音增强装置包括数字语音信号获取模块10、第一信号分量获取模块20、第一相关性系数获取模块30、第二信号分量获取模块40和目标语音信息获取模块50。各功能模块详细说明如下:

数字语音信号获取模块10,用于对原始语音信息进行转换,获取数字语音信号。

第一信号分量获取模块20,用于采用eemd算法对数字语音信号进行分解,获取第一信号分量。

第一相关性系数获取模块30,用于采用相关性计算公式对数字语音信号和第一信号分量进行相关性计算,获取第一相关性系数。

第二信号分量获取模块40,用于选取第一相关性系数大于预设阈值的第一信号分量,作为第二信号分量。

目标语音信息获取模块50,用于对第二信号分量进行集成处理,获取目标语音信息。

具体地,第一信号分量获取模块20,用于包括待处理语音信号获取单元21、中间信号分量获取单元22和第一信号分量获取单元23。

待处理语音信号获取单元21,用于向数字语音信号中加入不同的正态分布的白噪声序列,获取待处理语音信号。

中间信号分量获取单元22,用于对待处理语音信号进行emd分解,获取待处理语音信号对应的中间信号分量。

第一信号分量获取单元23,用于对中间信号分量进行取均值运算,获取第一信号分量。

具体地,中间信号分量获取单元22包括局部极值点获取子单元221、包络线构建子单元222、均值获取子单元223和中间信号分量获取子单元224。

局部极值点获取子单元221,用于获取待处理语音信号的局部极值点,每个局部极值点包括极大值点和极小值点。

包络线构建子单元222,用于基于所有局部极值点中的极大值点构建上包络线,并基于所有局部极值点中的极小值点构建下包络线。

均值获取子单元223,用于基于上包络线和所述下包络线,获取上包络线和下包络线对应的均值。

中间信号分量获取子单元224,用于基于待处理语音信号和均值,获取初始信号分量,若初始信号分量符合预设条件,则初始信号分量为中间信号分量。

具体地,相关性计算公式为其中,x为数字语音信号,y为第一信号分量,cov(x,y)为x与y的协方差,var[x]为x的方差,var[y]为y的方差,r为所述第一相关性系数。

具体地,该语音增强装置还包括二分解信号分量获取单元411、第二相关性系数获取单元412和第二信号分量更新单元413。

二分解信号分量获取单元411,用于采用eemd算法对第二信号分量进行分解,获取二分解信号分量。

第二相关性系数获取单元412,用于对数字语音信号和二分解信号分量进行相关性计算,获取第二相关性系数。

第二信号分量更新单元413,用于选取第二相关性系数大于预设阈值的二分解信号分量,作为更新的第二信号分量。

具体地,目标语音信息获取模块50为采用公式(n为正整数)对第二信号分量进行集成处理,获取目标语音信号。其中,sn表示第二信号分量,n表示第二信号分量的总数量,z表示目标语音信息。

关于语音增强装置的具体限定可以参见上文中对于语音增强方法的限定,在此不再赘述。上述语音增强装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于用于存储执行语音增强方法过程中生成或获取的数据,如目标语音信号。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音增强方法。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:对原始语音信息进行转换,获取数字语音信号;采用eemd算法对数字语音信号进行分解,获取第一信号分量;采用相关性计算公式对数字语音信号和第一信号分量进行相关性计算,获取第一相关性系数;选取第一相关性系数大于预设阈值的第一信号分量,作为第二信号分量;对第二信号分量进行集成处理,获取目标语音信息。

具体地,相关性计算公式为其中,x为数字语音信号,y为所述第一信号分量,cov(x,y)为x与y的协方差,var[x]为x的方差,var[y]为y的方差,r为所述第一相关性系数。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:向数字语音信号中加入不同的正态分布的白噪声序列,获取待处理语音信号;待处理语音信号进行emd分解,获取待处理语音信号对应的中间信号分量;对中间信号分量进行取均值运算,获取第一信号分量。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取待处理语音信号的局部极值点,每个局部极值点包括极大值点和极小值点;基于所有局部极值点中的极大值点构建上包络线,并基于所有局部极值点中的极小值点构建下包络线;基于上包络线和下包络线,获取上包络线和下包络线对应的均值;基于待处理语音信号和均值,获取初始信号分量,若初始信号分量符合预设条件,则初始信号分量为中间信号分量。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:采用eemd算法对第二信号分量进行分解,获取二分解信号分量;对数字语音信号和二分解信号分量进行相关性计算,获取第二相关性系数;选取第二相关性系数大于预设阈值的二分解信号分量,作为更新的第二信号分量。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:采用公式(n为正整数)对第二信号分量进行集成处理,获取目标语音信号;其中,sn表示第二信号分量,n表示第二信号分量的总数量,z表示目标语音信息。

在一个实施例中,提供了一种非易失性存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:对原始语音信息进行转换,获取数字语音信号;采用eemd算法对数字语音信号进行分解,获取第一信号分量;采用相关性计算公式对数字语音信号和第一信号分量进行相关性计算,获取第一相关性系数;选取第一相关性系数大于预设阈值的第一信号分量,作为第二信号分量;对第二信号分量进行集成处理,获取目标语音信息。

具体地,相关性计算公式为其中,x为数字语音信号,y为第一信号分量,cov(x,y)为x与y的协方差,var[x]为x的方差,var[y]为y的方差,r为所述第一相关性系数。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:向数字语音信号中加入不同的正态分布的白噪声序列,获取待处理语音信号;待处理语音信号进行emd分解,获取待处理语音信号对应的中间信号分量;对中间信号分量进行取均值运算,获取第一信号分量。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取待处理语音信号的局部极值点,每个局部极值点包括极大值点和极小值点;基于所有局部极值点中的极大值点构建上包络线,并基于所有局部极值点中的极小值点构建下包络线;基于上包络线和下包络线,获取上包络线和下包络线对应的均值;基于待处理语音信号和均值,获取初始信号分量,若初始信号分量符合预设条件,则初始信号分量为中间信号分量。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:采用eemd算法对第二信号分量进行分解,获取二分解信号分量;对数字语音信号和二分解信号分量进行相关性计算,获取第二相关性系数;选取第二相关性系数大于预设阈值的二分解信号分量,作为更新的第二信号分量。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:采用公式(n为正整数)对第二信号分量进行集成处理,获取目标语音信号;其中,sn表示第二信号分量,n表示第二信号分量的总数量,z表示目标语音信息。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1