一种语音增强的方法和装置的制作方法

文档序号：7706747阅读：146来源：国知局

专利名称：一种语音增强的方法和装置的制作方法
技术领域：
本发明涉及语音通信技术领域，特别是涉及一种语音增强的方法和装置。
背景技术：
现实的语音通信可能发生在嘈杂的噪声环境中，例如，工厂中的手机通讯会受到机器轰鸣声的影响；火车驾驶室中的语音通信会受到电机运行和铁轨碰撞声的干扰。而语音增强就是从带噪声的语音信号中提取出尽可能纯净的原始语音，进而改善语音质量，提高语音的清晰度和可懂度。在语音通信技术中，语音增强技术得到了极为广泛的应用。语音增强的目的主要有两个一是改进语音质量，消除背景噪声，使听者能够接受，并且没有疲劳感；二是提高语音的可懂度。其中，由于噪声特性各异，语音增强算法的方法也各不相同，目前常用的方法有谱减法、维纳滤波法和最小均方误差估计的方法等。在基于最小均方误差估计技术中，需要通过Decision-Directed Approach方法计算先验信噪比来得到纯净语音信号，但是，发明人在研究中发现，在现有基于最小均方误差估计技术中，对于先验信噪比的计算至少存在如下问题对当前数据帧的先验信噪比计算依赖于当前数据帧的前一帧信息，然而，当前帧的前一帧与当前帧之间是存在差异的，这种差异性会导致先验信噪比同样存在误差，并最终导致通过语音增强技术得到的纯净语音信号与真实的纯净语音信号之间也存在较大的误差。

发明内容
本发明实施例提供了一种语音增强的方法和装置，以降低增强语音信号与真实信号间的误差。本发明实施例公开了一种语音增强方法，包括将带噪语音信号进行变换，得到频域带噪语音信号；采用相关度修正参数设置所述频域带噪语音信号的前一帧谱方差和前一帧谱幅度平方的权值，得到频域纯净语音信号中当前帧的谱方差，其中，所述相关度修正参数指示所述当前帧与所述前一帧之间的相关性；根据所述频域纯净语音信号中当前帧的谱方差和所述频域带噪语音信号的前一帧的谱方差，得到频域纯净语音信号中当前帧的先验信噪比；依据最小均方误差估计法，由所述频域纯净语音信号中当前帧的先验信噪比，得到增强的频域纯净语音信号。本发明实施例还公开了一种语音增强的装置，包括频域变换单元，用于将带噪声的时域语音信号进行频域变换处理，得到带噪声的频域语音信号；谱方差修正单元，用于根据相关度修正参数设置前一帧谱方差和前一帧谱幅度平方的权值，得到纯净语音信号中当前帧的谱方差，其中，所述相关度修正参数指示所述当前帧与所述前一帧之间的相关性；先验信噪比获取单元，用于根据所述纯净语音信号中当前帧的谱方差和噪声信号中前一帧的谱方差，得到纯净语音信号中当前帧的先验信噪比；语音增强单元，用于依据最小均方误差估计法，由所述纯净语音信号中当前帧的先验信噪比，得到纯净的频域语音信号。
由上述实施例可以看出，引入相关度修正参数来描述某一帧与前一帧之间的相关性，采用相关度修正参数设置所述频域带噪语音信号的前一帧谱方差和前一帧谱幅度平方的权值，当某一帧与前一帧之间的无相关性时，则利用前一帧的谱方差计算某一帧的谱方差，当某一帧与前一帧之间具有强相关性时，则利用前一帧的谱幅度计算某一帧的谱方差，当某一帧与前一帧之间的相关性介于无相关性和强相关性之间时，通过调整相关度参数的值可以更精确获得某一帧的谱方差，由此可以降低增强语音信号与真实信号间的误差。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。图1为本发明一种语音增强的方法的一个实施例的流程图；图2为本发明中采用最小均方差估计方法进行语音增强的原理框图；图3为本发明一种语音增强的方法的一个具体实施方式
的流程图；图4为原始带噪声的语音信号仿真图；图5为现有技术中语音增强处理后的纯净语音信号仿真图；图6为本发明中语音增强处理后的纯净语音信号仿真图；图7为本发明一种语音增强的装置的一个实施例的结构图。
具体实施例方式为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明实施例进行详细描述。实施例一请参阅图1，其为本发明一种语音增强的方法的一个实施例的流程图，该方法包括以下步骤步骤101 将带噪语音信号进行变换，得到频域带噪语音信号；步骤102 采用相关度修正参数设置所述频域带噪语音信号的前一帧谱方差和前一帧谱幅度平方的权值，得到频域纯净语音信号中当前帧的谱方差，其中，所述相关度修正参数指示所述当前帧与所述前一帧之间的相关性；其中，所述根据相关度修正参数设置前一帧谱方差和前一帧谱幅度平方的权值，得到纯净语音信号中当前帧的谱方差包括将所述前一帧谱方差和所述前一帧谱幅度平方加权求和，得到前一帧谱方差的修正值，其中，1与相关度修正参数的差值为所述前一帧谱方差的权值，相关度修正参数为所述前一帧谱方差平方的权值；获得所述前一帧谱方差的修正值与纯净语音信号中当前帧之前所有数据帧的谱方差的最小值中的最大值，将所述最大值作为所述纯净语音信号中当前帧的谱方差。步骤103 根据所述频域纯净语音信号中当前帧的谱方差和所述频域带噪语音信号的前一帧的谱方差，得到频域纯净语音信号中当前帧的先验信噪比；
5
其中，所述根据所述纯净语音信号中当前帧的谱方差和噪声信号中前一帧的谱方差，得到纯净语音信号中当前帧的先验信噪比具体包括将所述纯净语音信号中当前帧的谱方差和所述噪声信号中前一帧的谱方差求商，得到所述纯净语音信号中当前帧的先验信噪比。步骤104 依据最小均方误差估计法，由所述频域纯净语音信号中当前帧的先验信噪比，得到增强的频域纯净语音信号。其中，所述依据最小均方误差估计法，由所述纯净语音信号中当前帧的先验信噪比，得到纯净的频域语音信号包括根据所述纯净语音信号中当前帧的先验信噪比和后验信噪比，得到当前帧的频谱增益；根据所述当前帧的频谱增益和带噪声语音信号中当前帧的频谱分量信号的乘积，得到纯净语音信号中当前帧的频谱分量信号；将各个数据帧的频谱分量信号求和，得到所述纯净的频域语音信号。需要说明的是，在得到增强的频域纯净语音信号后，还可以进一步将所述频域纯净语音信号进行时域变换处理，得到时域纯净语音信号。通过上述实施例可以看出，引入相关度修正参数来描述某一帧与前一帧之间的相关性，采用相关度修正参数设置所述频域带噪语音信号的前一帧谱方差和前一帧谱幅度平方的权值，当某一帧与前一帧之间的无相关性时，则利用前一帧的谱方差计算某一帧的谱方差，当某一帧与前一帧之间具有强相关性时，则利用前一帧的谱幅度计算某一帧的谱方差，当某一帧与前一帧之间的相关性介于无相关性和强相关性之间时，通过调整相关度参数的值可以更精确获得某一帧的谱方差，由此可以降低增强语音信号与真实信号间的误差。实施例二在本实施例中，将详细说明用引入权值的先验信噪比进行语音增强的最小均方差估计方法，请参阅图2所示，其为本发明中最小均方差估计方法进行语音增强的原理框图，结合图2，请参阅图3，其为本发明一种语音增强的方法的一个具体实施方式
的流程图，具体包括以下步骤步骤301 获取带噪声语音信号；其中，设定获得的带噪声语音信号为y(n)，包括纯净语音信号x(n)和噪声信号 d(n)；步骤302 将所述获取的带噪声语音信号进行傅里叶变换，得到频域带噪声语音信号；其中，设定将带噪声语音信号y(n)经过傅里叶变换后为Y(k)，包括纯净语音信号 X(k)和噪声信号D(k)；步骤303 在频域下，计算纯净语音信号中各个数据帧的谱方差；其中，设定一个相关度修正系数，用于指示纯净语音信号中第1帧与第1-1帧之间的相关性，当第1帧与第1-1帧之间没有相关性时，则用第1-1帧的谱方差来代替第1帧的谱方差，当第1帧与第1-1帧之间具有强相关性时，则用第1-1帧的谱幅度来计算第1帧的
谱方差。
由此，可以得到知
,其中，、表示纯净语音信号中
第1帧的谱方差，示纯净语音信号中第1-1帧谱方差，二二表示纯净语音信号中第1-1
帧谱幅度的平方，入_表示纯净语音信号中第1帧之前所有数据帧的谱方差的最小值，e 为所述相关度修正参数，用于指示所述当前帧与所述前一帧之间的相关度。S卩，先将第1-1帧谱方差和第1-1帧谱幅度的平方加权求和，得到第1-1帧的谱方差的修正值，然后再比较第1-1帧的谱方差的修正值和第1帧之前所有数据帧的谱方差的最小值的大小，将比较得到的最大值做为纯净语音信号中第1帧的谱方差。同时，试验结果表明，当e落在0.4 0.8的范围内，语音增强的效果较好；其中当e =0.8时，语音增强的效果最好。步骤304 在频域下，根据纯净语音信号中各个数据帧的谱方差计算纯净语音信号中各个数据帧的先验信噪比；其中，当计算得到纯净语音信号中各个数据帧的谱方差后，根据
则得到此外，根据最小均方误差估计准则，有
又根据
第1帧的语音谱方差&估计\可按如下公式计算由于
则将上式两边除以可以得到
改写为差步骤305 根据最小均方误差估计法，由纯净语音信号中各个数据帧的先验信噪比，得到纯净语音信号中各个数据帧的频谱分量；其中，按照公式+ 计算得到第1帧的频谱增益函数，其
中，
表示第1帧的频谱增益函数；
同时根据公式
计算得到纯净语音信号中第1帧的频谱分量。步骤306 将纯净语音信号中各个数据帧的频谱分量求和，得到频域纯净语音信号；其中
并由此获得频域纯净语音信号，实现了语音增强功能。步骤307 将所述频域纯净语音信号进行傅里叶逆变换，得到时域纯净语音信号。其中，请参阅图4、图5和图6，图4为原始带噪声的语音信号仿真图，可以看出噪声对语音的影响是明显的，尤其是在低频段，主观测听可知噪声相当明显；图5为现有技术中语音增强处理后的纯净语音信号仿真图，可以看出噪声在很大程度上被抑制，但是抑制噪声的同时也抑制了部分语音，主观测听有明显的语音畸变；图6为本发明中语音增强处理后的纯净语音信号仿真图，可以看出在噪声抑制和语音畸变之间取得了平衡，有利于主观听觉感受，主观测听语音畸变不明显，噪声程度不影响听觉感受。通过上述实施例可以看出，引入相关度修正参数来描述某一帧与前一帧之间的相关性，并将1与相关度参数的差值作为前一帧谱方差估计值的权值，将相关度参数作为前一帧谱幅度估计值平方的权值，当某一帧与前一帧之间的无相关性时，则利用前一帧的谱方差估计值计算某一帧的谱方差估计值，当某一帧与前一帧之间具有强相关性时，则利用前一帧的谱幅度估计值计算某一帧的谱方差估计值，当某一帧与前一帧之间的相关性介于无相关性和强相关性之间时，通过调整相关度参数的值可以更精确地估计纯某一帧的谱方差估计值，并由此可以更精确地估计纯净语音信号先验信噪比，从而降低了在语音增强过程中，由先验信噪比的计算而引入的误差。此外，本发明实施例采用每帧更新的先验信噪比估计方法也可以更精确地估计纯净语音信号的先验信噪比。实施例三与上述一种语音增强方法相对应，本发明实施例还提供了一种语音增强装置。请参阅图7，其为本发明一种语音增强装置的一个实施例的结构图，该装置包括频域变换单元701、谱方差修正单元702、先验信噪比获取单元703和语音增强单元704。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。频域变换单元701，用于将带噪声的时域语音信号进行频域变换处理，得到带噪声的频域语音信号；谱方差修正单元702，用于根据相关度修正参数设置前一帧谱方差和前一帧谱幅度平方的权值，得到纯净语音信号中当前帧的谱方差，其中，所述相关度修正参数指示所述当前帧与所述前一帧之间的相关性；先验信噪比获取单元703，用于根据所述纯净语音信号中当前帧的谱方差和噪声信号中前一帧的谱方差，得到纯净语音信号中当前帧的先验信噪比；语音增强单元704，用于依据最小均方误差估计法，由所述纯净语音信号中当前帧的先验信噪比，得到纯净的频域语音信号。其中，上述谱方差修正单元702包括加权单元7021和比较单元7022，加权单元 7011，用于将所述前一帧谱方差和所述前一帧谱幅度平方加权求和，得到前一帧谱方差的修正值，其中，1与相关度修正参数的差值为所述前一帧谱方差的权值，相关度修正参数为所述前一帧谱方差平方的权值，所述相关度修正参数指示所述当前帧与所述前一帧之间的相关性；比较单元7012，用于比较所述前一帧谱方差的修正值与纯净语音信号中当前帧之前所有数据帧的谱方差的最小值的大小，获得所述前一帧谱方差的修正值与纯净语音信号中当前帧之前所有数据帧的谱方差的最小值的最大值，将所述最大值作为所述纯净语音信号中当前帧的谱方差。上述语音增强单元704包括频谱增益获取单元7041、频谱分量信号计算单元 7042和整合单元7043，频谱增益获取单元7041，用于根据所述纯净语音信号中当前帧的先验信噪比和后验信噪比，得到当前帧的频谱增益；频谱分量信号计算单元7042，用于根据所述当前帧的频谱增益和带噪声语音信号中当前帧的频谱分量信号的乘积，得到纯净语音信号中当前帧的频谱分量信号；整合单元7043，用于将各个数据帧的频谱分量信号求和，得到所述纯净的频域语
音信号。需要说明的是，所述装置还可以进一步包括时域变换单元，用于将所述纯净的频域语音信号进行时域变换处理，得到纯净的时域语音信号。由上述实施例可以看出，引入相关度修正参数来描述某一帧与前一帧之间的相关性，采用相关度修正参数设置所述频域带噪语音信号的前一帧谱方差和前一帧谱幅度平方的权值，当某一帧与前一帧之间的无相关性时，则利用前一帧的谱方差计算某一帧的谱方差，当某一帧与前一帧之间具有强相关性时，则利用前一帧的谱幅度计算某一帧的谱方差，当某一帧与前一帧之间的相关性介于无相关性和强相关性之间时，通过调整相关度参数的值可以更精确获得某一帧的谱方差，由此可以降低增强语音信号与真实信号间的误差。需要说明的是，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体 (Random Access Memory, RAM)等。以上对本发明所提供的一种语音增强的方法和装置进行了详细介绍，本文中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式
及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。
权利要求
一种语音增强的方法，其特征在于，包括将带噪语音信号进行变换，得到频域带噪语音信号；采用相关度修正参数设置所述频域带噪语音信号的前一帧谱方差和前一帧谱幅度平方的权值，得到频域纯净语音信号中当前帧的谱方差，其中，所述相关度修正参数指示所述当前帧与所述前一帧之间的相关性；根据所述频域纯净语音信号中当前帧的谱方差和所述频域带噪语音信号的前一帧的谱方差，得到频域纯净语音信号中当前帧的先验信噪比；依据最小均方误差估计法，由所述频域纯净语音信号中当前帧的先验信噪比，得到增强的频域纯净语音信号。
2.根据权利要求1所述的方法，其特征在于，还包括将所述频域纯净语音信号进行时域变换处理，得到时域纯净语音信号。
3.根据权利要求1所述的方法，其特征在于，所述根据相关度修正参数设置前一帧谱方差和前一帧谱幅度平方的权值，得到纯净语音信号中当前帧的谱方差包括将所述前一帧谱方差和所述前一帧谱幅度平方加权求和，得到前一帧谱方差的修正值，其中，1与相关度修正参数的差值为所述前一帧谱方差的权值，相关度修正参数为所述前一帧谱方差平方的权值；获得所述前一帧谱方差的修正值与纯净语音信号中当前帧之前所有数据帧的谱方差的最小值中的最大值，将所述最大值作为所述纯净语音信号中当前帧的谱方差。
4.根据权利要求1所述的方法，其特征在于，所述根据所述纯净语音信号中当前帧的谱方差和噪声信号中前一帧的谱方差，得到纯净语音信号中当前帧的先验信噪比具体包括将所述纯净语音信号中当前帧的谱方差和所述噪声信号中前一帧的谱方差求商，得到所述纯净语音信号中当前帧的先验信噪比。
5.根据权利要求1所述的方法，其特征在于，所述依据最小均方误差估计法，由所述纯净语音信号中当前帧的先验信噪比，得到纯净的频域语音信号包括根据所述纯净语音信号中当前帧的先验信噪比和后验信噪比，得到当前帧的频谱增■、ΛM ；根据所述当前帧的频谱增益和带噪声语音信号中当前帧的频谱分量信号的乘积，得到纯净语音信号中当前帧的频谱分量信号；将各个数据帧的频谱分量信号求和，得到所述纯净的频域语音信号。
6.一种语音增强的装置，其特征在于，包括频域变换单元，用于将带噪声的时域语音信号进行频域变换处理，得到带噪声的频域语音信号；谱方差修正单元，用于根据相关度修正参数设置前一帧谱方差和前一帧谱幅度平方的权值，得到纯净语音信号中当前帧的谱方差，其中，所述相关度修正参数指示所述当前帧与所述前一帧之间的相关性；先验信噪比获取单元，用于根据所述纯净语音信号中当前帧的谱方差和噪声信号中前一帧的谱方差，得到纯净语音信号中当前帧的先验信噪比；语音增强单元，用于依据最小均方误差估计法，由所述纯净语音信号中当前帧的先验信噪比，得到纯净的频域语音信号。
7.根据权利要求6所述的装置，其特征在于，所述装置还包括时域变换单元，用于将所述纯净的频域语音信号进行时域变换处理，得到纯净的时域语音信号。
8.根据权利要求6所述的装置，其特征在于，谱方差修正单元包括加权单元，用于将所述前一帧谱方差和所述前一帧谱幅度平方加权求和，得到前一帧谱方差的修正值，其中，1与相关度修正参数的差值为所述前一帧谱方差的权值，相关度修正参数为所述前一帧谱方差平方的权值，所述相关度修正参数指示所述当前帧与所述前一帧之间的相关性；比较单元，用于比较所述前一帧谱方差的修正值与纯净语音信号中当前帧之前所有数据帧的谱方差的最小值的大小，获得所述前一帧谱方差的修正值与纯净语音信号中当前帧之前所有数据帧的谱方差的最小值的最大值，将所述最大值作为所述纯净语音信号中当前帧的谱方差。
9.根据权利要求6所述的装置，其特征在于，所述语音增强单元包括频谱增益获取单元，用于根据所述纯净语音信号中当前帧的先验信噪比和后验信噪比，得到当前帧的频谱增益；频谱分量信号计算单元，用于根据所述当前帧的频谱增益和带噪声语音信号中当前帧的频谱分量信号的乘积，得到纯净语音信号中当前帧的频谱分量信号；整合单元，用于将各个数据帧的频谱分量信号求和，得到所述纯净的频域语音信号。
全文摘要
本发明实施例公开了一种语音增强的方法和装置。其中，所述方法包括将带噪语音信号进行变换，得到频域带噪语音信号；采用相关度修正参数设置所述频域带噪语音信号的前一帧谱方差和前一帧谱幅度平方的权值，得到频域纯净语音信号中当前帧的谱方差，其中，所述相关度修正参数指示所述当前帧与所述前一帧之间的相关性；根据所述频域纯净语音信号中当前帧的谱方差和所述频域带噪语音信号的前一帧的谱方差，得到频域纯净语音信号中当前帧的先验信噪比；依据最小均方误差估计法，由所述频域纯净语音信号中当前帧的先验信噪比，得到增强的频域纯净语音信号。通过本发明实施例，可以降低在语音增强过程中，由先验信噪比的计算而引入的误差。
文档编号H04L25/02GK101853666SQ20091013234
公开日2010年10月6日申请日期2009年3月30日优先权日2009年3月30日
发明者张清, 杨毅申请人:华为技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨毅;张清
技术所有人：华为技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。