语音基音周期估计方法和装置制造方法

文档序号：2826222阅读：284来源：国知局

语音基音周期估计方法和装置制造方法
【专利摘要】本发明涉及一种语音基音周期估计方法和装置。所述装置包括：信号预处理单元、归一化自相关函数计算单元和基音周期后处理单元。所述方法包括：S1、对语音信号进行除去直流分量、感知加权和信号下采样的预处理；S2、计算所述预处理后的语音信号的归一化自相关函数值；S3、确定基音周期搜索范围内所述归一化自相关函数值中的最大值，将所述最大值对应的基音周期候选值确定为所述语音信号的基音周期估计值。本发明较好地克服了基音周期估计中的倍频和半频错误，提升了基音周期估计方法的抗噪声性能，同时降低了算法的运算复杂度，改进了相应的数字音频/语音编码效率。本发明能够适用于各种语音编解码算法中的基音搜索，具有广泛的适用性。
【专利说明】语音基音周期估计方法和装置
【技术领域】
[0001]本发明涉及语音编码技术，更具体地说，涉及一种语音基音周期估计方法和装置。【背景技术】
[0002]基音周期是指人发音时声带振动的周期。基音周期是语音编码中一个重要的问题，其准确性将直接影响到语音编码器的编码质量和效率。准确的基音周期性分析，可以在语音编码过程中有效地去除冗余，降低编码的比特数，实现低比特率高质量语音编码。但是，由于语音的特殊性，基音周期的准确搜索会面临如下困难:
[0003](I)语音信号变化十分复杂，声门激励波形不是一个完全的周期脉冲串，并且语音波形的周期是时变的。
[0004](2)在语音的开头和结尾部分并不具有声带振动那样的周期性，有些清浊音等过渡音是很难判定它属于周期或非周期信号，从而也就无法估计基音周期。
[0005](3)要从语音信号中去除声道影响，直接取出仅和声带振动有关的信息比较困难。
[0006](4)在浊音段定义每个基音周期的准确开始和结束这一困难限制了基音的可靠测量，这不仅因为语音信号本身是准周期的(即基音是有变化的)，同时也因为波形易受共振峰和噪声等的影响。
[0007](5)在实际应用中，背景噪声会影响基音检测的性能，对于移动通信环境尤为重要，因为波形经常会出现高电平噪声。
[0008](6)基音周期变化范围较大也给准确基音检测带来了一定的困难。
[0009]目前，还没有一种通用的方法能精确可靠地提取出语音在任一情况下的基音周期。传统的基音检测方法，可分为时域法和频域法。在时域，传统的基音周期算法包括基于平均幅度差函数(Average Magnitude Difference Function, AMDF)的基音估计算法、基于短时自相关函数(Autocorrelation Function, ACF)基音检测算法。这两种算法可以参见如下文献的介绍:
[0010]Chu, Wai C.Speech coding algorithms !foundation and evolution ofstandardized coders.John ffiley&Sons, Inc.2003, pp.33-45。
[0011]在频域的角度,Griffin和Lim提出了一种频域基音周期估计方案(D.ff.Griffin,J.S.Lim.Multiband Excitation Vocoder.1EEE Trans ASSP, 1988, 36 (8)),用于多带激励语音编码算法(MBE)，这种基音周期估计算法采用闭环分析合成方法，匹配信号频域波形，得到最优基音周期估计。
[0012]在实际应用中，基于时域的基音搜索算法由于其算法简单，性能较佳而得到广泛应用。例如在当前的语音编码标准G.729、AMR-WB中，均采取了时域改进的短时自相关函数(ACF)基音检测算法(鲍长春.低码率数字语音编码基础.北京:北京工业大学出版社，2001.2.)。但是，通常时域的ACF方法容易产生“倍频”和“半频”错误，AMDF方法不能有效跟踪语音频率快速变化。频域方法一般采用倒谱法，由于引入对数运算，使计算量大幅度增加，且易受噪音的影响。
【发明内容】

[0013]本发明要解决的技术问题在于，针对现有技术的上述缺陷，提供一种低复杂度、高效的语音基音周期估计方法和装置，能较好地克服基音周期估计中的倍频与半频错误，并能提升抗噪声性能。
[0014]本发明解决其技术问题所采用的技术方案是:提出一种语音基音周期估计方法，包括如下步骤:
[0015]S1、对语音信号进行除去直流分量、感知加权和信号下采样的预处理；
[0016]S2、使用下式计算所述预处理后的语音信号的归一化自相关函数值:
[0017]
【权利要求】
1.一种语音基音周期估计方法，其特征在于，包括如下步骤: 51、对语音信号进行除去直流分量、感知加权和信号下采样的预处理； 52、使用下式计算所述预处理后的语音信号的归一化自相关函数值:
2.根据权利要求1所述的方法，其特征在于，所述步骤SI进一步包括: 511、对语音信号重采样到内部采样率； 512、对重采样的语音信号进行高通滤波以除去直流分量； 513、对高通滤波后的语音信号进行感知加权； 514、对感知加权后的语音信号进行低通滤波和1/2下采样。
3.根据权利要求2所述的方法，其特征在于，所述内部采样率为12.8kHz，所述高通滤波的截止频率为50Hz。
4.根据权利要求1所述的方法，其特征在于，所述步骤S3进一步包括: 531、依据语音信号的采样率，将基音周期搜索范围划分成第一区间、第二区间和第三区间，分别得到各个区间的归一化自相关函数最大值和对应的基音周期候选值； 532、依据一定的权重参数，从所述三个区间的归一化自相关函数最大值中选择出所述基音周期搜索范围的归一化自相关函数最大值，将该最大值对应的基音周期候选值确定为所述语音信号的基音周期估计值。
5.根据权利要求4所述的方法，其特征在于，所述步骤S32进一步包括:判断第二区间的归一化自相关函数最大值是否大于等于第一区间的归一化自相关函数最大值与所述权重参数的乘积，如果是，则将第二区间的归一化自相关函数最大值对应的基音周期候选值确定为所述语音信号的基音周期估计值，否则，进一步判断第三区间的归一化自相关函数最大值是否大于等于第一区间的归一化自相关函数最大值与所述权重参数的乘积，如果是，则将第三区间的归一化自相关函数最大值对应的基音周期候选值确定为所述语音信号的基音周期估计值，否则将第一区间的归一化自相关函数最大值对应的基音周期候选值确定为所述语音信号的基音周期估计值。
6.根据权利要求5所述的方法，其特征在于，所述第一区间、第二区间和第三区间具体为[L_min，39]，[40，79]，[80，L_max]，其中L_min表示基音周期搜索范围的起始值，L_max表示基音周期搜索范围的结束值。
7.一种语音基音周期估计装置，其特征在于，包括: 信号预处理单元，对语音信号进行除去直流分量、感知加权和信号下采样的预处理；归一化自相关函数计算单元，使用下式计算所述预处理后的语音信号的归一化自相关函数值:
8.根据权利要求7所述的装置，其特征在于，所述信号预处理单元进一步对语音信号重采样到内部采样率，然后对重采样的语音信号进行高通滤波以除去直流分量，随后对高通滤波后的语音信号进行感知加权，最后对感知加权后的语音信号进行低通滤波和1/2下采样。
9.根据权利要求7所述的装置，其特征在于，所述基音周期后处理单元进一步依据语音信号的采样率，将基音周期搜索范围划分成第一区间、第二区间和第三区间，分别得到各个区间的归一化自相关函数最大值和对应的基音周期候选值，并依据一定的权重参数，从所述三个区间的归一化自相关函数最大值中选择出所述基音周期搜索范围的归一化自相关函数最大值，将该最大值对应的基音周期候选值确定为所述语音信号的基音周期估计值。
10.根据权利要求9所述的装置，其特征在于，所述基音周期后处理单元依据一定的权重参数从所述三个区间的归.一化自相关函数最大值中选择出所述基音周期搜索范围的归一化自相关函数最大值具体为:判断第二区间的归一化自相关函数最大值是否大于等于第一区间的归一化自相关函数最大值与所述权重参数的乘积，如果是，则将第二区间的归一化自相关函数最大值对应的基音周期候选值确定为所述语音信号的基音周期估计值，否贝U，进一步判断第三区间的归一化自相关函数最大值是否大于等于第一区间的归一化自相关函数最大值与所述权重参数的乘积，如果是，则将第三区间的归一化自相关函数最大值对应的基音周期候选值确定为所述语音信号的基音周期估计值，否则将第一区间的归一化自相关函数最大值对应的基音周期候选值确定为所述语音信号的基音周期估计值。
【文档编号】G10L19/00GK103474074SQ201310409433
【公开日】2013年12月25日申请日期:2013年9月9日优先权日:2013年9月9日
【发明者】闫建新, 张勇申请人:深圳广晟信源技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：闫建新;张勇
技术所有人：深圳广晟信源技术有限公司
我是此专利的发明人

上一篇：一种接听来电的方法及移动终端的制作方法
上一篇：数字音频处理系统和方法