语音信号中基音提取及修正方法

文档序号:2829064阅读:1059来源:国知局
专利名称:语音信号中基音提取及修正方法
技术领域
本发明涉及语音信号处理领域,具体地,涉及一种语音信号中基音提取及修正方法。
背景技术
人在发音过程中,肺部及与之相连的肌肉就相当于整个声道系统的激励源。当声带处于绷紧状态时,由肺部排出的气流会使声带产生振动,这时产生的声音叫做浊音(Voiced sound),反之,不带有声带振动的声音则叫做清音(Unvoiced sound)。声带振动的频率就是基音频率(Pitch frequency),基音频率的倒数就是基音周期(pitch period)。基音周期或基音频率的检测简称基音检测(Pitch detection)又称基音估计(Pitchestimation)或者基音提取(Pitch extraction),基音提取就是准确提取与声带相一致的振动频率,找出和声带振动频率一致或尽量相吻合的轨迹曲线。 基音周期是语音信号的一个极其重要的特征参数,它表征了语音激励源的一个重要特征。基音检测器是很多语音信号处理系统中的一个关键组成部分,不仅是因为它对语音信号的激励源提供深入而有价值的分析,而且语音的基音在语音信号处理的多个领域(如语音分析合成、语音低速率编码、语音识别、说话人识别、语音分离、发音器官疾病诊断、助听设备研制、听觉残障者的语言指导等)都有着广泛而且重要的应用。迄今,国内外很多学者提出了各种各样的基音检测算法,对如何准确地提取语音信号的基音周期做了大量的工作。虽然对干净语音信号的基音检测算法有很多种,但是对于带噪声的语音信号的基音检测方面的研究比较少,进展也比较缓慢,诸多算法在存在噪声时检测精度明显下降,甚至无法检测。

发明内容
本发明的目的在于,针对上述问题,提出一种语音信号中基音提取及修正方法,以实现在噪音环境下精确语音提取和检测的优点。为实现上述目的,本发明采用的技术方案是
一种语音信号中基音提取及修正方法,包括以下步骤
计算浊音帧的循环平均幅度和函数(CAMSF);
计算浊音帧的循环平均幅度差函数(CAMDF);
将上述循环平均幅度差函数(CAMDF)与上述循环平均幅度和函数(CAMSF)进行加权运算,搜索该加权函数的峰值点,并记录该峰值点所对应的延迟点,该延迟点即为对应池音中贞的基音周期初始估计值;
根据所有浊音帧的基音周期初始估计值,利用基于局部浊音段的后处理技术对所述基音周期初始估计值进行修正。根据本发明的优选实施例,所述的利用基于局部浊音段的后处理技术对基音周期初始估计值进行修正,包括以下步骤找出上述基音周期连续不为零的浊音段;
找出在上述浊音段基音周期的最大值与最小值及其它们相应的位置,设当前浊音段基音周期的最大值与最小值分别为TPmax,与它们相邻最近5帧浊音帧的基音周期的平均值分别为TFotI、TPav2 ;
如 \
权利要求
1.一种语音信号中基音提取及修正方法,其特征在于,包括以下步骤 计算浊音帧的循环平均幅度和函数(CAMSF); 计算浊音帧的循环平均幅度差函数(CAMDF); 将上述循环平均幅度差函数(CAMDF)与上述循环平均幅度和函数(CAMSF)进行加权运算,搜索该加权函数的峰值点,并记录该峰值点所对应的延迟点,该延迟点即为对应池音中贞的基音周期初始估计值; 根据所有浊音帧的基音周期初始估计值,利用基于局部浊音段的后处理技术对所述基音周期初始估计值进行修正。
2.如权利要求I所述语音信号中基音提取及修正方法,其特征在于,所述的利用基于局部浊音段的后处理技术对基音周期初始估计值进行修正,包括以下步骤 找出上述基音周期连续不为零的浊音段; 找出在上述浊音段基音周期的最大值与最小值及其它们相应的位置,设该浊音段基音周期的最大值与最小值分别为TPmax、ZPmm,与最大值与最小值相邻最近5帧浊音帧的基音周期的平均值分别为;
3.如权利要求I或2所述的语音信号中基音提取及修正方法,其特征在于,所述浊音帧的循环平均幅度和函数(CAMSF)的计算式如下
4.如权利要求I或所述语音信号中基音提取及修正方法,其特征在于,所述浊音帧的循环平均幅度和函数的计算公式如下
5.如权利要求I或2所述语音信号中基音提取及修正方法,其特征在于,将上述循环平均幅度差函数(CAMDF)与上述循环平均幅度和函数(CAMSF)进行加权运算,所述加权运算公式如下
全文摘要
本发明公开了一种语音信号中基音提取及修正方法,包括以下步骤计算浊音帧的循环平均幅度和函数;计算浊音帧的循环平均幅度差函数;将上述循环平均幅度差函数与上述循环平均幅度和函数进行加权运算,搜索该加权函数的峰值点,并记录该峰值点所对应的延迟点,该延迟点即为对应浊音帧的基音周期初始估计值;根据所有浊音帧的基音周期初始估计值,利用基于局部浊音段的后处理技术对所述基音周期初始估计值进行修正。利用循环平均幅度差函数加权循环平均幅度和函数,提取浊音帧的基音周期初始估计值,能有效突出基音周期处的峰值点,提高了抗噪性能,达到了在噪音环境下精确语音提取和检测的目的。
文档编号G10L15/20GK102779526SQ20121027827
公开日2012年11月14日 申请日期2012年8月7日 优先权日2012年8月7日
发明者何姣, 吴少智, 吴跃, 孟现东, 贺知明 申请人:无锡成电科大科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1