电话线质量语音的基音周期提取方法

文档序号:8283480阅读:317来源:国知局
电话线质量语音的基音周期提取方法
【技术领域】
[0001] 本发明涉及数字化语音通信技术领域,特别涉及一种电话线质量语音的基音周期 提取方法。
【背景技术】
[0002] 基音周期是语音压缩编码中非常重要的参数,也是很多语音相关技术用到的参 数,基音周期参数的正确提取是保证数字化语音正常通信的前提。
[0003] 目前的基音周期参数提取技术对于频谱完整的语音,也就是60-4000HZ的语音, 可以达到较高的提取准确度。对于电话线质量语音,其并不单纯指电话系统的语音,也包括 其它由于经过了 300-3400HZ带通滤波器而导致语音频谱缺失的语音,比如模拟对讲机的 语音。因此,电话线质量语音大部分的基频被滤掉了(人的基频范围是60-400HZ),会造成 基音周期对应的不是自相关函数的最大值,甚至不会出现在候选值当中,但是目前的提取 技术严重依赖于自相关函数,因此提取的准确度不高,会出现很严重的错误,比如男声变得 尖细,女声变得粗重,不仅影响听感,也影响说话人的识别和说话内容的辨别,影响很大。

【发明内容】

[0004] 本发明旨在至少在一定程度上解决上述相关技术中的技术问题之一。
[0005] 为此,本发明的目的在于提出一种电话线质量语音的基音周期提取方法,该方法 将时域与频域相结合,在对电话线质量语音提取时,具有准确度高的优点。
[0006] 为了实现上述目的,本发明的实施例提出了一种电话线质量语音的基音周期提取 方法,包括以下步骤:对输入的原始语音进行非线性处理,并计算所述原始语音的第一时域 自相关函数和非线性处理后的语音的第二时域自相关函数;融合所述第一时域自相关函数 和所述第一时域自相关函数得到第三时域自相关函数;计算原始语音中每一帧的长时基音 周期,并根据所述长时基音周期对所述第三时域自相关函数进行修正;对所述原始语音进 行LPC逆滤波得到余量信号,并对所述余量信号进行FFT变换,并根据变换结果计算频域 自相关函数;根据所述第三时域自相关函数和所述频域自相关函数计算基音周期候选值的 时域权重和频域权重,并根据所述时域权重和频域权重得到所述基音周期候选值的最终权 重;根据所述基音周期候选值以及所述基音周期候选值的最终权重进行路径规划,以确定 最终的基音周期值。
[0007] 根据本发明实施例的电话线质量语音的基音周期提取方法,将时域与频域相结 合,时域上,引进一个新的参数一一长时基音周期,并根据语音短时平稳特性,对自相关函 数进行时域修正,去除不可能成为基音周期的延时值;频域上,计算频域自相关函数,将基 音周期候选值所对应的频域自相关值也作为候选值权重的一部分,以增大真正基音周期的 权重。进而,该方法能够提高电话线质量语音的基音周期提取的准确度。
[0008] 另外,根据本发明上述实施例的电话线质量语音的基音周期提取方法还可以具有 如下附加的技术特征:
[0009] 在一些示例中,通过以下公式计算所述第三时域自相关函数:
【主权项】
1. 一种电话线质量语音的基音周期提取方法,其特征在于,包括w下步骤: 对输入的原始语音进行非线性处理,并计算所述原始语音的第一时域自相关函数和非 线性处理后的语音的第二时域自相关函数; 融合所述第一时域自相关函数和所述第一时域自相关函数得到第=时域自相关函 数; 计算原始语音中每一帖的长时基音周期,并根据所述长时基音周期对所述第=时域自 相关函数进行修正; 对所述原始语音进行LPC逆滤波得到余量信号,并对所述余量信号进行FFT变换,并根 据变换结果计算频域自相关函数; 根据所述第=时域自相关函数和所述频域自相关函数计算基音周期候选值的时域权 重和频域权重,并根据所述时域权重和频域权重得到所述基音周期候选值的最终权重; 根据所述基音周期候选值W及所述基音周期候选值的最终权重进行路径规划,W确定 最终的基音周期值。
2. 根据权利要求1所述的电话线质量语音的基音周期提取方法,其特征在于,通过W 下公式计算所述第=时域自相关函数:
其中,Rc?b( T )为所述第S时域自相关函数,T )为原始语音的第一时域自相关函 数,Rabs( T )为非线性处理后的语音的第二时域自相关函数。
3. 根据权利要求1所述的电话线质量语音的基音周期提取方法,其特征在于,所述计 算原始语音中每一帖的长时基音周期,具体包括:
其中,1为帖号,Pwg(l)为当前帖的长时基音周期,pa-1)是上一帖的长时基音周期, Pmid位于男声和女声基音周期范围重合的部分,Vl_l为0和1时分别表示上一帖是清音和浊 音,Gi_i为上一帖的能量,G。为能量的口限值。
4. 根据权利要求3所述的电话线质量语音的基音周期提取方法,其特征在于,其中,如 果上一帖语音信号是浊音,且其能量大于口限值G。,则用上一帖的长时基音周期来更新当 前帖的长时基音周期,否则用Pmid更新当前帖的长时基音周期。
5. 根据权利要求4所述的电话线质量语音的基音周期提取方法,其特征在于,其中,通 过W下公式对所述第=时域自相关函数进行修正:
其中,Pthl和P th2为两个口限阔值。
6. 根据权利要求5所述的电话线质量语音的基音周期提取方法,其特征在于,其中, Pthl 二 45, P 化2 二 26。

7. 根据权利要求5所述的电话线质量语音的基音周期提取方法,其特征在于,其中,如 果位于Pmi。到P 之间T值的长时基音周期大于P thi,则将该T的自相关函数值置为0。
8. 根据权利要求1所述的电话线质量语音的基音周期提取方法,其特征在于,对所述 余量信号进行FFT变换,并根据变换结果计算频域自相关函数,具体包括:
其中,氏f(f)为频域自相关函数,s(m)为余量信号的FFT变换结果。
9. 根据权利要求1所述的电话线质量语音的基音周期提取方法,其特征在于,通过W 下公式计算所述基音周期候选值的最终权重: Rsx(T,f) = aR_b(T) + (l-a)Rsf(f), 其中,Rsx(T,f)为基音周期候选值T的最终权重,aRe"mb(T)为时域权重,(1-a) Rsf(f)为频域权重,T与f成对应关系,Rc"b(T)为时域自相关值,Rsf(f)是频域自相关值, a为加权因子。
10. 根据权利要求9所述的电话线质量语音的基音周期提取方法,其特征在于,其中, a 为 0. 5。
【专利摘要】本发明提出一种电话线质量语音的基音周期提取方法,包括以下步骤:对原始语音进行非线性处理,计算原始语音的第一时域自相关函数和非线性处理后的语音的第二时域自相关函数;融合第一时域自相关函数和第一时域自相关函数得到第三时域自相关函数;计算原始语音中每一帧的长时基音周期,并据此对第三时域自相关函数进行修正;对原始语音进行LPC逆滤波得到余量信号,并进行FFT变换,根据变换结果计算频域自相关函数;根据第三时域自相关函数和频域自相关函数计算基音周期候选值的时域权重和频域权重,并进一步得到最终权重;根据最终权重进行路径规划,以确定最终的基音周期值。本发明的方法在对电话线质量语音提取时,具有准确度高的优点。
【IPC分类】G10L19-09, G10L25-90
【公开号】CN104599682
【申请号】CN201510017199
【发明人】常亮, 唐昆, 崔慧娟
【申请人】清华大学
【公开日】2015年5月6日
【申请日】2015年1月13日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1