非常短的基音周期检测和编码的制作方法

文档序号:2825836阅读:120来源:国知局
非常短的基音周期检测和编码的制作方法
【专利摘要】为用于语音或音频信号的非常短的基音周期检测和编码提供了系统和方法实施例。该系统和方法包括使用时域和频域基音周期检测技术的组合在语音或音频信号中检测是否存在比常规最小基音周期限制更短的非常短的基音周期。基音周期检测技术包括使用时域中的基音相关系数和检测频域中的语音或音频信号中的低频能量的缺少。使用开始于预定义最小的非常短的基音限制(小于常规最小基音限制)的基音周期范围对检测到的非常短的基音周期进行编码。
【专利说明】非常短的基音周期检测和编码
[0001] 本发明要求2012年12月21日递交的发明名称为"非常短的基音周期检测"(Very Short Pitch Detection)的第13/724769号美国非临时专利申请案的在先申请优先权, 该在先申请案要求2011年12月21日递交的发明名称为"非常短的基音周期检测"(Very Short Pitch Detection)的第61/578398号美国临时专利申请案的在先申请优先权,以上 在先申请的内容以引入的方式并入本文本中。

【技术领域】
[0002] 本发明大体涉及信号编码领域,且在特定实施例中,涉及一种用于非常短的基音 周期检测和编码的系统和方法。

【背景技术】
[0003] 传统上,参数语音编码方法都是利用语音信号中本身的冗余,来减少待发送的信 息量,并估算一个一个信号的语音样本在短时段内的参数。这种冗余起因于语音波形周期 性的重复和语音信号的频谱包络慢变过程。不同形式的语音波形的冗余对应于不同类型的 语音信号,例如浊音和清音。就浊音语音而言,语音信号基本上是周期性的。然而,这种周 期性在语音段中是变化的,而且周期波形在语音段之间缓慢变化。低比特率的语音编码可 以很大地受益于这种周期性。浊音语音周期还称为基音周期,这种基音周期预测通常被命 名为长期预测(LTP)。至于清音语音,其信号更像是一个随机噪声,可预测性也较小。


【发明内容】

[0004] 根据一项实施例,一种由语音或音频编码装置实施的非常短的基音周期检测和编 码的方法包括:使用时域和频域基音周期检测技术的组合在语音或音频信号中检测比常规 最小基音周期限制更短的非常短的基音周期,所述组合包括使用基音周期相关系数和检测 缺少低频能量。所述方法进一步包括在最小的非常短的基音周期限制到所述常规最小基音 周期限制的范围内对所述语音或音频信号的所述非常短的基音周期进行编码,其中所述最 小的非常短的基音周期限制是预定义的并且小于所述常规最小基音周期限制。
[0005] 根据另一实施例,一种由语音或音频编码装置实施的非常短的基音周期检测和编 码的方法包括:通过使用基音周期相关系数检测时域中比常规最小基音周期限制更短的语 音或音频信号的非常短的基音周期,进一步通过检测所述语音或音频信号中缺少低频能量 检测频域中存在所述非常短的基音周期,以及使用开始于预定义最小的非常短的基音周期 限制的基音周期范围对所述语音或音频信号的非常短的基音周期进行编码,所述最小的非 常短的基音周期限制小于所述常规最小基音周期限制。
[0006] 在又一实施例中,一种支持用于语音或音频编码的非常短的基音周期检测和编码 的装置包括一个处理器和一个计算机可读存储介质,其存储由所述处理器执行的程序。所 述程序包括可进行如下操作的指令:使用时域和频域基音周期检测技术的组合在语音信号 中检测比常规最小基音周期限制更短的非常短的基音周期,所述组合包括使用基音周期相 关系数和检测缺少低频能量,并且在最小的非常短的基音周期限制到所述常规最小基音周 期限制的范围内对所述语音信号的所述非常短的基音周期进行编码,其中所述最小的非常 短的基音周期限制是预定的并且小于所述常规最小基音周期限制。

【专利附图】

【附图说明】
[0007] 为了更完整地理解本发明及其优点,现在参考以下结合附图进行的描述,其中:
[0008] 图1是码激励线性预测技术(CELP)编码器的方框图。
[0009] 图2是对应于图1中的CELP编码器的解码器的方框图。
[0010] 图3是另一具有自适应分量的CELP编码器的方框图。
[0011] 图4是另一对应于图3中的CELP编码器的解码器的方框图。
[0012] 图5是基音周期小于子帧大小和半帧大小的浊音语音信号的示例。
[0013] 图6是基音周期大于子帧大小而小于半帧大小的浊音语音信号的示例。
[0014] 图7示出了浊音语音信号的频谱的示例。
[0015] 图8示出了图7中的经过双倍基音周期编码的相同信号的频谱的示例。
[0016] 图9示出了用于语音或声音信号的非常短的基音周期检测和编码的实施例方法。
[0017] 图10是可用于实施各种实施例的处理系统的方框图。

【具体实施方式】
[0018] 下文将详细论述当前优选实施例的制作和使用。然而,应了解,本发明提供可在各 种具体上下文中体现的许多适用的发明性概念。所论述的具体实施例仅仅说明用以实施和 使用本发明的具体方式,而不限制本发明的范围。
[0019] 针对浊音语音或清音语音,参数编码通过分割频谱包络分量和语音信号的激励分 量来减少语音段的冗余。频谱包络慢变过程可以被描述成线性预测编码(LPC)(也称为短 期预测(STP))。低比特率的语音编码也同样受益于短期预测。这种编码的优点就来自于参 数的慢速变化。进一步地,语音信号参数可能不会在几毫秒内的值明显不同。在8千赫兹 (kHz)、12. 8kHz或16kHz采样率时,语音编码算法将10毫秒至30毫秒范围内的语音段作为 常用的帧长。而20毫秒是最常用的帧长。在G. 723. 1、G. 729、G. 718、EFR、SMV、AMR、VMR-WB 或AMR-WB等较近期的知名国际标准中已经采用了码激励线性预测技术(CELP)。CELP是一 种编码激励、长期预测和短期预测技术的结合。尽管不同编解码器的CELP细节可能显著不 同,但利用CELP的语音编码算法在语音压缩领域已经相当流行。
[0020] 图1示出了 CELP编码器100的示例,其中利用综合分析方法可以最小化合成语音 信号102和原始语音信号101之间的加权误差109。CELP编码器100执行不同的操作或功 能。对应的函数W(z)通过误差加权滤波器110实现。函数1/B(z)通过长期线性预测滤波 器105实现。函数1/A(z)通过短期线性预测滤波器103实现。来自编码激励块108的编 码激励107,也称为固化码本激励,在通过随后滤波器之前乘以增益GJ06调节。短期线性 预测滤波器103通过分析原始信号101实施并由一组系数表示:
[0021]

【权利要求】
1. 一种由语音或音频编码装置实施的非常短的基音周期检测和编码的方法,其特征在 于,所述方法包括: 使用时域和频域基音周期检测技术的组合在语音或音频信号中检测比常规最小基音 周期限制更短的非常短的基音周期,所述组合包括使用基音周期相关系数和检测缺少低频 能量;以及 在最小的非常短的基音周期限制到所述常规最小基音周期限制的范围内对所述语音 或音频信号的所述非常短的基音周期进行编码,其中所述最小的非常短的基音周期限制是 预定义的并且小于所述常规最小基音周期限制。
2. 根据权利要求1所述的方法,其特征在于,使用时域和频域基音周期检测技术的组 合检测非常短的基音周期包括: 使用候选基音周期和所述语音信号或音频的加权值计算标准化基音周期相关系数;和 使用所述标准化基音周期相关系数计算平均标准化基音周期相关系数。
3. 根据权利要求2所述的方法,其特征在于,使用时域和频域基音周期检测技术的组 合检测所述非常短的基音周期进一步包括: 检测从零到预定义最小频率的第一频率区域中的所述语音或音频信号的第一能量以 及从所述预定义最小频率到预定义最大频率的第二频率区域中的第二能量;以及 计算所述第一能量和所述第二能量之间的能量比。
4. 根据权利要求3所述的方法,其特征在于,使用时域和频域基音周期检测技术的组 合检测所述非常短的基音周期进一步包括: 使用所述平均标准化基音周期相关系数调整所述能量比;以及 使用所述调整的能量比计算平滑能量比。
5. 根据权利要求4所述的方法,其特征在于,使用时域和频域基音周期检测技术的组 合检测所述非常短的基音周期进一步包括: 计算最初非常短的基音周期的相关系数;以及 使用所述最初非常短的基音周期的所述相关系数计算平滑短基音周期相关系数。
6. 根据权利要求5所述的方法,其特征在于,使用时域和频域技术的组合检测非常短 的基音周期进一步包括根据所述平滑能量比和所述平滑短基音周期相关系数计算最终非 常短的基音周期。
7. 根据权利要求1所述的方法,其特征在于,12. 8千赫兹(kHz)采样频率的所述常规 最小基音周期限制等于34。
8. 根据权利要求1所述的方法,其特征在于,所述常规最小基音周期限制对应于码激 励线性预测技术(CELP)算法标准。
9. 一种由语音或音频编码装置实施的非常短的基音周期检测和编码的方法,其特征在 于,所述方法包括: 通过使用基音周期相关系数在时域中检测比常规最小基音周期限制更短的语音或音 频信号的非常短的基音周期; 通过检测所述语音或音频信号中缺少低频能量检测频域中存在所述非常短的基音周 期,以及 使用开始于预定义最小的非常短的基音周期限制的范围内的基音周期编码所述语音 或音频信号的非常短的基音周期,所述最小的非常短的基音周期限制小于所述常规最小基 音周期限制。
10. 根据权利要求9所述的方法进一步包括计算候选基音周期的标准化基音周期相关 系数,如下
其中R(P)是所述标准化基音周期相关系数,P是所述候选基音周期,以及sw(η)是所述 语音信号的加权值。
11. 根据权利要求10所述的方法进一步包括计算平均标准化基音周期相关系数,如下 Voicing =[札(PJ +R2 (P2) +R3 (P3) +R4 (Ρ4) ] /4, 其中Voicing是所述平均标准化基音周期相关系数,R1 (PI)、R2 (Ρ2)、R3 (Ρ3)和R4 (Ρ4) 是为所述语音或音频信号的帧的四个子帧计算的四个标准化基音周期相关系数,并且Pi、 P2、P3和P4是所述四个子帧的四个基音周期候选。
12. 根据权利要求11所述的方法进一步包括计算平滑基音周期相关系数,如下 Voicing _sm (3 Voicingsm + Voicing! A, 其中Voicing_Sm是所述平滑基音周期系数相关系数。
13. 根据权利要求12所述的方法,其特征在于,检测缺少低频能量进一步包括计算能 量比,如下 Ratio = Energyl-EnergyO, 其中Ratio是所述能量比,EnergyO是第一频率区域[0,FMIN]Hz中的第一检测的能量, 单位为分贝(dB)、Energyl是第二频率区域[FMIN,900]赫兹(Hz)中的第二检测的能量,单 位为分贝、以及F MIN是预定义最小的频率。
14. 根据权利要求13所述的方法进一步包括使用所述平均标准化基音周期相关系数 调整所述能量比,如下 Ratio <= Ratio- Voicing.
15. 根据权利要求14所述的方法进一步包括计算平滑比,如下 LF -Energy R(ub-sm {\5· LF _ Energy Raid _sm + Ralio) /16, whereLF_EnergyRatio_smisthesmoothratio.
16. 根据权利要求15所述的方法进一步包括计算最初非常短的基音周期的相关系数, 如下 VoicingO = R(Pitch_Tp) = MAX{R(P),P = ΡΙΤ_ΜΙΝ0, ....,PIT_MIN}, 其中VoicingO是所述相关系数、Pitch_Tp是所述最初非常短的基音周期、PIT_MIN0是 所述预定义最小的非常短的基音周期限制、以及PIT_MIN是所述常规最小基音周期限制。
17. 根据权利要求16所述的方法进一步包括计算平滑短基音周期相关系数,如下 ν〇?α?ηφ_χιη <= (3 Voicing_sm + ν〇?α?ιιφ)14, 其中V〇icingO_Sm是所述平滑短基音周期相关系数。
18. 根据权利要求17所述的方法进一步包括计算最终非常短的基音周期,如下 Open-Loop-Pitch = Pitch-Tp ; stab-pit-flag = 1 ; coder-type = VOICED ; 其中Open_L〇〇p_PitCh是所述最终非常短的基音周期,所述语音信号不属于UNVOICED 种类或 TRANSITION 种类,LF_EnergyRatio_sm>35 或 Ratio>50,以及(Voicing0_sm>0. 7)和 (Voicing0_sm>0. 7Voicing_sm)。
19. 根据权利要求9所述的方法,其特征在于,对于标准码激励线性预测技术(CELP)算 法而言,所述常规最小基音周期限制等于34。
20. -种支持用于语音或音频编码的非常短的基音周期检测和编码的装置,其特征在 于,包括: 一种处理器;以及 一种计算机可读存储介质,所述计算机可读存储介质存储由所述处理器执行的程序, 所述程序包括可进行如下操作的指令: 使用时域和频域基音周期检测技术的组合在语音或音频信号中检测比常规最小基音 限制更短的非常短的基音周期,所述组合包括使用基音周期相关系数和检测缺少低频能 量;以及 在最小的非常短的基音限制到所述常规最小基音限制的范围内对所述语音或音频信 号的所述非常短的基音周期进行编码,其中所述最小的非常短的基音限制是预定义的并且 小于所述常规最小基音限制。
21. 根据权利要求20所述的装置,其特征在于,所述语音或音频信号属于VOICED或 GENERIC种类并且包括四个子帧。
22. 根据权利要求20所述的方法,其特征在于,对于码激励线性预测技术(CELP)算法 标准而言,所述常规最小基音限制等于34。
【文档编号】G10L13/00GK104115220SQ201280055726
【公开日】2014年10月22日 申请日期:2012年12月21日 优先权日:2011年12月21日
【发明者】高扬, 齐峰岩 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1