自适应带宽扩展方法及其装置的制造方法

文档序号:9872510阅读:493来源:国知局
自适应带宽扩展方法及其装置的制造方法
【专利说明】
[0001] 本发明要求2014年9月5日递交的发明名称为"自适应带宽扩展方法及其装置 (Adaptive Bandwidth Extension and Apparatus for the Same)" 的第14/478,839号美 国专利申请案的在先申请优先权,该在先申请是2013年9月10日递交的发明名称为"基于带 宽扩展的频谱能量级的位移频带的自适应选择(Adaptive Selection of Shifting Band Based on Spectral Energy Level for Bandwidth Extension)''的第61/875,690号美国 临时专利申请案的连续申请案,这两个在先申请的内容以引入的方式并入本文本中,如全 文再现一般。
技术领域
[0002] 本发明大体上涉及语音处理领域,尤其涉及自适应带宽扩展方法及其装置。
【背景技术】
[0003] 在现代音频/语音数字信号通信系统中,数字信号在编码器处被压缩,已压缩的信 息(比特流)可以打包并且通过通信信道逐帧向解码器发送。编码器和解码器在一起的系统 被称为编解码器。语音/音频压缩可以用来减少表示语音/音频信号的比特数,从而降低传 输所需的比特率。语音/音频压缩技术大体上可以分类为时域编码和频域编码。时域编码通 常用于编码低比特率的语音信号或音频信号。频域编码通常用于编码高比特率的音频信号 或语音信号。带宽扩展(BWE)可以是时域编码或频域编码的一部分,用于以非常低的比特率 或以零比特率生成高带信号。
[0004] 然而,语音编码器是有损编码器,即,解码得到信号不同于原始信号。因此,语音编 码的目标之一是为了使失真(或可感知损失)在给定比特率下最小化,或者使比特率最小化 以达到给定的失真。
[0005] 语音编码与其它形式的音频编码的不同之处在于语音是一种比大多数其它音频 信号简单地多的信号,而且关于语音特性的统计信息更多。因此,与音频编码相关的一些听 觉信息在语音编码上下文中可以是不必要的。在语音编码中,最重要的标准是在传输的数 据量受限的情况下保持语音的清晰度和"愉悦度"。
[0006] 语音的清晰度,除了包括实际文字内容,还包括说话者身份、情绪、语调、音色,所 有这些对于最佳清晰度都很重要。受损语音的愉悦度是一个较抽象的概念,它不同于清晰 度的一个特性,因为退化语音有可能是完全清晰的,但是主观上另听众厌烦。
[0007] 语音波形的冗余与不同类型的语音信号有关,例如浊音和清音语音信号。浊音,例 如'a'、'b',基本上是由于声带的振动而产生的,而且是振荡的。因此,在一个较短时间内, 通过正弦等周期性信号的叠加可以很好地模拟它们。换言之,浊音语音信号基本上是周期 性的。然而,这种周期性在语音片段的持续时间内可能是变化的,而且周期性波的形状通常 随着片段而逐渐地变化。低比特率语音编码可以大大受益于研究这种周期性。浊音语音周 期还被称为基音(pitch),基音预测通常被称为长期预测(LTP)。相比之下,清音,例如's'、 'sh',更像噪声。这是因为清音语音信号更像一种随机噪声,并且具有更小的可预测性。
[0008] 传统上,所有参数语音编码方法利用语音信号内在的冗余来减少发送的信息量以 及在短的间隔内估计信号的语音样本的参数。这种冗余主要是因为语音波形以准周期速率 重复,以及语音信号的频谱包络变化缓慢。
[0009] 可以参考若干不同类型的语音信号,例如浊音和清音,考虑语音波形的冗余度。尽 管浊音语音信号基本上是周期性的,但是这种周期性在语音片段的持续时间内可能是变化 的,而且周期性波的形状通常随着片段而逐渐地变化。低比特率语音编码可以大大受益于 研究这种周期性。浊音语音周期还被称为基音,基音预测通常被称为长期预测(LTP)。至于 清音语音,信号更像一种随机噪声,并且具有更小的可预测性。
[0010] 在任一情况下,参数编码可以用于通过将语音信号的激励分量与频谱包络分量分 离来减少语音片段的冗余。缓慢变化的频谱包络可以通过线性预测编码(LPC),也称为短期 预测(STP)表示。低比特率语音编码还可以大大受益于研究此种短期预测。编码的优势来自 于参数的缓慢变化。然而,这些参数与在几毫秒内保持的值明显不同是很少见的。相应地, 在8kHz、12.8kHz或16kHz的采样速率下,语音编码算法采用的标称帧持续时间的范围在十 到三十毫秒内。20毫秒的帧持续时间是最常见的选择。
[0011] 基于滤波器组技术的音频编码被广泛使用,例如在频域编码中。在信号处理中,滤 波器组是一组将输入信号分离为多个分量的带通滤波器,每个带通滤波器携带原始信号的 单个子频带。由滤波器组执行的解压缩过程被称为分析,而滤波器组分析的输出被称为子 带信号,其中子带信号具有和滤波器组中的滤波器个数一样多的子带。重构过程被称为滤 波器组合成。在数字信号处理中,术语"滤波器组"通常还应用于接收器组。区别在于接收器 还将子带下转换成可以以更低的速率重新采样的低中心频率。有时可以通过对带通子带进 行下采样获得相同的结果。滤波器组分析的输出可以采用复合系数形式。每个复合系数包 含分别表示滤波器组中每个子带的余弦项和正弦项的实元素和虚元素。
[0012] 在最近的著名标准,例如G. 723.1、G. 729、G. 718、增强型全速率(EFR)、可选择模式 声码器(SMV)、自适应多速率(AMR)、可变速率多模式宽带(VMR-WB),或自适应多速率宽带 (AMR-WB)中,已经采用了码激励线性预测技术("CELP")XELP通常理解为编码激励、长期预 测和短期预测的技术组合。CELP主要利用人类声音特性或人类嗓音发声模型对语音信号进 行编码。CELP语音编码在语音压缩领域是一种非常普遍的算法原理,尽管不同编解码器中 的CELP细节可能有很大不同。由于它的普遍性,CELP算法已经应用于ITU-T、MPEG、3GPP和 3GPP2等各种标准中。CELP的变体包括代数CELP、广义CELP、低时延CELP和矢量和激励线性 预测,以及其它。CELP是一类算法的通用术语,而不是针对特定的编解码器。
[0013] CELP算法基于四个主要观点。第一,使用通过线性预测(LP)的语音生成的源滤波 器模型。用于语音生成的源滤波器将语音模拟为声源,例如声带,和线性声滤波器,即声道 (和辐射特性)的组合。在语音生成的源滤波器模型的实施方式中,声源或激励信号通常被 模拟为浊音语音的周期性脉冲序列,或清音语音的白噪声。第二,将自适应和固定码本用作 LP模型的输入(激励)。第三,在"感知加权域"的闭环中执行搜索。第四,使用了矢量量化 (VQ)0

【发明内容】

[0014] 本发明实施例描述一种在解码器处对已编码音频比特流进行解码以及生成频带 扩展的方法。所述方法包括对所述音频比特流进行解码以产生已解码低带音频信号以及生 成对应于低频带的低带激励频谱。使用参数从所述低频带内选择子带区域,所述参数指示 所述已解码低带音频信号的频谱包络的能量信息。通过从所述选择的子带区域复制子频带 激励频谱到对应于高频带的高子带区域生成所述高频带的高带激励频谱。使用所述生成的 高带激励频谱通过采用高带频谱包络生成扩展的高带音频信号。将所述扩展的高带音频信 号添加到所述已解码低带音频信号以生成具有扩展的频率带宽的音频输出信号。
[0015] 根据本发明的一个替代性实施例,一种用于对已编码音频比特流进行解码和生成 频率带宽的解码器包括低带解码单元,用于解码所述音频比特流以产生已解码低带音频信 号以及生成对应于低频带的低带激励频谱。所述解码器还包括耦合到所述低带解码单元的 带宽扩展单元。所述带宽扩展单元包括子带选择单元和复制单元。所述子带选择单元用于 使用指示所述已解码低带音频信号的频谱包络的能量信息的参数从所述低频带内选择子 带区域。所述复制单元用于通过从所选择的子带区域复制子带激励频谱到对应于高频带的 高子带区域生成所述高频带的高带激励频谱。
[0016] 根据本发明的一个替代性实施例,一种用于语音处理的解码器包括处理器和存储 由所述处理器执行的程序的计算机可读存储介质。所述程序包括执行以下操作的指令:对 所述音频比特流进行解码以产生已解码低带音频信号以及生成对应于低频带的低带激励 频谱。所述程序包括执行以下操作的指令:使用参数从所述低频带内选择子带区域,所述参 数指示所述已解码低带音频信号的频谱包络的能量信息;以及通过从所述选择的子带区域 复制子带激励频谱到对应于高频带的高子带区域生成所述高频带的高带激励频谱。所述程 序还包括执行以下操作的指令:使用所述生成的高带激励频谱通过采用高带频谱包络生成 扩展的高带音频信号,以及将所述扩展的高带音频信号添加到所述已解码低带音频信号以 生成具有扩展的频率带宽的音频输出信号。
[0017] 本发明的一替代性实施例描述一种在解码器处对已编码音频比特流进行解码以 及生成频带扩展的方法。所述方法包括对所述音频比特流进行解码以产生已解码低带音频 信号和生成对应于低频带的低带频谱,以及使用参数从所述低频带内选择子带区域,所述 参数指示所述已解码低带音频信号的频谱包络的能量信息。所述方法还包括通过从所述选 择的子带区域复制子带频谱到高子带区域生以成高带频谱,以及使用所述生成的高带频谱 以通过采用高带频谱包络能量生成扩展的高带音频信号。所述方法还包括将所述扩展的高 带音频信号添加到所述已解码低带音频信号以生成具有扩展的频率带宽的音频输出信号。
【附图说明】
[0018] 为了更完整地理解本发明及其优点,现在参考下文
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1