一种带宽扩展方法及其装置的制作方法

文档序号:7701594阅读:186来源:国知局
专利名称:一种带宽扩展方法及其装置的制作方法
技术领域
本发明涉及一种新的带宽扩展方法及其装置,更具体地,涉及一种基于非等带宽增益的带宽扩展方法及其装置。
背景技术
在编码条件受限的条件下,例如码率受限的通信环境或安全防范监控环境中,仅 仅采用通常的语音或音频编码方法往往难于获得令人满意的编码效果。此时,需要更多地 考虑人耳的听觉特性以进一步降低码率例如,早期码率受限的编码方法中将更多的比特 分配给音频或语音信号的低频部分,而对信号的高频部分少分配甚至不分配比特。这种简 单放弃或部分放弃高频部分的编码方法使编码码率达到了目标码率的要求,但解码后的音 频信号质量可能会明显下降。带宽扩展BWE (Band Width Extension)技术是对前述放弃高频思想的一种改进技 术它通过在编码端选取适当的参数加以编码,然后在解码端利用这些参数,将低频解码后 的频带较窄的信号“扩展”到频带范围更加宽广的范围。目前,BffE技术被广泛使用在低码 率音频或语音(例如AMR-WB+)编码应用中。作为BWE技术的应用实例,在图1描述了一种典型的包含BWE技术的数字音频编 码装置10,其包括了接收输入PCM数据的预处理模块12、分别连接到预处理模块12的低频 编码核14、带宽扩展处理模块16、以及将低频编码核14的输出和带宽扩展处理模块16的 输出打包的数据打包模块18。与音频编码系统10相对应的音频解码装置在本文中并未示 出,但本领域技术人员通过阅读说明书能够理解,该音频解码装置是这样的装置根据所接 收的编码数据中的边信息,逆向执行音频编码系统10处理数据时的各个步骤,最终在解码 端恢复出编码前的PCM数据。下面结合图1,详细说明音频编码系统10中的各模块的工作 原理 预处理模块12的作用有两大方面首先,该模块判定送入的PCM音频数据属于 环境类信号还是语音类信号;其次,该模块通过时域的处理将一个个PCM数据超帧分割为 高频时域信号和低频时域信号(将在下文中详细描述)。 低频编码核14接收来自预处理模块的低频时域信号,在时域或变换域(如,频 域)进行压缩编码(根据预处理模块12判定的结果,选用的压缩编码方法可能不同,典型 的如AMR-WB+中提到的ACELP、TCX等);将低频编码数据发送给数据打包模块18。预处理模块12中判定环境类信号和语音类信号的方法优选是现有技术中现有技 术中用于区分音乐信号(环境类信号具有音乐信号的特点)和语音信号的方法,由于这部 分内容并非本发明所关注的内容,因此不再详述。 带宽扩展处理模块16接收来自预处理模块的低频时域信号和高频时域信号, 并对它们进行带宽扩展处理,最终向数据打包模块18输出用于重建信号高频部分的高频 BWE参数。 数据打包模块18接收低频编码数据和高频BffE参数以及其它边信息(未示出),并将它们打包成适于传输的格式,发往解码端。在示例性地说明现有技术中的带宽扩展技术之前,首先结合图2简要描述预处理模块12中用于将输入的PCM信号分为高频时域信号和低频时域信号的方法。如图2所示(以一个超帧的PCM信号为例),由于原始音频信号的输入采样频率可 能是16kHz、24kHz、32kHz和48kHz之一,需要将各种不同采样频率的输入信号在编码之前 的预处理中进行重采样,转换为内部采样频率Fs (kHz)的信号。同理,在解码之后的后处理 部分同样需要采样率转换。随后,将上述采样率为Fs的、共L个PCM信号分别送入截至频率为Fs/4的低通滤 波器124和截至频率为Fs/4的高通滤波器122进行滤波;然后再经由降采样装置126、128, 将得到的信号分别作一个2倍临界降采样,分别得到Fs/2采样低频信号& (η)和Fs/2采样 高频信号xH (η),下标L和H代表低频和高频,数字L表示一个音频超帧中样本的个数(即, 长度),优选为512、1024或2048 (降采样前的数目),具体长度由级别参数决定。与之相应 的,一个音频帧的长度一般固定为512个样本(降采样前的数目),本文中所称的“音频帧” 为进行环境类或语音类编码的最小单位。需要注意的是,图2仅仅示出了预处理模块12中与时域分割有关的一个示例,而 用于判断信号类型的装置并未示出,添加了判断类型功能的预处理模块12’(未示出)对于 本领域技术人员是显而易见的。下面结合几篇中国专利,对现有技术中的BffE技术进行说明。现有技术中提出了 多个应用BWE技术或改进BWE技术的技术方案1、在申请于2006年12月14日、公开于2008年6月18日(公开号CN 101202042Α) 的中国专利申请200610165864. 4中,申请人公开了一种可扩展的音频编码框架,其中采用 了带宽扩展技术来处理PCM流中的噪声信号,高效重建了谐波和类噪声成分的高频部分。 该技术方案公开了如何将现有BWE技术应用于音频编码系统中,但对BWE技术本身并无给 出改进的建议。2、在申请于2007年12月12日、公开于2009年6月17日(公开号CN 101458930Α) 的中国专利申请200710198774. X中,申请人公开了一种BWE的改进方法,采用折叠低频再 合成的方式来生成所需的高频激励信号。该方法的特点在于通过频谱折叠生成较高频率 激励信号后需要进一步对高频和低频激励信号进行合成滤波。3、在申请于2006年9月8日、公开于2008年3月12日(公开号CN101140759A) 的中国专利申请200610128778. 6中,申请人公开了一种音频或语音信号的带宽扩展方法。 该方法的特点在于需要先求取归一化合成滤波器来重建高频信号,再在时域空间比较原 始高频信号和重建高频信号,获得BWE所需的参数(增益因子)。本文旨在提供一种全新的BWE技术,其可实现在较低码率下高质量地对数字信号 (例如音频或语音类的信号)进行编码。

发明内容
为了达到本发明的目的,提供了一种基于非等带宽BffE增益的新的带宽扩展技 术。根据本发明的一个实施例,提供了一种带宽扩展方法,其可包括通过预处理将处于时间段tl-t2之内的时域信号分为高频时域信号和低频时域信号;通过时频变换将高频 时域信号和低频时域信号分别变换为高频频域信号和低频频域信号;以及,基于部分的低 频频域信号和至少部分的高频频域信号来计算对应于时间段tl-t2的、至少一个带宽扩展
增益ο进一步地,该至少一个带宽扩展增益可与下述值成正比至少部分的高频频域信 号的能量和与部分的低频频域信号的能量和之比。更进一步地,时间段tl_t2内的带宽扩展增益可不少于2个,并且具有不同的频率 分辨率。优选地,当所述时间段tl-t2内的带宽扩展增益为2个时,所述频率分辨率可分别 为Fs/12和Fs/6(Fs代表采样频率);当所述时间段tl_t2内的带宽扩展增益为4个时,所 述频率分辨率可分别为Fs/108、Fs/54、Fs/18、及Fs/6。更进一步地,时间段tl_t2内的带宽扩展增益可为1个。优选地,部分的低频频域 信号为低频频域信号的较高频率部分。更进一步地,根据本发明的带宽扩展方法还可包括判断所述部分的所述低频频 域信号和所述至少部分的所述高频频域信号是否具有弦性;当所述部分的所述低频频域信 号具有弦性且所述至少部分的所述高频频域信号不具有弦性时,衰减所述带宽扩展增益作 为实际的带宽扩展增益。此外,根据本发明的带宽扩展方法还可包括对一帧内的所有带宽扩展增益进行
矢量量化。根据本发明的再一个实施例,提供了一种带宽扩展装置,其可包括预处理模块, 其用于将处于时间段tl-t2之内的时域信号分为高频时域信号和低频时域信号;时频变换 模块,其用于将高频时域信号和低频时域信号分别变换为高频频域信号和低频频域信号; 以及增益计算模块,其基于部分的低频频域信号和至少部分的高频频域信号来计算对应于 时间段tl-t2的、至少一个带宽扩展增益。进一步地,至少一个带宽扩展增益可与下述值成正比至少部分的高频频域信号 的能量和与部分的低频频域信号的能量和之比。更进一步地,时间段tl_t2内的带宽扩展增益可不少于2个,并且具有不同的频率 分辨率。优选地,当所述时间段tl-t2内的带宽扩展增益为2个时,所述频率分辨率可分别 为Fs/12和Fs/6 (Fs代表采样频率);当所述时间段tl_t2内的带宽扩展增益为4个时,所 述频率分辨率可分别为Fs/108、Fs/54、Fs/18、及Fs/6。更进一步地,时间段tl_t2内的带宽扩展增益可为1个。优选地,部分的低频频域 信号可为低频频域信号的较高频率部分。更进一步地,根据本发明的带宽扩展装置还可包括判断模块,其用于判断部分的 低频频域信号和至少部分的高频频域信号是否具有弦性;以及衰减模块,当部分的低频频 域信号具有弦性且至少部分的高频频域信号不具有弦性时,衰减模块就衰减带宽扩展增益 作为实际的带宽扩展增益。此外,根据本发明的带宽扩展方法还可包括矢量量化模块,其用于对一帧内的所 有带宽扩展增益进行矢量量化。基于上述技术方案,到达了利用全新BWE技术,在较低码率下实现高质量编码的 技术效果。



图1是方框图,其示意性示出了现有的、含BffE模块的数字音频编码器;图2是方框图,其示例性示出了图1编码器中的预处理模块(仅仅示出其中的时 域分割装置);图3A是流程图,其示出了根据本发明的BWE编码方法;图3B是方框图,其示出了根据本发明的BWE编码装置;图4是方框图,其示出了根据本发明的BffE解码装置;图5A-5C是图解说明几种具体栅格划分方式的示意图;以及图6A-6C是方框图,它们示意性示出了分别对应图5A-5C的栅格划分方式的一种 具体编码实现方式。
具体实施例方式通过借助附图在下文中将描述本发明的优选实施例。在以下描述中,将不详细描 述已成为现有技术的功能或结构,因为不必要的细节将导致本发明的介绍含混不清。另外, 说明书中与附图中使用的相同的附图标记表示同一装置或同一步骤。下文中将结合图3A,具体说明根据本发明实施例的BWE编码方法100 步骤101,对经过预处理模块处理后的高频时域信号xH(n)和低频时域信号 xL(η)分别进行量化的分析滤波,以求取每一子帧的低频残差eji,n)和高频残差eH(i,n), 其中i表示子帧的序号,取值从0到I-I (I表示超帧中包含的子帧个数,也是每个超帧中包 含的增益的个数,优选取值为L/128)。其中,用于低频信号的量化的分析滤波器(见 图3B)直接从低频编码核获得;用于高频信号的分析滤波器Ahf(Z)进行的是如下处理对 高频信号xHF(i,n)的每一帧求取一组8阶的LPC系数,将LPC系数转换为ISP系数,ISP又 进一步变换成ISF参数(电导谱频率)并用9比特量化。每一个64个样点的子帧根据如 下公式对ISP系数进行内插
权利要求
一种带宽扩展方法,包括通过预处理将处于时间段t1 t2之内的时域信号分为高频时域信号和低频时域信号;通过时频变换将所述高频时域信号和所述低频时域信号分别变换为高频频域信号和低频频域信号;以及基于部分的所述低频频域信号和至少部分的所述高频频域信号来计算对应于所述时间段t1 t2的、至少一个带宽扩展增益。
2.根据权利要求1所述的方法,其特征在于,所述至少一个带宽扩展增益与下述值成 正比所述至少部分的所述高频频域信号的能量和与所述部分的所述低频频域信号的能量 和之比。
3.根据权利要求2所述的方法,其特征在于,所述时间段tl-t2内的带宽扩展增益不少 于2个,并且具有不同的频率分辨率。
4.根据权利要求3所述的方法,其特征在于,当所述时间段tl-t2内的带宽扩展增益为2个时,所述频率分辨率分别为Fs/12和 Fs/6 ;当所述时间段tl-t2内的带宽扩展增益为4个时,所述频率分辨率分别为Fs/108、 Fs/54、Fs/18、及 Fs/6 ;其中,Fs代表采样频率。
5.根据权利要求2所述的方法,其特征在于,所述时间段tl-t2内的带宽扩展增益为1个。
6.根据权利要求2所述的方法,其特征在于,所述部分的所述低频频域信号为所述低 频频域信号的较高频率部分。
7.根据权利要求2所述的方法,其特征在于,还包括判断所述部分的所述低频频域信号和所述至少部分的所述高频频域信号是否具有弦 性;以及当所述部分的所述低频频域信号具有弦性且所述至少部分的所述高频频域信号不具 有弦性时,衰减所述带宽扩展增益作为实际的带宽扩展增益。
8.根据权利要求3-7中任一权利要求所述的方法,其特征在于还包括对一个超帧内 的所有带宽扩展增益进行矢量量化。
9.一种带宽扩展装置,包括预处理模块,其用于将处于时间段tl-t2之内的时域信号分为高频时域信号和低频时 域信号;时频变换模块,其用于将所述高频时域信号和所述低频时域信号分别变换为高频频域 信号和低频频域信号;以及增益计算模块,其基于部分的所述低频频域信号和至少部分的所述高频频域信号来计 算对应于所述时间段tl-t2的、至少一个带宽扩展增益。
10.根据权利要求9所述的装置,其特征在于,所述至少一个带宽扩展增益与下述值成 正比所述至少部分的所述高频频域信号的能量和与所述部分的所述低频频域信号的能量 和之比。
11.根据权利要求10所述的装置,其特征在于,所述时间段tl-t2内的带宽扩展增益不少于2个,并且具有不同的频率分辨率。
12.根据权利要求11所述的装置,其特征在于,当所述时间段tl-t2内的带宽扩展增益为2个时,所述频率分辨率分别为Fs/12和 Fs/6 ;当所述时间段tl-t2内的带宽扩展增益为4个时,所述频率分辨率分别为Fs/108、 Fs/54、Fs/18、及 Fs/6 ;其中,Fs代表采样频率。
13.根据权利要求10所述的装置,其特征在于,所述时间段tl-t2内的带宽扩展增益为1个。
14.根据权利要求10所述的装置,其特征在于,所述部分的所述低频频域信号为所述 低频频域信号的较高频率部分。
15.根据权利要求10所述的装置,其特征在于,还包括判断模块,其用于判断所述部分的所述低频频域信号和所述至少部分的所述高频频域 信号是否具有弦性;以及衰减模块,当所述部分的所述低频频域信号具有弦性且所述至少部分的所述高频频域 信号不具有弦性时,所述衰减模块就衰减所述带宽扩展增益作为实际的带宽扩展增益。
16.根据权利要求11-15中任一权利要求所述的装置,其特征在于还包括矢量量化模 块,其用于对一个超帧内的所有带宽扩展增益进行矢量量化。
17.—种编码装置,其包含根据权利要求11-15中任一权利要求所述的带宽扩展装置。
18.—种解码装置,其包含用于解码带宽扩展处理后的信号的子解码装置,所述带宽扩 展处理根据权利要求11-15中任一权利要求所述的带宽扩展装置执行。
全文摘要
本发明提供了一种全新的带宽扩展方法,包括通过预处理将处于时间段t1-t2之内的时域信号分为高频时域信号和低频时域信号;通过时频变换将高频时域信号和低频时域信号分别变换为高频频域信号和低频频域信号;以及,基于部分的低频频域信号和至少部分的高频频域信号来计算对应于时间段t1-t2的、至少一个带宽扩展增益。
文档编号H04W28/16GK101990253SQ20091008915
公开日2011年3月23日 申请日期2009年7月31日 优先权日2009年7月31日
发明者王磊, 闫建新 申请人:数维科技(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1