一种带宽扩展方法及其装置的制作方法

文档序号：7701594阅读：186来源：国知局

专利名称：一种带宽扩展方法及其装置的制作方法
技术领域：
本发明涉及一种新的带宽扩展方法及其装置，更具体地，涉及一种基于非等带宽增益的带宽扩展方法及其装置。
背景技术：
在编码条件受限的条件下，例如码率受限的通信环境或安全防范监控环境中，仅仅采用通常的语音或音频编码方法往往难于获得令人满意的编码效果。此时，需要更多地考虑人耳的听觉特性以进一步降低码率例如，早期码率受限的编码方法中将更多的比特分配给音频或语音信号的低频部分，而对信号的高频部分少分配甚至不分配比特。这种简单放弃或部分放弃高频部分的编码方法使编码码率达到了目标码率的要求，但解码后的音频信号质量可能会明显下降。带宽扩展BWE (Band Width Extension)技术是对前述放弃高频思想的一种改进技术它通过在编码端选取适当的参数加以编码，然后在解码端利用这些参数，将低频解码后的频带较窄的信号“扩展”到频带范围更加宽广的范围。目前，BffE技术被广泛使用在低码率音频或语音(例如AMR-WB+)编码应用中。作为BWE技术的应用实例，在图1描述了一种典型的包含BWE技术的数字音频编码装置10，其包括了接收输入PCM数据的预处理模块12、分别连接到预处理模块12的低频编码核14、带宽扩展处理模块16、以及将低频编码核14的输出和带宽扩展处理模块16的输出打包的数据打包模块18。与音频编码系统10相对应的音频解码装置在本文中并未示出，但本领域技术人员通过阅读说明书能够理解，该音频解码装置是这样的装置根据所接收的编码数据中的边信息，逆向执行音频编码系统10处理数据时的各个步骤，最终在解码端恢复出编码前的PCM数据。下面结合图1，详细说明音频编码系统10中的各模块的工作原理预处理模块12的作用有两大方面首先，该模块判定送入的PCM音频数据属于环境类信号还是语音类信号；其次，该模块通过时域的处理将一个个PCM数据超帧分割为高频时域信号和低频时域信号(将在下文中详细描述)。低频编码核14接收来自预处理模块的低频时域信号，在时域或变换域(如，频域)进行压缩编码(根据预处理模块12判定的结果，选用的压缩编码方法可能不同，典型的如AMR-WB+中提到的ACELP、TCX等)；将低频编码数据发送给数据打包模块18。预处理模块12中判定环境类信号和语音类信号的方法优选是现有技术中现有技术中用于区分音乐信号(环境类信号具有音乐信号的特点)和语音信号的方法，由于这部分内容并非本发明所关注的内容，因此不再详述。带宽扩展处理模块16接收来自预处理模块的低频时域信号和高频时域信号，并对它们进行带宽扩展处理，最终向数据打包模块18输出用于重建信号高频部分的高频 BWE参数。数据打包模块18接收低频编码数据和高频BffE参数以及其它边信息(未示出)，并将它们打包成适于传输的格式，发往解码端。在示例性地说明现有技术中的带宽扩展技术之前，首先结合图2简要描述预处理模块12中用于将输入的PCM信号分为高频时域信号和低频时域信号的方法。如图2所示(以一个超帧的PCM信号为例)，由于原始音频信号的输入采样频率可能是16kHz、24kHz、32kHz和48kHz之一，需要将各种不同采样频率的输入信号在编码之前的预处理中进行重采样，转换为内部采样频率Fs (kHz)的信号。同理，在解码之后的后处理部分同样需要采样率转换。随后，将上述采样率为Fs的、共L个PCM信号分别送入截至频率为Fs/4的低通滤波器124和截至频率为Fs/4的高通滤波器122进行滤波；然后再经由降采样装置126、128，将得到的信号分别作一个2倍临界降采样，分别得到Fs/2采样低频信号& (η)和Fs/2采样高频信号xH (η)，下标L和H代表低频和高频，数字L表示一个音频超帧中样本的个数(即，长度)，优选为512、1024或2048 (降采样前的数目)，具体长度由级别参数决定。与之相应的，一个音频帧的长度一般固定为512个样本(降采样前的数目)，本文中所称的“音频帧” 为进行环境类或语音类编码的最小单位。需要注意的是，图2仅仅示出了预处理模块12中与时域分割有关的一个示例，而用于判断信号类型的装置并未示出，添加了判断类型功能的预处理模块12’(未示出)对于本领域技术人员是显而易见的。下面结合几篇中国专利，对现有技术中的BffE技术进行说明。现有技术中提出了多个应用BWE技术或改进BWE技术的技术方案1、在申请于2006年12月14日、公开于2008年6月18日(公开号CN 101202042Α) 的中国专利申请200610165864. 4中，申请人公开了一种可扩展的音频编码框架，其中采用了带宽扩展技术来处理PCM流中的噪声信号，高效重建了谐波和类噪声成分的高频部分。该技术方案公开了如何将现有BWE技术应用于音频编码系统中，但对BWE技术本身并无给出改进的建议。2、在申请于2007年12月12日、公开于2009年6月17日(公开号CN 101458930Α) 的中国专利申请200710198774. X中，申请人公开了一种BWE的改进方法，采用折叠低频再合成的方式来生成所需的高频激励信号。该方法的特点在于通过频谱折叠生成较高频率激励信号后需要进一步对高频和低频激励信号进行合成滤波。3、在申请于2006年9月8日、公开于2008年3月12日(公开号CN101140759A) 的中国专利申请200610128778. 6中，申请人公开了一种音频或语音信号的带宽扩展方法。该方法的特点在于需要先求取归一化合成滤波器来重建高频信号，再在时域空间比较原始高频信号和重建高频信号，获得BWE所需的参数(增益因子)。本文旨在提供一种全新的BWE技术，其可实现在较低码率下高质量地对数字信号 (例如音频或语音类的信号)进行编码。

发明内容
为了达到本发明的目的，提供了一种基于非等带宽BffE增益的新的带宽扩展技术。根据本发明的一个实施例，提供了一种带宽扩展方法，其可包括通过预处理将处于时间段tl-t2之内的时域信号分为高频时域信号和低频时域信号；通过时频变换将高频时域信号和低频时域信号分别变换为高频频域信号和低频频域信号；以及，基于部分的低频频域信号和至少部分的高频频域信号来计算对应于时间段tl-t2的、至少一个带宽扩展
增益ο进一步地，该至少一个带宽扩展增益可与下述值成正比至少部分的高频频域信号的能量和与部分的低频频域信号的能量和之比。更进一步地，时间段tl_t2内的带宽扩展增益可不少于2个，并且具有不同的频率分辨率。优选地，当所述时间段tl-t2内的带宽扩展增益为2个时，所述频率分辨率可分别为Fs/12和Fs/6(Fs代表采样频率)；当所述时间段tl_t2内的带宽扩展增益为4个时，所述频率分辨率可分别为Fs/108、Fs/54、Fs/18、及Fs/6。更进一步地，时间段tl_t2内的带宽扩展增益可为1个。优选地，部分的低频频域信号为低频频域信号的较高频率部分。更进一步地，根据本发明的带宽扩展方法还可包括判断所述部分的所述低频频域信号和所述至少部分的所述高频频域信号是否具有弦性；当所述部分的所述低频频域信号具有弦性且所述至少部分的所述高频频域信号不具有弦性时，衰减所述带宽扩展增益作为实际的带宽扩展增益。此外，根据本发明的带宽扩展方法还可包括对一帧内的所有带宽扩展增益进行
矢量量化。根据本发明的再一个实施例，提供了一种带宽扩展装置，其可包括预处理模块，其用于将处于时间段tl-t2之内的时域信号分为高频时域信号和低频时域信号；时频变换模块，其用于将高频时域信号和低频时域信号分别变换为高频频域信号和低频频域信号；以及增益计算模块，其基于部分的低频频域信号和至少部分的高频频域信号来计算对应于时间段tl-t2的、至少一个带宽扩展增益。进一步地，至少一个带宽扩展增益可与下述值成正比至少部分的高频频域信号的能量和与部分的低频频域信号的能量和之比。更进一步地，时间段tl_t2内的带宽扩展增益可不少于2个，并且具有不同的频率分辨率。优选地，当所述时间段tl-t2内的带宽扩展增益为2个时，所述频率分辨率可分别为Fs/12和Fs/6 (Fs代表采样频率)；当所述时间段tl_t2内的带宽扩展增益为4个时，所述频率分辨率可分别为Fs/108、Fs/54、Fs/18、及Fs/6。更进一步地，时间段tl_t2内的带宽扩展增益可为1个。优选地，部分的低频频域信号可为低频频域信号的较高频率部分。更进一步地，根据本发明的带宽扩展装置还可包括判断模块，其用于判断部分的低频频域信号和至少部分的高频频域信号是否具有弦性；以及衰减模块，当部分的低频频域信号具有弦性且至少部分的高频频域信号不具有弦性时，衰减模块就衰减带宽扩展增益作为实际的带宽扩展增益。此外，根据本发明的带宽扩展方法还可包括矢量量化模块，其用于对一帧内的所有带宽扩展增益进行矢量量化。基于上述技术方案，到达了利用全新BWE技术，在较低码率下实现高质量编码的技术效果。

图1是方框图，其示意性示出了现有的、含BffE模块的数字音频编码器；图2是方框图，其示例性示出了图1编码器中的预处理模块(仅仅示出其中的时域分割装置)；图3A是流程图，其示出了根据本发明的BWE编码方法；图3B是方框图，其示出了根据本发明的BWE编码装置；图4是方框图，其示出了根据本发明的BffE解码装置；图5A-5C是图解说明几种具体栅格划分方式的示意图；以及图6A-6C是方框图，它们示意性示出了分别对应图5A-5C的栅格划分方式的一种具体编码实现方式。
具体实施例方式通过借助附图在下文中将描述本发明的优选实施例。在以下描述中，将不详细描述已成为现有技术的功能或结构，因为不必要的细节将导致本发明的介绍含混不清。另外，说明书中与附图中使用的相同的附图标记表示同一装置或同一步骤。下文中将结合图3A，具体说明根据本发明实施例的BWE编码方法100 步骤101，对经过预处理模块处理后的高频时域信号xH(n)和低频时域信号 xL(η)分别进行量化的分析滤波，以求取每一子帧的低频残差eji，n)和高频残差eH(i，n)，其中i表示子帧的序号，取值从0到I-I (I表示超帧中包含的子帧个数，也是每个超帧中包含的增益的个数，优选取值为L/128)。其中，用于低频信号的量化的分析滤波器(见图3B)直接从低频编码核获得；用于高频信号的分析滤波器Ahf(Z)进行的是如下处理对高频信号xHF(i，n)的每一帧求取一组8阶的LPC系数，将LPC系数转换为ISP系数，ISP又进一步变换成ISF参数(电导谱频率)并用9比特量化。每一个64个样点的子帧根据如下公式对ISP系数进行内插
权利要求
一种带宽扩展方法，包括通过预处理将处于时间段t1 t2之内的时域信号分为高频时域信号和低频时域信号；通过时频变换将所述高频时域信号和所述低频时域信号分别变换为高频频域信号和低频频域信号；以及基于部分的所述低频频域信号和至少部分的所述高频频域信号来计算对应于所述时间段t1 t2的、至少一个带宽扩展增益。
2.根据权利要求1所述的方法，其特征在于，所述至少一个带宽扩展增益与下述值成正比所述至少部分的所述高频频域信号的能量和与所述部分的所述低频频域信号的能量和之比。
3.根据权利要求2所述的方法，其特征在于，所述时间段tl-t2内的带宽扩展增益不少于2个，并且具有不同的频率分辨率。
4.根据权利要求3所述的方法，其特征在于，当所述时间段tl-t2内的带宽扩展增益为2个时，所述频率分辨率分别为Fs/12和 Fs/6 ；当所述时间段tl-t2内的带宽扩展增益为4个时，所述频率分辨率分别为Fs/108、 Fs/54、Fs/18、及 Fs/6 ；其中，Fs代表采样频率。
5.根据权利要求2所述的方法，其特征在于，所述时间段tl-t2内的带宽扩展增益为1个。
6.根据权利要求2所述的方法，其特征在于，所述部分的所述低频频域信号为所述低频频域信号的较高频率部分。
7.根据权利要求2所述的方法，其特征在于，还包括判断所述部分的所述低频频域信号和所述至少部分的所述高频频域信号是否具有弦性；以及当所述部分的所述低频频域信号具有弦性且所述至少部分的所述高频频域信号不具有弦性时，衰减所述带宽扩展增益作为实际的带宽扩展增益。
8.根据权利要求3-7中任一权利要求所述的方法，其特征在于还包括对一个超帧内的所有带宽扩展增益进行矢量量化。
9.一种带宽扩展装置，包括预处理模块，其用于将处于时间段tl-t2之内的时域信号分为高频时域信号和低频时域信号；时频变换模块，其用于将所述高频时域信号和所述低频时域信号分别变换为高频频域信号和低频频域信号；以及增益计算模块，其基于部分的所述低频频域信号和至少部分的所述高频频域信号来计算对应于所述时间段tl-t2的、至少一个带宽扩展增益。
10.根据权利要求9所述的装置，其特征在于，所述至少一个带宽扩展增益与下述值成正比所述至少部分的所述高频频域信号的能量和与所述部分的所述低频频域信号的能量和之比。
11.根据权利要求10所述的装置，其特征在于，所述时间段tl-t2内的带宽扩展增益不少于2个，并且具有不同的频率分辨率。
12.根据权利要求11所述的装置，其特征在于，当所述时间段tl-t2内的带宽扩展增益为2个时，所述频率分辨率分别为Fs/12和 Fs/6 ；当所述时间段tl-t2内的带宽扩展增益为4个时，所述频率分辨率分别为Fs/108、 Fs/54、Fs/18、及 Fs/6 ；其中，Fs代表采样频率。
13.根据权利要求10所述的装置，其特征在于，所述时间段tl-t2内的带宽扩展增益为1个。
14.根据权利要求10所述的装置，其特征在于，所述部分的所述低频频域信号为所述低频频域信号的较高频率部分。
15.根据权利要求10所述的装置，其特征在于，还包括判断模块，其用于判断所述部分的所述低频频域信号和所述至少部分的所述高频频域信号是否具有弦性；以及衰减模块，当所述部分的所述低频频域信号具有弦性且所述至少部分的所述高频频域信号不具有弦性时，所述衰减模块就衰减所述带宽扩展增益作为实际的带宽扩展增益。
16.根据权利要求11-15中任一权利要求所述的装置，其特征在于还包括矢量量化模块，其用于对一个超帧内的所有带宽扩展增益进行矢量量化。
17.—种编码装置，其包含根据权利要求11-15中任一权利要求所述的带宽扩展装置。
18.—种解码装置，其包含用于解码带宽扩展处理后的信号的子解码装置，所述带宽扩展处理根据权利要求11-15中任一权利要求所述的带宽扩展装置执行。
全文摘要
本发明提供了一种全新的带宽扩展方法，包括通过预处理将处于时间段t1-t2之内的时域信号分为高频时域信号和低频时域信号；通过时频变换将高频时域信号和低频时域信号分别变换为高频频域信号和低频频域信号；以及，基于部分的低频频域信号和至少部分的高频频域信号来计算对应于时间段t1-t2的、至少一个带宽扩展增益。
文档编号H04W28/16GK101990253SQ20091008915
公开日2011年3月23日申请日期2009年7月31日优先权日2009年7月31日
发明者王磊, 闫建新申请人:数维科技(北京)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：闫建新;王磊
技术所有人：数维科技（北京）有限公司
我是此专利的发明人

上一篇：实时数据提供方法、服务器和网络的制作方法
上一篇：一种基于自动交换光网络的安全光路建立方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。