音频编解码方法

文档序号：2831164阅读：401来源：国知局

专利名称：音频编解码方法
技术领域：
本发明涉及音频编解码技术领域，具体涉及一种基于高频残差重构的信号重构方法，用于多媒体通信和消费类电子领域。
背景技术：
在多媒体通信领域，包括语音在内的音频、尤其是宽带音频已逐渐成为主要通信业务之一。但是音频信号频带较宽、编码数据量较大，这给音频信号的实时传输和有效存储带来很大的困难。虽然MP3、 AAC、 EAAC和EAAC+等音频编码算法己经能够较好地音频信号进行压缩编码，满足了一定应用的要求，但还无法较好地胜任目前正在发展的移动多媒体通信和各种移动平台等业务。所以有必要研究效率更高和质量更好的音频编码算法。近年来，在音频压縮编码的研究领域，音频信号高频成分的处理、压縮和重构成为相关研究的关键技术之一，如何利用低频频段的信号来重建高频信号是重要的研究内容。
现有技术利用频域低频进行频域高频重建的方法主要有两种，简单介绍如下现有技术1
把音频或语音的低频信号通过一个数字滤波组处理，得到一组低频子带信号；再把该组低频子带作为一个整块信号来进行高频信号的复制。整个高频频段信号的复制方法是将高频信号按照频率由低到高划分成若干频段，每段与上述整块低频信号的带宽大致相同；然后将整块低频子带组连续复制到高频频段的每一段。这样，整块低频子带组会被周期性地在高频频段使用若干次，直到整个需要恢复的高频频段都被复制完成为止。具体方式有两种一是把整块低频子带组平移到对应的高频频段，二是把整块低频子带组先折叠，即颠倒了子带排列顺序，再把整块低频子带组平移到对应的高频频段；在复制过程中，这两种方式可能会交叉使用。这样，整块低频子带组会被周期性地使用，直到整个需要恢复的高频频段都被复制完成为止。
现有技术2
把低频信号通过低通滤波器组处理，得到一组低频子带信号。这里不再像现有技术 l那样，把选取的低频子带组作为一个整体，整段地连续复制需要恢复的高频部分,而是利用低频子带组中的子带，分别对应地恢复一些离散分布的高频子带。如果在高频部分有非常丰富的谐波分量，则其谐波分量的频率可能就是其相应基频的整数倍。在此思想的指导下，现有技术2提出，如果高频部分某些子带的子带序号是2、 3、 4、 5等自然数的整数倍，即某些高频子带和低频子带之间存在倍数的对应关系，这些子带很可能存在丰富的谐波成分，需要重点恢复。这样，用连续的低频子带组恢复离散分布的高频子带的过程就完成了。最后，对于该方法遗漏的高频子带，还要选取波形与之相近的低频子带，对遗漏的高频子带进行恢复，从而完成所有高频子带的复制。
上述两种现有技术中无论按现有技术1把低频子带作为一个整块进行周期性地平移复制或折叠复制，还是按现有技术2进行倍频复制，都是机械性地恢复谐波，没有考虑音频语音信号的多样性和变化性，另外复制时候是按照子带序号依次提取复制，由于低频子带和高频子带的波形本来就不同，所以被复制的高频子带和原始的高频子带相比，将存在较大波形差别或峰值差异，因此重建的高频信号准确性不是太高，影响重构音频信号的质量。

发明内容
本发明的目的之一是提供一种基于频域滤波和高频残差重构的音频编解码方法，目的之二是提供一种基于时域滤波和高频残差重构的音频编解码方法，以避免上述已有技术的不足，提高重建高频残差信号的准确性和音频编解码的压縮比，保证重构音频信号质量<=
本发明的技术方案是这样实现的技术方案一-
基于频域滤波和高频残差重构的音频编解码方法，包括如下步骤
1) 在编码端，音频原始时域信号经过时频变换处理，得到原始频域信号；
2) 原始频域信号经过频域感知滤波处理，得到原始频域残差信号；
3) 原始频域残差信号经过频域残差分析和编码处理，得到低频残差信号编码和高频残差参数编码，并输出到传输信道或存储介质。
4) 在解码端，接收来自输出到传输信道或存储介质的低频残差信号编码和高频残差参数编码，并对其进行频域残差解码和重构处理，得到重构频域残差信号；
5) 重构频域残差信号经过频域感知逆滤波处理，得到重构频域信号；
6) 对重构频域信号进行时频反变换处理，得到音频重构时域信号。技术方案二
基于时域滤波和高频残差重构的音频编解码方法，包括如下步骤
Tl)在编码端，音频原始时域信号经过时域感知滤波处理，得到原始时域残差信号；T2)原始时域残差信号经过时频变换处理，得到原始频域残差信号； T3)原始频域残差信号经过频域残差分析和编码处理，得到低频残差信号编码和高频残差参数编码，并输出到传输信道或存储介质。
T4)在解码端，接收来自输出到传输信道或存储介质的低频残差信号编码和高频残差参数编码，并对其进行频域残差解码和重构处理，得到重构频域残差信号； T5)对重构频域残差信号进行时频逆变换处理，得到重构时域残差信号；
T6)将重构时域残差信号进行时域逆滤波处理，得到音频重构时域信号。
上述两种方案的音频编解码方法，其中所述的频域残差分析和编码处理，包括如下
步骤
(Al)按照等带宽频带、或临界频带、或频程频带频的带划分方法，先对原始频域
残差信号进行频带划分，然后根据音频编码器设定的编码速率选择一个频带划分端点，将原始频域残差信号分割成原始低频残差信号和原始高频残差信号两部分，使这两部分
各具有若干个频带；
(A2)对原始低频残差信号进行编码，得到低频残差信号编码输出；再对低频残差信号编码在编码端进行本地解码，得到解码低频残差信号；
(A3)根据解码低频残差信号与原始高频残差信号的相似性或相关性，对高频残差
参数进行分析，即选择一个频带匹配策略对解码低频残差信号和原始高频残差信号进行频带匹配，并计算最佳匹配的高频残差参数，得到包括频带划分方法、最佳匹配频带频
率位置、能量匹配因子、声道耦合参数和帧间扩展参数在内的原始高频残差参数； (A4)对原始高频残差参数进行编码，得到高频残差参数编码输出。上述两种方案的音频编解码方法，其中所述的频域残差解码和重构处理，包括如下步骤
(Cl)对接收到的低频残差信号编码进行解码，得到解码低频残差信号； (C2)对接收到的高频残差参数编码进行解码，得到解码高频残差参数； (C3)利用解码低频残差信号、解码高频残差参数中的最佳匹配频带频率位置和能量匹配因子，重构高频残差信号频带i^(《Q，/);
(C4)利用解码高频残差参数中的频带划分方法、声道耦合参数和帧间扩展参数，将得到的重构高频残差信号频带进行组合，得到重构高频残差信号；
(C5)利用解码高频残差参数中的频域残差高低频段分界频率，将解码低频残差信号与重构高频残差信号进行组合，得到重构频域残差信号。
上述两种方案的音频编解码方法，其中所述的频带匹配策略包括高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配、通过声道耦合进行高频残差信号匹配和通过帧间扩展进行高频残差信号匹配。
本发明由于充分考虑了频域残差信号频谱的白化特性和高频残差信号和低频残差信号之间的相关性和相似性，通过选择高频残差信号和低频残差信号的匹配策略，估算高频残差信号的重构参数，并用高频残差参数准确的重构高频残差信号，并以此为基础，实现音频信号的高效编码和解码，因而提高了音频信源编码的压縮比或编码效率，节省了传输音频信号所需传输带宽和节省存储音频信号所需存储容量，同时提高了音频压縮编码质量。

图1基于频域滤波的音频编解码方法流程图；图2基于时域滤波的音频编解码方法流程图；图3频域残差信号分析和编码方法流程图；图4频域残差信号解码和重构方法流程图；图5高低频频域残差信号及高频残差信号重构示意图；图6高频残差信号频带在低频残差信号区域进行匹配策略示意图；图7高频残差信号频带在低频残差信号区域及其扩展区域进行匹配策略示意图；图8通过声道耦合进行高频残差信号匹配策略示意图；图9通过帧间扩展进行高频残差信号匹配策略示意图。
具体实施方式
实施例一
本实施例提供一种音频编解码的方法，该方法是基于频域滤波和高频残差重构的音频编码方法。高频残差信号是频域残差信号的高频部分，高频残差信号的分析和重构是为了有效的压缩频域残差信号的数据量，提高音频信号编码和传输效率。高频残差信号的分析和重构是按照一定的规则将频域残差信号分成低频残差信号和高频残差信号两部分，利用高频残差信号与低频残差信号的相关性或相似性，提取高频残差重构所需要的参数，丢弃高频残差信号，然后用高频残差参数来重构高频残差信号，从而重构整个频域残差信号。
参照图1,本实施例的音频编解码步骤如下
步骤IOI，在编码端，音频原始时域信号经过时频变换处理，得到原始频域信号。音频原始时域信号是包括语音信号、音频信号或任何人耳可以听到的各种声音信号的混合声音;音频信号的频率范围主要在0Hz到20kHz之间，音频信号的釆样频率为 96kHz、 48kHz、 44. lkHz、 32kHz、 22. 05kHz、 16kHz、 11. 025kHz和8kH;音频信号的编码通常是以音频帧为单位，常用音频帧的大小按照实际应用一般在50毫秒之内。时域变换采用但不限于修正离散余弦变换、修正重叠变换和快速傅里叶变换方法进行变换。步骤102，原始频域信号经过频域感知滤波处理，得到原始频域残差信号。频域感知滤波器是反映人耳听觉特性的频域滤波器，它对来步骤101的频域信号进行频域滤波，得到在感知意义上白化了的频域残差信号，如果用/^(/)表示频域感知滤
波器的传输函数，用M(/)表示由感知参数表征的感知曲线，则M/CO可以表示为 1(/) = ^77，其中/表示频率，单位为Hz。步骤103，频域残差分析和编码。
参见3所示，频域残差分析和编码的具体步骤包括
步骤301，频带划分和高低频残差信号分割，即按照等带宽频带、或临界频带、或频程频带等方法，先对原始频域残差信号进行频带划分，然后根据音频编码器的编码速率选择其中一个划分频带的端点将原始频域残差信号分割成原始低频残差信号和原始高频残差信号两部分，使这两部分各具有若干个频带。
如图5所示，完整的频域残差信号用i 表示，为了有效地对频域残差信号进行分析、编码和重构，将频域残差信号按照等带宽频带、或临界频带、或频程频带等方法进行频带划分，把具有一定属性，如听觉特性的相邻频率分量划分到相同的频带中去。设/c,、
,,和>,分别为第/个频带的中心频率、低端边界频率和高端边界频率，6,为频带带宽，
选择某个频带的低端边界频率或高端边界频率为分界频率 > ，将频域残差信号在
频域内分割成低频残差信号&和高频残差信号^两部分,在0到/Z)之间就具有连续M
个低频残差信号频带，在A与々之间就具有连续A^个高频残差信号频带，高于频率/z
的高频残差信号频带中的信号为零。设/表示频率，单位为Hz、 /s表示采样频率，归
一化频率用/ = //々表示；如果用办表示时域音频信号的带宽，则》=々/々=0.5。
步骤302，对原始低频残差信号进行编码，得到低频残差信号编码输出。原始低频残差信号的编码，采用各种有失真的编码方法，如线性或非线性标量量化编码、矢量量化编码，或者同时采用各种无失真的编码方法，如Huffman编码和算术编码；
步骤303，对低频残差信号编码在编码端进行本地解码，得到解码低频残差信号和低频残差信号的编码；
步骤304，根据解码低频残差信号和原始高频残差信号的相似性或相关性，对高频残差参数进行分析，即选择一个频带匹配策略对解码低频残差信号与原始高频残差信号进行频带匹配，并计算最佳匹配的高频残差参数，得到原始高频残差参数。
如图5所示，频带匹配就是在低频残差信号内寻找与高频残差频带特性最接近的频带，目的是在解码端高质量地重构高频残差信号。频带匹配采用不同的频带匹配策略，所谓频带匹配策略是指如何在低频残差信号^中选择一段频域残差信号，并用它来重构高频残差信号i^中具有相同频带宽度的高频残差信号的方法。在图5中，因为频率/z
以上的残差信号已经归零，所以没有必要再对这部分残差进行重构。所述频带匹配策略包括但不限于以下几种 (Pl)高频残差信号频带在低频残差信号区域进行匹配
如图6所示，将处于/d与/z之间的M/个高频残差频带分别独立地在处于0到 >之
间的低频残差信号区域A进行匹配，寻找误差最小或相关性最大的最佳匹配频带。这时，频带划分方法、最佳匹配频带频率位置和能量匹配因子等即为高频残差重构参数。 (P2)高频残差信号频带在低频残差信号区域及其扩展区域进行匹配如图7所示，采用上述频带匹配策略(Pl)，先将处于/o与/z之间的频率最低的
高频残差信号频带i w在处于0到>之间的低频残差信号区域仏进行匹配，寻找误差最
小或相关性最大的最佳匹配频带，并用此最佳匹配频带来重构频率最低的高频残差信号频带i w ;再将这个重构的频率最低的高频残差信号频带i /n加入原来的低频残差信号 A，形成一个新组成的低频残差信号及"=^ +及沼；然后，以这个新组成的低频残差信号为基础，采用上述频带匹配策略(Pl)，继续重构更高频率的高频残差信号频带；依此类推，直至完成全部/o到/z之间的所有高频残差信号频带的匹配和重构。这时，频
带划分方法、最佳匹配频带频率位置、能量匹配因子和低频残差区域扩展参数即为高频残差重构参数。
(P3)通过声道耦合进行高频残差信号匹配如图8所示，设音频信源是具有C (C22)个主声道的多声道音频信源，比如5.1 声道音频就有5个主声道和一个低重音效声道，这时存在C个声道的低频残差信号。因为各声道的音频信号具有较大相关性，所以各声道的频域残差信号也具有较大相关性，因此任何一个声道不仅能够利用其所在声道的低频残差信号进行高频残差信号重构，而且还能够利用其它声道的低频残差信号进行高频残差信号重构；这样可以得到更多的匹配选择，提高高频残差信号重构质量。以第l声道为例给以说明，首先可以采用上述频带匹配策略(Pl)和(P2)，利用所在声道的处在0到/d之间的低频残差信号i i匹配和
重构处于/o与/z之间的高频残差信号。除此之外，还可以利用其它声道的处在0到/d之
间的低频残差信号仏匹配和重构第1声道内处于 >与/z之间的高频残差信号。与第1
声道一样，所有c个声道的频域残差信号多可以采用相同的方法进行处理。
(P4)通过帧间扩展进行高频残差信号匹配上述频带匹配策略(Pl)、 (P2)和(P3)所描述的高频残差信号的匹配策略是利用当前帧的低频残差信号重构当前帧的高频残差信号。因为相邻帧音频信号之间通常存在很大的相关性，所以相邻帧的残差也具有较大的相关性。因此，当前音频帧的高频残差信号，不仅可以用当前帧的低频残差信号进行重构，也可以用当前帧之前若干帧的包括重构低频残差信号和重构高频残差信号的重构残差信号进行重构。如图9所示，采用上述频带匹配策略(Pl)、 (P2)和(P3)的方法利用第y帧的低频残差信号对第y'帧的高
频残差信号进行重构，或采用上述频带匹配策略(Pl)、 (P2)和(P3)的方法利用第
帧的低频残差信号对第y帧的高频残差信号进行重构，还可以采用上述频带匹配策略
(Pl)、 (P2)和(P3)的方法利用第J-l帧的重构高频残差信号对第y帧的高频残差信
号进行重构。此外，这些方法还可以扩展到第y'-2帧、第_/-3帧去。
上述各种频带匹配策略都需要在低频残差信号和高频残差信号之间寻找最佳匹配频带，这里所说的最佳，可以用误差或失真最小来表达，也可以用相关性最大来表示。具体计算最佳匹配的高频残差参数的步骤包括
(Bl)计算归一化低频残差频带信号^(;7，/)和归一化高频残差频带信号^/(A/): 设进行匹配的高频残差信号和低频残差信号的频带宽度为Z个频点、化(p,/)， / = 0,1,..丄-1为低频残差信号频带、iM仏/)， / = 0,1,..丄-l为高频残差信号频带，其中户和《分别表示&(p，/)和i /^，/)所在频带的起始位置，； e
、《e[>,/z]，计算A(;7,/)和L(/7，/)，其中，^(/ ,/)表示i i(A/)， / = 0,1,..丄-1被其自身绝对值的最大值尥max(;7)进行归一化得到的归一化低频残差信号、^(p，/)表示勐(;7,/) ， / = 0,1，..丄-1被
其自身绝对值的最大值i H:nax(《)进行归一化得到的归一化高频残差信号。
(B2)计算匹配失真测度dO, )或匹配相关函数rO,《)，如果用失真最小来进行匹
配分析，则匹配的失真测度表示为
<formula>formula see original document page 12</formula> ( 1 )
其中w(A《)是频率影响因子，w(l^/(仏/)l)是残差幅度影响因子。如果<;^) = 1.0， w(|;L(《，/)|) = 1.0，那么式(14)可以简化为
<formula>formula see original document page 12</formula>( 2 )
如果用相关性最大进行匹配分析，归一化低频残差信号l(/7,/)和归一化高频残差信号的相关函数表示为
<formula>formula see original document page 12</formula> ( 3 )
同样，W(/7,《)表示频率影响因子，W(l^/(g，/)l)表示残差幅度影响因子。如果 WO，？) = 1.0， W(|^r,/)|) = 1.0，那么式(16)可以简化为
<formula>formula see original document page 12</formula>
(B3)确定最佳频带匹配位置p。和《。，该最佳匹配就是失真测度d(p，《)的最小值或相关函数r(A《)的最大值所对应的和《的最佳值p。和《。，它们确定了高频残差与低频
残差所匹配的频带。
(B4)利用如下公式计算最佳能量匹配因子
<formula>formula see original document page 12</formula>(5)
这样，步骤304所得到的频带划分结果、最佳匹配频带频率位置、频域残差高低频段分界频率/D、能量匹配因子、声道耦合参数和帧间扩展参数，就是原始高频残差参数。步骤305，高频残差参数编码。
对步骤304产生的原始高频残差参数进行编码，得到高频残差信号编码输出。原始高频残差参数的编码，采用各种有失真的编码方法，如线性或非线性标量量化编码、矢量量化编码，或者同时采用各种无失真的编码方法，如Huffman编码和算术编码。
步骤104，频域残差解码和重构。
在解码端，接收到的低频残差信号编码和高频残差参数编码经过频域残差解码和重
构处理，得到重构频域残差信号，如图4所示。具体步骤包括
步骤401，对接收到的低频残差信号编码进行解码，得到解码低频残差信号。步骤402，对接收到的高频残差参数编码进行解码，得到解码高频残差参数，该解
码高频残差参数包括频带划分结果、频域残差高低频段分界频率/D 、最佳匹配频带频率
位置、能量匹配因子、声道耦合参数和帧间扩展参数。步骤403，高频残差信号重构。
根据解码高频残差参数，利用解码低频残差信号复制和重构高频残差信号，具体步骤包括
(Dl)根据步骤401和402得到的解码低频残差信号、最佳匹配频带频率位置和能量匹配因子，用下式进行高频残差信号复制和能量匹配
^(《o，/) = Gfl(>, —， / = 0,1"丄一1 (6)
得到重构高频残差信号频带i^(《。，/);
(D2)根据步骤401和402得到的频带划分结果、声道耦合参数和帧间扩展参数，将所有重构高频残差信号频带进行组合，得到重构高频残差信号。
步骤404，根据解码得到的频域残差高低频段分界频率/b，将解码低频残差信号与
重构高频残差信号进行组合，得到重构频域残差信号。
步骤105，重构频域残差信号经过频域逆滤波处理，得到重构频域信号；如果用
// (/)表示频域感知逆滤波器，则表示为// (/) = = M(/)，其中/表示频
率，单位为Hz。
步骤106，对重构频域信号进行时频反变换处理，得到音频重构时域信号。与时频变换相对应，时域反变换采用反向修正离散余弦变换、反向修正重叠反变换或反向快速傅里叶变换方法。实施例二
本实施例提供一种基于时域滤波和高频残差重构的音频编解码方法。参见图2，该方法步骤如下
步骤201，在编码端，音频原始时域信号经过时域感知滤波处理，得到原始时域残差信号。其中，时域感知滤波器是反映人耳听觉特性的时域滤波器，它对音频原始时域信号进行时域滤波，得到在感知意义上白化了的时域残差信号；时域感知滤波器的传输函数用//m(力表示，时域感知滤波器采用但不限于线性预测滤波器。
步骤202，原始时域残差信号经过时频变换处理，得到原始频域残差信号，其中，时域变换采用但不限于修正离散余弦变换、修正重叠变换和快速傅里叶变换方法进行变换。
步骤203，频域残差分析和编码。
参见3所示，频域残差分析和编码的具体步骤包括
步骤301，频带划分和高低频残差信号分割，即按照等带宽频带、或临界频带、或
频程频带等方法，先对原始频域残差信号进行频带划分，然后根据音频编码器的编码速率选择其中一个划分频带的端点将原始频域残差信号分割成原始低频残差信号和原始高频残差信号两部分，使这两部分各具有若干个频带。
如图5所示，完整的频域残差信号用i 表示，为了有效地对频域残差信号进行分析、
编码和重构，将频域残差信号按照等带宽频带、或临界频带、或频程频带等方法进行频
带划分，把具有一定属性，如听觉特性的相邻频率分量划分到相同的频带中去。设/c,、
/"和// 分别为第/个频带的中心频率、低端边界频率和高端边界频率，6,为频带带宽，选择某个频带的低端边界频率A或高端边界频率为分界频率> ，将频域残差信号在
频域内分割成低频残差信号1和高频残差信号i h两部分，在0到之间就具有连续个低频残差信号频带，在/z)与/z之间就具有连续i^个高频残差信号频带，高于频率/z 的高频残差信号频带中的信号为零。设/表示频率，单位为Hz、 /s表示采样频率，归一化频率用/ = //>表示；如果用/s表示时域音频信号的带宽，则》=>/々=0.5。
步骤302，对原始低频残差信号进行编码，得到低频残差信号编码输出。原始低频残差信号的编码，采用各种有失真的编码方法，如线性或非线性标量量化编码、矢量量化编码，或者同时采用各种无失真的编码方法，如Huffman编码和算术编码；
步骤303，对低频残差信号编码在编码端进行本地解码，得到解码低频残差信号和低频残差信号的编码；
步骤304，根据解码低频残差信号和原始高频残差信号的相似性或相关性，对高频残差参数进行分析，即选择一个频带匹配策略对解码低频残差信号与原始高频残差信号进行频带匹配，并计算最佳匹配的高频残差参数，得到原始高频残差参数。
如图5所示，频带匹配就是在低频残差信号内寻找与高频残差频带特性最接近的频带，目的是在解码端高质量地重构高频残差信号。频带匹配采用不同的频带匹配策略，所谓频带匹配策略是指如何在低频残差信号^中选择一段频域残差信号，并用它来重构高频残差信号i //中具有相同频带宽度的高频残差信号的方法。在图5中，因为频率
以上的残差信号己经归零，所以没有必要再对这部分残差进行重构。所述频带匹配策略包括但不限于以下几种 (Pl)高频残差信号频带在低频残差信号区域进行匹配
如图6所示，将处于/D与々之间的7Vw个高频残差频带分别独立地在处于0到 >之
间的低频残差信号区域i i进行匹配，寻找误差最小或相关性最大的最佳匹配频带。这时，频带划分方法、最佳匹配频带频率位置和能量匹配因子等即为高频残差重构参数。 (P2)高频残差信号频带在低频残差信号区域及其扩展区域进行匹配如图7所示，采用上述频带匹配策略(Pl)，先将处于/o与々之间的频率最低的
高频残差信号频带及/n在处于0到 > 之间的低频残差信号区域&进行匹配，寻找误差最
小或相关性最大的最佳匹配频带，并用此最佳匹配频带来重构频率最低的高频残差信号频带及m;再将这个重构的频率最低的高频残差信号频带i /n加入原来的低频残差信号 &，形成一个新组成的低频残差信号^Fi^ + i /n;然后，以这个新组成的低频残差信号为基础，采用上述频带匹配策略(Pl)，继续重构更高频率的高频残差信号频带；依此类推，直至完成全部/o到/z之间的所有高频残差信号频带的匹配和重构。这时，频
带划分方法、最佳匹配频带频率位置、能量匹配因子和低频残差区域扩展参数即为高频残差重构参数。
(P3)通过声道耦合进行高频残差信号匹配如图8所示，设音频信源是具有C (C22)个主声道的多声道音频信源，比如5.1 声道音频就有5个主声道和一个低重音效声道，这时存在C个声道的低频残差信号。因为各声道的音频信号具有较大相关性，所以各声道的频域残差信号也具有较大相关性，因此任何一个声道不仅能够利用其所在声道的低频残差信号进行高频残差信号重构，而且还能够利用其它声道的低频残差信号进行高频残差信号重构；这样可以得到更多的匹配选择，提高高频残差信号重构质量。以第l声道为例给以说明，首先可以采用上述频带匹配策略(Pl)和(P2)，利用所在声道的处在0到/o之间的低频残差信号&匹配和
重构处于/D与/z之间的高频残差信号。除此之外，还可以利用其它声道的处在0到>之
间的低频残差信号A匹配和重构第1声道内处于/d与々之间的高频残差信号。与第1
声道一样，所有c个声道的频域残差信号多可以采用相同的方法进行处理。
(P4)通过帧间扩展进行高频残差信号匹配上述频带匹配策略(Pl)、 (P2)和(P3)所描述的高频残差信号的匹配策略是利用当前帧的低频残差信号重构当前帧的高频残差信号。因为相邻帧音频信号之间通常存在很大的相关性，所以相邻帧的残差也具有较大的相关性。因此，当前音频帧的高频残差信号，不仅可以用当前帧的低频残差信号进行重构，也可以用当前帧之前若干帧的包括重构低频残差信号和重构高频残差信号的重构残差信号进行重构。如图9所示，采用上述频带匹配策略(Pl)、 (P2)和(P3)的方法利用第y帧的低频残差信号对第j'帧的高
频残差信号进行重构，或釆用上述频带匹配策略(Pl)、 (P2)和(P3)的方法利用第/-1 帧的低频残差信号对第_/帧的高频残差信号进行重构，还可以采用上述频带匹配策略 (Pl)、 (P2)和(P3)的方法利用第y-l帧的重构高频残差信号对第y帧的高频残差信号进行重构。此外，这些方法还可以扩展到第7-2帧、第/-3帧去。
上述各种频带匹配策略都需要在低频残差信号和高频残差信号之间寻找最佳匹配频带，这里所说的最佳，可以用误差或失真最小来表达，也可以用相关性最大来表示。具体计算最佳匹配的高频残差参数的步骤包括
(Bl)计算归一化低频残差频带信号^(^/)和归一化高频残差频带信号^/(p，/): 设进行匹配的高频残差信号和低频残差信号的频带宽度为i个频点、 / = 0,1，...￡-l为低频残差信号频带、h(仏/), / = 0,1，..丄-l为高频残差信号频带，其中p 和《分别表示i i(A/)和i /^,/)所在频带的起始位置，；^
、？0,/z]，计算i i(/7,/)和^Kp，/)，其中，A(p，/)表示^(A/)， / = 0,1,..丄-1被其自身绝对值的最大值
J imaxO)进行归一化得到的归一化低频残差信号、^/(; ,/)表示i^0,/) ， / = 0,1,..丄-1被其自身绝对值的最大值i^max(《)进行归一化得到的归一化高频残差信号。
(b2)计算匹配失真测度^Q ,《)或匹配相关函数KA《)，如果用失真最小来进行匹
配分析，则匹配的失真测度表示为
/=丄_1 八八
，《)=vKm)- Z w(i鲍/)i).(/ 々，/)-:^,/》2 (i)
/=0
其中w(p,g)是频率影响因子，w(l^/(仏/)l)是残差幅度影响因子。如果wO,^^1.0，
w(|^/(《,/)|) = 1.0，那么式(14)可以简化为
，《)=S /) -/))2 ( 2 )
/-0
如果用相关性最大进行匹配分析，归一化低频残差信号^o ，/)和归一化高频残差信
号》h(p,/)的相关函数表示为
r(a g) = w(a《)■ 'S w(| L(仏/) I) (3i(p, /). h(《，/》 (3 )
同样，wO,《)表示频率影响因子，w(l^f(仏/)l)表示残差幅度影响因子。如果 w(m) = 1.0， w(|",/)|) = 1.0，那么式(16)可以简化为
KA《)=2]仏O， O及h(q， /) (4 )
/=o
(b3)确定最佳频带匹配位置p。和^，该最佳匹配就是失真测度d(/7,《)的最小值或
相关函数KP,《)的最大值所对应的P和《的最佳值户和《。，它们确定了高频残差与低频
残差所匹配的频带。
(b4)利用如下公式计算最佳能量匹配因子
GwO,—= ^-^ (5)
这样，步骤304所得到的频带划分结果、最佳匹配频带频率位置、频域残差高低频段分界频率/d、能量匹配因子、声道耦合参数和帧间扩展参数，就是原始高频残差参数。步骤305，高频残差参数编码。
对步骤304产生的原始高频残差参数进行编码，得到高频残差信号编码输出。原始高频残差参数的编码，采用各种有失真的编码方法，如线性或非线性标量量化编码、矢量量化编码，或者同时釆用各种无失真的编码方法，如Huffman编码和算术编码。
步骤204，频域残差解码和重构。
在解码端，接收到的低频残差信号编码和高频残差参数编码经过频域残差解码和重
构处理，得到重构频域残差信号，如图4所示。具体步骤包括
步骤401，对接收到的低频残差信号编码进行解码，得到解码低频残差信号。步骤402，对接收到的高频残差参数编码进行解码，得到解码高频残差参数，该解
码高频残差参数包括频带划分结果、频域残差高低频段分界频率>、最佳匹配频带频率
位置、能量匹配因子、声道耦合参数和帧间扩展参数。步骤403，高频残差信号重构。
根据解码高频残差参数，利用解码低频残差信号复制和重构高频残差信号，具体步骤包括
(Dl)根据步骤401和402得到的解码低频残差信号、最佳匹配频带频率位置和能量匹配因子，用下式进行高频残差信号复制和能量匹配
i /K《0,/) = G (/70，^))-Wi(po，/)，/ = 0，1,—丄一1 (6)
得到重构高频残差信号频带及h(W,/);
(D2)根据步骤401和402得到的频带划分结果、声道耦合参数和帧间扩展参数，将所有重构高频残差信号频带进行组合，得到重构高频残差信号。
步骤404，根据解码得到的频域残差高低频段分界频率>，将解码低频残差信号与
重构高频残差信号进行组合，得到重构频域残差信号。
步骤205，重构频域残差信号经过时频反变换处理，得到重构时域残差信号；与时频变换相对应，时域反变换采用反向修正离散余弦变换、反向修正重叠反变换或反向快速傅里叶变换方法。
步骤206，对重构时域残差信号进行时域感知逆滤波处理，得到音频重构时域信号输出；如果用压(z)表示时域感知逆滤波器，则压(/)可以表示为払(力=^^。本发明上述实施例提供的音频编码方法和解码方法，能够对包括语音信号在内的音频信号进行高效高质量的压縮编码，提高音频传效率。
以上实施例只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式
及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。
权利要求
1. 一种基于频域滤波和高频残差重构的音频编解码方法，包括如下步骤1)在编码端，音频原始时域信号经过时频变换处理，得到原始频域信号；2)原始频域信号经过频域感知滤波处理，得到原始频域残差信号；3)原始频域残差信号经过频域残差分析和编码处理，得到低频残差信号编码和高频残差参数编码，并输出到传输信道或存储介质。4)在解码端，接收来自输出到传输信道或存储介质的低频残差信号编码和高频残差参数编码，并对其进行频域残差解码和重构处理，得到重构频域残差信号；5)重构频域残差信号经过频域感知逆滤波处理，得到重构频域信号；6)对重构频域信号进行时频反变换处理，得到音频重构时域信号。
2. 根据权利要求1所述的音频信号编解码方法，其中步骤3)所述的频域残差分析和编码处理，包括如下步骤(Al)按照等带宽频带、或临界频带、或频程频带的频带划分方法，先对原始频域残差信号进行频带划分，然后根据音频编码器设定的编码速率选择一个频带划分端点，将原始频域残差信号分割成原始低频残差信号和原始高频残差信号两部分，使这两部分各具有若干个频带；(A2)对原始低频残差信号进行编码，得到低频残差信号编码输出；再对低频残差信号编码在编码端进行本地解码，得到解码低频残差信号；(A3)根据解码低频残差信号与原始高频残差信号的相似性或相关性，对高频残差参数进行分析，即选择一个频带匹配策略对解码低频残差信号和原始高频残差信号进行频带匹配，并计算最佳匹配的高频残差参数，得到包括频带划分结果、频域残差高低频段分界频率、最佳匹配频带频率位置、能量匹配因子、声道耦合参数和帧间扩展参数在内的原始高频残差参数；(A4)对原始高频残差参数进行编码，得到高频残差参数编码输出。
3. 根据权利要求2所述的音频信号编解码方法，其中步骤(A3)所述的频带匹配策略包括高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配、通过声道耦合进行高频残差信号匹配和通过帧间扩展进行高频残差信号匹配。
4. 根据权利要求3所述的音频信号编解码方法，其中所述的高频残差信号频带在低频残差信号区域进行匹配，是用各个高频残差信号频带在低频残差信号区域进行匹配，寻找误差最小或相关性最大的最佳匹配频带。
5. 根据权利要求3所述的音频信号编解码方法，其中所述的高频残差信号频带在低频残差信号区域及其扩展区域进行匹配，是先将频率最低的高频残差信号频带在低频残差信号区域进行匹配，寻找误差最小或相关性最大的最佳匹配频带，并用此最佳匹配频带重构频率最低的高频残差信号频带；再将这个重构的频率最低的高频残差信号频带加入原来的低频残差信号，形成一个新组成的低频残差信号；然后以这个新组成的低频残差信号为基础，对更高频率的高频残差信号频带进行匹配，直至完成所有高频残差信号频带的匹配。
6. 根据权利要求3所述的音频信号编解码方法，其中所述的通过声道耦合进行高频残差信号匹配，是指多声道音频信号情况下，任意一个声道的高频残差信号频带采用高频残差信号频带在低频残差信号区域进行匹配或高频残差信号频带在低频残差信号区域及其扩展区域进行匹配，利用所在声道的低频残差信号对所在声道的高频残差信号进行匹配，并采用高频残差信号频带在低频残差信号区域进行匹配或高频残差信号频带在低频残差信号区域及其扩展区域进行匹配，利用其它声道的低频残差信号对所在声道的高频残差信号进行匹配。
7. 根据权利要求3所述的音频信号编解码方法，其中所述的通过帧间扩展进行高频残差信号匹配，是指当前帧的高频残差信号频带采用高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配或通过声道耦合进行高频残差信号匹配，利用当前帧的低频残差信号对当前帧的高频残差信号进行匹配，并采用高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配或通过声道耦合进行高频残差信号匹配，利用前一帧或前若干帧的重构频域残差信号，包括重构低频残差信号和重构高频残差信号，对当前帧的高频残差信号进行匹配。
8. 根据权利要求2所述的音频信号编解码方法，其中步骤(A3)所述的计算最佳匹配的高频残差参数，包括如下步骤-(Bl)在pe
、《e[A/z]范围，计算归一化低频残差频带信号^(AO和归一化高频残差频带信号》h(/ ，/)，其中，/7和9分别表示和所在频带的起始位置， >为低频残差信号和高频残差信号分界频率，/为频带内频点指针。 (B2)在户e
、 ^[>,別范围，计算匹配失真测度c/(/^)或匹配相关函(B3)在;^
、《e[/z),/z]范围，将失真测度d(;7,^)的最小值或相关函数 r(p,9)的最大值所对应的p和g的取值/7。和《。为最佳频带匹配位置； (B4)计算最佳能量匹配因子C^07。,^)。
9.根据权利要求1所述的音频信号编解码方法，其中步骤4)所述的频域残差解码和重构处理，包括如下步骤(Cl)对接收到的低频残差信号编码进行解码，得到解码低频残差信号； (C2)对接收到的高频残差参数编码进行解码，得到解码高频残差参数；(C3)利用解码低频残差信号、解码高频残差参数中的最佳匹配频带频率位置和能量匹配因子，重构高频残差信号频带i /z(《。,/);(C4)利用解码高频残差参数中的频带划分方法、声道耦合参数和帧间扩展参数，将得到的重构高频残差信号频带进行组合，得到重构高频残差信号；(C5)利用解码高频残差参数中的频域残差高低频段分界频率，将解码低频残差信号与重构高频残差信号进行组合，得到重构频域残差信号。
10. —种基于时域滤波和高频残差重构的音频编解码方法，包括如下步骤Tl)在编码端，音频原始时域信号经过时域感知滤波处理，得到原始时域残差信号；T2)原始时域残差信号经过时频变换处理，得到原始频域残差信号；T3)原始频域残差信号经过频域残差分析和编码处理，得到低频残差信号编码和高频残差参数编码，并输出到传输信道或存储介质。T4)在解码端，接收来自输出到传输信道或存储介质的低频残差信号编码和高频残差参数编码，并对其进行频域残差解码和重构处理，得到重构频域残差信号； T5)对重构频域残差信号进行时频逆变换处理，得到重构时域残差信号； T6)将重构时域残差信号进行时域逆滤波处理，得到音频重构时域信号。
全文摘要
本发明公开了一种音频编解码方法，主要解决目前音频编码方法压缩比低、重构音频质量差的问题。采用时频变换与频域滤波方法或时域滤波与时频变换方法，分析音频信号，得到频域残差信号；将频域残差信号分割成低频和高频残差信号，分别对低频残差信号进行直接编码和对高频残差进行参数编码；然后用解码低频残差信号和解码高频残差重构高频残差信号；再将解码低频残差信号与重构高频残差信号重组得到重构频域残差信号；最后采用频域逆滤波与时频反变换的方法或时频反变换与时域逆滤波的方法，得到重构音频信号。本发明消除了频域残差信号中的多余度，提高了音频编码的压缩比、信道利用率和音频传输质量，用于多媒体通信和消费类电子设备。
文档编号G10L19/00GK101436407SQ200810232760
公开日2009年5月20日申请日期2008年12月22日优先权日2008年12月22日
发明者吴礼仲, 徐雅俊, 静熊, 郭小川, 马鸿飞申请人:西安电子科技大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马鸿飞;郭小川;熊静;徐雅俊;吴礼仲
技术所有人：西安电子科技大学
我是此专利的发明人