谐波音频信号的变换编码/解码的制造方法与工艺

文档序号:11412599阅读:247来源:国知局
谐波音频信号的变换编码/解码的制造方法与工艺
本发明所提出的技术涉及音频信号(特别是谐波音频信号)的变换编码/解码。

背景技术:
变换编码是用于压缩和发送音频信号的主要技术。变换编码的概念是首先将信号变换到频域,然后量化并发送变换系数。解码器使用所接收的变换系数通过应用逆频率变换来重构信号波形,见图1。在图1中,将音频信号X(n)转发到频率变换器10。将所得到的频率变换Y(k)转发到变换编码器12,并将已编码的变换发送到解码器,变换解码器14对该已编码的变换进行解码。将已解码的变换Y(k)转发到逆频率变换器16,逆频率变换器16将其变换为已解码的音频信号此方案背后的动机是,因为以下原因,可以更高效地量化频域系数:1)变换系数(图1中的Y(k))比输入信号采样(图1中的X(n))更非相关。2)频率变换提供能量压缩(更多的系数Y(k)接近于零并可以被忽略),以及3)变换背后的主观动机是人的听觉系统在变换域上工作,在该域上更易于选择感官上重要的信号成分。在典型的变换编解码器中,使用修正离散余弦变换(MDCT)来逐块地(有50%重合)对信号波形进行变换。在MDCT类型变换编解码器中,将块信号波形X(n)变换为MDCT矢量Y(k)。波形块的长度对应于20-40ms音频段。如果长度用2L表示,则MDCT变换可以定义为:其中k=0,...,L-1。然后,MDCT矢量Y(k)被分为多个频带(子矢量),并且每个频带中的能量(或增益)计算为:其中,mj是频带j中的第一系数,Nj指代对应频带中MDCT系数的数量(典型范围包含8-32个系数)。作为均匀频带结构的示例,对所有j设Nj=8,则G(0)可以是前8个系数的能量,G(1)可以是下8个系数的能量,以此类推。这些能量值或增益给出已量化的谱包络的近似,并将量化索引发送给解码器。通过利用对应包络增益缩放MDCT子矢量来获得残余子矢量或形状,例如对每个频带中的残余进行缩放以具有单位均方根(RMS)能量。然后,基于对应的包络增益,利用不同数量的比特来量化残余子矢量或形状。最终,在解码器处,通过利用对应包络增益缩放残余子矢量或形状来重构MDCT矢量,并使用逆MDCT来重构时域音频帧。传统变换编码概念对非常谐波的音频信号(例如单一乐器)不太有效。在图2中示出了这种谐波谱的示例(为了比较,在图3中示出了不具有过量谐波的典型音频谱)。原因是,利用谱包络的归一化不会导致足够“平”的残余矢量,并且残余编码方案不会产生可接受质量的音频信号。这种信号和编码模型之间的不匹配仅可以以非常高比特率解决,但在大多数情况下,此方案是不合适的。

技术实现要素:
所提出的技术的目的是更合适于谐波音频信号的变换编码/解码方案。所提出的技术涉及一种对谐波音频信号的频率变换系数进行编码的方法,所述方法包括以下步骤:对具有超过预定频率相关阈值的幅度的谱峰进行定位;对包括已定位的波峰并在已定位的波峰周围的峰域进行编码;对在所述峰域之外并在交越频率以下的系数的至少一个低频集合进行编码,该交越频率取决于用于对所述峰域进行编码的比特数;对所述峰域之外的尚未编码系数的至少一个高频集合的噪声基底增益进行编码。所提出的技术还涉及一种用于对谐波音频信号的频率变换系数进行编码的编码器,所述编码器包括:波峰定位器,被配置为:对具有超过预定频率相关阈值的幅度的谱峰进行定位;峰域编码器,被配置为:对包括已定位的波峰和在已定位的波峰周围的峰域进行编码;低频集合编码器,被配置为:对在所述峰域之外并在交越频率以下的系数的至少一个低频集合进行编码,所述交越频率取决于用于对所述峰域进行编码的比特数;噪声基底增益编码器,被配置为:对所述峰域之外的尚未编码的系数的至少一个高频集合的噪声基底增益进行编码。所提出的技术还涉及一种包括这种编码器的用户设备(UE)。所提出的技术涉及一种用于对已编码的频率变换谐波音频信号的频率变换系数进行重构的方法,所述方法包括以下步骤:对已编码的频率变换谐波音频信号的谱峰域进行解码;对系数的至少一个低频集合进行解码;对所述峰域之外的每个低频集合的系数进行分配;对所述峰域之外的系数的至少一个高频集合的噪声基底增益进行解码;用具有所述对应噪声基底增益的噪声来填充每个高频集合。所提出的技术还涉及一种用于对已编码的频率变换谐波音频信号的频率变换系数进行重构的解码器,所述解码器包括:峰域解码器,被配置为:对所述已编码的频率变换谐波音频信号的谱峰域进行解码;低频集合解码器,被配置为:对系数的至少一个低频集合进行解码;系数分配器,被配置为:对所述峰域之外的每个低频集合的系数进行分配;噪声基底增益解码器,被配置为:对所述峰域之外的系数的至少一个高频集合的噪声基底增益进行解码;噪声填充器,被配置为:用具有所述对应噪声基底增益的噪声来填充每个高频集合。所提出的技术还涉及一种包括这种编码器的用户设备(UE)。所提出的谐波音频编码/解码方案为大类别的谐波音频信号提供了比传统编码方案更好的感官质量。附图说明可以通过参考以下说明书连同附图最佳地理解本技术及其其他目的和优点,在附图中:图1示出了频率变换编码概念;图2示出了谐波音频信号的典型谱;图3示出了非谐波音频信号的典型谱;图4示出了峰域;图5是示出了所提出的编码方法的流程图;图6A-D是示出了所提出的编码方法的示例实施例;图7是所提出的编码器的示例实施例的框图;图8是所提出的解码方法的流程图;图9A-C示出了所提出的解码方法的示例实施例;图10是所提出的解码器的示例实施例的框图;图11是所提出的编码器的示例实施例的框图;图12是所提出的解码器的示例实施例的框图;图13是包括所提出的编码器的UE的示例实施例的框图;图14是包括所提出的解码器的UE的示例实施例的框图;图15是所提出的编码方法的一部分的示例实施例的流程图;图16是所提出的编码器中峰域编码器的示例实施例的框图;图17是所提出的解码方法的一部分的示例实施例的流程图;图18是所提出的解码器中峰域解码器的示例实施例的框图。具体实施方式图2示出了谐波音频信号的典型谱,图3示出了非谐波音频信号的典型谱。谐波信号的谱是通过由非常弱的频带分离的强谱峰形成的,而非谐波信号的谱更平滑。所提出的技术提供更好地处理谐波音频信号的备选音频编码模型。主要概念是频率变换矢量(例如MDCT矢量)未分为包络和残余部分,而是一起直接提取和量化谱峰以及相邻MDCT频段(bin)。在高频处,不对相邻波峰之外的低能量系数进行编解码(coded),而是在解码器处进行噪声填充。这里,在传统编码中使用的信号模型,{谱包络+残余}被替换为新模型{谱峰+噪声基底}。在低频处,仍对相邻波峰之外的系数进行编解码,因为它们具有重要的感官作用。编码器编码器侧的主要步骤是:●对谱峰域进行定位和编码●对低频(LF)谱系数进行编码。已编码区域的大小取决于在峰域编码之后剩余的比特的数量。●对峰域之外的谱系数的噪声基底增益进行编码首先估计噪声基底,然后通过波峰采选算法(在附录I-II中更详细地描述了对应的算法)提取谱峰。在波峰位置,将每个波峰及其周围的4个相邻波峰归一化为单位能量,参见图4。换言之,对整个区域进行缩放使得波峰具有幅度一。对波峰位置、增益(表示波峰幅度、量值)和符号进行量化。将矢量量化器(VQ)应用于波峰周围的MDCT频段,并搜索提供最佳匹配的码本矢量的索引Ishape。对波峰位置、增益和符号以及周围形状矢量进行量化,并将量化索引{IpositionIgainIsignIshape}发送到解码器。除了这些索引之外,还向解码器通知波峰的总数。在以上示例中,每个峰域包括对称地处于波峰周围的4个相邻波峰。然而,以对称或非对称方式在波峰周围具有更少更多相邻波峰也是切实可行的。在对峰域进行量化之后,使用所有可用的剩余比特(除了为噪声基底编码保留的比特之外,见下文)来对低频MDCT系数进行量化。这是通过将剩余的未量化的MDCT系数分组到例如从第一频段起的24维频带中来完成。因此,这些频带将覆盖最低频直至特定交越频率。不包括在波峰编码中已经量化的系数,因此频带不一定由24个连续系数组成。因此,以下还将频带称为“集合”。LF频带或集合的总数取决于可用比特的数量,但总是保留了足够的比特用于创建至少一个集合。当更多比特可用时,为第一集合分配更多比特,直到达到每个集合的最大比特数的阈值。如果存在更多可用比特,则创建另一集合并向该集合分配比特直到达到阈值。重复此过程直到分配完所有可用比特。这意味着此过程停止的交越(crossover)频率将取决于帧,因为波峰的数量随着帧而改变。交越频率将由已经对峰域进行编码时对LF编码可用的比特的数量来确定。可用利用任意合适的矢量量化方案完成LF集合的量化,但通常使用某种类型的增益形状编码。例如,可将阶乘脉冲编码用于波形矢量,并可将标量量化器用于增益。总是保留特定数量的比特用于对峰域之外的系数的至少一个高频频带和LF频带的上边频以上的噪声基底增益进行编码。优选地,将两个增益用于此目的。可用从附录I中描述的噪声基底算法获得这些增益。如果将阶乘脉冲编码用于对低频频带的编码,则可以不对某些LF系数进行编码。作为替代,将这些系数包括在高频频带编码中。因为在LF频带的情况下,HF频带不必须由连续系数组成。因此,以下频带也将被称为“集合”。如果合适的话,还可以编码并发送针对带宽扩展(BWE)区域的谱包络。频带的数量(以及BWE起始的过渡频率)是取决于比特率的,例如在24kbps时是5.6kHz,在32kbps时是6.4kHz。图5是示出了从通常角度看的所提出的编码方法的流程图。步骤S1定位具有超过预定频率相关阈值的幅度的谱峰。步骤S2对包括已定位的波峰和在已定位的波峰周围的峰域进行编码。步骤S3对在峰域之外并在交越频率以下的至少一个低频集合的系数进行编码,该交越频率取决于用于对峰域进行编码的比特数。步骤S4对峰域之外的尚未编码(仍未编码或剩余)系数的至少一个高频集合的噪声基底增益进行编码。图6A-D示出了所提出的编码方法的示例实施例。图6A示出了要编码的信号帧的MDCT变换。在图中有比实际信号更少的系数。然而,应当记住,附图的目的仅是用于阐述编码过程。图6B示出了准备用于增益形状编码的4个已标识的峰域。附录II中描述的方法可以用于找到它们。然后在图6C中收集峰域之外的LF系数。这些LF系数被连接到已经增益形状编码的块中。图6A中原始信号的剩余系数是图6D中所示的高频系数。它们被分为2个集合并针对每个集合通过噪声基底增益进行编码(编码为已连接的块)。该噪声基底增益可以根据每个集合的能量获得,或通过从附录I中描述的噪声基底估计算法获得的估计获得。图7是所提出的编码器20的示例实施例的框图。波峰定位器22被配置为对具有超过预定频率相关阈值的幅度的谱峰进行定位。峰域编码器24被配置为对包括和在所提取的波峰周围的峰域进行编码。低频集合编码器26被配置为对在峰域之外并在交越频率以下的系数的至少一个低频集合进行编码,该交越频率取决于用于对波形区域进行编码的比特数。噪声基底增益编码器28被配置为:对峰域之外的尚未编码系数的至少一个高频集合的噪声基底增益进行编码。在本实施例中,编码器24、26、28使用所检测的波峰位置来决定在各自编码中要包括哪些系数。解码器解码器中的主要步骤是:●重构谱峰区域●重构LF谱系数...
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1