音频信号的频谱的频谱系数的编码的制作方法_3

文档序号:9932714阅读:来源:国知局
器106相应地仅执行其逆变换。频谱系数编码器10可W被配置为无损地对输入频谱20进行 编码。与之相比,频谱计算器102可能由于量化而引入编码损耗。
[0056] 为了对量化噪声进行频谱成形,可W如图Ila所示的实现频谱计算器102。运里,频 谱12是使用比例因子频谱成形的。具体地,根据图Ila,频谱计算器102包括级联的变换器 108和频谱成形器110,其中变换器108使输入音频信号18经历频谱分解变换W获得音频信 号18的未成形的频谱112,其中频谱成形器110使用从频谱计算器102的比例因子确定器116 获得的比例因子114对该未成形的频谱112进行频谱成形,W获得频谱12,最后由频谱系数 编码器10对频谱12进行编码。例如,频谱成形器110针对来自比例因子确定器116的每一个 比例因子频带获得一个比例因子114,并且将相应比例因子频带的每一个频谱系数除W与 相应比例因子频带相关联的比例因子W接收频谱12。比例因子确定器116可W由感知模型 来驱动,W基于音频信号1如角定比例因子。备选地,比例因子确定器116可W基于线性预测 分析来确定比例因子,使得比例因子表示取决于由线性预测系数信息定义的线性预测合成 滤波器的传递函数。线性预测系数信息118与频谱20的频谱系数一起由编码器10编码到数 据流30中。为了完整起见,图Ila将量化器120示出为位于频谱成形器110的下游W使用量化 的频谱系数获得频谱12,然后量化的频谱系数由频谱系数编码器10无损编码。
[0057] 图Ub示出了与图IOa的编码器相对应的解码器。运里,频谱到时域计算器106包括 比例因子确定器122,比例因子确定器122基于包含在数据流30中的线性预测系数信息118 来重构比例因子118,使得比例因子表示取决于由线性预测系数信息118定义的线性预测合 成滤波器的传递函数。频谱成形器根据比例因子114对由解码器40根据数据流30解码的频 谱12进行频谱成形,即,频谱成形器124使用相应比例因子频带的比例因子对每一个频带内 的比例因子进行缩放。因此,在频谱成形器124的输出端处,产生音频信号18的未成形频谱 112的重构,并且如在图Ilb中通过虚线所示,通过逆变换器126的方式对频谱112进行逆变 换W在时域中重构音频信号18是可选的。
[0058] 图12a示出了在使用基于线性预测的频谱成形的情况下图Ila的基于变换的音频 编码器的更详细的实施例。除了图Ila中所示的组件之外,图12a的编码器还包括预加强滤 波器128,预加强滤波器128被配置为首先使输入音频信号18经历预加强滤波。预加强滤波 器128可W例如被实现为FIR滤波器。预加强滤波器128的传递函数可W例如表示高通传递 函数。根据实施例,预加强滤波器128被实现为n阶高通滤波器,例如,一阶高通滤波器,其具 有传递函数H(Z) = I-QZ^i,其中,a被设置为例如0.68。因此,在预加强滤波器128的输出端, 产生音频信号18的预加强版本130。此外,图12a将比例因子确定器116示出为由LP(线性预 分析器132和线性预测系数到比例因子转换器134构成。LPC分析器132基于音频信号18 的预加强版本来计算线性预测系数信息118。因此,信息118的线性预测系数表示音频信号 18的基于线性预测的频谱包络,或者更具体地,其预加强版本130"LP分析器132的操作模式 可W例如设及对输入信号130进行加窗W获得要进行LP分析的信号130的加窗部分序列、进 行自相关确定W确定每一个加窗部分的自相关、W及进行滞后加窗(可选的)W向自相关应 用滞后窗函数。然后,可W对自相关或滞后窗输出(即,加窗的自相关函数)执行线性预测参 数估计。线性预测参数估计可W例如设及对(滞后加窗的)自相关执行Wiener-Levinson-Durbin或其他适合的算法W导出针对信号130的每一个自相关(即,针对每一个加窗部分) 的线性预测系数。也即是说,在LP分析器132的输出端产生LPC系数IISdLP分析器132可W被 配置为对线性预测系数进行量化W插入数据流30中。线性预测系数的量化可W在与线性预 测系数域不同的另一个域中执行,例如,在线性频谱对或线性频谱频率域中。然而,也可W 使用与Wiener-Levinson-Durbin算法不同的其他算法。
[0059] 线性预测系数到比例因子转换器134将线性预测系数转换为比例因子114。转换器 134可W确定比例因子140W与由线性预测系数信息118定义的线性预测合成滤波器IA(Z) 的逆相对应。备选地,转换器134确定比例因子W遵循该线性预测合成滤波器的感知激励修 改,例如,1/A(丫 ? Z),其中,例如丫 =0.92±10%。线性预测合成滤波器的感知激励修改 (即,1/A(丫 -Z))可W被称作"感知模型"。
[0060] 为了说明的目的,图12a示出了另一元件,然而,对于图12a的实施例而言,该另一 元件是可选的。该元件是位于变换器108上游的LTP(长期预测)滤波器136W使音频信号经 历长期预测。优选地,LP分析器132对非长期预测滤波版本进行操作。换言之,LTP滤波器136 对音频信号18或其预加强版本130执行LTP预测,并且输出LTP残差版本138使得变换器108 对预加强的且LTP预测的残差信号138执行变换。LTP滤波器可W例如被实现为FIR滤波器, 并且LTP滤波器136可W由包括例如LTP预测增益和LTP滞后的LTP参数来控制。两个LTP参数 140被编码到数据流30中。如下面将更详细所述的,LTP增益表示度量60的示例,运是因为它 指示音高或周期,音高或周期在没有LTP滤波的情况下在频谱12中完全体现并且在使用LTP 滤波的情况下在频谱12中W逐渐减小的强度出现,其中,减小的程度取决于控制LTP滤波器 136的LTP滤波的强度的LTP增益参数。
[0061] 为了完整起见,图12b示出了适应图12a的编码器的解码器。除了图Ub的组件W及 比例因子确定器122被实现为LPC到比例因子转换器142之外,图12b的解码器还包括位于逆 变换器126下游的重叠相加级144,该重叠相加级144使逆变换器126输出的逆变换经历重叠 相加处理,从而获得预加强的且LTP滤波的版本138的重构,然后,该重构在LTP后置滤波器 146处经历LTP后置滤波,其中,LTP后置滤波器146的传递函数对应于LTP滤波器136的传递 函数的逆。LTP后置滤波器146可W例如被实现为IIR滤波器的形式。在LTP后置滤波器146的 后续(在图12b中,示例性地,在LTP后置滤波器146的下游),图12b的解码器包括去加强滤波 器148,去加强滤波器148使用与预加强滤波器128的传递函数的逆相对应的传递函数对时 域信号执行去加强滤波。去加强滤波器148也可W实现为IIR滤波器的形式。在加强滤波器 148的输出端产生音频信号18。
[0062] 换言之,上述实施例提供了用于通过将诸如算数编码器上下文等的赌编码器上下 文的设计调整为诸如信号的周期等的信号的频谱的形状来对音调信号和频域进行编码的 可能性。坦白地说,上述实施例将上下文扩展超出邻居的概念,并且提议基于音频信号频谱 的形状(例如,基于音高信息)的自适应上下文设计。运种音高信息可W附加地发送到解码 器,或者可能已经可W从其他编码模块(例如,上述LTP增益)得到。然后,对上下文进行映射 W指向W-距离与当前要编码的系数有关的已经编码的系数,所述距离是输入信号的基本 频率的倍数或者与输入信号的基本频率成正比。
[0063] 应当注意的是,根据图12和图12b使用的LTP前置/后置滤波器构思可W由谐波后 置滤波器构思替换,根据谐波后置滤波器构思,通过经由数据流30从编码器向解码器发送 的LTP参数(包括音高(或音高滞后))来控制解码器处的谐波后置滤波器。LTP参数可W用作 参考,W使用显式信令区别地向解码器发送前述关于频谱的形状的信息。
[0064] 通过上述实施例的方式,可W不再使用针对音调信号的预测,从而例如避免引入 不期望的帖间依赖性。另一方面,关于编码/解码频谱系数的上述构思也可W与任何预测技 术相组合,运是因为预测残差仍然表明一些谐波结构。
[0065] 换言之,再次关于W下【附图说明】上述实施例,在所述附图中,图13示出了使用上述 频谱距离调整的编码处理的一般框图。为了便于W下描述与迄今提出的描述之间的一致 性,部分地重新使用附图标记。
[0066] 首先,将输入信号18传送给TD(TD =时域)中噪声成形/预测模块200。模块200包含 例如图12a的元件128和136中的一个或二者。该模块200可W被绕过,或者它可W通过使用 LPC编码来执行短期预测,和/或一一如图12a所示一一长期预测。可W设想每种类型的预 。如果时域处理之一采用音高信息并且发送音高信息,则如上文已经通过LTP滤波器136 输出的LTP滞后参数简要描述的,然后可W将运种信息传送到基于上下文的算数编码器模 块W进行基于音高的上下文映射。
[0067] 然后,由变换器108在时频变换的帮助下将残余的且成形的时域信号202变换到频 域。可W使用DFT或MDCT。变换长度可W是自适应的,并且为了低延迟,将使用与前一变换窗 和下一变换窗(比较:24)的低重叠区域。在文档的其余部分中,将使用MDCT作为说明性示 例。
[0068] 然后,由模块204在频域中对变换的信号112进行成形,模块204因此是例如使用比 例因子确定器116和频谱成形器110实现的。运可W通过LPC系数的频率响应并且通过由屯、 理声学模型驱动的比例因子来完成。还可W应用时间噪声成形(TNS)或频域预测,从而采用 并发送音高信息。在运种情况下,可W根据基于音高的上下文映射将音高信息传送到基于 上下文的算数编码器模块。后一个可能性也可W分别应用于图IOa至图12b的上述实施例。
[0069] 然后,在由基于上下文的赌编码器10对输出频谱系数进行无噪编码之前,由量化 级120对输出频谱系数进行量化。如上所述,该最后一个模块10使用例如输入信号的音高估 计作为关于音频信号的频谱的信息。运种信息可W是从噪声成形/预测模块200或204之一 继承得到的,运已经在时域中或在频域中预先执行了。如果该信息不可用,则可W例如由音 高估计模块206对输入信号执行专用音高估计,然后音高估计模块206将音高信息发送到比 特流30中。
[0070] 图14示出了适应图13的解码处理的一般框图。它由图13中所述的逆处理构成。音 高信息一一在图13和图14的情况下用作关于频谱的形状的信息的示例一一被首先解码并 且传送到算数解码器40。如果需要的话,该信息被进一步传送到需要该信息的其他模块。
[0071] 具体地,除了对来自数据流30的音高信息进行解码并因此负责图9b中的导出处理 84的音高信息解码器208之外,图14的解码器在基于上下文的解码器40之后按照其提及的 顺序还包括解量化器210、FD(频域)中逆噪声成形/预测模块212、逆变换器214和TD中逆噪 声成形/预测模块216,其均彼此串联W根据频谱12重构时域中的音频信号18,其中,频谱12 的频谱系数由解码器40根据比特流30进行解码。在将图14的元件映射到例如图12b中所示 的那些元件时,逆变换器214包含图12b的逆变换器126和重叠相加级144。此外,图14示出了 可W例如使用针对所有频谱线等同的量化步长函数向由编码器40输出的经解码的频谱系 数应用解量化。此外,图14示出了模块212(例如,TNS(时间噪声成形)模块何W位于频谱成 形器124和126之间。时域中逆噪声成形/预测模块216包含图12b的元件146和/或148。
[0072] 为了再次促进由本申请的实施例提供的优点,图15示出了针对频谱系数的赌编码 的传统上下文。该上下文涵盖当前要编码的系数的过去邻居的有限区域。也即是说,图15示 出了如在M阳G USAC中使用上下文自适应一样使用上下文自适应对频谱系数进行赌编码的 示例。因此,图15W与图1和图2类似的方式示出了频谱系数,然而,对频谱相邻频谱系数进 行分组或者将其划分为群集,称作频谱系数的n元组。为了将运种n元组与单独的频谱系数 区分开但是保持与上文提出的描述的一致性,使用附图标记
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1