音频信号的频谱的频谱系数的编码的制作方法_2

文档序号:9932714阅读:来源:国知局
解码引 擎54将通过对非逸出符号进行算术解码来获得例如目标区间[0…/-1]中的值a,并且将通 过将当前频谱系数的值计算为等于a+2乘W逸出符号的数量来导出X的系数值。
[0037] 关于使用概率分布估计56W及将概率分布估计56应用于用于表示当前频谱系数X 的符号序列存在不同的可能性:概率分布估计可W例如应用于数据流30中针对频谱系数X 表达的任何符号,即,非逸出符号W及任何逸出符号(如果存在的话)。备选地,概率分布估 计56仅用于0个或更多个逸出符号后接非逸出符号的序列中的前一个或前两个或前n<N 个,其中,例如,针对符号序列中的任意后续一个使用某一默认概率分布估计,例如,等概率 分布。
[0038] 图5示出了频谱图12中的示例性频谱20。具体地,在图5中沿y轴W任意单位绘制了 频谱系数的幅度,而水平X轴W任意单位对应于频率。如上所述,图5中的频谱20对应于音频 信号的频谱图上的某一时刻的频谱片,其中,频谱图12由运种频谱20序列构成。图5还示出 了当前频谱系数X的频谱位置。
[0039] 如下文更详细描述的,虽然频谱20可W是音频信号的未加权频谱,但是根据下面 进一步所述的实施例,例如频谱20是已经使用与感知合成滤波器函数的逆相对应的传递函 数感知加权的。然而,本申请不受下面进一步所述的具体情况的限制。
[0040] 在任意情况下,图5示出了沿频率轴具有特定周期的频谱20,运W频谱中的局部最 大值和最小值沿频率方向的差不多等距的布置体现。仅为了说明的目的,图5示出了由频谱 的局部最大值之间的频谱距离定义的音频信号的音高或周期的度量60,其中,当前频谱系 数X位于所述局部最大值之间。当然,度量60可W被区别地定义和确定,例如,局部最大值 和/或局部最小值之间的平均音高或者等同于在时域信号18的自相关函数中测量的时间延 迟最大值的频率距离。
[0041] 根据实施例,度量60是关于频谱的形状的信息或者由关于频谱的形状的信息构 成。编码器10和解码器40,或者更具体地,概率分布估计导出器42/52可W例如根据该度量 60来调整先前的频谱系数O与当前的频谱系数X之间的相对频谱距离。例如,相对频谱距离 28可W根据度量60而改变,使得距离28随着度量60的增加而增加。例如,将距离28设置为等 于度量60或者是其整数倍可W是有利的。
[0042] 如下文将更详细描述的,关于如何使解码器利用关于频谱12的形状的信息存在不 同的可能性。通常,可W显式地向解码器发信号通知该信息(例如,度量60),其中,仅编码器 10或概率分布估计导出器42实际上确定关于频谱的形状的信息,或者对关于频谱的形状的 信息的确定是在编码器和解码器侧基于频谱的先前解码部分并行执行的或者可W根据已 经写入比特流的另一信息导出。
[0043] 通过使用不同的术语,度量60还可W被解释为"谐波间距离的度量",运是因为频 谱中的前述局部最大值或峰值化ill)可W形成彼此的谐波。
[0044] 图6提供了关于频谱的形状的信息的另一示例,其中可W基于该频谱的形状的信 息一一排他地或者与前述另一度量(例如,度量60)-起一一来调整频谱距离28。具体地,图 6示出了使用感知加权合成滤波器函数的逆来对由编码器10和解码器40编码/解码的频谱 系数所表示的频谱12(在图6中示出了其频谱片)进行加权的示例性情况。也即是说,在图6 中在62处示出了原始的且最终重构的音频信号的频谱。在64处使用虚线示出了预加强版 本。使用点划线66示出了预加强版本64的线性预测估计的频谱包络,并且在图6中在68处使 用点点划线示出了其感知修改版本,即,感知激励合成滤波器函数的传递函数。频谱12可W 是使用感知加权合成滤波器函数68的逆对原始音频信号频谱62的预加强版本进行滤波的 结果。在任意情况下,编码器和解码器二者可W有权访问频谱包络66,频谱包络66进而可W 具有或多或少显著的共振峰70或谷72。根据本申请的备选实施例,至少部分地基于频谱12 的频谱包络66的运些共振峰70和/或谷72的相位位置来定义关于频谱的形状的信息。例如, 共振峰70之间的频谱距离74可W用于设置前述当前频谱系数X与先前频谱系数〇之间的相 对频谱距离28。例如,距离28可W优选地被设置为等于距离74或距离74的整数倍,然而,其 中备选方式也是可行的。
[0045] 替代如图6所示的基于LP的包络,还可W区别地定义频谱包络。例如,包络可W W 比例因子的方式被定义并且在数据流中传输。也可W使用发送包络的其他方式。
[0046] 由于W上文关于图5和图6所述的方式对距离28进行调整,因此与例如在频谱上位 于当前频谱系数X较近的其他频谱系数相比,"参考"频谱系数O的值表示用于估计当前频谱 系数X的概率分布估计的实质上更好的提示。在运一方面,应当注意的是,大多数情况下的 上下文建模是在一方面赌编码复杂度与另一方面编码效率之间的折中。因此,迄今所述的 实施例提议根据关于频谱的形状的信息对相对频谱距离28进行调整,使得例如距离28随着 度量60的增加而增加和/或随着共振峰间距离74的增加而增加。然而,先前系数〇(基于所述 先前系数来执行对赌编码/解码的上下文自适应)的数量可W是恒定的,即,可W不增加。先 前频谱系数〇(基于所述先前频谱系数来执行上下文自适应)的数量可W例如是恒定的,而 不论关于频谱的形状的信息的变化如何。运意味着W上述方式对相对频谱距离28的调整在 不会显著增加执行上下文建模的开销的情况下导致更好的或更有效的赌编码/解码。仅频 谱距离28本身的调整增加了上下文建模的开销。
[0047] 为了更详细地说明刚刚提到的问题,参照示出了频谱图12的频谱时间部分的图7, 频谱时间部分包括要编码/解码的当前频谱系数14。此外,图7示出了示例性的五个先前编 码/解码的频谱系数O的模板,其中,基于所述模板来执行针对当前频谱系数X的赌编码/解 码的上下文建模。模板位于当前频谱系数X的位置处并且指示相邻的参考频谱系数0。根据 前述关于频谱的形状的信息,对运些参考频谱系数O的频谱位置的频谱扩展进行调整。运在 图7中使用双箭头80和小的阴影线O示出,其中小的阴影线O示例性地示出了在例如根据调 整80对参考频谱系数的频谱位置的频谱扩展进行缩放的情况下参考频谱系数的位置。也即 是说,图7示出了贡献于上下文建模的参考频谱系数的数量,即,当前频谱系数X周围的并且 标识参考频谱系数O的模板的参考频谱系数的数量,保持恒定,而不论关于频谱的形状的信 息的任何变化如何。仅运些参考频谱系数与当前频谱系数之间的相对频谱距离根据80而被 调整,并且参考频谱系数本身之间的距离是固有的。然而,应当注意的是,参考频谱系数曰的 数量不必保持恒定。根据实施例,参考频谱系数的数量可W随着相对频谱距离的增加而增 加。然而,相反的情况下也是可行的。
[0048] 应当注意的是,图7示出了针对当前频谱系数X的上下文建模还设及与早前频谱/ 时间帖相对应的先前编码/解码频谱系数的示例性情况。然而,运也仅应当被理解为示例, 并且根据另一实施例,可W不再使用对运种时间在前的先前编码/解码频谱系数的依赖性。 图8示出了概率分布估计导出器42/52可W如何根据一个或多个参考频谱系数O来确定针对 当前频谱系数的概率分布估计。如图8所述,为此,一个或多个参考频谱系数O可能经历标量 函数82。基于标量函数,例如,一个或多个参考频谱系数曰可W被映射为索引,该索引对可用 的概率分布估计集合中要用于当前频谱系数X的概率分布估计编写索引。如先前所述的,可 用的概率分布估计可W例如在算数编码的情况下对应于针对符号字母表的不同的概率区 间细分或者在使用可变长度编码的情况下对应于不同的可变长度编码表格。
[0049] 在继续描述将前述频谱系数编码器/解码器向相应的基于变换的编码器/解码器 进行可能的集成之前,在下文中讨论了关于可W如何改变迄今所述的实施例的几个可能 性。例如,上文关于图3和图4简要描述的逸出机制仅被选择用于说明的目的,并且可W根据 备选实施例不再使用该逸出机制。在下述实施例中,使用了逸出机制。此外,如根据下述具 体实施例的描述将清楚的是,不是单独地对频谱系数进行编码/解码,而是可W Wn元组为 单位(即,Wn个频谱上紧邻的频谱系数为单位)对频谱系数进行编码/解码。在该情况下,还 可WW运种n元组为单位或者W单独的频谱系数为单位来确定对相对频谱距离的确定。关 于图8的标量函数82,应当注意的是,标量函数可W是算术函数或逻辑运算。此外,可W针对 例如由于W下原因而不可用的那些参考标量系数O采取特殊度量:例如超出频谱的频率范 围或者例如位于通过频谱系数W与在对应于当前频谱系数的时刻对频谱进行采样的频谱 时间分辨率不同的频谱时间分辨率采样的频谱的一部分中。不可用的参考频谱值O的值可 W由例如默认值替换,然后与其他(可用)参考频谱系数一起输入标量函数82中。关于赌编 码/解码可W如何使用上文所述的频谱距离调整而工作的另一种方式如下:例如,当前频谱 系数可W经历二进制化。例如,频谱系数X可W被映射为二进制序列,然后使用对相对频谱 距离调整的调整来对二进制序列进行赌编码。当解码时,可W在遇到有效的二进制序列之 前顺序地对二进制进行赌解码,然后,经解码的二进制可W被重新映射到当前频谱系数X的 相应值。
[0050] 此外,可W W与图8所述的方式不同的方式来实现根据一个或多个先前频谱系数曰 的上下文自适应。具体地,标量函数82可W用于对可用上下文集合中的一个上下文编写索 引,并且每一个上下文可W具有与之相关联的概率分布估计。在该情况下,每当已经将当前 编码/解码的频谱系数X指派给特定上下文(即,使用该当前频谱系数X的值)时,与相应的上 下文相关联的概率分布估计可W被调整为实际的频谱系数统计数据。
[0051] 最后,图9a和图9b示出了关于可W如何在编码器与解码器之间同步对关于频谱的 形状的信息的导出的不同可能性。图9a示出了隐式信令用于在编码器与解码器之间同步对 关于频谱的形状的信息的导出的可能性。运里,在编码和解码侧二者处,分别基于比特流30 的先前编码部分或先前解码部分来执行对信息的导出,编码侧处的导出是使用附图标记83 来指示的,并且解码侧处的导出是使用附图标记84来指示的。可W例如由导出器42和52本 身来执行两个导出。
[0052] 图9b示出了显式信号作用用于从编码器向解码器传达关于频谱的形状的信息的 可能性。编码侧处的导出83可能甚至设及对原始音频信号(包括其分量)的分析,由于编码 损耗,其分量在解码侧处不可用。更确切地,数据流30中的显式信令用于擅染解码侧处可用 的关于频谱的形状的信息。换言之,解码侧处的导出84使用数据流30中的显式信号作用来 获得对关于频谱的形状的信息的访问。显式信号作用30可W设及区别编码。如下文将更详 细所述的,例如,为了其他目的而在数据流30中已经可用的LTP(长期预测)滞后参数可W用 作关于频谱的形状的信息。然而,备选地,图9b的显式信号作用可W关于(即,区别地针对) 已经可用的LTP滞后参数对度量60进行区别编码。存在擅染解码侧可用的关于频谱的形状 的信息的很多其他可能性。
[0053] 除了上述备选实施例之外,还应当注意的是,除了赌编/解码,对频谱系数的编/解 码还可W设及对当前要编/解码的频谱系数进行频谱和/或时间预测。然后,预测残差可W 经历如上所述的赌编/解码。
[0054] 在已经描述了针对频谱系数编码器和解码器的各种实施例之后,在下文中,描述 了关于可W如何将频谱系数编码器和解码器有利地构建到基于变换的编码器/解码器中的 一些实施例。
[0055] 图IOa例如示出了根据本发明的实施例的基于变换的音频编码器。图IOa的基于变 换的音频编码器通常是使用附图标记100来指示的,并且包括频谱计算器102后接图1的频 谱系数编码器10。频谱计算器102接收音频信号18,并且基于音频信号18来计算频谱12,频 谱12的频谱系数由如上所述的频谱系数编码器10编码到数据流30中。图IOb示出了相应解 码器104的构造:解码器104包括级联的频谱系数解码器40(如上所述形成的),并且在图IOa 和图IOb的情况下,频谱计算器102可W例如仅对频谱20执行重叠变换,而频谱到时域计算
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1