音频信号的频谱的频谱系数的编码的制作方法

文档序号:9932714阅读:483来源:国知局
音频信号的频谱的频谱系数的编码的制作方法
【技术领域】
[0001] 本申请设及针对例如可W在各种基于变换的音频编解码器中使用的音频信号的 频谱的频谱系数的编码方案。
【背景技术】
[0002] 基于上下文的算术编码是对基于变换的编码器的频谱系数进行无噪声编码的有 效方式[1]。上下文采用频谱系数与存在于其附近的已经编码的系数之间的交互信息。上下 文可W在编码器和解码器侧二者处使用,并且无需发送任何额外信息。通过运种方式,基于 上下文的赌编码具有提供比无记忆赌编码更高增益的潜力。然而,实际上,上下文的设计尤 其由于内存要求、计算复杂度和对信道误差的鲁棒性而受到严重约束。运些约束限制了基 于上下文的赌编码的效率,并且造成了较低的编码增益,特别是针对必须限制上下文W采 用信号的谐波结构的音调信号。
[0003] 此外,在低延迟的基于音频变换的编码中,低重叠窗用于减小算法延迟。作为直接 结果,MDCT的泄露对于音调信号而言很重要,并且导致更高的量化噪声。可W如针对MPEG2/ 4-AAC[2]所进行的那样在频域中通过对变换和预测进行组合或者在时域中利用预测来处 理音调信号[3]。
[0004] 考虑编码构思将是有利的,运提高了编码效率。因此,本发明的目的是提供针对音 频信号的频谱的频谱系数的编码构思,运提高了编码效率。该目的是通过未决的独立权利 要求的主题来实现的。
[0005] 本申请的基本发现是,可W通过W赌编/解码同时根据关于频谱的形状的信息对 先前编/解码的频谱系数与当前编/解码的频谱系数之间的相对频谱距离进行调整的方式 对当前要编/解码的频谱系数进行编/解码来提高对音频信号的频谱的频谱系数进行编码 的编码效率,其中,在进行赌编/解码时,W上下文自适应方式根据先前编/解码的频谱系数 执行赌编/解码。关于频谱的形状的信息可W包括:音频信号的音高或周期的度量、音频信 号的频谱的谐波间距离的度量和/或频谱的频谱包络的共振峰和/或谷的相对位置,并且基 于该知识,为了形成当前要编/解码的频谱系数的上下文所采用的频谱邻居可W被调整为 由此确定的频谱的形状,从而增强赌编码效率。
【附图说明】
[0006] 有利实现是从属权利要求的主题,并且在下文中参照附图描述了本申请的优选实 施例,在附图中:
[0007] 图1示出了说明频谱系数编码器及其在对音频信号的频谱的频谱系数进行编码时 的操作模式的示意图;
[000引图2示出了说明适应图1的频谱系数编码器的频谱系数解码器的示意图;
[0009] 图3示出了根据实施例的图1的频谱系数编码器的可能内部结构的框图;
[0010] 图4示出了根据实施例的图2的频谱系数解码器的可能内部结构的框图;
[0011] 图5示意性地指示了频谱(其系数要被编码/解码)的图形W说明根据音频信号的 音高或周期的度量或者谐波间距离的度量对相对频谱距离的调整;
[0012] 图6示出了说明根据实施例的频谱(其频谱系数要被编码/解码)(其中,根据基于 LP的感知加权合成滤波器(即,其逆)对频谱进行频谱成形)同时说明了根据实施例根据共 振峰间距离度量对相对频谱距离的调整的示意图;
[0013] 图7示意性地示出了根据实施例的频谱的一部分,W说明围绕当前要编码/解码的 频谱系数的上下文模板W及根据关于频谱的形状的信息来对上下文模板频谱扩展的调整;
[0014] 图8示出了说明根据实施例的使用标量函数从上下文模板81的参考频谱系数的一 个或多个值进行映射W导出要用于对当前频谱系数进行编码/解码的概率分布估计的示意 图;
[0015] 图9a示意性地示出了使用隐式信令W在编码器和解码器之间对相对频谱距离的 调整进行同步;
[0016] 图9b示出了说明使用显式信令W在编码器和解码器之间对相对频谱距离的调整 进行同步的示意图;
[0017] 图IOa示出了根据实施例的基于变换的音频编码器的框图;
[0018] 图IOb示出了适应图IOa的编码器的基于变换的音频解码器的框图;
[0019] 图Ila示出了根据实施例的使用频域频谱成形的基于变换的音频编码器的框图;
[0020] 图Ub示出了适应图Ila的编码器的基于变换的音频解码器的框图;
[0021] 图12a示出了根据实施例的基于线性预测的变换码激励音频编码器的框图;
[0022] 图12b示出了适应图12a的编码器的基于线性预测的变换码激励音频解码器;
[0023] 图13示出了根据另一实施例的基于变换的音频编码器的框图;
[0024] 图14示出了适应图13的实施例的基于变换的音频解码器的框图;
[0025] 图15示出了说明覆盖当前要编码/解码的频谱系数的邻居的传统上下文或上下文 模板;
[0026] 图16a至图16c示出了根据本申请的实施例的修改的上下文模板配置或映射的上 下文;
[0027] 图17示意性地示出了谐波频谱的图形W说明针对谐波频谱使用图16a至图16c中 的任意一个的映射的上下文相对于图15的上下文模板定义的优点;
[0028] 图18示出了根据实施例用于优化用于上下文映射的相对频谱距离D的算法的流程 图。
【具体实施方式】
[0029] 图1示出了根据实施例的频谱系数编码器10。编码器被配置为对音频信号的频谱 的频谱系数进行编码。图IW频谱图12的形式示出了连续频谱。更准确地,频谱系数14被示 出为沿时间轴t和频率轴f在频谱时间上布置的框。虽然频谱时间分辨率可能保持恒定,但 是图1示出了频谱时间分辨率可W随着时间而改变,其中在图1中在16处示出了一个运样的 时刻。该频谱图12可W是在不同时刻应用于音频信号18的频谱分解变换的结果,例如,重叠 变换,如严格采样变换,例如,MDCT或某种其他实值严格采样变换。迄今为止,频谱图12可W 由频谱系数编码器IOW频谱20的形式接收,频谱20由变换系数序列构成,变换系数序列中 的每一个变换系数属于相同的时刻。频谱20因而表示频谱图的频谱片,并且在图I中被示出 为频谱图12的单独列。每一个频谱由变换系数序列14构成,并且已经使用例如某一窗函数 24根据音频信号18的相应时间帖22导出。具体地,时间帖22顺序地布置在前述时刻,并且与 频谱20的时间序列相关联。如图1所示,它们可W彼此重叠,如同相应的变换窗24可W实现 的一样。也即是说,如本文所使用的,"频谱"表示属于相同时刻的频谱系数,因此是频率分 解。"频谱图"是由连续频谱构成的时频分解,其中"频谱(Spectra)"是频谱(spectrum)的复 数。但是,有时"频谱"同义地用于频谱图。如果原始信号在时域并且变换是频率变换,则"变 换系数"同义地用于"频谱系数"。
[0030] 如刚刚所述的,频谱系数编码器10用于对音频信号18的频谱图12的频谱系数14进 行编码,并且为此,编码器可W例如应用预定的编码/解码顺序,运沿频谱时间路径遍历例 如频谱系数14,运例如在频谱上在一个频谱20内从低频到高频扫描频谱系数14,然后继续 处理时间连续频谱20的频谱系数,如图1在26处所示。
[0031] 通过下面更详细所述的方式,编码器10被配置为通过W上下文自适应方式根据一 个或多个先前编码的频谱系数(如在图1中使用小圆圈O示例性所示)进行赌编码来对当前 要编码的频谱系数(如在图1中使用小十字X所示)进行编码。具体地,编码器10被配置为根 据关于频谱的形状的信息来调整先前编码的频谱系数与当前编码的频谱系数之间的相对 频谱距离。至于依赖性和关于频谱的形状的信息,在下文中阐述了细节W及关于由于根据 刚刚提到的信息调整相对频谱距离28而产生的优点的考虑。
[0032] 换言之,频谱系数编码器10将频谱系数14顺序地编码到数据流30中。如下文将更 详细所述的,频谱系数编码器10可W是基于变换的编码器的一部分,其中,除了频谱系数14 之外,基于变换的编码器还将其他信息编码到数据流30中使得数据流30实现对音频信号18 的重构。
[0033] 图2示出了适应图1的频谱系数编码器10的频谱系数解码器40。频谱系数解码器40 的功能实质上是图1的频谱系数编码器10的逆:频谱系数解码器40使用例如解码顺序26对 频谱12的频谱系数14进行顺序解码。在通过赌解码对当前要解码的频谱系数(在图2中使用 小X示例性指示的)进行解码时,频谱系数解码器40W上下文自适应方式根据一个或多个先 前解码的频谱系数(也在图2中也由小O指示)执行赌解码。通过运样做,频谱系数解码器40 根据前述关于频谱12的形状的信息来调整先前解码的频谱系数与当前要解码的频谱系数 之间的相对频谱距离28。按照与上述方式相同的方式,频谱系数解码器40可W是基于变换 的解码器的一部分,该基于变换的解码器被配置为根据数据流30对音频信号18进行重构, 频谱系数解码器40使用赌解码根据数据流30对频谱系数14进行解码。后面的基于变换的解 码器可W使频谱12经历逆变换(例如,逆重叠变换)作为重构的一部分,运例如导致重叠加 窗时间帖22序列的重构,其通过重叠相加处理移除了由于频谱分解变换引起的混叠。
[0034] 如下文将更详细描述的,由于根据关于频谱12的形状的信息调整相对频谱距离28 产生的优点依赖于提高用于对当前频谱系数X进行赌编码/解码的概率分布估计的能力。概 率分布估计越好,赌编码更有效,即,更紧凑。"概率分布估计"是当前频谱系数14的实际概 率分布的估计,即,向值域中的每一个值指派概率的函数,其中,当前频谱系数14可W假定 该值域。由于距离28的调整对频谱12的形状的依赖性,概率分布估计可W被确定W更接近 地对应于实际概率分布,运是因为采用关于频谱12的形状的信息使得能够根据当前频谱系 数X的频谱邻居来导出概率分布估计,运允许更准确地估计当前频谱系数X的概率分布。下 面给出了运一点的细节W及关于频谱12的形状的信息的示例。
[0035] 在继续前述关于频谱12的形状的信息的具体示例之前,图3和图4分别示出了频谱 系数编码器10和频谱系数解码器40的可能内部结构。具体地,如图3所示,频谱系数编码器 10可W由概率分布估计导出器42和赌编码引擎44构成,其中,类似地,频谱系数解码器40可 W由概率分布估计导出器52和赌解码引擎54构成。概率分布估计导出器42和52W相同的方 式操作:它们基于一个或多个先前解码/编码的频谱系数O的值来导出用于对当前频谱系数 X的进行赌解码/编码的概率分布估计56。具体地,赌编码/解码引擎44/54从导出器42/52接 收概率分布估计,并且相应地关于当前频谱系数X执行赌编码/解码。
[0036] 赌编码/解码引擎44/54可W使用例如可变长度编码(例如,霍夫曼编码)来对当前 频谱系数X进行编码/解码,并且在运一方面,引擎44/54可W针对不同的概率分布估计56使 用不同的VLC(可变长度编码)表格。备选地,引擎44/54可W关于当前频谱系数X使用算数编 码/解码,其中概率分布估计56控制表示算数编码/解码引擎44/54的内部状态的当前概率 区间的概率区间细分,每一个部分区间被指派给可W由当前频谱系数X假定的目标值范围 中的不同可能值。如下文将更详细描述的,赌编码引擎44和赌解码引擎54可W使用逸出机 审睐将频谱系数14的总值范围映射到有限的整数值区间,即,目标范围,例如,[0…/-1]。目 标范围中的整数值集合(即,{〇,…,2^})与逸出符号{esc}-起定义了算数编码/解码引擎 44/54的符号字母表,即,{0,…,2W-i,esc}。例如,赌编码引擎44使输入频谱系数X根据需要 (如果存在的话)除W2, W使频谱系数X进入前述目标区间[0…/-1],其中,针对每次除法, 将逸出符号编码到数据流30中、然后将除法余数一一或者在不需要进行除法的情况下原始 频谱值一一算数编码到数据流30中。赌解码引擎54进而将按如下方式执行逸出机制:它将 来自数据流30的当前变换系数X解码为0、1或者更多个逸出符号esc后接非逸出符号的序 列,即,解码为序列{a}、{esc,a}、{esc,esc,a}……之一,其中a表示非逸出符号。赌
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1