音频编码中的后量化增益校正的制作方法

文档序号:9472493阅读:535来源:国知局
音频编码中的后量化增益校正的制作方法
【专利说明】音频编码中的后量化増益校正
[0001] 本申请是2013年9月4日(申请日:2011年7月4日)向中国专利局递 交并进入中国国家阶段的题为"音频编码中的后量化增益校正"的发明专利申请 No. 201180068987. 5(PCT国际申请No.PCT/SE2011/050899)的分案申请。
技术领域
[0002] 本技术设及基于量化被划分为增益表示和形状表示的量化方案的音频编码(所 谓的增益-形状音频编码)中的增益校正,尤其设及后量化增益校正。
【背景技术】
[0003] 期望现代通信服务处理很多不同类型的音频信号。虽然主要音频内容是语音信 号,但期望处理更普通的信号(例如音乐W及音乐和语音的混合)。虽然通信网络的容量持 续增加,但很大的兴趣仍然是限制每通信信道的所需带宽。在移动网络中,用于每个呼叫传 输带宽越小在移动设备和基站中产生的功耗越低。运对于移动运营商而言转变为能量和成 本节约,而端用户将体验到延长的电池寿命和增加的交谈时间。此外,在每用户消耗带宽较 小的情况下,移动网络能够并行地服务于更大数量的用户。
[0004] 如今,用于移动语音服务的主流压缩技术是CELP(码激励线性预测),其对于低带 宽语音实现了良好的音频质量。其广泛地用在已部署的编解码器(例如AMR(自适应多速 率)、AMR-WB(自适应多速率宽带)和GSM-EFR(全球移动通信系统-增强全速率))中。然 而,对于普通音频信号(例如音乐),CELP技术具有糟糕的性能。一般可W通过使用基于 频率变换的编码(例如ITU-T编解码器G. 722. 1[1]和G. 719 [2])来更好地表示运些信号。 然而,变换域编解码器通常W比语音编解码器更高的比特率操作。就编码而言在语音与普 通音频域之间存在分歧,期望W较低比特率提高变换域编解码器的性能。
[0005] 变换域编解码器需要频域变换系数的压缩表示。运些表示常常依赖于矢量量化 (VQ),在VQ中按群组对系数进行编码。针对矢量量化的各种方法中包括增益-形状VQ。该 方法在对各个系数进行编码之前将归一化应用于矢量。归一化因子W及归一化后的系数被 称为矢量的增益和形状,其可被相对独立地编码。增益-形状结构具有很多优点。通过划分 增益和形状,编解码器可W容易地适用于通过设计增益量化器来改变源输入级别。从感知 角度看,还有利的是:增益和形状可W在不同频率区域中携带不同重要性。最后,增益-形 状划分简化了量化器设计,并且使得其与无约束矢量量化器相比在存储器和计算资源方面 复杂度较小。图1可见增益-形状量化器的功能概述。
[0006] 如果应用于频域谱,则增益-形状结构可W用于形成谱包络和精细结构表示。增 益值序列形成谱包络,而形状矢量给出谱细节。从感知角度看,使用服从人类听觉系统的频 率分辨率的不均匀带结构对谱进行分区是有利的。运通常意味着,针对低频率使用窄带宽, 而针对高频率使用较大带宽。谱精细结构的感知重要性随着频率而变化,但还取决于信号 自身的特性。变换编码器常常采用听觉模型来确定精细结构的重要部分,并且将可用资源 分配给该最重要的部分。谱包络常常被用作该听觉模型的输入。形状编码器使用所分配的 比特对形状矢量进行量化。对于具有听觉模型的基于变换的编码系统的示例,见图2。
[0007] 取决于形状量化器的精度,用于重构矢量的增益值可能比较适当或不那么适当。 尤其是当所分配的比特很少时,增益值偏离最优质。一种用于解决该问题的方式是:在形状 量化之后对考虑增益失配的校正因子进行编码。另一解决方案是首先对形状进行编码,然 后在给定量化后的形状的情况下计算优化增益因子。
[0008] 用于在形状量化之后对增益校正因子进行编码的解决方案可能消耗大量比特率。 如果速率已经很低,则运意味着,必须另外取得更多比特,并且有可能减少用于精细结构的 可用比特率。
[0009] 在对增益进行编码之前对形状进行编码是更好的解决方案,但如果根据所量化的 增益值来判断用于形状量化器的比特率,则增益和形状量化将相互依赖。迭代解决方案可 能有望解决运种相互依赖性,但可能容易变得太复杂而无法在移动设备上实时地运行。

【发明内容】

[0010] 目的在于在对已经W相对独立的增益表示和形状表示编码的音频进行解码中获 得增益调整。
[0011] 根据所附权利要求来实现该目的。
[0012] 第一方面包括一种增益调整方法,其包括W下步骤:
[0013] 估计所述形状表示的精度测度。
[0014] 基于所估计的精度测度来确定增益校正。
[0015] 基于所确定的增益校正来调整所述增益表示。
[0016] 第二方面包括一种增益调整装置,其包括:
[0017] 精度仪,被配置为:估计所述形状表示的精度测度,W及基于所估计的精度测度来 确定增益校正。
[0018] 包络调整器,被配置为:基于所确定的增益校正来调整所述增益表示。
[0019] 第=方面包括一种解码器,其包括如第二方面所述的增益调整装置。
[0020] 第四方面包括一种网络节点,其包括如第=方面所述的解码器。
[0021] 所提出的用于增益校正的方案改进了增益-形状音频编码系统的感知质量。该方 案具有低的计算复杂度,并且需要的附加比特很少(如果需要任何附加比特的话)。
【附图说明】
[0022] 通过连同附图一起参照下述描述,可W最佳地理解本发明连同其其它目的和优 点,其中:
[0023] 图1示出示例增益-形状矢量量化方案;
[0024] 图2示出示例变换域编码和解码方案;
[0025] 图3A-图3C示出在简化情况下的增益-形状矢量量化;
[00%] 图4示出使用精度测度来确定包络校正的示例变换域解码器;
[0027]图5A-图5B示出当形状矢量是稀疏脉冲矢量时W增益因子来标定合成的示例结 果;
[002引 图6A-图6B示出最大脉冲高度可如何指示形状矢量的精度;
[0029] 图7示出实施例1的基于速率的衰减函数的示例;
[0030] 图8示出用于实施例1的依赖速率和最大脉冲高度的增益调整函数的示例;
[0031] 图9示出用于实施例1的依赖速率和最大脉冲高度的增益调整函数的另一示例; 阳03引图10示出在基于MDCT的音频编码器和解码器系统的情况下的本发明实施例;
[0033] 图11示出从稳定性测度到增益调整限制因子的映射函数的示例。
[0034] 图12示出具有自适应步长大小的ADPCM编码器和解码器系统的示例;
[0035] 图13示出在基于子带ADPCM的音频编码器和解码器系统的情况下的示例;
[0036] 图14示出在基于子带ADPCM的音频编码器和解码器系统的情况下的本发明实施 例;
[0037] 图15示出包括信号分类器的示例变换域编码器;
[0038]图16示出使用精度测度来确定包络校正的另一示例变换域解码器;
[0039] 图17示出根据本发明的增益调整装置的实施例;
[0040] 图18更详细地示出根据本发明的增益调整的实施例;
[0041] 图19是示出根据本发明的方法的流程图;
[0042] 图20是示出根据本发明的方法的实施例的流程图;
[0043] 图21示出根据本发明的网络的实施例。
【具体实施方式】 W44] 在W下描述中,相同标号将用于执行相同或相似功能的要素。
[0045] 在详细描述本发明之前,将参照图1-图3说明增益-形状编码。
[0046] 图1示出示例增益-形状矢量量化方案。该图的上部示出编码器侧。输入矢量X 转发到范数计算器10,其确定矢量范数(增益)g,典型地是欧几里德范数。在范数量化器 12中对该确切范数进行量化,量化后的范数I的倒数1/|转发到乘法器14,用于缩放输入 矢量X得到形状。在形状量化器16中对形状进行量化。量化后的增益和形状的表示转发 到比特流复用器(mux) 18。通过虚线来示出运些表示,W指示它们可W例如将指数构成为表 (码书)而不是实际量化后的值。
[0047] 图1的下部示出解码器侧。比特流解复用器(demux) 20接收增益和形状表示。形 状表示转发到形状解量化器22,增益表示转发到增益解量化器24。所获得的增益转发到 乘法器26,在此,其缩放所获得的形状,其给出重构的矢量索。
[0048] 图2示出示例变换域编码和解码方案。该图的上部示出编码器侧。输入信号转发 到频率变换器30 (其例如基于修正离散余弦变换(MDCT) ),W产生频率变换X。频率变换X 转发到包络计算器32,其确定每个频带b的能量E化)。运些能量在包络量化器34中被量 化为能量/;(b)。量化后的能量/;(b)转发到包络归一化器36,包络归一化器36W包络的对 应的量化后的能量爱〇))的倒数来缩放变换X的频带b的系数。所得缩放后的形状转发到 精细结构量化器38。量化后的能量E(b)还转发到比特分配器40,其将精细结构量化的比 特分配给每个频带b。如上所述,比特分配R(b)可W基于人类听觉系统的模型。量化后的 增益a-》巧日对应的量化后的形状的表示转发到比特流复用器18。
[0049] 图2的下部示出解码器侧。比特流解复用器20接收增益和形状表示。增益表示 转发到包络解量化器42。所生成的包络能量的转发到比特分配器44,其确定所接收到 的形状的比特分配R化)。形状表示转发到精细结构解量化器46,其受控于比特分配R化)。 解码的形状转发到包络成形器48,其W对应包络能量/Ub)来缩放它们,W形成重构的频率 变换。该变换转发到逆频率变换器50 (其例如基于逆修正离散余弦变换(IMDCT)),其产生 表示合成音频的输出信号。
[0050] 图3A-图3C示出在简化情况下W上所描述的增益-形状矢量量化,其中,在图3A 中,通过2维矢量X(b)表示频带b。运种情况足够简单W在图中示出,但也足够普通W示出 关于增益-形状量化的问题(实际上矢量典型地具有8维或更多维)。图3A的右手边示出 具有增益E(b)和形状(单位长度矢量)N'化)的矢量X(b)的确切增益-形状表示。
[0051] 然而,如图3B所示,在编码器侧上将确切增益E(b)编码为量化后的增益由 于量化后的增益iUb)
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1