用于对音频信号的时间段进行编码和解码的变换音频编解码器和方法

文档序号：2825359阅读：133来源：国知局

用于对音频信号的时间段进行编码和解码的变换音频编解码器和方法
【专利摘要】用于对音频信号的时间段进行有效编码/解码的方法和设备。该方法包括：导出与音频信号的时间段相关联的残差向量在频率刻度中的位置的指示符z，以及导出与残差向量的结构量有关的度量Φ。该方法还包括：确定是否满足涉及度量Φ、指示符z和预定义阈值Θ的预定义标准，这对应于估计在重构音频信号的时间段之后残差向量的非零系数中的至少一些非零系数的符号改变是否将是可听的。对残差向量的系数的相应幅度进行编码，并且仅当确定满足标准因而符号改变将是可听的时，才对残差向量的系数的符号进行编码。
【专利说明】用于对音频信号的时间段进行编码和解码的变换音频编解码器和方法【技术领域】
[0001]本发明涉及对音频信号的时间段的编码和解码，具体地说，涉及变换音频编解码器中的编码和解码。
【背景技术】
[0002]先前已知使用变换域编码方案，例如，[I]中所描述的变换域编码方案。下面将给出这种变换域编码方案的高层次概述。
[0003]要编码的波形被逐块地变换到频域。用于该目的的一种常用的变换是所谓的修正离散余弦变换(MDCT)。由此获得的频域变换向量被划分为频谱包络(慢变能量)和频谱残差。通过使用所述频谱包络对获得的频域向量进行归一化来获得频谱残差。频谱包络被量化，并且量化索引被发送到解码器。接下来，量化的频谱包络用作比特分发算法的输入，并且基于频谱包络的特征来分发用于对残差向量进行编码的比特。作为该步骤的结果，特定数量的比特被指派给残差的不同部分(残差向量或“子向量”)。一些残差向量未接收到任何比特，并且必须对这些残差向量进行噪声填充或频带扩展，这一点在例如图1中被示出。通常，残差向量的编码是两步过程；首先，对向量元素的幅度进行编码，接下来，对非零元素的符号(sign)(符号不应当与“相位”混淆，而是与例如傅里叶变换相关联)进行编码，这一点在例如图2中被示出。针对残差的幅度和符号的量化索引被发送到解码器，在解码器处，残差和频谱包络被组合并且最后被变换回时域。
[0004]然而，当可用于编码的比特的数量有限(例如，处于低或中等比特率)时，编码的结果可能不令人满意。

【发明内容】

[0005]期望实现改善的变换域编码方案。本发明的目的是实现变换音频编码器中的有效编码和变换音频解码器中的相应解码。
[0006]根据第一方案，提供了一种在变换音频编码器中用于对音频信号的时间段进行编码的方法。所述方法包括:导出与所述音频信号的所述时间段相关联的残差向量在频率刻度中的位置的指示符z，并且导出与所述残差向量的结构量有关的度量Φ。所述方法还包括:确定是否满足涉及所述度量Φ、所述指示符z和预定义阈值&的预定义标准，这对应于估计在重构所述音频信号时间段之后所述残差向量的非零系数中的至少一些非零系数的符号改变是否将是可听的。对所述残差向量的所述系数的相应幅度进行编码，并且仅当确定满足所述标准因而符号改变将是可听的时，才对所述残差向量的系数的符号进行编码。
[0007]根据第二方案，提供了一种用于对音频信号的时间段进行编码的变换音频编码器。所述变换音频编码器包括:适配为导出与所述音频信号的所述时间段相关联的残差向量在频率刻度中的位置的指示符z并且导出与所述残差向量的结构量有关的度量Φ的功能单元。所述变换音频编码器还包括:适配为确定是否满足涉及所述度量Φ、所述指示符Z和预定义阈值Θ的预定义标准的功能单元。所述变换音频编码器还包括:适配为对所述残差向量的系数的幅度进行编码，并且仅当确定满足所述标准时才对所述残差向量的系数的相应符号进行编码的功能单元。
[0008]上述方法和变换音频编码器可以用于实现音频信号的有效变换编码。与当使用先前已知的变换音频编码器时相比，当应用上述方法和变换音频编码器时，可能只需要较少的比特来对音频信号进行编码。尽管较少的比特被用于编码，但是与当使用先前已知的变换音频编码器时相比，重构的音频信号的感知质量并未降级。相反，节省的比特可以取而代之地用于对在可以利用增大的比特预算来进行编码时其感知质量可以得到改善的音频信号部分进行编码。因此，上述方法和布置实现了用于变换域音频编解码器的更有效的比特分发方案，这是因为比特可以向音频信号中对于重构的音频信号的感知质量更关键的信号参数移动。因此，可以在保持特定比特预算的同时实现整体质量改善。
[0009]根据第三实施例，提供了一种在变换音频解码器中用于对音频信号的编码时间段进行解码的方法。所述方法包括:对与所述音频信号的所述时间段相关联的变换向量的段的残差向量的系数的幅度进行解码。所述方法还包括:导出所述残差向量在频率刻度中的位置的指示符z，并且导出与所述残差向量的结构量有关的度量Φ。所述方法还包括:确定是否满足涉及所述度量Φ、所述指示符z和预定义阈值Θ的预定义标准，这对应于估计在重构所述音频信号时间段之后所述残差向量的非零系数中的至少一些非零系数的符号改变是否将是可听的。当确定满足所述标准(这对应于在重构的音频信号中符号改变将是可听的)时，对所述残差向量的系数的符号进行解码。当确定不满足所述标准因而在重构的音频信号中符号改变将是不可听的时，产生针对所述残差向量的非零系数的相应随机符号。
[0010]根据第四实施例，提供了一种用于对音频信号的编码时间段进行解码的变换音频解码器。所述变换音频解码器包括:适配为对与所述音频信号的所述时间段相关联的变换向量的段的残差向量的系数的相应幅度进行解码的功能单元。所述变换音频解码器还包括:适配为导出所述残差向量在频率刻度中的位置的指示符z，并且导出与所述残差向量的结构量有关的度量Φ的功能单元。所述变换音频解码器还包括:适配为确定是否满足涉及所述度量Φ、所述指示符z和预定义阈值Θ的预定义标准的功能单元。所述变换音频解码器还适配为仅当确定满足所述标准时，才对所述残差向量的非零系数的符号进行解码。所述变换音频解码器还包括:适配为当确定不满足所述标准时，产生针对所述残差向量的非零系数的相应随机符号的功能单元。
[0011]解码器和变换音频解码器/编解码器中的上述方法可以用于对使用上述方法和变换音频编码器编码的音频信号进行解码，从而实现上文所讨论的有效的编码和改善的比特分发。
[0012]可以在不同的实施例中实现上述方法和变换音频编码器/解码器或者编解码器。在一些实施例中，度量Φ是所谓的频谱平坦度度量。可以将预定义标准公式化为:
[0013]ω ιΦ + ω2ζ ^ ?(b)，其中，O1和ω2是缩放因子；Θ是取决于所述编解码器(编码器/解码器)的比特率b的阈值。Θ可以至少部分地根据经验感知数据导出。
[0014]此外，所述阈值Θ可以被配置为随着所述编解码器的比特率的增大而增大。这提供了以下优点:编码适配于可用于编码的比特量。例如，在高比特率时，比特预算可以允许对大多数或者甚至所有残差向量的非零系数的符号进行编码。如果阈值Θ被配置为随着比特率(因而比特预算)的增大而增大，则阈值Θ可以被配置为使得在高比特率时对于大多数(或者所有)残差向量而言将满足标准，而对于低比特率(因而更严格的比特预算)，在解码器中将对更多残差向量进行幅度编码，但是向这些残差向量指派随机符号。
[0015]此外，仅当所述指示符z指示残差向量位于在预定义跨越频率(cross-overfrequency)Zc之上的频率处时才可以导出所述度量Φ，其中，所述跨越频率Z。取决于所述编解码器(编码器/解码器)的比特率b。由此，对于在重构的音频信号中其系数中的一些系数的符号改变很可能是可听的残差向量而言，可以避免Φ的相当复杂的计算。因此，可以节省计算资源。随着比特率和比特预算的增大而增大的跨越频率确保当比特预算允许时，将对更多经幅度编码的残差向量的符号进行编码。
[0016]在阶乘脉冲编码FPC方案被用于对残差向量进行编码的实施例中，可以以低复杂度的计算效率很效的方式导出度量oFrc，即:
[0017]
【权利要求】
1.一种在变换音频编码器中用于对音频信号的时间段进行编码的方法，所述方法包括: -导出(404)与所述音频信号的所述时间段相关联的变换向量的段的残差向量在频率刻度中的位置的指示符z， -导出(406)与所述残差向量的结构量有关的度量Φ ; -确定(412)是否满足涉及所述度量Φ、所述指示符z和预定义阈值Θ的预定义标准，从而估计在重构所述音频信号时间段之后所述残差向量的非零系数中的至少一些非零系数的符号改变是否将是可听的； -对所述残差向量的系数的幅度进行编码；以及 -仅当确定满足所述标准因而符号改变将是可听的时，才对所述残差向量的系数的符号进行编码(408)。
2.根据权利要求1所述的方法，其中，所述度量Φ是所谓的频谱平坦度度量。
3.根据权利要求1或2所述的方法，其中，将所述预定义标准公式化为: ω ^ + q2z ^ Θ (b), 其中，(^和ω2是缩放因子；O是取决于所述编码器的比特率b的阈值。
4.根据权利要求3所述的方法，其中，所述缩放因子Co1和《2是至少部分地根据经验感知数据导出的。
5.根据前述权利要求中任意一项所述的方法，其中，所述阈值?被配置为随着所述编码器的比特率b的增大而增大。
6.根据前述权利要求中任意一项所述的方法，其中，仅当所述指示符z指示(406)在预定义跨越频率Z。之上的频率时才导出(410)所述度量Φ，其中，所述跨越频率Z。取决于所述编码器的比特率b。
7.根据前述权利要求中任意一项所述的方法，其中，阶乘脉冲编码FPC方案被用于对所述残差向量进行编码，其中，度量oFrc被导出为:
8.一种用于对音频信号的时间段进行编码的变换音频编码器，所述编码器包括: -导出单元(506)，适配为导出与所述音频信号的所述时间段相关联的变换向量的段的残差向量在频率刻度中的位置的指示符z，并且导出与所述残差向量的结构量有关的度量Φ ; -确定单元(508)，适配为确定是否满足涉及所述度量Φ、所述指示符z和预定义阈值Θ的预定义标准，从而估计在重构所述音频信号时间段之后所述残差向量的非零系数中的至少一些非零系数的符号改变是否将是可听的；以及 -编码单元(510)，适配为对所述残差向量的系数的幅度进行编码，并且仅当确定满足所述标准因而符号改变将是可听的时，才对所述残差向量的系数的符号进行编码。
9.根据权利要求8所述的变换音频编码器，还适配为:导出作为所谓的频谱平坦度度量的所述度量Φ。
10.根据权利要求8或9所述的变换音频编码器，其中，将所述预定义标准公式化为: ω ^ + q2z ^ Θ (b), 其中，(^和ω2是缩放因子；O是取决于所述编码器的比特率b的阈值。
11.根据权利要求8至10中任意一项所述的变换音频编码器，其中，所述阈值Θ被配置为随着所述编码器的比特率b的增大而增大。
12.根据权利要求8至11中任意一项所述的变换音频编码器，还适配为:仅当所述指示符z指示在预定义跨越频率Z。之上的频率时才导出所述度量Φ ,其中,所述跨越频率Z。取决于所述编码器的比特率b。
13.根据权利要求8至12中任意一项所述的变换音频编码器，还适配为:使用阶乘脉冲编码FPC方案来对所述残差向量进行编码，其中，度量ΦΡΡ。被导出为:

14.一种在变换音频解码器中用于对音频信号的编码时间段进行解码的方法，所述方法包括: -对与所述音频信号的所述时间段相关联的变换向量的段的残差向量的系数的幅度进行解码(603)； -导出(604)所述残差向量在频率刻度中的位置的指示符z ； -导出(606)与所述残差向量的结构量有关的度量Φ ； -确定(612)是否满足涉及所述度量Φ、所述指示符z和预定义阈值&的预定义标准，从而估计在重构所述音频信号时间段之后所述残差向量的非零系数中的至少一些非零系数的符号改变是否将是可听的； -仅当确定满足所述标准因而符号改变将是可听的时，才对所述残差向量的非零系数的相应符号进行解码(608);以及 -当确定不满足所述标准因而符号改变将是不可听的时，产生针对所述残差向量的非零系数的相应随机符号。
15.根据权利要求14所述的方法，其中，所述度量Φ是所谓的频谱平坦度度量。
16.根据权利要求14或15所述的方法，其中，将所述预定义标准公式化为: ω ^ + q2z ^ Θ (b), 其中，(^和ω2是缩放因子；O是取决于所述解码器的比特率b的阈值。
17.根据权利要求16所述的方法，其中，所述缩放因子Co1和ω2是至少部分地根据经验感知数据导出的。
18.根据权利要求14至17中任意一项所述的方法，其中，所述阈值Θ被配置为随着所述解码器的比特率b的增大而增大。
19.根据权利要求14至18中任意一项所述的方法，其中，仅当所述指示符z指示(406)在预定义跨越频率Z。之上的频率时才导出(410)所述度量Φ，其中，所述跨越频率Z。取决于所述解码器的比特率b。
20.根据权利要求14至19中任意一项所述的方法，其中，阶乘脉冲编码FPC方案被用于对所述残差向量进行解码，其中，度量oFrc被导出为:
21.一种用于对音频信号的编码时间段进行解码的变换音频解码器，所述解码器包括: -解码单元(710)，适配为对与所述音频信号的所述时间段相关联的变换向量的段的残差向量的系数的幅度进行解码； -导出单元(706)，适配为导出所述残差向量在频率刻度中的位置的指示符z，并且导出与所述残差向量的结构量有关的度量Φ ; -确定单元(708)，适配为确定是否满足涉及所述度量Φ、所述指示符z和预定义阈值Θ的预定义标准，从而估计在重构所述音频信号时间段之后所述残差向量的非零系数中的至少一些非零系数的符号改变是否将是可听的； -所述解码单元(710)，还适配为仅当确定满足所述标准因而符号改变将是可听的时，才对所述残差向量的非零系数的符号进行解码；以及 -符号产生器(712)，适配为当确定不满足所述标准因而符号改变将是不可听的时，产生针对所述残差向量的非零系数的相应随机符号。
22.根据权利要求21所述的变换音频解码器，还适配为:导出作为所谓的频谱平坦度度量的所述度量Φ。
23.根据权利要求21或22所述的变换音频解码器，其中，将所述预定义标准公式化为: 其中，(^和ω2是缩放因子；O是取决于所述解码器的比特率b的阈值。
24.根据权利要求21至23中任意一项所述的变换音频解码器，其中，所述阈值Θ被配置为随着所述解码器的比特率b的增大而增大。
25.根据权利要求21至24中任意一项所述的变换音频解码器，还适配为:仅当所述指示符z指示在预定义跨越频率Z。之上的频率时才导出所述度量Φ ,其中,所述跨越频率Z。取决于所述解码器的比特率b。
26.根据权利要求21至25中任意一项所述的变换音频解码器，还适配为:使用阶乘脉冲编码FPC方案来对所述残差向量进行解码，其中，度量ΦΡΡ。被导出为:
【文档编号】G10L19/032GK103620674SQ201180072006
【公开日】2014年3月5日申请日期:2011年6月30日优先权日:2011年6月30日
【发明者】沃洛佳·格兰恰诺夫, 西德格尔·思维里森申请人:瑞典爱立信有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：沃洛佳·格兰恰诺夫;西德格尔·思维里森
技术所有人：瑞典爱立信有限公司
我是此专利的发明人