用于选择第一编码算法与第二编码算法中的一个的装置及方法

文档序号：9476325阅读：374来源：国知局

用于选择第一编码算法与第二编码算法中的一个的装置及方法
【技术领域】
[0001]本发明涉及音频编码，更具体地，涉及切换式音频编码，其中对于音频信号的不同部分，使用不同编码算法产生经编码信号。
【背景技术】
[0002]已知判定用于音频信号的不同部分的不同编码算法的切换式音频编码器。大体而言，切换式音频编码器提供在两个不同模式(即，算法，诸如ACELP (代数码激励线性预测(Algebraic Code Excited Linear Predict1n ;ACELP))及TCX(变换编码激励(TransformCoded Excitat1n ;TCX)))之间进行切换。
[0003]MPEG USAC (MPEG 统一语音音频编码(Unified Speech Aud1 Coding ;USAC))的LPD模式基于该两个不同模式ACELP及TCX。ACELP为语音状及瞬态状信号提供较好质量。TCX为音乐状及噪声状信号提供较好质量。编码器逐帧地决定使用哪种模式。编码器所作出的决定对于编解码器质量至关重要。单一的错误决定可产生大量伪像，尤其在低比特率的情况下。
[0004]用于决定使用哪种模式的最直接方法为封闭回路模式选择，亦即执行两种模式的完整编码/解码，接着基于音频信号及经编码/经解码音频信号计算用于两种模式的选择准则(例如，区段性SNR)，且最后基于选择准则选择模式。此方法大体上产生稳定且稳固的决定。然而，其亦要求大量复杂性，因为必须在每一帧处运行两种模式。
[0005]为减少复杂性，替代性方法为开放回路模式选择。开放回路选择由并不执行两种模式的完整编码/解码，但代替地使用通过低复杂性所计算的选择准则而选择一模式组成。接着，通过最不复杂模式(通常为TCX)的复杂性减去计算选择准则所需的复杂性而减少最差状况复杂性。通常节约大量复杂性，此情况使得当编解码器最差状况复杂性受到约束时，此种方法是有吸引力的。
[0006]AMR-WB+标准(国际标准3GPP TS 26.290 V6.1.0 2004-12中所定义)包括用于在80ms帧中，在ACELP/TCX20/TCX40/TCX80的所有组合之间决定的开放回路模式选择。其描述于3GPP TS 26.290的章节5.2.4中。其亦描述于「用于行动、多媒体的较不复杂音频编码(Low Complex Aud1 Encoding for Mobile, Multimedia)，VTC 2006，Makinen 等人」的会议文件中，及追溯至此会议文件的作者的US7，747，430 B2及US 7，739，120 B2。
[0007]US7, 747, 430 B2揭示基于长期预测参数的分析的开放回路模式选择。US7，739，120 B2揭示基于信号特性的开放回路模式选择，该信号特性指示音频信号的各自区段中的音频内容的类型，其中，若此选择并不可行，则进一步基于统计评价进行用于各自相邻区段的选择。
[0008]可以两个主要步骤描述AMR-WB+的开放回路模式选择。在第一主要步骤中，对音频信号进行若干特征计算，诸如能量位准的标准偏差、低频/高频能量比例、总能量、ISP(导抗谱对(immittance spectral pair ;ISP))距离、音调滞后及增益、频谱倾斜。接着，使用简单的基于临限分类器，将此等特征用于在ACELP与TCX之间作出选择。若在第一主要步骤中选择TCX，则第二主要步骤以封闭回路方式在TCX20/TCX40/TCX80的可能组合之间决定。
[0009]WO 2012/110448 Al揭示用于基于音频信号的瞬态侦测结果及质量结果，在具有不同特性的两个编码算法之间作出决定的方法。另外，揭示应用磁滞，其中磁滞依赖于过去所作出的选择，亦即对音频信号的较早部分所作出的选择。
[0010]在“用于行动、多媒体的较不复杂音频编码(Low Complex Aud1 Encoding forMobile, Multimedia)，VTC 2006,Makinen等人”的会议文件中，对AMR-WB+的封闭回路及开放回路模式选择进行比较。主观收听测试指示开放回路模式选择执行显著较差于封闭回路模式选择。但亦展示，开放回路模式选择减少40%的最差状况复杂性。

【发明内容】

[0011]本发明的目标在于提供一种允许在一第一编码算法与具有良好效能及减少的复杂性的一第二编码算法之间作出选择的经改良方法。
[0012]由如权利要求1的装置、如权利要求20的方法及如权利要求37的计算机程序实现此目标。
[0013]本发明的实施例提供一种用以选择具有一第一特性的一第一编码算法及具有一第二特性的一第二编码算法中的一个的装置，该算法用于编码一音频信号的一部分，以获得该音频信号的该部分的一经编码版本，该装置包含:
[0014]—第一估计器，其用于在实际上并不使用该第一编码算法编码及解码该音频信号的该部分的情况下，估计该音频信号的该部分的一第一质量测量，该第一质量测量与该第一编码算法相关联；
[0015]—第二估计器，其用于在实际上并不使用该第二编码算法编码及解码该音频信号的该部分的情况下，估计该音频信号的该部分的一第二质量测量，该第二质量测量与该第二编码算法相关联；以及
[0016]—控制器，其用于基于该第一质量测量与该第二质量测量之间的一比较，选择该第一编码算法或该第二编码算法。
[0017]本发明的实施例提供一种用以选择具有一第一特性的一第一编码算法及具有一第二特性的一第二编码算法中的一个的方法，该算法用于编码一音频信号的一部分，以获得该音频信号的该部分的一经编码版本，该方法包含:
[0018]在实际上并不使用该第一编码算法编码及解码该音频信号的该部分的情况下，估计该音频信号的该部分的一第一质量测量，该第一质量测量与该第一编码算法相关联；
[0019]在实际上并不使用该第二编码算法编码及解码该音频信号的该部分的情况下，估计该音频信号的该部分的一第二质量测量，该第二质量测量与该第二编码算法相关联；及
[0020]基于该第一质量测量与该第二质量测量之间的一比较，选择该第一编码算法或该第二编码算法。
[0021]本发明的实施例基于如下认识:可通过估计第一编码算法及第二编码算法中的每一个的一质量测量，并基于该第一质量测量与该第二质量测量之间的一比较选择该编码算法中的一个，而实施具有改良的效能的一开放回路选择。估计该质量测量，亦即实际上并不编码及解码该音频信号以获得该质量测量。因此，可通过减少的复杂性而获得该质量测量。接着，可使用该估计质量测量执行与一封闭回路模式选择类似的模式选择。
[0022]在本发明的实施例中，实施首先通过较低的复杂性估计ACELP及TCX的区段性SNR的一开放回路模式选择。且接着，类似于在一封闭回路模式选择中，使用此等估计区段性SNR值执行该模式选择。
[0023]本发明的实施例并不类似于AMR-WB+的该开放回路模式选择中所进行地利用一经典的特征+分类器方法。但代替地，本发明的实施例试图估计每一模式的一质量测量，并选择给出最佳质量的该模式。
【附图说明】
[0024]现将参考随附图进一步详细地描述本发明的实施例，其中:
[0025]图1示出用以选择第一编码算法与第二编码算法中的一个的装置的实施例的示意图；
[0026]图2示出用于编码音频信号的装置的实施例的示意图；
[0027]图3示出用以选择第一编码算法与第二编码算法中的一个的装置的实施例的示意图；
[0028]图4a和图4b可能表示SNR及区段性SNR。
【具体实施方式】
[0029]在以下描述中，通过相同参考记号参考不同图式中的类似组件/步骤。应注意，在图式中，已省略理解本发明并不必要的特征(诸如，信号连接及类似者)。
[0030]图1展示用以选择第一编码算法(诸如，TCX算法)与第二编码算法(诸如，ACELP算法)中的一个的装置10，如用于编码音频信号的一部分的编码器。装置10包含用于估计信号部分的第一质量测量的第一估计器12。第一质量测量与第一编码算法相关联。换言的，第一估计器12估计若使用第一编码算法编码并解码，音频信号的部分将具有的第一质量测量，而实际上并不使用第一编码算法编码及解码音频信号的部分。装置10包含用于估计信号部分的第二质量测量的第二估计器14。第二质量测量与第二编码算法相关联。换言的，第二估计器14估计若使用第二编码算法编码并解码，音频信号的部分将具有的第二质量测量，而实际上并不使用第二编码算法编码及解码音频信号的部分。此外，装置10包含用以基于第一质量测量与第二质量测量之间的比较，选择第一编码算法或第二编码算法的控制器16。控制器可包含指

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：埃曼努埃尔·拉维利;斯特凡·多赫拉;纪尧姆·福奇斯;埃莱尼·福托普洛;克里斯蒂安·赫尔姆里希;
技术所有人：弗劳恩霍夫应用研究促进协会;
我是此专利的发明人

上一篇：噪声消除麦克风装置的制造方法
上一篇：用于编码模式切换补偿的技术的制作方法