选择性低音后置滤波器的制作方法

文档序号：2832807阅读：206来源：国知局

专利名称：选择性低音后置滤波器的制作方法
技术领域：
本发明主要涉及数字音频编码，更准确地说，涉及对于包含具有不同特性的分量的音频信号的编码技术。
背景技术：
对于包含说话或者歌声的音频信号的普遍类别的编码方法包括与不同的编码方法在时间上交替应用的代码激励线性预测(CELP)，这些不同的编码方法包括特别适于音乐的频域编码方法或者用于解释音频信号的连续时间段之间的特性变化的具有普通性质的方法。例如，如附图2的上部所示，简化运动图片专家组(MPEG)联合语音和音频编码(USAC ；参见标准IS0/IEC23003-3)解码器在至少三种解码方法:高级音频编码(AAC ;参见标准IS0/IEC 13818-7)、代数CELP(ACELP)和变换编码激励(TCX)中可操作。CELP的各种实施例被适配于人的语音器官的属性，并且尽可能地被适配于人的听觉。如在该应用中所使用的，CELP是指所有可能的实施例和变化，包括、但不限于ACELP、宽带和窄带CELP、SB-CELP (子带CELP)、低速率和高速率CELP、RCELP (松弛CELP)、LD-CELP (低延迟 low-delay CELP)、CS-CELP (共轭结构 CELP)、CS-ACELP (共轭结构ACELP)、PS1-CELP (音高同步革新CELP)以及VSELP (矢量和激励线性预测)。R.Schroeder 和 S.Atal 在 Proceedings of the IEEE InternationalConference onAcoustics, Speech, and Signal Processing (ICASSP), vol.10, pp.937-940,1985 中讨论了 CELP 的原理，并且在 Chen and Gersho, IEEETransactions on Speech and AudioProcessing, vol.3，n0.1, 1995中引用的参考文献25-29中描述了某些它的应用。如在前者的论文中进一步详细描述的，CELP解码器(或者类似地，CELP语音合成器)可以包括恢复编码语音信号的周期分量的音高预测器和用来添加革新序列(innovation)的脉冲代码本。音高预测器依次可以包括通过频谱包络成形来恢复音高的长延迟预测器和恢复共振峰的短延迟预测器。在该情境中，通常将音高理解为由声带生成并且通过声道的共振部分进一步进行了润色的有声调声音分量的基频。该频率将与其谐波一起对说话或者歌唱进行主导。通常来说，CELP方法最适合于对良好限定了音高频率并且音高频率相对容易确定的独唱或者一个声部的歌唱进行处理。为了提高CELP编码语音的感知质量，共同的作法是将其与后置滤波(或者音高增强(另一术语))组合。美国专利第4 969 192号和Chen和Gersho的论文的第II部分公开了这种后置滤波器的理想属性，即其抑制处于检测到的语音音高(长期部分；参见第IV部分)的谐波之间的噪声分量的能力。相信该噪声的重要部分来源于频谱包络成形。简单的后置滤波器的长期部分可以被设计为具有下面的传递函数:HE(Z)=1+α[(ZT+Z-T)/2-1]
其中，T是按照样本数量估计的音高周期，α是后置滤波器的增益，如

图1和2所示。以与梳状滤波器类似的方式，这种滤波器对位于音高频率的谐波之间的中途的频率1/(2T)、3/(2T)、5/(2T)、…以及相邻的频率进行衰减。衰减取决于增益α的值。稍微复杂一些的后置滤波器仅对最容易感知噪音的低频应用该衰减一因此有常用术语低音后置滤波器。这可以通过将上述传递函数He和低通滤波器Huj进行级联来表示。因此，通过下式在变换域中给出由后置滤波器提供的后置处理后的解码Se:Se (ζ) -S (ζ) - a S (z) Plt (z) Hlp (ζ),其中，
权利要求
1.一种谐波间噪声衰减后置滤波器(440 ；550 ；740 ；1040 ;1140)，被适配为接收包括初级音频信号的输入信号，并且优选通过对位于频谱谷中的噪声进行衰减来提供输出音频信号，所述后置滤波器的特征在于控制部，所述控制部用于根据后置滤波信号的值选择性地以下列模式之一操作所述后置滤波器: i)滤波模式，其中，所述控制部对所述初级音频信号进行滤波以获得滤波信号，并且提供所述滤波信号作为输出音频信号；以及 )旁路模式，其中，所述控制部提供所述初级音频信号作为输出音频信号。
2.根据权利要求1所述的后置滤波器，其中，所述后置滤波信号被包括在所述输入信号中。
3.根据权利要求1所述的后置滤波器，还包括决定模块(I120)，所述决定模块被适配为估计所述初级音频信号的音高频率，并且对下列标准中的至少一个进行评价: a)所述音高频率以下的频谱分量的功率是否超过预定阈值； b)所述音高频率以下的频谱分量是否是有声调的； c)所述音高频率的谐波之间的频谱分量的功率是否超过预定阈值；以及 d)所述音高频率的谐波之间的频谱分量是否是有声调的；并且所述决定模块被适配为响应于肯定确定，做出生成否定后置滤波信号的决定，所述否定后置滤波信号使所述后置滤波器禁用。
4.一种解码器系统(400 ；500 ；700 ;1000)，用于将比特流信号解码为音频时间信号，所述解码器系统包括: 解码部(410 ;511、512、513 ;711、712、713 ;1011、1013)，用于将比特流信号解码为初级音频时间信号；以及根据权利要求1至3中的任一项所述的谐波间噪声衰减后置滤波器。
5.根据权利要求4所述的解码器系统，其中，所述后置滤波器具有确定谐波间衰减的可变增益，并且所述控制部包括增益控制器，所述增益控制器可操作用于将所述增益的绝对值设置为预定阈值以下，由此禁用所述后置滤波器。
6.根据权利要求4或5所述的解码器系统，其中，所述后置滤波器被适配为仅对处于预定截止频率以下的这种频谱分量进行衰减。
7.根据权利要求4至6中的任一项所述的解码器系统，所述解码部还包括代码激励线性预测CELP解码模块(511 ；711 ；1011)和变换编码激励TCX解码模块(512 ;712)，用于将比特流信号解码为音频时间信号，所述控制部被适配为至少以下列模式操作所述解码器系统: a)启用所述TCX模块，并且禁用所述后置滤波器； b)启用所述CELP模块和所述后置滤波器；以及 c)启用所述CELP模块，并且禁用所述后置滤波器，其中，所述初级音频时间信号和所述音频时间信号一致。
8.根据权利要求6或7所述的解码器系统，所述解码部还包括高级音频编码AAC解码模块(513 ;713)，所述AAC解码模块用于将比特流信号解码为音频时间信号，所述控制部被适配为还以下列模式操作所述解码器: d)启用所述AAC模块，并且禁用所述后置滤波器。
9.根据权利要求4至8中的任一项所述的解码器系统，其中，所述比特流信号是运动图片专家组MPEG比特流，并且所述比特流信号被分割为时间帧，并且所述控制部被适配为禁用整个时间帧或者整个时间帧中的一个序列；以及所述控制部还被适配为针对每个时间帧，接收与该时间帧相关联的数据字段，并且所述控制部响应于所述数据字段的值可操作用于使所述后置滤波器禁用。
10.根据权利要求4至9中的任一项所述的解码器系统(400；500 ；700 ; 1000)，其中: 所述解码部被适配为生成表示激励的中间解码信号，并且向控制部提供该信号；以及所述控制部被适配为作为所述中间解码信号和经过了后置滤波时的所述中间解码信号之间的差来计算近似差信号，所述近似差信号近似于所述后置滤波器要从所述解码信号中去除的信号分量，并且所述控制部被适配为对下列标准中的至少一个进行评价: a)所述近似差信号的功率是否超过预定阈值； b)所述近似差信号的特性是否是有声调的； c)所述近似差信号的幅频谱和所述音频时间信号的幅频谱之间的差是否关于频率不均匀地分布； d)所述近似差信号的幅频谱是否局限于预定相关包络内的频率间隔；以及 e)所述近似差信号的幅频谱是否局限于通过由以预定比例因子缩减的其中的最大信号分量的幅值、对所述音频时间信号的幅频谱进行阈值计算而获得的相关包络内的频率间隔; 并且所述控制部被适配为响应于肯定确定，做出生成使所述后置滤波器禁用的否定后置滤波信号的决定，由此输出所述初级音频时间信号作为所述音频时间信号。
11.一种将比特流信号解码为音频时间信号的的方法，包括如下步骤: 将比特流信号解码为初级音频时间信号；以及通过对谐波间噪声进行衰减来对所述初级音频时间信号进行后置滤波，由此获得音频时间信号，所述方法的特征在于，响应于后置滤波信号，选择性地省略所述后置滤波步骤。
12.根据权利要求11所述的方法，其中，后置滤波的所述省略包括下列之一: 衰减的全省略，衰减的部分省略，逐步增加衰减，以及逐步减小衰减。
13.一种用于将音频时间信号编码为比特流信号的编码器系统(800)，所述编码器系统包括编码部(810)，所述编码部用于将音频时间信号编码为比特流信号，所述编码器系统的特征在于决定部(820)，所述决定部被适配为决定是否要在对所述比特流信号进行解码时禁用后置滤波，所述后置滤波包括对谐波间噪声的衰减，并且所述决定部被适配为在所述比特流信号中对该决定进行编码作为后置滤波信息。
14.根据权利要求13所述的编码器系统，所述决定部被适配为: 检测具有主导基频的信号分量以及处于所述基频以下和任选地其谐波之间的信号分量的共同存在；以及响应于此做出禁用的决定。
15.根据权利要求13或14所述的编码器系统，还包括代码激励线性预测CELP编码模块，所述CELP编码模块被适配为估计所述音频时间信号中的音高频率，其中，所述决定部被适配为检测处于所估计出的音高频率以下的频谱分量，并且响应于此做出禁用的决定。
16.根据权利要求13至15中的任一项所述的编码器系统，所述决定部被适配为计算经过了 CELP编码时的所述音频时间信号的预测功率和经过了 CELP编码和后置滤波时的所述音频时间信号的预测功率之间的差，以及响应于所述差超过预定阈值的，做出禁用的决定。
17.根据权利要求13至16中的任一项所述的编码器系统，所述编码部还包括变换编码激励TCX编码模块，其中，所述决定部被适配为优选地基于速率失真最优化来选择下列编码模式之一: a)TCX编码； b)具有后置滤波的CELP编码； c)没有后置滤波的CELP编码，所述编码器系统还包括编码选择器(814)，被适配为选择下列超级模式之一: i)高级音频编码AAC编码，其中，所述决定部被禁用；以及 ii)TCX/CELP编码，其中，所述决定部被启用以选择编码模式a)、b)和c)中的一个。
18.根据权利要求13至17中的任一项所述的编码器系统，其中，所述决定部被适配为: 根据所述音频时间信号得出近似差信号，所述近似差信号近似于所述后置滤波器要从将来的解码信号中去除的信号分量；对下列标准中的至少一个进行评价: a)所述近似差信号的功率是否超过预定阈值； b)所述近似差信号的特性是否是有声调的； c)所述近似差信号的幅频谱和所述音频时间信号的幅频谱之间的差，是否关于频率不均匀地分布； d)所述近似差信号的幅频谱是否局限于预定相关包络内的频率间隔；以及 e)所述近似差信号的幅频谱是否局限于通过由以预定比例因子缩减的其中的最大信号分量的幅值、对所述音频时间信号的幅频谱进行阈值计算而获得的相关包络内的频率间隔; 以及响应于肯定确定，做出禁用所述后置滤波器的决定。
19.一种将音频时间信号编码为比特流信号的方法，所述方法包括将音频时间信号编码为比特流信号的步骤，所述方法的特征在于另一步骤，该另一步骤决定是否要在对所述比特流信号进行解码时并且在在所述比特流信号中对该决定进行编码作为后置滤波信息时禁用后置滤波，所述后置滤波包括对谐波间噪声的衰减。
20.根据权利要求19所述的方法，其中，决定要禁用后置滤波的步骤的结果从下列中选出: 无衰减，全衰减，部分衰减，逐步增大衰减，以及逐步减小衰减。
21.一种计算机程序产品，其包括数据载体，所述数据载体存储用于执行根据权利要求,11、12、19和20中的任一项所述的方法的指令。
全文摘要
在一个方面，本发明提供一种音频编码方法，其特征在于，做出关于对获得的比特流进行解码的设备是否应当应用包括对谐波间噪声的衰减的后置滤波的决定。因此，与关于最合适的编码方法的决定分开地进行是否使用后置滤波器的决定，所述决定被编码在比特流中。在另一方面，提供一种音频解码方法，该方法具有解码步骤，之后有后置滤波步骤，该后置滤波步骤包括谐波间噪声衰减，该方法的特征在于根据在比特流信号中编码的后置滤波信息禁用后置滤波器的步骤。该方法借助于其仅依据后置滤波信息使后置滤波器失效的能力，因此不依赖于诸如当前编码模式的因素，而非常适合于对混合来源音频信号。
文档编号G10L19/10GK103098129SQ201180033082
公开日2013年5月8日申请日期2011年6月23日优先权日2010年7月2日
发明者巴尔巴拉·雷施, 克里斯托弗·薛林, 拉尔斯·维尔默斯申请人:杜比国际公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：巴尔巴拉·雷施;克里斯托弗·薛林;拉尔斯·维尔默斯
技术所有人：杜比国际公司
我是此专利的发明人

上一篇：处理音频信号的方法和装置的制作方法
上一篇：用于运行用户接口的方法和设备的制作方法