具有动态可变规整特性的音频编码器、音频解码器和音频处理器的制作方法

文档序号:2830527阅读:316来源:国知局
专利名称:具有动态可变规整特性的音频编码器、音频解码器和音频处理器的制作方法
技术领域
本发明涉及采用规整滤波器的音频处理,具体涉及多用途音频编码。
背景技术
在低比特率音频以及语音编码技术环境下,传统上采用几种不同的编 码技术,从而在给定速率下以尽可能好的主观质量对此类信号进行低比特 率编码。 一般的音乐/声音信号所用的编码器旨在,根据掩蔽阈值曲线对量 化误差的谱(时域)形状进行成形,以优化主观质量,所述掩蔽阈值曲线 是利用感知模型("感知音频编码")根据输入信号来估计得到的。另一方 面,当基于人类语音的产生模型进行语音编码时,以极低的比特率进行语 音编码是很有效的,所述基于人类语音的产生模型进行语音编码,即使 用线性预测编码(LPC)以对人类声道的谐振效应进行建模,并对残差激 励信号进行高效编码。
由于上述两种不同方法的缘故,对于极低数据速率的语音信号, 一般 的音频编码器(如MPEG-1层3、或MPEG-2/4高级音频编码、AAC)由 于没有利用语音源模型,因此其性能通常不如专用的基于LPC的语音编码 器好。相反,基于LPC的语音编码器在应用于一般的音乐信号时,由于不 能根据掩蔽阈值曲线灵活地将编码失真的谱包络进行成形,因此通常不能 取得令人满意的结果。本发明的目的在于,提供一种概念,将基于LPC 的编码同感知音频编码的优势合并于单一框架下,从而提出对于一般音频 和语音信号均很有效的统一音频编码。
以下部分对一组为高效地对音频以及语音信号进行编码而提出的相 关技术进行说明。 感知音频编码(图9)
传统上,感知音频编码器使用基于滤波器组的方法,来高效地对音频 信号进行编码,以及根据对掩蔽曲线的估计,将量化失真成形。图9示出了单声道感知编码系统的基本方框图。分析滤波器组用于将 时域采样映射至子采样谱分量。
根据谱分量的数目,系统还被称为子带编码器(子带数目较少,例如,
32)或基于滤波器组的编码器(谱线数目很大,例如,512)。感知("心
理声学")模型用于估计实际的时间相关掩蔽阈值。谱("子带"或"频域") 分量的量化和编码方式为,将量化噪声隐藏在实际的发送信号下,并且在 解码之后无法察觉量化噪声。这是通过在时域和频域上改变谱值的量化粒 度来实现的。
最近提出了一种基于前置/后置滤波的编码,作为完全基于滤波器组的
感知编码概念的可替换方法,如图10所示。
在[Ed IOO]中,提出了一种感知音频编码器,该感知音频编码器通过 使用所谓的前置滤波器而不是频域上的谱系数的可变量化,将减小非相关 性(即,根据感知准则进行噪声成形)以及减小冗余(即,获得在数学上 更加简洁的信息表示)的方面进行分离。在下图中对该原理进行了说明。 感知模型对输入信号进行分析,以估算以频率为自变量的掩蔽阈值曲线。 将掩蔽阈值转换为一组前置滤波器系数,使前置滤波器频率响应的幅度与 掩蔽阈值成反比。前置滤波操作将这组系数作用于输入信号,从而产生输 出信号,其中,根据频率分量的感知重要性表现全部频率分量("感知白
化")。接着,利用任意类型的音频编码器对该信号进行编码,即不采用任 何感知噪声成形,从而产生"白"量化失真。因此,音频信号的传输/存储包 括编码器的比特流以及前置滤波系数的编码版本。在解码器中,将编码器 比特流解码为中间音频信号,接着根据所发送的滤波器系数对中间音频信 号进行后置滤波操作。由于后置滤波器执行与前置滤波器相对的逆滤波过 程,因此它根据掩蔽曲线对其输入信号应用谱加权。采用这种方法,像预 期的那样,谱平坦("白")编码噪声看似在解码器输出端得到感知成形。
由于在这样的方案中感知噪声成形是通过前置/后置滤波步骤而不是 通过对谱系数进行频率相关量化来实现的,因此可以将此概念推广为包
括除基于滤波器组的音频编码器以外的、用于表示经前置滤波的音频信
号的非基于滤波器组的编码机制。在[Sch02]中,针对使用预测和熵编码级 的时域编码核示出了这个概念。[Ed脂]B. Edler, G. Schuller: "Audio coding using a psychoacoustic pre- and post-filter", ICASSP 2000, Volume 2, 5-9 June 2000 Page (s) :11881 -II884 vol.2 G. Schuller, B. Yu, D. H腿g, and B. Edler, "Perceptual Audio Coding using Adaptive Pre- and post-filters and Lossless Compression", IEEE Transactions on Speech and Audio Processing, September 2002, pp. 379-390
为了利用前置/后置滤波技术实现适当的谱噪声成形,使前置/后置滤 波器的频率分辨率适应于人类听觉系统的频率分辨率是十分重要的。理想 情况下,频率分辨率遵循众所周知的感知频率标度,如BARK或ERB频 率标度[Zwi]。为了最小化前置/后置滤波器模型的阶,从而最小化相关计 算复杂度和辅助信息传输速率,极其希望满足该条件。
前置/后置滤波器频率分辨率的调整可由众所周知的^^J^^概念予以实现。本质上,用导致滤波器频率响应的非均匀变形("规整") 的(一阶或高阶)全通滤波器代替滤波器结构内的单位延迟。已知即使利
用一阶全通滤波器(如^4),也可以通过适当选择全通系数十分精确
地逼近感知频率标度[SA99]。由于一阶全通滤波器完全取决于决定频率标 度变形的单个标量参数(以下称为"规整因子"-1<义<1)。因此,大多数已 知系统不利用高阶全通滤波器进行频率规整。举例而言,对于规整因子 义=0,无有效变形,即滤波器以正常频率标度工作。所选的规整因子越高, 集中于谱的低频部分的频率分辨率越高(由于必须逼近感知频率标度), 所述较高的频率分辨率是从谱的高频部分获得的。图5针对正规整系数和 负规整系数示出了上述情况
利用规整前置/后置滤波器,音频编码器通常以诸如48kHz或44.1kHz 的常见采样率使用8至20间的滤波器阶数[WSKH05]。
现己记录了规整滤波的多种其他应用,如房间冲激响应建模[HKSOO]、 音频信号中噪声分量的参数建模(其等效术语为Laguerre/Kauz滤波)
12[SOB03]。 Zwicker, E. and H. Fasti, "Psychoacoustics, Facts and Models", Springer Verlag, Berlin M. Karjalainen, A. H汪rma, U.K. Laine, "Realizable warped IIR filters and their properties", IEEE ICASSP 1997, pp. 2205 - 2208, vol.3 J.O. Smith, J.S. Abel, "BARK and ERB Bilinear Transforms", IEEE Transactions on Speech and Audio Processing, Volume 7, Issue 6, Nov. 1999, pp. 697 —708 H汪rma, Aki; Karjalainen, Matti; Savioja, Lauri; Valimaki, Vesa; Laine, Unto K.; Huopaniemi, Jyri, "Frequency-Warped Signal Processing for Audio Applications", Journal of the AES, Volume 48 Number 11 pp. 1011-1031; November 2000 E. Schuijers, W. Oomen, B. den Brinker, J. Breebaart, "Advances in Parametric Coding for High-Quality Audio", 114th Convention, Amsterdam, The Netherlands 2003, preprint 5852 S. Wabnik, G. Schuller, U. Kramer, J. Hirschfeld, "Frequency Warping in Low Delay Audio Coding", IEEE International Conference on Acoustics, Speech, and Signal Processing, March 18-23, 2005, Philadelphia, PA, USA 基于LPC的语音编码
传统上,高效语音编码基于线性预测编码(LPC),以对人类声道的谐 振效应进行建模并对残差激励信号进行高效编码[VM06]。将LPC和激励 参数从编码器传送至解码器。以下附图(编码器和解码器)示出了该原理。
随着技术的发展,现已针对残差(激励)信号的高效和感知有效的表 示提出了许多方法,如多脉冲激励(MPE)、规则脉冲激励(RPE)和码 激励线性预测编码(CELP)。
线性预测编码试图基于对于特定数量的过去值的观察产生过去观察 的线性组合,作为对于当前采样值序列的估计。为了减小输入信号中的冗 余,编码器LPC滤波器在其谱包络中"白化"输入信号,即,其频率响应是 信号谱包络的逆的模型。相反地,解码器LPC滤波器的频率响应是信号谱包络的模型。特别地,已知著名的自动回归(AR)线性预测分析利用全 极点近似对信号谱包络进行建模。
典型地,窄带语音编码器(即,具有8kHz采样率的语音编码器)采 用阶数在8至12间的LPC滤波器。由于LPC滤波器特性的缘故,均匀频 率分辨率在整个频率范围内都是有效的。这与感知频率标度并不对应。 规整LPC编码
值得注意,由规整技术提供的非均匀频率灵敏度也可以为语音编码提 供优势,己提出用规整预测分析替代规则LPC分析。特别地,[TML94] 提出一种语音编码器,通过根据时变输入信号逐采样更新的倒谱系数c(m) 对语音谱包络进行建模。利用一阶全通滤波器而不是通常的单位延迟,调 整模型的频率标度,使其近似于感知MEL标度[Zwi]。以8kHz的编码器 采样率使用0.31的固定规整系数。在[KTK95]中,该方法还进一步发展为 包括用于表示激励信号的CELP编码核,该编码核仍然使用0.31的固定规 整系数。
虽然作者宣称所提出的方案具有良好的性能,但现有技术的语音编码 并未采用预测编码技术。
己知规整LPC和CELP编码的其他组合,如[HLM99],其中以44.1kHz 的采样率使用0.723的规整因子。 K. Tokuda, H. Matsumura, T. Kobayashi and S. Imai, "Speech coding based on adaptive mel-cepstral analysis," Proc. IEEE ICASSP'94, pp. 197-200, Apr. 1994.Aki战rma, Unto K. Laine, Matti Karjalainen, "Warped low-delay CELP for wideband audio coding", 17th International AES Conference, Florence, Italy, 1999 Peter Vary, Rainer Martin, "Digital Speech Transmission: Enhancement, Coding and Error Concealment", published by John Wiley & Sons, LTD, 2006, ISBN 0-471-56018-9
14推广的规整LPC编码
在随后几年内在规整频率标度上执行语音编码的概念得到了进一步 的发展。特别地,注意到根据感知频率标度对谱分析进行完全常规规整可
能不适于实现可能的最佳质量。因此,在[KTK96]中提出了Me/难广激谱 i^叛,允许谱模型特性在前面提出的mel倒谱分析的谱模型特性(具有全 规整频率标度和倒谱分析)和传统LPC模型的特性(具有均匀频率标度和 信号谱包络的全极点模型)之间渐变。特别地,所提出的一般分析具有两 个控制上述特性的参数
*参数y, -1^^0连续在倒谱型和0>(:型分析间渐变,其中,r=0 对应于倒谱型分析,对应于LPC型分析。
*参数a, |a|<l是规整因子。01=0对应于完全均匀的频率标度(如在 标准LPC中那样),a=0.31对应于完全感知频率规整。
在[KHT98]中将相同的概念应用于宽带语音编码(以16kHz采样率进 行编码)。应当注意的是,针对这样的推广分析的工作点(y;a)是先验选 定的,并且不随时间变化。 K. Koishida, K. Tokuda, T. Kobayashi and S. Imai, "CELP coding system based on mel-generalized cepstral analysis," Proc. ICSLP'96, pp. 318-321, 1996. K. Koishida, G. Hirabayashi, K. Tokuda, and T, Kobayashi, "A wideband CELP speech coder at 16 kbit/s based on mel-generalized cepstral analysis," Proc. IEEE ICASSP,98, pp. 161 - 164, 1998.
包括编码滤波器和两个可选编码核的结构已在文献("WB-AMR+编 码器"[BLS05])中进行了描述。不存在使用规整滤波器的任何概念,甚至 使用具有时变规整特性的滤波器的概念。 B. Bessette, R. Lefebvre, R. Salami, "UNIVERSAL
Proc. IEEE ICASSP 2005, pp. 301 - 304, 2005.
所有上述技术的缺陷在于,它们都是专门用于特定的音频编码算法的。 采用规整滤波器的任何语音编码器都最佳地适应于语音信号,但是当用于 对一般音频信号(如音乐信号)进行编码时语音编码器性能不佳。
15另一方面, 一般的音频编码器被优化为完美地将量化噪声隐藏于掩蔽 阈值以下,即最佳地适应于减小非相关性。因此,它们具有满足人类听觉 机制的非均匀频率分辨率的功能。然而,由于它们是一般的音频编码器, 因此无法特别地利用有关特定类型信号模式的任何先验知识,而这是获得 获知于例如语音编码器的极低比特率的原因。
此外,许多语音编码器是使用固定和可变码本的时域编码器,然而由 于作为频率度量的掩蔽阈值的问题,大多数一般音频编码器是基于滤波器 组的编码器,因此虽然还存在基于时域的一般的音频编码器,但是以高效 的方式将两个编码器引入单个编码/解码框架困难重重。

发明内容
本发明的目的是,提供一种改进的通用编码概念,不仅为特定信号模 式甚至为一般音频信号提供较高的质量和较低的比特率。
根据本发明的第一方面,该目的是通过对音频信号进行编码的音频编 码器予以实现的,所述音频编码器包括前置滤波器用于产生经前置滤波 的音频信号,所述前置滤波器具有可变规整特性,所述规整特性可响应于 时变控制信号得到控制,所述控制信号指示小规整特性、无规整特性、或 相对较高的规整特性;控制器,用于提供所述时变控制信号,所述时变控 制信号取决于所述音频信号;以及可控编码处理器,用于处理经前置滤波 的音频信号,以获得经编码的音频信号,其中所述编码处理器适于根据第 一编码算法或根据第二编码算法处理经前置滤波的音频信号,所述第一编 码算法适于特定的信号模式,所述第二编码算法不同于所述第一编码算 法,适于对一般的音频信号进行编码。
优选地,所述编码处理器适于受控制器控制,从而利用第二编码算法 处理利用相对较高的规整特性进行滤波的音频信号部分,以获得经编码的 信号,并利用第一编码算法处理利用较小规整特性或未利用规整特性进行 滤波的音频信号。
根据本发明的另一方面,该目的是通过对经编码的音频信号进行解码 的音频解码器予以实现的,所述经编码的音频信号具有根据第一编码算法 进行编码的第一部分,并具有根据第二编码算法进行编码的第二部分,所
16述第一编码算法适于特定的信号模式,所述第二编码算法不同于所述第一 编码算法,适于对一般的音频信号进行编码,所述音频解码器包括检测 器,用于检测形成第一部分或第二部分的编码算法;解码处理器,用于对 所述检测器予以响应,利用所述第一编码算法对第一部分进行解码,以获 得第一解码时间部分,并利用所述第二编码算法对第二部分进行解码,以 获得第二解码时间部分;以及后置滤波器,具有可控的可变规整特性,所
述可变规整特性可以被控制在具有较小规整特性或不具有规整特性的第 一状态和具有相对较高的规整特性的第二状态间。
优选地,后置滤波器被控制为利用小规整特性或不利用规整特性对 第一解码时间部分进行滤波,并利用相对较高的规整特性对第二解码时间 部分进行滤波。
根据本发明的另一方面,该目的是通过对音频信号进行处理的音频处 理器予以实现的,所述音频处理器包括滤波器,用于产生经滤波的音频 信号,所述滤波器具有可变规整特性,所述规整特性可响应于时变控制信 号得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的 规整特性;以及控制器,用于提供所述时变控制信号,所述时变控制信号
取决于所述音频信号。
本发明的其他方面涉及相应的编码、加密和音频处理方法以及相关的 计算机程序和经编码的音频信号。
本发明基于以下发现,即位于音频编码器侧的具有可变规整特性的前 置滤波器是将不同的编码算法集成于单个编码器框架的关键特征。所述两 个不同的编码算法彼此不同。第一编码算法适于特定的信号模式(如语音 信号),但任何其他特定的谐波模式、基音模式、或瞬态模式也可以作为 一种选项,而第二编码算法适于对一般的音频信号进行编码。编码器侧的 前置滤波器或解码器侧的后置滤波器使得可以将信号特定编码模块和一 般编码模块集成在单个编码器/解码器框架内。
通常,可以对一般音频编码器模块或信号特定编码器模块的输入进行 较高程度、较低程度的规整、或不对其进行规整。这取决于特定信号和编 码器模块的实现。因此,可以用信号告知哪个规整滤波特性属于哪个编码 模块。在许多情况下,结果可以是较强的规整特性属于一般音频编码器,较小的或零规整特性属于信号特定模块。在某些实施例中,该情况可以是 固定设置,或者可以是针对特定信号部分动态地向编码器模块传信的结 果。
虽然适于特定信号模式的编码算法通常不十分依赖于采用掩蔽阈值 来减小非相关性,但该编码算法不一定需要规整预处理或仅仅"软"规整预 处理。这意味着适于特定信号模式的第一编码算法有利地使用有关特定信 号模式的先验知识,但不那么依赖掩蔽阈值,因此,不需要接近人类听觉 机制的非均匀频率分辨率。人类听觉机制的非均匀频率分辨率是由沿频率
标度带宽不同的标度因子带所反映的。该非均匀频率标度也被称为BARK 或ERB标度。
只有当编码算法十分依赖于利用掩蔽阈值的概念来减小非相关性,才 必须利用非均匀频率分辨率进行处理和噪声成形,但对于适于特定信号模 式的特定编码算法,无需利用非均匀频率分辨率进行处理和噪声成形,并 且使用先验知识来高效地处理这样的特定信号模式。事实上,由于规整将 影响特定信号模式,而由于第一编码算法是针对特定信号模式进行高度优 化的,因而规整将使第一编码算法的编码效率大大降低,因此任何非均匀 频率规整都将导致这种特定信号模式所适合的编码算法效率下降。
与此相反,只有当采取满足人类听觉机制的非均匀频率分辨率的任何 度量,使得可以从掩蔽阈值得到最佳受益时,第二编码算法才可以产生可 接受的输出比特率以及可接受的音频质量。
由于音频信号可以包括跟随在一般音频后的特定信号模式,即不含该 特定信号模式,或仅仅少量含有该特定信号模式的信号,因此本发明的前 置滤波器仅当存在不含有特定信号模式时,才较大程度地进行规整,而对 于不含特定信号模式的信号,不应用规整,或仅仅应用较小的规整特性。
特别地,对于第一编码算法是依赖于线性预测编码的情况,以及第二 编码算法是基于前置滤波器/后置滤波器架构的一般音频编码器的情况,前 置滤波器可以利用相同的滤波器执行不同的任务。当音频信号具有特定信 号模式时,前置滤波器充当LPC分析滤波器,因此第一编码算法只与残差 信号或LPC激励信号的编码有关。
当存在不含特定信号模式的信号部分时,前置滤波器被控制为具有较
18强的规整特性,优选地,前置滤波器被控制为基于心理声学掩蔽阈值执行 LPC滤波,从而使频率规整滤波器对经前置滤波的输出信号进行滤波,并 且使得相对于心理声学不太重要的谱部分而言心理声学较重要的部分得 到放大。接着,可以使用直接量化器,或者更一般地说,编码过程中的量 化可以无需将编码噪声非均匀地分布在规整滤波器输出中的频率范围上。 量化噪声的噪声成形将自动地被通过解码器侧的时变规整滤波器获得的 后置滤波操作所取代,相对于规整特性,解码器侧的时变规整滤波器与编 码器侧的前置滤波器是相同的,并且,由于该滤波器是解码器侧前置滤波 器的逆,因此自动地产生噪声成形,以最大地减小非相关性,同时保持较 高的音频质量。


下面参考附图对本发明的优选实施例予以说明,附图中 图1是一优选音频编码器的方框图; 图2是一优选音频解码器的方框图; 图3a是经编码的音频信号的示意表示;
图3b是图3a的第一和/或第二时间部分的辅助信息的示意表示; 图4是适用于本发明的现有技术的FIR前置滤波器或后置滤波器的表
不;
图5示出了取决于规整因子的滤波器的规整特性;
图6示出了具有线性滤波器和控制器的本发明的音频处理器,所述线 性滤波器具有时变规整特性;
图7示出了本发明的音频编码器的优选实施例; 图8示出了本发明的音频解码器的优选实施例;
图9示出了具有编码器和解码器的现有技术的基于滤波器组的编码算
法;
图10示出了具有编码器和解码器的现有技术的基于前/后置滤波器的 音频编码算法;以及
图11示出了具有编码器和解码器的现有技术的LPC编码算法。
具体实施例方式
本发明的优选实施例提供了一种实现了对一般音频信号和语音信号 进行编码的统一方法,具有至少与已知的针对两种类型信号的最佳编码方 案的性能相当的编码性能。该方法基于以下考虑
*对于一般音频信号的编码,必须根据掩蔽阈值曲线(根据"感知 音频编码"的思想)对编码噪声谱包络进行成形,因而感知规整 频率标度是所期望的。然而,可能存在特定的(如谐波)音频信 号,其中由于均匀频率分辨率可以更好地分辨音频信号的独立谱 精细结构,因此均匀频率分辨率比感知规整频率分辨率性能更好。 *对于语音信号编码,可以通过规则(非规整)线性有预测实现现 有技术的编码性能。可能存在某些语音信号,对于语音信号一定 程度的规整可以改进编码性能。 根据本发明的思想,用包括可以使其特性平滑地在完全规整操作和非 规整操作间渐变的编码系统解决了这个难题,所述完全规整操作对于音乐 信号的编码而言通常是优选的,所述非规整操作对于语音信号的编码而言
通常是优选的。特别地,所提出的本发明的方法包括具有;^^^i^#房子游
鍵丝^^^^。该滤波器受额外输入的控制,所述额外输入接收期望的规整 因子,并相应地改变滤波操作。
这样的滤波器的操作使滤波器既表现为掩蔽曲线的模型(用于音乐编
码的后置滤波器,进行规整,;l=aq)又表现为信号谱包络的模型(用于 语音编码的逆lpc滤波器,不进行规整,义=0),具体取决于控制输入。 如果本发明的滤波器被配置为还处理中间规整因子的连续区间,那么还可
以得到软中间特性(soft in-between characteristics)。
自然,类似地装配了逆解码器滤波机制,即带有时变规整因子的线性 解码器滤波器,并且可以起感知前置滤波器以及lpc滤波器的作用。
为了产生性能良好的经滤波的信号,以进行后继编码,不希望在两个 不同的规整因子间瞬间切换,而希望使规整因子随时间平缓过渡。作为示 例,在非规整和完全规整操作间的128个采样的过渡可以避免输出信号中 非希望的不连续性。
利用这样的带有可变规整的滤波器,可以构建合并语音/音频编码器,
20按以下方式实现最佳的语音和音频编码质量(参见图7或图8):
对所要使用的编码模式("语音模式"或"音乐模式")的判决是 在独立模块中通过执行输入信号分析实现的,并且可以基于现有 的用于区分语音信号和音乐的技术。因此,判决模块产生关于编 码模式/和相关的滤波器的最佳规整因子的判决结果。此外,根据 该判决结果,确定一组适于选定编码模式下的输入信号的适当的 滤波器系数,即对于语音编码,执行LPC分析(无规整或采用小 规整因子),而对于音乐编码,估计掩蔽曲线,并将掩蔽曲线的逆 转换为规整谱系数。 *用具有时变规整特性的滤波器作为一般的编码器/解码器滤波器, 并且根据编码模式判决结果/规整因子以及由判决模块产生的一组 滤波器系数将其作用于信号。
*根据编码模式,用语音编码核(如CELP编码器)或一般音频编
码器核(如滤波器组/子带编码器、或预测音频编码器)或同时使 用两者,对音频滤波级的输出信号进行编码。
參所要发送/存储的信息包括:编码模式判决结果(或规整因子指示)、 编码形式的滤波器系数、和由语音/激励和一般音频编码器传送的
"f曰息。
对应的解码器相应地按以下方式工作解码器接收所发送的信息,根 据编码模式信息对语音和一般音频部分进行解码,将它们合并为(如通过 将两者相加)单个中间信号,并利用编码模式/规整因子和滤波器系数对该 中间信号进行滤波,以形成最终的输出信号。
接下来,将结合图1讨论本发明的音频编码器。图1的音频编码器有 效地对线路10上的音频信号输入进行编码。将音频信号输入前置滤波器 12,产生出现在线路14上的经前置滤波的音频信号。前置滤波器具有可 变规整特性,所述规整特性可响应于线路16上的时变控制信号得到控制。 所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性。因 此,时变规整控制信号可以是具有两种不同状态(如表示强规整的"1" 或表示无规整的"0")的信号。应用规整的期望目标是,获得与BARK标 度相似的前置滤波器的频率分辨率。然而,也可以使用信号/规整特性设
21置的不同状态。
此外,本发明的音频编码器包括控制器18,用于提供时变控制信号, 其中,如图1中的线路20所示,所述时变控制信号取决于音频信号。此
外,本发明的音频编码器包括可控编码处理器22,用于处理经前置滤波的 音频信号,以在线路24上获得经编码的音频信号输出。具体而言,编码 处理器22适于根据第一编码算法或根据第二编码算法对经前置滤波的音 频信号进行处理,所述第一编码算法适于特定信号模式,所述第二编码算 法不同于所述第一编码算法,适于对一般音频信号进行编码。具体而言, 编码处理器22适于优选地借助线路26上单独的编码器控制信号受控制器 18的控制,从而利用第二编码算法处理利用相对较高的规整特性进行滤波 的音频信号部分,以获得经编码的信号,并利用第一编码算法处理利用较 小规整特性或未利用规整特性进行滤波的音频信号部分。
因此,如控制线路26上信号的控制表28所示,在某些情形下,当处 理音频信号时,对于根据第一编码算法进行滤波的信号,滤波器执行小规 整或不执行规整,而当前置滤波器采用了较强的并且优选的感知全标度规 整时,使用针对一般音频信号的第二编码算法对时间部分进行处理,优选 地所述处理基于将量化噪声隐藏在心理声学掩蔽阈值以下。自然,本发明 还覆盖以下情况对于具有信号特定模式的音频信号的另一部分,应用较 高的规整特性,而对于不具有该特定信号模式的又一部分,采用较低的或 不采用规整特性。举例而言,这可以通过综合编码器判决结果以进行分析 或利用任何其他现有技术中的已知算法,来进行判定。然而,编码器模块 控制还可以根据所发送的规整因子进行固定设置,或者规整因子可由所发 送的编码器模块指示导出。此外,两个信息项(即编码器模块和规整因子) 可以作为辅助信息予以发送。
图2示出了用于对在线路30处输入的经编码的音频信号进行解码的 本发明的解码器。经编码的音频信号具有根据第一编码算法进行编码的第 一部分,并具有根据第二编码算法进行编码的第二部分,所述第一编码算 法适于特定的信号模式,所述第二编码算法不同于所述第一编码算法,适 于对一般的音频信号进行编码。具体而言,本发明的解码器包括检测器 32,用于检测形成第一部分或第二部分的编码算法。该检测可以如虚线34
22所示通过从经编码的音频信号中提取辅助信息的方式来实现,和/或可以如
虚线38所示通过检查进入解码处理器36的比特流的方式来实现。解码处 理器36用于如控制线路40所示对检测器予以响应,以进行解码,从而为 第一和第二部分选择正确的编码算法。
优选地,解码处理器有效地使用第一编码算法对第一时间部分进行解 码,并使用第二编码算法对第二时间部分进行解码,以在线路42上输出 第一和第二解码时间部分。线路42将输入作用于具有可变规整特性的后 置滤波器44。具体而言,可以使用线路46上的时变规整控制信号控制后 置滤波器44,使该后置滤波器在第一状态下只具有较小的规整特性或不具 有规整特性,并在第二状态下具有较高的规整特性。
优选地,后置滤波器44被控制为,利用小规整特性或不利用规整特 性对使用第一编码算法进行解码的第一时间部分进行滤波,并利用相对较 高的规整特性对解码音频信号的第二时间部分进行滤波,从而在线路48 处获得音频解码器输出信号。
当观察图1和图2时,第一编码算法确定要在编码处理器22中采取 的编码器相关步骤,以及要实现于解码处理器36中的相应的解码器相关 步骤。此外,第二编码算法确定要在编码处理器中使用的编码器相关的第 二编码算法步骤,以及要实现于解码处理器36中的相应的第二编码算法 相关的解码步骤。
此外,前置滤波器12和后置滤波器44通常是互逆的。上述滤波器的 规整特性被控制为,使后置滤波器具有与前置滤波器相同的规整特性,或 具有至少相似程度在10%的容差范围以内的相似的规整特性。
自然,当由于存在例如具有特定信号模式的信号,而为规整前置滤 波器时,那么后置滤波器也不必是规整滤波器。
然而,正如稍后将予以概述的那样,前置滤波器12和后置滤波器44 可以实现与第一编码算法或第二编码算法相结合所需的任何其他前置滤 波器或后置滤波器操作。
图3a示出了在图1的线路2上获得的以及可以在图2的线路30上出 现的经编码的音频信号的示例。具体而言,经编码的音频信号包括如参 考标记50所指示的由第一编码算法产生的编码形式的第一时间部分、以及第一部分的相应的辅助信息52。此外,比特流包括如54所示的编码
形式的第二时间部分、以及第二时间部分的辅助信息56。此处应当注意的 是,图3a中各项的顺序可以改变。此外,辅助信息不一定必须被复用在 主要信息50和54之间。如外部需要或实现所指示的那样,上述信号甚至 可以来自独立的信号源。
图3b示出了本发明的显式传信实施例的辅助信息,用于显式地以信 号告知规整因子和编码器模式,可用于图3a的52和56中。以下示出了 图3b的辅助信息流。因此,辅助信息可以包括编码模式指示,显式地 以信号告知形成辅助信息所属部分的第一或第二编码算法。
此外,可以信号告知规整因子。当系统只能使用两种不同的规整特性 (即作为第一种可能的无规整特性,和作为第二种可能的感知全标度规整 特性),以信号告知规整因子并非是必须的。在这种情况下,规整因子可 以是固定的,并且不一定必须发送。
然而,在优选实施例中,规整因子可以两个极端值以外的值,因此使 用如绝对值或差分编码值,显式地以信号告知规整因子。
此外,优选地,前置滤波器不仅实现规整,还实现由第一编码算法和 第二编码算法所要求的、使第一和第二编码算法更加高效工作的任务。
如果第一编码算法是基于LPC的编码算法,那么前置滤波器还实现 LPC分析滤波器的功能,并且解码器侧的后置滤波器实现LPC综合滤波 器的功能。
如果第二编码算法是不具有特定噪声成形功能的通用音频编码器,前 置滤波器优选为LPC滤波器,对音频信号进行前置滤波,使得在前置滤波 后,相对于心理声学不太重要的谱部分而言心理声学较重要的部分得到放 大。在解码器侧,后置滤波器被实现为,用于再生类似于前置滤波前情形 的滤波器,即逆滤波器,所述逆滤波器使心理声学不太重要的谱部分相对 于心理声学较重要的部分得到放大,使得经后置滤波的信号(除发生编码 错误的情况外)类似于输入编码器的原始音频信号。
优选地,上述前置滤波器的滤波器系数还借助辅助信息从编码器发送 至解码器。
典型地,前置滤波器和后置滤波器将被实现为规整FIR滤波器或规整
24IIR数据滤波器,图4示出了规整FIR滤波器的结构。[KHL97]中详细描 述了图4滤波器。[KHL97]还公开了规整IIR滤波器的示例。所有上述数 字滤波器的共同点在于都具有规整延迟单元60,和由Po、 p!、 p2、...所指 示的加权系数或加权单元。如图4中两侧的滤波器结构所示,当用全通滤 波器(如一阶全通滤波器D(z))代替非规整滤波器结构(未示出)中的延 迟单元时,滤波器结构转换为规整滤波器。图4右侧示出了左侧结构的高 计算效率的实现,其中示出了规整因子人的显式使用及其实现。
因此,图4右侧的滤波器结构可以容易地实现于前置滤波器和后置滤 波器内部,其中,规整因子受参数X的控制,而滤波器特性,即LPC分析 /综合或用于放大/减弱心理声学较重要部分的前置滤波或后置滤波的滤波 器系数通过将加权参数po、 (3卜(32、...设置为适当数值来进行控制。
图5示出了频率-规整特性对规整因子 i的依赖,X在-0.8禾n+0.8之间。 当人被设置为0.0时,无法获得任何规整。将X设置在0.3和0.4之间,可以 获得心理声学全标度规整。 一般地,最佳规整因子取决于所选定的采样率, 并且对于32和48kHz间的采样率,具有约0.3和0.4间的规整因子值。利 用规整滤波器如此获得的非均匀频率分辨率类似于BARK或ERB标度。 可以实现明显更强的规整特性,但明显更强的规整特性仅仅在特定情况下 才是有用的,当控制器判定较高规整因子有用时,能够出现所述特定情况。
因此,优选地,编码器侧的前置滤波器具有正规整因子人,用于在低 频范围内提高频率分辨率,并在高频范围内降低频率分辨率。因此,解码 器侧的后置滤波器也具有正规整因子。这样一来,在图6中的70处将优 选的本发明的时变规整滤波器表示为音频处理器的一部分。优选地,本发 明的滤波器是线性滤波器,后者是作为前置滤波器或后置滤波器实现的、 或者是作为依赖于系统控制信号的LPC分析/综合滤波器实现的,前置滤 波器或后置滤波器用于滤波以放大或减弱心理声学上较重要/不太重要的 部分。在这点上值得注意的是,规整滤波器是线性滤波器,并且不改变分 量(如输入滤波器的正弦波)的频率。然而,如果假设规整前的滤波器是 低通滤波器,那么必须按以下阐释的那样理解图5。
如果示例正弦波具有0.6的归一化原始频率,那么滤波器将对等于0.0 的规整因子应用由该非规整滤波器的滤波器冲激响应限定的相位和幅度加权。
当为该低通滤波器设置0.8的规整因子时(此时滤波器变为规整滤波 器),具有0.6的归一化频率的正弦波将被滤波为,使输出得到非规整滤波 器所具有的针对图5中0.97的归一化频率的相位和幅度加权。由于该滤波 器是线性滤波器,因此不改变正弦波的频率。
根据情况,当滤波器70仅仅得到规整时,必须应用规整因子或一般 的规整控制16或46。滤波器系数Pi是从掩蔽阈值导出的。这些滤波器系 数可以是前置或后置滤波器系数、或LPC分析/综合滤波器系数、或结合 第一或第二编码算法有用的任何其他滤波器系数。
因此,除了具有可变规整特性的滤波器以外,根据本发明的音频处理 器还包括图1的控制器18,或实现为图2的编码算法检测器32的控制 器,或在音频输入10/42中查找特定信号模式以便能够设置特定规整特性 的一般音频输入信号分析器,所述特定规整特性符合特定信号模式,因此, 如果音频输入是经编码或经解码的音频输入,可以获得音频输入的时间自 适应可变规整。优选地,前置滤波器系数和后置滤波器系数是相同的。
图6示出的音频处理器包括滤波器70和控制器74,其输出可以被存 储用于各种目的,或者可以由编码处理器22进行处理或者在音频处理器 位于解码器侧的情况下由音频再现设备进行处理,或者可以用任何其他信 号处理算法进行处理。
下面,将讨论图7和8,图7和8示出了本发明的编码器(图7)和 本发明的解码器(图8)的优选实施例。上述设备的功能类似于图1和图 2的设备。具体而言,图7示出了一实施例,其中,第一编码算法是语音 编码器类的编码算法,特定信号模式是音频输入10中的语音模式。第二 编码算法22b是通用音频编码器,如结合图9予以说明和讨论的直接基于 滤波器组的音频编码器,或如图10所示的前置滤波器/后置滤波器音频编 码算法。
第一编码算法与图11的语音编码系统相对应,除了 LPC分析/综合滤 波器1100和1102,语音编码系统还包括残差/激励编码器1104和相应的 激励解码器1106。在该实施例中,图7中的时变规整滤波器12具有与LPC 滤波器1100相同的功能,并且实现于图11中的方框1108中的LPC分析是在控制器18中实现的。
残差/激励编码器U04与图7中的残差/激励编码器核22a相对应。类 似地,激励解码器1106与图8中的残差/激励解码器36a相对应,并且时 变规整滤波器44具有逆LPC滤波器1102的功能,用于处理根据第一编码 算法进行编码的第一时间部分。
由LPC分析方框1108产生的LPC滤波器系数与用于第一时间部分的 图7中90所示的滤波器系数相对应,输入至图11中方框1102的LPC滤 波器系数与图8的线路92上的滤波器系数相对应。此外,图7编码器包 括编码器输出接口94,编码器输出接口可以被实现为比特流复用器,但也 可以被实现为产生适于传输和/或存储的数据流的任何其他设备。相应地, 图8的解码器包括输入接口 %,输入接口可以被实现为,用于对结合图 3a所讨论的特定的时间部分信息进行解复用并提取图3b所示的所需辅助 信息的比特流解复用器。
在图7实施例中,编码核22a、 22b具有公共输入96,并且通过线路 97a和97b受控制器18的控制。该控制确保在特定时刻,编码器核22a、 22b中只有一个向输出接口输出主要和辅助信息。可选地,两编码核可以 完全并行地工作,编码器控制器18确保只将由编码模式信息所指示的编 码核的输出输入至比特流,而将其他编码器的输出丢弃。
再次,可选地,两个解码器可以并行运行,并且可以将其输出相加。 在这种情况下,优选对编码器侧前置滤波器和解码器侧后置滤波器使用中 等的规整特性。此外,举例而言,该实施例利用第一编码算法处理信号的 语音部分,如特定频率范围或(一般地)特定信号部分,并用第二一般编 码算法处理信号的剩余部分。接着,从编码器向解码器侧发送两个编码器 的输出。解码器侧合并确保在进行后置滤波前将信号进行结合。
只要能够确保输出的经编码的音频信号24具有如图3所示的第一和 第二部分的顺序或如语音部分和一般音频部分等信号部分的合并,可以实 现任何类型的特定控制。
在解码器侧,编码模式信息用于使用正确的解码算法对时间部分进行
解码,以在解码器核36a和36b的输出端获得第一部分和第二部分的时间 交错模式,然后,如利用加法器符号36c示意性示出的那样,将两者复用
27为单个时域信号。此时,在元件36c的输出端存在时域音频信号,该信号 必须经后置滤波,以便获得经解码的音频信号。
如之前在

后的发明内容中所讨论的那样,在图7中的编码器
和图8中的解码器可以包括内插器100或102,以借助特定时间部分平滑 过渡,所述特定时间部分至少包括两个采样,但优选包括50个以上的采 样,甚至100个以上的采样也是可实现的。这样可以确保避免可能由规整 因子和滤波器系数的快速改变所引起的编码噪声。然而,由于后置滤波器 和前置滤波器完全是在时域中运作的,因此不存在与基于块的特定实现有 关的问题。因此,再次考虑图4,可以逐采样地改变Po、 (3,、 (52、...和人的 值,使得可以从例如全规整状态渐变为无规整的另一状态。虽然,可以发 送经内插的参数,从而省去解码器侧的内插器,但是,由于后一种选择需 要较少的辅助信息比特,因此优选不发送经内插的值,而发送内插前的值。
此外,如上述已经指出的那样,图7所示的通用音频编码器核22b可 以同图10中的编码器1000相同。在这种情况下,前置滤波器12还将实 现图10中前置滤波器1002的功能。此外,图10中的感知模型1004将被 实现于图7的控制器18中。对于采用第二编码算法的时间部分,由感知 模型1004所产生的滤波器系数与图7中线路90上的滤波器系数相对应。
类似地,图10中的解码器1006是由图8中的通用音频解码器核36b 实现的,后置滤波器1008是由图8中的时变规整滤波器44实现的。在解 码器侧在线路92十—接收由感知模型产生的优选地经编码的滤波器系数, 使进入图10中后置滤波器1008的标有"滤波器系数"的线路与第二编码 算法时间部分的图8中的线路92相对应。
然而,同根据图10和11的两个由于音频质量和比特率的缘故并不完 美的并行工作的编码器相比,本发明的编码器设备和本发明的解码器设备 仅使用单个的但可控的滤波器,并且分辨输入信号,以判断音频信号的时 间部分是具有特定的模式,还是仅仅是一般的音频信号。
关于控制器18内的音频分析器,可以用多种不同的实现来判断音频 信号的一部分是否是具有特定信号模式的部分,或该部分是否不具有该特 定信号模式,并因此必须使用一般的音频编码算法对其进行处理。虽然已 讨论了特定信号模式是语音信号的优选实施例,但是还可以确定其他信号特定模式,并且可以用这样的信号特定的第一编码算法(如谐波信号、噪 声信号、音调信号、或脉冲序列状信号等的编码算法)对其他信号特定模 式进行编码。
标准检测器是综合分析检测器,举例而言,综合分析检测器尝试不同 的编码算法以及不同的规整检测器,以寻找最佳规整因子以及最佳滤波器 系数和最佳编码算法。在某些情况下,这样的综合分析检测器在计算上开 销很大。这在编码器数量较少解码器数量较多的情况下无关紧要,因为在 这种情况下解码器可以极其简单。这是由于只有编码器执行该复杂的计算 任务,而解码器可以简单地使用所发送的辅助信息。
其他信号检测器基于直接模式分析算法,直接模式分析算法查找音频 信号中的特定信号模式,并在匹配程度超过特定门限时以信号告知一肯定
结果。[BLS05]中给出了有关这种检测器的更多的信息。
此外,根据本发明方法的特定实现需求,本发明的方法可以用硬件或 软件来实现。可以使用数字存储介质(特别是在其上存储着电子可读控制
信号的盘片或CD)来完成实现,所述数字存储介质能够同可编程计算机
系统协作,以实现本发明的方法。 一般地,因此,本发明是将程序代码存 储在机器可读载体上的计算机程序产品,所述程序代码被配置为,在计算 机程序产品运行于计算机上时,执行本发明的至少一种方法。换言之,因 此,本发明的方法是计算机程序,所述计算机程序含有用于在计算机程序 运行于计算机上时执行本发明方法的程序代码。
上述实施例仅仅说明了本发明的原理。应当理解的是,对于所属领域 技术人员而言,对此处所述的配置和细节的改变和修改是显而易见的。因 此,本意上本发明仅受限于以下专利权利要求的范围,而不受通过此处对 实施例的说明和描述所展现的特定细节的限制。
29
权利要求
1. 一种用于对音频信号进行编码的音频编码器,包括前置滤波器,用于产生经前置滤波的音频信号,所述前置滤波器具有可变规整特性,所述规整特性可响应于时变控制信号从而得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性;控制器,用于提供所述时变控制信号,所述时变控制信号取决于所述音频信号;以及可控编码处理器,用于处理经前置滤波的音频信号,以获得经编码的音频信号,其中,所述编码处理器适于根据第一编码算法或根据第二编码算法处理经前置滤波的音频信号,所述第一编码算法适于特定的信号模式,所述第二编码算法不同于所述第一编码算法,适于对一般的音频信号进行编码。
2. 根据权利要求1所述的音频编码器,其中,所述编码处理器适于 使用语音编码算法的至少一部分作为第一编码算法。
3. 根据权利要求1所述的音频编码器,其中,所述编码处理器适于 使用残差/激励编码算法作为第一编码算法的一部分,所述残差/激励编码 算法包括码激励线性预测(CELP)编码算法、多脉冲激励(MPE)编 码算法、或规则脉冲激励(RPE)编码算法。
4. 根据权利要求1所述的音频编码器,其中,所述编码处理器适于 使用基于滤波器组的、基于滤波器组的、或基于时域的编码算法作为第 二编码算法。
5. 根据权利要求1所述的音频编码器,还包括心理声学模块,用于提供有关掩蔽阈值的信息,并且其中,所述前置滤波器有效地基于掩蔽阈值执行滤波操作,使得在经 前置滤波的音频信号中,相对于心理声学上较不重要的部分,心理声学上 较重要的部分得到放大。
6. 根据权利要求5所述的音频编码器,其中,所述前置滤波器是具 有可控规整因,线性滤波器,所述可控规整因子是由所述时变控制信号 确定的,并且其中,滤波器系数是基于所述掩蔽阈值通过分析加以确定的。
7. 根据权利要求1所述的音频编码器,其中,所述第一编码算法包 括残差或激励编码步骤,所述第二编码算法包括一般的音频编码步骤。
8. 根据权利要求1所述的音频编码器,其中,所述编码处理器包括: 第一编码核,用于对音频信号应用所述第一编码算法; 第二编码核,用于对音频信号应用所述第二编码算法;其中,第一和第二编码核具有与所述前置滤波器的输出相连的公共输入,第一和第二编码核具有单独的输出,其中,所述音频编码器还包括输出级,用于输出经编码的信号,并且 其中,所述控制器有效地仅将所述控制器所指示的应在一时间部分处于活动状态的编码核的输出连接至所述输出级。
9. 根据权利要求1所述的音频编码器,其中,所述编码处理器包括-第一编码核,用于对音频信号应用所述第一编码算法; 第二编码核,用于对音频信号应用所述第二编码算法;其中,第一和第二编码核具有与所述前置滤波器的输出相连的公共输 入,第一和第二编码核具有单独的输出,并且其中,所述控制器有效地激活由编码模式指示选定的编码核,并禁用 未被编码模式指示选定的编码核,或针对音频信号的同一时间部分的不同 成份激活第一和第二编码核。
10. 根据权利要求1所述的音频编码器,还包括输出级,用于向经 编码的信号输出时变控制信号、或通过量化或编码由时变控制信号导出的 信号,作为辅助信息。
11. 根据权利要求6所述的音频编码器,还包括输出级,用于向经编码的音频信号输出有关掩蔽阈值的信息作为辅助信息。
12. 根据权利要求6所述的音频编码器,其中,所述编码处理器在应 用所述第二编码算法时,有效地利用量化器对经前置滤波的音频信号进行 量化,所述量化器具有引入具有平坦谱分布的量化噪声的量化特性。
13. 根据权利要求12所述的音频编码器,其中,所述编码处理器在 应用所述第二编码算法时,有效地对由经前置滤波的音频信号导出的经前 置滤波的时域采样、子带采样、频率系数、或残差采样进行量化。
14. 根据权利要求1所述的音频编码器,其中,所述控制器有效地提 供所述时变控制信号,使得同前置滤波器的小规整特性相比,对于前置滤 波器的相对较高的规整特性,规整操作提高低频范围的频率分辨率并降低 高频范围的频率分辨率。
15. 根据权利要求1所述的音频编码器,其中,所述控制器包括音 频信号分析器,用于分析音频信号以确定所述时变控制信号。
16. 根据权利要求1所述的音频编码器,其中,所述控制器有效地产 生时变控制信号,除指示无规整特性或很小的规整特性的第一极端状态以 及指示最大规整特性的第二极端状态之外,所述时变控制信号还具有指示 两种极端状态之间的规整特性的零个、 一个或多个中间状态。
17. 根据权利要求1所述的音频编码器,还包括内插器,其中,所述 内插器有效地控制所述前置滤波器,使规整特性在具有至少两个时域采样 的渐变时段内在两个规整状态间渐变,所述两个规整状态是由所述时变控 制信号通知的。
18. 根据权利要求17所述的音频编码器,其中,所述渐变时段包括 在不引起规整或引起小规整的滤波特性和引起相对较高的规整的滤波特性间的至少50个时域采样,所述相对较高的规整导致与BARK或ERB标 度相似的规整频率分辨率。
19. 根据权利要求17所述的音频编码器,其中,所述内插器有效地 在所述渐变时段内使用由时变控制信号指示的产生两个规整特性间的规 整特性的规整因子。
20. 根据权利要求1所述的音频编码器,其中,所述前置滤波器是具 有规整FIR或规整IIR结构的数字滤波器,所述结构包括延迟单元,所述 延迟单元被形成为,具有一阶或高阶全通滤波特性。
21. 根据权利要求20所述的音频编码器,其中,所述全通滤波特性 基于以下滤波特性(z一-" / (H1), 其中,z"表示离散时域内的延迟,人是规整因子,当所述规整因子大 小接近于'T'时指示较强的规整特性,当所述规整因子大小接近于"O"时指 示较小的规整特性。
22. 根据权利要求20所述的音频编码器,其中,所述FIR或IIR结 构还包括加权单元,每个加权单元具有相关加权因子,其中,所述加权因子是由前置滤波器的滤波器系数确定的,所述滤波 器系数包括LPC分析或综合滤波器系数、或者掩蔽阈值确定的分析或综 合滤波器系数。
23. 根据权利要求20所述的音频编码器,其中,所述前置滤波器具 有6至30间的滤波器阶数。
24. 根据权利要求1所述的音频编码器,其中,所述编码处理器适于 受所述控制器控制,从而利用所述第二编码算法处理利用相对较高的规整 特性进行滤波的音频信号部分,以获得经编码的信号,并利用所述第一编 码算法处理利用较小规整特性或未利用规整特性进行滤波的音频信号。
25. —种用于对经编码的音频信号进行解码的音频解码器,所述经编 码的音频信号具有根据第一编码算法进行编码的第一部分,并具有根据第 二编码算法进行编码的第二部分,所述第一编码算法适于特定的信号模 式,所述第二编码算法不同于所述第一编码算法,适于对一般的音频信号 进行编码,所述音频解码器包括检测器,用于检测形成第一部分或第二部分的编码算法; 解码处理器,用于对所述检测器予以响应,利用所述第一编码算法对第一部分进行解码,以获得第一解码时间部分,并利用所述第二编码算法对第二部分进行解码,以获得第二解码时间部分;以及后置滤波器,具有可控的可变规整特性,所述可变规整特性可以被控制在具有较小规整特性或不具有规整特性的第一状态和具有相对较高的规整特性的第二状态间。
26. 根据权利要求25所述的音频解码器,其中,所述后置滤波器被 设置为,使后置滤波期间的规整特性与前置滤波期间使用的规整特性相 似,相似程度在相对于规整强度10%的容差范围以内。
27. 根据权利要求25所述的音频解码器,其中,所述经编码的音频 信号包括编码模式指示符或规整因子信息,其中,所述检测器有效地从经编码的音频信号中提取有关编码模式的 信息或规整因子,并且其中,利用所述所提取的信息,所述解码处理器或后置滤波器有效地 得到控制。
28. 根据权利要求27所述的音频解码器,其中,由所述所提取的信息导出并用于控制所述后置滤波器的规整因子是正数。
29. 根据权利要求25所述的音频解码器,其中,所述经编码的信号 还包括与滤波器系数有关的信息,所述滤波器系数取决于构成所述经编 码的信号的原始信号的掩蔽阈值,并且其中,所述检测器有效地从经编码的音频信号中提取有关滤波器系数 的信息,并且其中,所述后置滤波器适于基于与所述滤波器系数有关的提取信息得 到控制,使得同后置滤波前的信号相比,经后置滤波的信号与原始信号更 为相似。
30. 根据权利要求25所述的音频解码器,其中,所述解码处理器适 于使用语音编码算法作为第一编码算法。
31. 根据权利要求25所述的音频解码器,其中,所述解码处理器适 于使用残差/激励解码算法作为第一编码算法。
32. 根据权利要求25所述的音频解码器,其中,所述残差/激励解码算法包括所述残差/激励编码算法,作为第一编码算法的一部分,所述残差 /激励编码算法包括:码激励线性预测(CELP)编码算法、多脉冲激励(MPE) 编码算法、或规则脉冲激励(RPE)编码算法。
33. 根据权利要求25所述的音频解码器,其中,所述解码器处理器 适于使用基于滤波器组的或基于变换的或基于时域的解码算法作为第二 编码算法。
34. 根据权利要求25所述的音频解码器,其中,所述解码器处理器 包括第一编码核,用于对经编码的音频信号应用所述第一编码算法;第二编码核,用于对经编码的音频信号应用所述第二编码算法;其中,第一和第二编码核具有输出,每个输出与合并器相连,所述合 并器具有与所述后置滤波器的输入相连的输出,其中,所述编码核被控制为只将由选定的编码算法输出的经解码的时间部分转发至合并器和后置 滤波器,或者用不同编码核以及所述合并器对音频信号的同一时间部分的不同成份进行处理,所述合并器有效地合并所述不同成份的解码表示。
35. 根据权利要求35所述的音频解码器,其中,所述解码器处理器在应用所述第二编码算法时,有效地对已利用量化器进行过量化的音频信 号进行反量化,所述量化器具有引入具有平坦谱分布的量化噪声的量化特 性。
36. 根据权利要求25所述的音频解码器,其中,所述编码处理器在 应用所述第二编码算法时,有效地对经量化的时域采样、经量化的子带采 样、经量化的频率系数、或经量化的残差采样进行反量化。
37. 根据权利要求25所述的音频解码器,其中,所述检测器有效地 提供时变后置滤波器控制信号,使得同具有小规整特性或不具有规整特性 的后置滤波器的滤波输出信号相比,对于后置滤波器的相对较高的规整特 性,规整滤波输出信号在高频范围内具有降低了的频率分辨率,在低频范 围内具有增加了的频率分辨率。
38. 根据权利要求25所述的音频解码器,还包括内插器,用于控 制所述后置滤波器,使规整特性在具有至少两个时域釆样的渐变时段内在 两个规整状态间渐变。
39. 根据权利要求25所述的音频解码器,其中,所述后置滤波器是 具有规整FIR或规整IIR结构的数字滤波器,所述结构包括延迟单元,所 述延迟单元被形成为,具有一阶或高阶全通滤波特性。
40. 根据权利要求25所述的音频解码器,其中,所述全通滤波特性 基于以下滤波特性(z-1-" / (l画Xz-", 其中,z"表示离散时域内的延迟,X是规整因子,当所述规整因子大小接近于"r时指示较强的规整特性,当所述规整因子大小接近于"o"时指示较小的规整特性。
41. 根据权利要求25所述的音频解码器,其中,所述规整FIR或规 整IIR结构还包括加权单元,每个加权单元具有相关加权因子,其中,所述加权因子是由前置滤波器的滤波器系数确定的,所述滤波 器系数包括LPC分析或综合滤波器系数、或者掩蔽阈值确定的分析或综 合滤波器系数。
42. 根据权利要求25所述的音频解码器,其中,所述后置滤波器被控制为利用小规整特性或不利用规整特性对第一解码时间部分进行滤 波,并利用相对较高的规整特性对第二解码时间部分进行滤波。
43. —种经编码的音频信号,具有根据第一编码算法进行编码的第 一时间部分、以及根据第二编码算法进行编码的第二时间部分,所述第一 编码算法适于特定的信号模式,所述第二编码算法不同于所述第一编码算 法,适于对一般的音频信号进行编码。
44. 根据权利要求43所述的经编码的音频信号,还包括作为辅助信息的编码模式指示符、或规整因子、或滤波器系数信息,所述编码模式 指示符指示是第一编码算法形成第一部分还是第二编码算法形成第二部 分,所述规整因子指示形成经编码的音频信号的第一或第二部分的规整强 度,所述滤波器系数信息表示用于对音频信号进行编码的前置滤波器或在 对音频信号进行解码时所使用的后置滤波器。
45. —种对音频信号进行编码的方法,包括产生经前置滤波的音频信号,所述前置滤波器具有可变规整特性,所 述规整特性可响应于时变控制信号得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性;提供所述时变控制信号,所述时变控制信号取决于所述音频信号;以及根据第一编码算法或根据第二编码算法处理经前置滤波的音频信号, 以获得经编码的音频信号,所述第一编码算法适于特定的信号模式,所述 第二编码算法不同于所述第一编码算法,适于对一般的音频信号进行编 码。
46. —种于对经编码的音频信号进行解码的方法,所述经编码的音频 信号具有根据第一编码算法进行编码的第一部分,并具有根据第二编码算 法进行编码的第二部分,所述第一编码算法适于特定的信号模式,所述第 二编码算法不同于所述第一编码算法,适于对一般的音频信号进行编码, 所述方法包括检测形成第一部分或第二部分的编码算法;对所述检测器予以响应,利用所述第一编码算法对第一部分进行解码,以获得第一解码时间部分,并利用所述第二编码算法对第二部分进行 解码,以获得第二解码时间部分;以及对所述检测步骤予以响应,利用所述第一编码算法对第一部分进行解 码,以获得第一解码时间部分,并利用所述第二编码算法对第二部分进行解码,以获得第二解码时间部分;利用可控的可变规整特性进行后置滤波,所述可变规整特性可以被控 制在具有较小规整特性或不具有规整特性的第一状态和具有相对较高的 规整特性的第二状态间。
47. —种用于处理音频信号的音频处理器,包括滤波器,用于产生经滤波的音频信号,所述滤波器具有可变规整特性, 所述规整特性可响应于时变控制信号得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性;控制器,用于提供所述时变控制信号,所述时变控制信号取决于所述 音频信号。
48. —种处理音频信号的方法,包括利用滤波器产生经滤波的音频信号,所述滤波器具有可变规整特性, 所述规整特性可响应于时变控制信号得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性;以及提供所述时变控制信号,所述时变控制信号取决于所述音频信号。
49. 一种含有程序代码的计算机程序,当在计算机上运行时,所述程 序代码执行权利要求45、 46或48所述的方法。
全文摘要
一种音频编码器、音频解码器或音频处理器,包括滤波器(12),用于产生经滤波的音频信号,所述滤波器具有可变规整特性,所述规整特性可响应于时变控制信号(16)得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性。此外,控制器(18)连接用于提供取决于音频信号的时变控制信号。经滤波的音频信号可以被引入具有不同编码算法的编码处理器(22),所述编码算法之一是适于特定信号模式的编码算法。可选地,滤波器是接收经解码的音频信号的后置滤波器。
文档编号G10L19/00GK101501759SQ200780030281
公开日2009年8月5日 申请日期2007年5月16日 优先权日2006年6月30日
发明者乌尔里希·克拉梅尔, 于尔根·赫勒, 伯恩哈德·格瑞, 延斯·希斯费尔德, 斯特凡·拜尔, 斯特凡·瓦希尼克, 格拉尔德·舒勒, 马库斯·马特拉斯 申请人:弗劳恩霍夫应用研究促进协会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1