支持音频编码器模式间的转换的制作方法

文档序号：2829031阅读：212来源：国知局

专利名称：支持音频编码器模式间的转换的制作方法
技术领域：
本发明涉及一种用于支持音频信号编码的方法，其中至少第一编码器模式和第二编码器模式可以用于编码该音频信号的各个部分，并且其中至少第二编码器模式至少基于两种不同编码模型启动该音频信号各个部分的编码。本发明同样涉及相应的模块，涉及包含相应编码器的电子设备并且涉及包含相应编码器和解码器的音频编码系统。最后，本发明还涉及相应的软件程序产品。
背景技术：
一个音频信号可以是语音信号或者其它类型的音频信号，比如音乐，不同的编码模型可以适用于不同类型的音频信号。
用于编码语音信号的广泛使用的技术是代数码激励线性预测(ACELP)编码。ACELP模仿人类语音生成系统，而且非常适合编码语音信号的周期。作为结果，用非常低的比特率能够实现高语音品质。例如，自适应多速率宽带(AMR-WB)是基于ACELP技术的语音编解码器。例如，在技术规范3GPP TS 26.190“Speech Codec speechprocessing functions；AMR Wideband speech codec；Transcodingfunctions”，V5.1.0(2001年12月)中已经描述了AMR-WB。然而，基于人类语音生成系统的语音编解码器对其它类型的音频信号，比如音乐通常表现得相当差。
用于编码除去语音之外的其它音频信号的广泛使用的技术是变换编码(TCX)。对音频信号变换编码的优越性基于感知型掩蔽和频率域编码。通过为该变换编码选择适合的编码帧长度可以进一步改善得到的音频信号的质量。但是当变换编码技术导致除了语音之外的音频信号的高质量时，其性能在以低比特率运行时对周期性的语音信号并不好。因此，变换编码的语音的质量通常相当低，尤其对长的TCX帧长度更是如此。
扩展的AMR-WB(AMR-WB+)编解码器将立体声音频信号编码为高比特率单声道信号，并提供立体声扩展的某些边界信息。该AMR-WB+编解码器利用ACELP编码和TCX模型二者编码0Hz到6400Hz的频带中的核心单声道信号。对于TCX模型，利用20ms、40ms或者80ms的编码帧长度。
由于ACELP模型可以降低音频质量，而变换编码通常对语音表现很差，特别是在使用长编码帧时，不得不取决于要编码的信号的特性来选择各自最佳的编码模型。可以以各种各样的方式实现实际要使用的编码模型的选择。
在需要低复杂性技术的系统中，比如移动多媒体业务(MMS)中，通常使用音乐/语音分类算法来选择最佳的编码模型。这些算法基于音频信号的能量和频率特性的分析，将整个源信号分类为音乐或者语音。
如果一个音频信号仅由语音或者仅由音乐组成，基于这种音乐/语音分类对整个信号使用同一种编码模型将是符合要求的。然而在许多其它情况中，要编码的音频信号是混合型的音频信号。例如，在音频信号中，语音可能与音乐同时出现和/或暂时用音乐替代。
在这些情况中，将整个源信号分类为音乐或者语音种类是一种非常有限的方法。因而，仅可以通过在编码音频信号时暂时在编码模型之间转换来使综合音频质量最佳化。也就是说，ACELP模型也部分地用于编码分类为除去语音之外的音频信号的源信号，而TCX模型也部分地用于编码分类为语音信号的源信号。
扩展的AMR-WB(AMR-WB+)编解码器也设计为在一帧接一帧的基础上用混合的编码模型编码这种混合类型的音频信号。
可以以几种方式实现AMR-WB+中编码模型的选择，即分类。
在最复杂的方法中，信号首先用ACELP和TCX模型的所有可能组合来编码。接着，对每一种组合再次合成该信号。然后，基于所合成的语音信号的质量，选择最好的激励。可以通过，例如，确定其信噪比(SNR)，来测量用特定的组合得到的合成语音的质量。这种综合分析型的方法将提供好的结果。然而，由于其非常高的复杂性，在某些应用中它行不通。例如，这样的应用包括移动应用。复杂性很大程度上来自于ACELP编码，它是编码器最复杂的部分。
例如，在比如MMS的系统中，上面提到的全闭环综合分析方法太复杂而难以执行。因此，在MMS编码器中，较低复杂性的开环方法可以用于分类以确定要使用ACELP编码模型还是TCX模型来编码一个特殊的帧。
AMR-WB+可以使用各种各样的低复杂性开环方法来为每个帧选择各自的编码模型。这种方法中使用的选择逻辑旨在更详细地估计源信号特征及编码参数，以选择各自的编码模型。
在分类过程中一种建议的选择逻辑包括首先使每个帧中的音频信号分为几个频带，并分析较低频带中的能量与较高频带中的能量之间的关系，即分析那些频带中的能量等级变化。随后利用不同的分析窗口和判决阈值，基于所执行的测量二者或者基于这些测量的不同组合，将该音频信号的每个帧中的音频内容分类为类似音乐的内容或者类似语音的内容。
在另一种帮助分类的、特别地用于第一选择逻辑之外的并因此也称作模型分类改进的建议的选择逻辑中，编码模型选择是基于该音频信号的各个帧中的音频内容的周期和固定特性的估计。更特别地，通过确定相关性、长期预测(LTP)参数和频谱距离测量来估计周期和固定特性。
倘若取样频率不变，AMR-WB+编解码器此外允许，在音频数据流编码期间，在专门使用ACELP编码模型的AMR-WB模式和使用ACELP编码模型或者TCX模型的扩展模式之间的转换。例如，取样频率可以是16kHz。
扩展模式输出比AMR-WB模式较高的比特率。因而，当连接编码端和解码端的网络中的传输条件需要从较高比特率模式变化到较低比特率模式以降低网络中的拥塞时，从扩展模式到AMR-WB模式的转换可能是有利的。可能也需要从较高比特率模式到较低比特率模式的变化，以合并移动广播/多点传送业务(MBMS)中的新的低端接收机。
另一方面，当网络中的传输条件中的变化允许从较低比特率模式变化到较高比特率模式时，从AMR-WB模式到扩展模式的转换可能是有利的。使用较高比特率模式能够实现更好的音频质量。
由于核心编解码器对AMR-WB模式和AMR-WB+扩展模式使用6.4kHz的相同取样率，并至少使用部分地类似的编码技术，可以平滑地处理在这个频带从扩展模式到AMR-WB模式的变化，或者反之亦然。然而，由于ACELP核心波段编码过程与AMR-WB模式和扩展模式稍有不同，在编码器模式之间转换时，不得不小心地存储所有需要的状态变量和缓冲器，并从一个算法复制到另一个算法。
此外，不得不考虑到变换模型仅可用于扩展模式。
为了编码特定编码帧，TCX模型使用了重叠窗口。这在图1中举例说明了。图1是表示具有多个编码帧和多个重叠分析窗口的时间线示图。为了编码一个TCX帧，使用了一个覆盖了当前TCX帧和先前的TCX帧的窗口。在该图中用粗实线表示这样的TCX帧11及相应重叠窗口12。在该图中用粗虚线表示下一个TCX帧13及相应窗口14。即使实际上重叠通常较小，在所呈现的示例中，分析窗口重叠50％。
在AMR-WB扩展模式内的典型操作中，在已经编码当前帧之后，基于关于当前帧的信息，生成各自的下一帧的重叠信号。
当变换编码模型用于当前编码帧时，由于该变换的分析窗口重叠，通过定义生成下一个编码帧的重叠信号。
相反，ACELP编码模型仅依靠来自当前编码帧的信息，也就是说，它不使用重叠窗口。如果一个ACELP编码帧跟随了一个TCX帧，则ACELP算法因此需要人为生成一个重叠信号，也就是说，加上目前的ACELP相关的处理。
图2表示了扩展模式中的典型情况，其中，由于其紧跟着一个ACELP帧，不得不为一个TCX帧生成人为重叠信号。用粗虚线表示TCX帧23的ACELP编码帧21和人为重叠信号22。用粗实线表示TCX帧23和来自TCX帧23的重叠信号24。如果一个ACELP帧跟随了另一个ACELP帧，则由于ACELP编码不需要来自先前编码帧的任何重叠信号，所以不生成重叠信号。
在AMR-WB扩展模式中，ACELP模式中人为重叠信号的生成是固有的特征。因此，ACELP编码和TCX之间的转换是平滑的。
然而，当AMR-WB+编解码器从标准AMR-WB模式转换到扩展模式时，还留下一个问题。由于这个编码器模式中不需要重叠信号，标准AMR-WB模式不提供任何人为重叠信号的生成。因此，如果从AMR-WB模式转换到扩展模式之后选择的音频信号帧是一个TCX帧，则编码不能正确地执行。作为结果，丢失的重叠信号部分将导致音频信号的合成中听得见的人为瑕疵。

发明内容
本发明的一个目的是支持不同编码器模式间的平滑转换。
根据本发明的第一方面，提出了一种支持音频信号编码的方法，其中至少第一编码器模式和第二编码器模式可以用于编码该音频信号的各个部分。至少第二编码器模式能够基于至少两种不同的编码模型编码该音频信号的各个部分。该编码模型的第一种仅需要来自该音频信号的各个部分本身的信息来编码该部分，而该编码模型的第二种另外需要与来自该音频信号先前部分的信息相重叠的信号来编码该音频信号的各个部分。在从第一编码器模式转换到第二编码器模式之后，第一编码模型用于编码该音频信号的第一部分。对该音频信号的其它部分来说，选择各自最适合的编码模型。
此外，至少在为编码该音频信号的后续部分选择了第二编码模型的情况下，基于来自第一部分的信息生成人为重叠信号。各自所选的编码模型随后用于编码其它部分。
根据本发明的第一方面，此外还提出了一种用于编码音频信号连续部分的模块。该模块包括适合编码音频信号各个部分的第一编码器模式部分，和适合编码音频信号各个部分的第二编码器模式部分。该模块还包括适合在第一编码器模式部分与第二编码器模式部分之间转换以编码音频信号的各个部分的转换部分。第二编码器模式部分包括适合为音频信号的各个部分选择至少两种不同编码模型之一的选择部分，其中这些编码模型的第一种仅需要来自音频信号各个部分本身的信息来编码该部分，而这些编码模型的第二种另外需要与来自音频信号先前部分的信息相重叠的信号来编码该音频信号的各个部分。该选择部分还适合为音频信号的第一部分在转换到第二编码器模式部分之后总是选择第一编码模型。该第二编码器模式部分还包括适合基于由该选择部分选择的编码模型编码音频信号的各个部分的编码部分。该编码部分至少在已经为编码音频信号的后续部分选择了第二编码模型的情况下，还适合在转换到第二编码器模式部分之后生成与来自该音频信号的第一部分的信息人为地相重叠的信号。
根据本发明的第一方面，此外还提出了一种包括具有所提出的模块的特征的编码器的电子设备。
根据本发明的第一方面，此外还提出了一种包括具有所提出的模块的特征的编码器并且另外还包括用于解码连续编码部分的解码器的音频编码系统。
根据本发明的第一方面，最后提出了一种软件程序产品，其中存储了用于支持音频信号编码的软件代码。至少第一编码器模式和第二编码器模式可以用于编码该音频信号的各个部分，而至少第二编码器模式能够基于至少两种不同的编码模型编码该音频信号的各个部分。这些编码模型的第一种仅需要来自该音频信号的各个部分本身的信息来编码该部分，而这些编码模型的第二种另外需要与来自该音频信号先前部分的信息相重叠的信号来编码该音频信号的各个部分。该软件代码在从第一编码器模式转换到第二编码器模式之后，当运行在一个编码器的处理部件中时，实现了所提出的方法。
本发明的第一方面基于一种想法，即，可以为每个部分保证基于先前音频信号部分的重叠信号的存在，如果这种编码模型在一种特殊的编码器模式中永远不可以被选为音频信号的第一部分的编码模型的话，为每个部分选择需要这样的重叠信号的编码模型。因此提出了在转换到能够使用需要重叠信号的编码模型和不需要重叠信号的编码模型的第二编码器模式之后，总是选择不需要重叠信号的编码模型来编码第一音频信号部分。
本发明的第一方面的优势是，由于它防止使用无效的重叠信号，保证了从第一编码器模式到第二编码器模式的平滑转换。
在第一编码器模式只允许使用第一编码模型的情况下，可以无需这样一种防范而执行从第二编码器模式到第一编码器模式的转换。然而，对不同编码模型的量化可能是不同的。如果在转换之前没有正确地初始化量化工具，由于不同的编码方法，转换后可能导致该音频信号部分中听得见的人为瑕疵。因此，在从第二编码器模式转换到第一编码器模式之前保证正确地初始化量化工具是有利的。初始化可以包括，例如，提供存储在某个缓冲器中的适当的初始量化增益。
本发明的第二方面是基于一种想法，通过在从第二编码器模式转换到第一编码器模式之前保证第一编码模型用于以第二编码器模式编码该音频信号的最后部分。也就是说，当作出要执行从第二编码器模式到第一编码器模式的转换的决定时，实际的转换至少延时一个音频信号部分。
根据本发明的第二方面，从而提出了一种支持音频信号编码的方法，其中至少第一编码器模式和第二编码器模式可以用于编码该音频信号的各个部分。至少第二编码器模式能够基于两种不同的编码模型编码该音频信号的各个部分。该编码模型的第一种仅需要来自该音频信号的各个部分本身的信息用于编码该部分，而该编码模型的第二种另外需要与来自该音频信号先前部分的信息相重叠的信号来编码该音频信号的各个部分。在从第二编码器模式转换到第一编码器模式之前，使用所述第一编码模型以在转换前编码所述音频信号的最后部分。
根据本发明的第二方面，此外还提出了一种用于编码音频信号连续部分的模块。该模块包括适合编码音频信号各个部分的第一编码器模式部分，和适合编码音频信号各个部分的第二编码器模式部分。该模块还包括适合在第一编码器模式部分与第二编码器模式部分之间转换以编码音频信号的各个部分的转换部分。第二编码器模式部分包括适合为音频信号的各个部分选择至少两种不同编码模型之一的选择部分，其中这些编码模型的第一种仅需要来自该音频信号的各个部分本身的信息用于编码该部分，而这些编码模型的第二种另外需要与来自该音频信号的先前部分的信息相重叠的信号来编码该音频信号的各个部分。该选择部分还适合为音频信号的最后的部分在转换到第一编码器模式部分之前总是选择第一编码器模型。
根据本发明的第二方面，此外还提出了一种电子设备，该电子设备包括具有本发明第二方面所提出模块特征的编码器。
根据本发明的第二方面，此外还提出了一种音频编码系统，该系统包括具有本发明第二方面所提出模块功能的编码器，以及此外用于解码连续编码部分的解码器。
根据本发明的第二方面，最后提出了一种软件程序产品，其中存储了用于支持音频信号编码的软件代码。至少第一编码器模式和第二编码器模式可以用于编码该音频信号的各个部分，并且至少第二编码器模式能够基于至少两种不同编码模型编码该音频信号的各个部分。这些编码模型的第一种仅需要来自该音频信号各个部分本身的信息来编码该部分，而这些编码模型的第二种另外需要与来自该音频信号先前部分的信息相重叠的信号来编码该音频信号的各个部分。该软件代码在从第二编码器模式转换到第一编码器模式的情况下，当运行在一个编码器的处理部件中时实现了根据本发明第二部分所提出的方法。
因而，本发明的两个方面是基于对平滑转换能够，通过在第二编码器模式中超限运行第一编码模型与第二编码模型之间的常规选择，分别在转换后的音频信号第一部分中或者转换前的音频信号最后部分中来实现的考虑。
要理解到，本发明的两个方面能够一起实现，但是同样彼此互相独立。
对本发明的两个方面来说，第一编码模型可以是，例如，基于时间域的编码模型，如ACELP编码模型，而第二编码模型可以是，例如，基于频率域的编码模型，如TCX模型。此外，第一编码器模式可以是，例如，AMR-WB+编解码器的AMR-WB模式，而第二编码器模式可以是，例如，该AMR-WB+编解码器的扩展模式。
所提出的模块可以用于本发明的两个方面，例如，一个编码器或者一个编码器的一部分。
所提出的电子设备可以用于本发明的两个方面，例如，移动通信设备或者某些其它需要低分类复杂性的移动设备。不过，要理解到，该电子设备同样可以是一个非移动设备。
本发明的其它目的和特征将通过下面结合附图考虑的详细的说明而变得显而易见。然而，要理解到，附图的设计完全是为了说明的目的，而不是作为本发明的限制的定义，为此定义应该参考所附权利要求书。还应该理解到，附图不是按比例绘制的，它们只是试图概念性地说明本文中描述的结构和过程。

图1是说明TCX中使用的重叠窗口的示图；图2是说明在AMR-WB+模式中从ACELP编码到TCX的常规转换的示图；图3是根据本发明一种实施方式的系统的示意图；图4是说明图3的系统中的操作的流程图；以及图5是说明图3的实施方式中生成的重叠窗口的示图。
具体实施例方式
图3是根据本发明一种实施方式的音频编码系统的示意图，该系统在AMR-WB+编码器中实现AMR-WB模式与扩展模式的平滑过渡。
该系统包含包括一个AMR-WB+编码器32的第一设备31和包括一个AMR-WB+解码器52的第二设备51。第一设备31可以是，例如，一个移动设备或者一个非移动设备，例如一台MMS服务器。第二设备51可以是，例如，一部移动电话或者某些其它移动设备，或者类似地在某些情况下同样也可以是一个非移动设备。
AMR-WB+编码器32包含一个适合执行纯粹的ACELP编码的常规AMR-WB编码部分34，和一个适合基于ACELP编码模型或者基于TCX模型执行编码的扩展模式编码部分35。
AMR-WB+编码器32还包含一个用于转发音频信号帧到AMR-WB编码部分34或者到扩展模式编码部分35的转换部分36。
转换部分36为此目的包含一个过渡控制部分41，该部分适合接收来自某个估计部分(未示出)的转换命令。转换部分36还包含一个转换元件42，它在过渡控制部分41的控制下将AMR-WB+编码器32的信号输入连接到AMR-WB编码部分34或者连接到扩展模式编码部分35。
扩展模式编码部分35包含一个选择部分43。与该扩展模式编码部分35相关联的转换元件42的输出端连接到选择部分43的输入。另外，过渡控制部分41对选择部分43有一个控制接入，反之亦然。选择部分的输出还在扩展模式编码部分35内连接到一个ACELP/TCX编码部分43。
要理解到，所表示的部分34到36和41到44是为编码一个可能已经从一个立体声音频信号中生成的单声道音频信号设计的。其它的立体声信息可以在其它未示出的立体声扩展部分中生成。此外，要注意到，编码器32还包含未示出的部分。也要理解到，所表示的部分34到36和41到44不是不得不分开的部分，而是同样能够相互或者与其它部分交织在一起。
AMR-WB编码部分34、扩展模式编码部分35和转换部分36可以特殊地由在编码器32的处理部件33中运行的软件SW实现，以虚线示出。
下面，将参考图4的流程图更详细地描述AMR-WB+编码器32中的处理。
AMR-WB+编码器32接收已经提供给第一设备31的一个音频信号。该音频信号以20ms的帧提供给AMR-WB编码部分34或者扩展模式编码部分35用于编码。
该流程图现在从转换部分36提供该音频信号的帧给AMR-WB编码部分34用于实现低输出比特率的情形继续进行，例如由于在网络连接的第一设备31和第二设备51中没有足够的容量。因而，音频信号帧由AMR-WB编码部分34利用ACELP编码模型编码，并提供给第二设备51用于传输。
现在，设备31的某个估计部分认识到网络中的条件改变并允许较高的比特率。因此，该估计部分给转换部分36的过渡控制部分41提供一个转换命令。
如现在的情况，在该转换命令表示需要从AMR-WB模式转换到扩展模式的情况下，过渡控制部分41立即将该命令转发到转换元件42。于是，转换元件42将进入的音频信号帧提供给扩展模式编码部分35而不是提供给AMR-WB编码部分34。并行地，过渡控制部分41将一个超限运行命令提供给扩展模式编码部分35的选择部分42。
在扩展模式编码部分35内，选择部分43为每个接收到的音频信号帧确定应该使用ACELP编码模型或者TCX模型编码该音频信号帧。选择部分43随后将该音频信号帧与所选编码模型的指示一起转发到ACELP/TCX编码部分44。
当选择部分43接收到一个来自过渡控制部分41的超限运行命令时，它强行为同时接收到的音频信号帧选择ACELP编码模型。从而，在从AMR-WB模式转换后，选择部分43将总是为第一接收到的音频信号帧选择ACELP编码模型。
于是，根据所接收到的指示，由ACELP/TCX编码部分44利用ACELP编码模型编码第一音频信号帧。
此后，选择部分34以开环方法或者以闭环方法为每个接收到的音频信号帧确定应该使用ACELP编码模型或者TCX模型编码该音频信号帧。
于是，根据所选编码模型的相关指示，由ACELP/TCX编码部分44编码各个音频信号帧。
如对AMR-WB+的扩展模式所知的，在为后续音频信号帧选择了TCX模型的情况下，实际上各个ACELP的编码接下来是生成重叠信号。
由于在任何情况下第一音频信号帧都使用ACELP编码模型编码，因此保证了对第一TCX帧已经有一个来自先前的音频信号帧的重叠信号。
图5中说明了从AMR-WB模式到扩展模式的过渡。图5是一个表示具有在从AMR-WB模式转换到扩展模式之前或之后处理的多个编码帧的时间线的示图。在时间线上，AMR-WB模式和扩展模式用垂直的虚线分开。
编码帧61是在转换之前以AMR-WB模式编码的最后一个ACELP编码帧。这个由AMR-WB编码部分34编码的ACELP编码帧61接下来没有生成重叠信号。后续编码帧63是转换之后在扩展模式编码部分35中编码的第一编码帧。这个帧63强制为一个ACELP编码帧。两个ACELP编码帧61、63的编码排他地基于关于各个帧本身的信息，由虚线62、64指示。
下一个编码帧65由选择部分43选择为一个TCX帧。TCX帧的正确编码需要来自覆盖该TCX帧65和先前的ACELP编码帧63的至少一部分的重叠窗口的信息。因此，ACELP帧63的编码接下来是生成这个TCX帧65的重叠信号，以是虚粗线的虚线64指示。覆盖TCX帧65的重叠窗口部分以实粗线曲线66指示。
必须注意到，在TCX模型可以由使用大于20ms，例如40ms或80ms的编码帧的选择部分43选择，并且需要覆盖不只一个先前的音频信号帧的重叠窗口的情况下，选择部分43可能也在转换之后为不只一个音频信号帧强行选择ACELP编码模型。
如果设备31的估计部分稍后认识到再次需要较低的比特率，则它给转换部分36提供另一个转换命令。
如现在的情况，在该转换命令表示从扩展模式转换到AMR-WB模式的情况下，转换部分36的过渡控制部分41立即输出一个超限运行命令给扩展模式编码部分35的选择部分43。
由于该超限运行命令，选择部分43这次再次为下一个接收到的音频信号帧强行选择ACELP编码模型，为此自由选择仍然可能。随后，由ACELP/TCX编码部分44根据所接收到的指示使用ACELP编码模型编码该音频信号帧。
此外，在超限运行命令之后，只要可以为当前接收到的音频信号帧选择ACELP编码模型，选择部分43就发送确认信号给过渡控制部分41。
扩展模式编码部分35通常将以包含四个音频信号帧的80ms特大帧为基础处理所接收到的音频信号帧。这使扩展模式编码部分35能够使用直到80ms的TCX帧，从而支持更好的音频质量。由于转换命令的定时与音频帧的定时互相独立，在最坏的情况下，转换命令可能刚好在选择部分43为当前的特大帧选择了编码模型之后的编码过程期间给出。作为结果，由于通常仅可能为各个下一个特大帧的最后一个音频信号帧自由选择ACELP编码模式，超限运行命令与确认信号之间的延时通常将至少为80ms。
仅在接收到确认信号之后，过渡控制部分41才转发转换命令给转换元件42。
转换元件42于是提供进入的音频信号的帧给AMR-WB编码部分34而不是给扩展模式编码部分35。从而，转换有至少一个，但通常有几个音频信号帧的延时。
延时的转换和超限运行命令共同保证了由扩展模式编码部分35编码的最后一个音频信号帧使用ACELP编码模型编码。作为结果，量化工具能够在转换到AMR-WB编码部分34之前正确地被初始化。因此，可以避免转换后第一帧中听得见的人为瑕疵。
然后，AMR-WB编码部分34使用ACELP编码模型编码接收到的音频信号帧，并提供编码帧以传输到第二设备51，直到转换部分36接收到下一个转换命令。
在第二设备51中，如果需要的话，解码器52使用AMR-WB模式或者扩展模式解码具有ACELP编码模型或者TCX模型的所有接收到的编码帧。例如，为表示给第二设备51的用户而提供解码的音频信号帧。
在已经示出、描述并指出了施加于其优选的实施方式的本发明的基本的新颖特征的同时，将理解到，本领域的技术人员在不脱离本发明的精神的情况下，可以对所描述的设备和方法的形式和细节进行各种各样的删节、置换和改变。例如，意图明确的是以完全相同的方式执行完全相同的功能以实现相同结果的那些元件和/或方法步骤的所有组合都在本发明的范围内。此外，应该认识到，结合本发明的任何公开形式或实施方式示出的和/或描述的结构和/或元件和/或方法步骤可以作为设计选择的一个普通内容结合在任何其它公开的或描述的或建议的形式或实施方式中。因此，本发明仅受所附于此的权利要求书的范围所指示的限制。
权利要求
1.一种用于支持音频信号编码的方法，其中至少第一编码器模式和第二编码器模式可以用于编码所述音频信号的各个部分，其中至少所述第二编码器模式能够基于至少两种不同的编码模型编码所述音频信号的各个部分，其中所述编码模型的第一种仅需要来自所述音频信号的各个部分本身的信息来编码所述部分，而其中所述编码模型的第二种另外需要与来自所述音频信号先前部分的信息相重叠的信号来编码所述音频信号的各个部分，所述方法包括在从所述第一编码器模式转换到所述第二编码器模式之后在所述转换之后，将所述第一编码模型用于编码所述音频信号的第一部分；为所述音频信号的其它部分选择各自最适合的编码模型；至少在已经选择了所述第二编码模型以编码所述音频信号的后续部分的情况下，基于来自所述第一部分的信息生成人为重叠信号；以及将各个所选的编码模型用于编码所述其它部分。
2.根据权利要求1所述的方法，还包括在从所述第一编码器模式转换到所述第二编码器模式之前，使用所述第一编码模型以在所述转换前编码所述音频信号的最后部分。
3.根据权利要求1所述的方法，其中所述第一编码器模式是扩展的自适应多速率宽带编解码器的自适应多速率宽带模式，而其中所述第二编码器模式是所述扩展的自适应多速率宽带编解码器的扩展模式。
4.根据权利要求1所述的方法，其中所述第一编码模型是代数码激励线性预测编码模型而其中所述第二编码模型是变换编码模型。
5.一种用于支持由扩展的自适应多速率宽带编解码器编码音频信号的方法，其中自适应多速率宽带模式和扩展模式可以用于编码所述音频信号的各个帧，其中所述扩展模式支持基于代数码激励线性预测编码模型并基于变换编码模型的所述音频信号的各个帧的编码，其中所述变换编码模型需要与来自所述音频信号先前的帧的信息相重叠的信号来编码所述音频信号的各个帧，所述方法包括在从所述自适应多速率宽带模式转换到所述扩展模式之后在所述转换之后，将所述代数码激励线性预测编码模型用于编码所述音频信号的第一帧；为所述音频信号的其它帧选择各自最适合的编码模型；至少在已经选择了所述变换编码模型以编码所述音频信号的后续帧的情况下，基于来自所述第一帧的信息生成人为重叠信号；以及将各个所选的编码模型用于编码所述其它帧。
6.一种用于编码音频信号的连续部分的模块，所述模块包括一个适合编码音频信号各个部分的第一编码器模式部分；一个适合编码音频信号各个部分的第二编码器模式部分；以及一个适合在所述第一编码器模式部分和所述第二编码器模式部分之间转换以编码音频信号的各个部分的转换部分；所述第二编码器模式部分包括适合为音频信号的各个部分选择至少两种不同编码模型之一的选择部分，其中所述编码模型的第一种仅需要来自音频信号各个部分本身的信息来编码所述部分，而其中所述编码模型的第二种另外需要与来自音频信号的先前部分的信息相重叠的信号来编码所述音频信号的各个部分，所述选择部分还适合为音频信号的第一部分在转换到所述第二编码器模式部分之后总是选择所述第一编码模型；以及所述第二编码器模式部分包括适合基于由所述选择部分选择的编码模型编码音频信号的各个部分的编码部分，而所述编码部分至少在已经为编码所述音频信号的后续部分选择了所述第二编码模型的情况下，还适合在转换到所述第二编码器模式部分之后生成与来自音频信号的第一部分的信息人为地相重叠的信号。
7.根据权利要求6所述的模块，其中所述选择部分还适合在由所述转换部分从所述第一编码器模式转换到所述第二编码器模式之前，选择所述第一编码模型以编码所述音频信号的最后部分。
8.根据权利要求6所述的模块，其中所述第一编码器模式部分适合以扩展的自适应多速率宽带编解码器的自适应多速率宽带模式编码音频信号的各个部分，而其中所述第二编码器模式部分适合以所述扩展的自适应多速率宽带编解码器的扩展模式编码音频信号的各个部分。
9.根据权利要求6所述的模块，其中所述第二编码器模式部分适合将代数码激励线性预测编码模型用作所述第一编码模型，而将变换编码模型用作所述第二编码模型。
10.一种包括用于编码音频信号连续部分的编码器的电子设备，该编码器包括一个适合编码音频信号各个部分的第一编码器模式部分；一个适合编码音频信号各个部分的第二编码器模式部分；以及一个适合在所述第一编码器模式部分和所述第二编码器模式部分之间转换以编码音频信号的各个部分的转换部分；所述第二编码器模式部分包括适合为音频信号的各个部分选择至少两种不同编码模型之一的选择部分，其中所述编码模型的第一种仅需要来自音频信号各个部分本身的信息来编码所述部分，而其中所述编码模型的第二种另外需要与来自音频信号的先前部分的信息相重叠的信号来编码所述音频信号的各个部分，所述选择部分还适合为音频信号的第一部分在转换到所述第二编码器模式部分之后总是选择所述第一编码模型；以及所述第二编码器模式部分包括适合基于由所述选择部分选择的编码模型编码音频信号的各个部分的编码部分，而所述编码部分至少在已经为编码所述音频信号的后续部分选择了所述第二编码模型的情况下，还适合在转换到所述第二编码器模式部分之后生成与来自音频信号的第一部分的信息人为地相重叠的信号。
11.根据权利要求10所述的电子设备，其中所述电子设备是一种移动设备。
12.根据权利要求10所述的电子设备，其中所述电子设备是一种移动通信设备。
13.一种包括用于编码音频信号连续部分的编码器和用于解码音频信号的连续编码部分的解码器的音频编码系统，其中所述编码器包括一个适合编码音频信号各个部分的第一编码器模式部分；一个适合编码音频信号各个部分的第二编码器模式部分；以及一个适合在所述第一编码器模式部分和所述第二编码器模式部分之间转换以编码音频信号的各个部分的转换部分；所述第二编码器模式部分包括适合为音频信号的各个部分选择至少两种不同编码模型之一的选择部分，其中所述编码模型的第一种仅需要来自音频信号各个部分本身的信息来编码所述部分，而其中所述编码模型的第二种另外需要与来自音频信号的先前部分的信息相重叠的信号来编码所述音频信号的各个部分，所述选择部分还适合为音频信号的第一部分在转换到所述第二编码器模式部分之后总是选择所述第一编码模型；以及所述第二编码器模式部分包括适合基于由所述选择部分选择的编码模型编码音频信号的各个部分的编码部分，而所述编码部分至少在已经为编码所述音频信号的后续部分选择了所述第二编码模型的情况下，还适合在转换到所述第二编码器模式部分之后生成与来自音频信号的第一部分的信息人为地相重叠的信号。
14.一种软件程序产品，其中存储了用于支持音频信号编码的软件代码，其中至少第一编码器模式和第二编码器模式可以用于编码所述音频信号的各个部分，其中至少所述第二编码器模式能够基于至少两种不同的编码模型编码所述音频信号的各个部分，其中所述编码模型的第一种仅需要来自所述音频信号的各个部分本身的信息来编码所述部分，而其中所述编码模型的第二种另外需要与来自所述音频信号先前部分的信息相重叠的信号来编码所述音频信号的各个部分，所述软件代码在从所述第一编码器模式转换到所述第二编码器模式之后，当运行在一个编码器的处理部件中时实现下列步骤在所述转换之后，将所述第一编码模型用于编码所述音频信号的第一部分；为所述音频信号的其它部分选择各自最适合的编码模型；至少在已经选择了所述第二编码模型以编码所述音频信号的后续部分的情况下，基于来自所述第一部分的信息生成人为重叠信号；以及将各个所选的编码模型用于编码所述其它部分。
15.一种用于支持音频信号编码的方法，其中至少第一编码器模式和第二编码器模式可以用于编码所述音频信号的各个部分，其中至少所述第二编码器模式能够基于两种不同的编码模型编码所述音频信号的各个部分，其中所述编码模型的第一种仅需要来自所述音频信号的各个部分本身的信息来编码所述部分，而其中所述编码模型的第二种另外需要与来自所述音频信号先前部分的信息相重叠的信号来编码所述音频信号的各个部分，所述方法包括在从所述第二编码器模式转换到所述第一编码器模式之前，使用所述第一编码模型以编码所述音频信号的最后部分。
16.根据权利要求15所述的方法，其中所述第一编码器模式是扩展的自适应多速率宽带编解码器的自适应多速率宽带模式，而其中所述第二编码器模式是所述扩展的自适应多速率宽带编解码器的扩展模式。
17.根据权利要求15所述的方法，其中所述第一编码模型是代数码激励线性预测编码模型而其中所述第二编码模型是变换编码模型。
18.一种用于支持由扩展的自适应多速率宽带编解码器编码音频信号的方法其中自适应多速率宽带模式和扩展模式可以用于编码所述音频信号的各个帧，其中所述扩展模式支持基于代数码激励线性预测编码模型并基于变换编码模型的所述音频信号的各个帧的编码，其中所述变换编码模型需要与来自所述音频信号先前的帧的信息相重叠的信号来编码所述音频信号的各个帧，所述方法包括在从所述扩展模式转换到所述自适应多速率宽带模式之前，使用所述代数码激励线性预测编码模型以编码所述音频信号的最后部分。
19.一种用于编码音频信号的连续部分的模块，所述模块包括一个适合编码音频信号各个部分的第一编码器模式部分；一个适合编码音频信号各个部分的第二编码器模式部分；以及一个适合在所述第一编码器模式部分和所述第二编码器模式部分之间转换以编码音频信号的各个部分的转换部分；所述第二编码器模式部分包括适合为音频信号的各个部分选择至少两种不同编码模型之一的选择部分，其中所述编码模型的第一种仅需要来自音频信号各个部分本身的信息来编码所述部分，而其中所述编码模型的第二种另外需要与来自音频信号的先前部分的信息相重叠的信号来编码所述音频信号的各个部分，所述选择部分还适合为音频信号的最后部分在转换到所述第一编码器模式部分之前总是选择所述第一编码器模型。
20.根据权利要求19所述的模块，其中所述第一编码器模式部分适合以扩展的自适应多速率宽带编解码器的自适应多速率宽带模式编码音频信号的各个部分，而其中所述第二编码器模式部分适合以所述扩展的自适应多速率宽带编解码器的扩展模式编码音频信号的各个部分。
21.根据权利要求19所述的模块，其中所述第二编码器模式部分适合将代数码激励线性预测编码模型用作所述第一编码模型，而将变换编码模型用作所述第二编码模型。
22.一种包括用于编码音频信号连续部分的编码器的电子设备，该编码器包括一个适合编码音频信号各个部分的第一编码器模式部分；一个适合编码音频信号各个部分的第二编码器模式部分；以及一个适合在所述第一编码器模式部分和所述第二编码器模式部分之间转换以编码音频信号的各个部分的转换部分；所述第二编码器模式部分包括适合为音频信号的各个部分选择至少两种不同编码模型之一的选择部分，其中所述编码模型的第一种仅需要来自音频信号各个部分本身的信息来编码所述部分，而其中所述编码模型的第二种另外需要与来自音频信号的先前部分的信息相重叠的信号来编码所述音频信号的各个部分，所述选择部分还适合为音频信号的最后部分在转换到所述第一编码器模式部分之前总是选择所述第一编码器模式。
23.根据权利要求22所述的电子设备，其中所述电子设备是一种移动设备。
24.根据权利要求22所述的电子设备，其中所述电子设备是一种移动通信设备。
25.一种包括用于编码音频信号连续部分的编码器和用于解码音频信号的连续编码部分的解码器的音频编码系统，其中所述编码器包括一个适合编码音频信号各个部分的第一编码器模式部分；一个适合编码音频信号各个部分的第二编码器模式部分；以及一个适合在所述第一编码器模式部分和所述第二编码器模式部分之间转换以编码音频信号的各个部分的转换部分；所述第二编码器模式部分包括适合为音频信号的各个部分选择至少两种不同编码模型之一的选择部分，其中所述编码模型的第一种仅需要来自音频信号各个部分本身的信息来编码所述部分，而其中所述编码模型的第二种另外需要与来自音频信号的先前部分的信息相重叠的信号来编码所述音频信号的各个部分，所述选择部分还适合为音频信号的最后部分在转换到所述第一编码器模式部分之前总是选择所述第一编码器模型。
26.一种软件程序产品，其中存储了用于支持音频信号编码的软件代码，其中至少第一编码器模式和第二编码器模式可以用于编码所述音频信号的各个部分，其中至少所述第二编码器模式能够基于至少两种不同的编码模型编码所述音频信号的各个部分，其中所述编码模型的第一种仅需要来自所述音频信号的各个部分本身的信息来编码所述部分，而其中所述编码模型的第二种另外需要与来自所述音频信号先前部分的信息相重叠的信号来编码所述音频信号的各个部分，所述软件代码在从所述第二编码器模式转换到所述第一编码器模式之前，当运行在一个编码器的处理部件中时实现下列步骤在所述转换之前，将所述第一编码模型用于编码所述音频信号的最后部分。
全文摘要
本发明涉及一种用于支持音频信号编码的方法，其中第一编码器模式和第二编码器模式可以用于编码音频信号的各个部分。第二编码器模式能够基于仅需要来自各个部分本身的信息编码该部分的第一编码模型，并基于另外需要与来自先前部分的信息重叠的信号编码各个部分的第二编码模型，实现各个部分的编码。在从第一编码器模式转换到第二编码器模式之后，总是将第一编码模型用于编码该音频信号的第一部分。这个部分随后可以用于生成可能要用第二编码模型编码的后续部分的人为重叠信号。
文档编号G10L19/14GK1954367SQ200580015903
公开日2007年4月25日申请日期2005年4月15日优先权日2004年5月19日
发明者帕西·奥雅拉, 雅里·马基南, 阿里·拉卡尼米申请人:诺基亚公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：帕西.奥雅拉;雅里.马基南;阿里.拉卡尼米
技术所有人：诺基亚公司
我是此专利的发明人

上一篇：基于短消息的话音服务的制作方法
上一篇：用于对音频信号进行编码的编码模型的选择的制作方法