像言语的信号和不像言语的信号的多模式编码的制作方法

文档序号：2823084阅读：181来源：国知局

专利名称：像言语的信号和不像言语的信号的多模式编码的制作方法
技术领域：
本发明涉及用于编码与解码音频信号(特别是可以同时包括像言语的信号分量和不像言语的信号分量两者以及/或者在时间上顺序地包括像言语的信号分量和不像言语的信号分量两者的音频信号)的方法与装置。能够响应于像言语的信号内容和不像言语的信号内容的变化改变它们的编码特征和解码特征的音频编码器和解码器在本领域经常被称作“多模式” “编解码器(codec)”(其中“编解码器”可以是编码器和解码器)。本发明也涉及用于实现这样的编码与解码音频信号的方法的存储介质上的计算机程序。

发明内容
在本文档中，“像言语的信号(speech-like signal) ”通篇都指下面这样的信号，所述信号包含a)单个、强的周期分量(“浊音的”像言语的信号)、b)没有周期性的随机噪声(“清音的”像言语的信号)、或者c)这些信号类型之间的过渡(transition)。像言语的信号的例子包括单个谈话者的言语和某种单个的乐器产生的音乐；以及，“不像言语的信号(non-speech-like signal) ”指不具有像言语的信号的特征的信号。不像言语的信号的例子包括来自个乐器的音乐信号和来自不同音高(Pitch)的(人)谈话者的混合的言语。根据本发明的第一个方面，用于码激励线性预测(code excited linear prediction, CELP)音频编码的方法采用通过LPC参数控制的LPC综合滤波器；多个码本，每一个码本具有码矢量(codevector)；提供较适合于像言语的信号而较不适合于不像言语的信号的激励的至少一个码本、以及提供较适合于不像言语的信号而较不适合于像言语的信号的激励的至少一个其他的码本；以及多个增益因子，每一个增益因子与码本关联。该方法包含对音频信号应用线性预测编码(LPC)分析以生成LPC参数；通过将音频信号和从码本激励得到的音频信号的重构(reconstruction)之间的差异的量度(measure)最小化来从至少两个码本选择码矢量和/或关联的增益因子，所述码本包括提供较适合于不像言语的信号的激励的码本和提供较适合于像言语的信号的激励的码本；以及产生可由 CELP音频解码器用于重构音频信号的输出、包括LPC参数的输出、码矢量和增益因子。所述最小化可按闭环方式将音频信号的重构和音频信号之间的差异最小化。差异的量度可以是感知力口权的量度(perceptually-weighted measure)。根据一种变化，可以不通过线性预测编码综合滤波器对信号或者从码本(所述码本的激励输出较适合于不像言语的信号而较不适合于像言语的信号)得到的信号进行滤波。
提供较适合于像言语的信号而较不适合于不像言语的信号的激励输出的所述至少一个码本可以包括生成像噪声的激励的码本和生成周期性激励的码本，以及，提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述至少一个其他的码本可包括生成对仿真(emulating)感知音频编码器有用的正弦曲线激励的码本。该方法可进一步包含对音频信号应用长期预测(LTP)分析以生成LTP参数，其中生成周期性激励的码本是通过LTP参数控制的、接收至少周期性激励和像噪声的激励的时间延迟的组合作为信号输入的适应性码本，并且其中输出进一步包括LTP参数。适应性码本可选择性地或者接收周期性激励、像噪声的激励和正弦曲线激励的时间延迟的组合作为信号输入，或者仅接收周期性激励和像噪声的激励的时间延迟的组合作为信号输入，并且输出可进一步包括关于该适应性码本是否在激励的组合中接收正弦曲线激励的信息。该方法可进一步包含将音频信号分类成多个音频类别中的一个；响应于该分类，选择操作模式；以及，以开环方式排它地(exclusively)选择一个或多个码本来贡献 (contribute)激励输出。该方法可进一步包含确定对操作模式的选择的置信度水平(confidence level)，其中存在至少两个置信度水平，所述至少两个置信度水平包括高置信度水平，并且仅当置信度水平为高时才以开环方式排它地选择一个或多个码本来贡献激励输出。根据本发明的另一个方面，用于码激励线性预测(CELP)音频编码的方法采用通过LPC参数控制的LPC综合滤波器；多个码本，每一个码本具有码矢量；提供较适合于像言语的信号而较不适合于不像言语的信号的激励的至少一个码本、和提供较适合于不像言语的信号而较不适合于像言语的信号的激励的至少一个其他的码本；以及多个增益因子，每一个增益因子与码本关联。该方法包含将音频信号分离成像言语的信号分量和不像言语的信号分量；将线性预测编码(LPC)分析应用于音频信号的像言语的信号分量以生成LPC参数；通过改变与提供较适合于像言语的信号而较不适合于不像言语的信号的激励输出的所述码本或每一个码本关联的码矢量选择和/或增益因子、改变与提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述码本或每一个码本关联的码矢量选择和/或增益因子，将LPC综合滤波器输出和音频信号的像言语的信号分量之间的差异最小化；以及，提供可由CELP音频解码器用于再生成(!^produce)音频信号的近似 (approximation)的输出(所述输出包括与每一个码本关联的码矢量选择和/或增益)以及LPC参数。该分离可将音频信号分离成像言语的信号分量和不像言语的信号分量。根据作为替代方案的两个变化，该分离可以从音频信号分离像言语的信号分量，并且通过从音频信号减去像言语的信号分量的重构来得到不像言语的信号分量的近似；或者，该分离可以从音频信号分离不像言语的信号分量，并且通过从音频信号减去不像言语的信号分量的重构来得到像言语的信号分量的近似。可以提供第二线性预测编码(LPC)综合滤波器，并且可以通过这样的第二线性预测编码综合滤波器对不像言语的信号分量的重构进行滤波。提供较适合于像言语的信号而较不适合于不像言语的信号的激励输出的所述至少一个码本可以包括生成像噪声的激励的码本和生成周期性激励的码本，并且提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述至少一个其他的码本可以包括生成对于仿真感知音频编码器有用的正弦曲线激励的码本。该方法可进一步包含对音频信号的像言语的信号分量应用长期预测(LTP)分析以生成LTP参数，在这种情况下，生成周期性激励的码本可以是通过LTP参数控制的适应性码本，并且它可以接收周期性激励和像噪声的激励的时间延迟的组合作为信号输入。可以响应于像言语的信号，改变与提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述码本或每一个码本关联的码本矢量选择和/或增益因子。可改变与提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述码本或每一个码本关联的码本矢量选择和/或增益因子，以减少不像言语的信号与从所述这样的码本或每一个这样的码本重构的信号之间的差异。根据本发明的第三个方面，用于码激励线性预测(CELP)音频解码的方法采用通过LPC参数控制的LPC综合滤波器；多个码本，每一个码本具有码矢量；提供较适合于不像言语的信号而较不适合于像言语的信号的激励的至少一个码本、以及提供较适合于不像言语的信号而较不适合于像言语的信号的激励的至少一个其他的码本；以及多个增益因子，每一个增益因子与码本关联。该方法包含接收参数、码矢量和增益因子；从至少一个码本激励输出得到用于LPC综合滤波器的激励信号；以及从LPC滤波器的输出、或者从LPC综合滤波器的输出与各码本中的一个或多个的激励的组合得到音频输出信号，所述组合受与各码本中的每一个关联的码矢量和/或增益因子的控制。提供较适合于像言语的信号而较不适合于不像言语的信号的激励输出的所述至少一个码本可以包括生成像噪声的激励的码本和生成周期性激励的码本，以及，提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述至少一个其他的码本可包括生成对仿真感知音频编码器有用的正弦曲线激励的码本。生成周期性激励的所述码本可以是受所述LTP参数控制的、并且接收至少周期性激励和像噪声的激励的时间延迟的组合作为信号输入的适应性码本，并且所述方法可进一步包括接收LTP参数。所有码本的激励可被应用于LPC滤波器，并且适应性码本可选择性地或者接收周期性激励、像噪声的激励和正弦曲线激励的时间延迟的组合作为信号输入，或者仅接收周期性激励和像噪声的激励的时间延迟的组合作为信号输入，并且其中所述方法可以进一步包含接收关于该适应性码本是否在各激励的组合中接收正弦曲线激励的信息。从LPC滤波器的输出得到音频输出信号可包括后滤波(postfiltering)。

图1和图2示出根据本发明的各方面的音频分类分级结构决定树(audio classification hierarchy decision trees)白勺两fi歹Ij子。图3示出根据本发明的各方面的音频分类分级结构决定树的另一个例子，其中音频样本块可基于其统计量(statistics)被分类成不同的类别。图4a是根据本发明的各方面的编码器和解码器方法或器件的示意性概念框图，其显示一种方式其中，组合的像言语的信号和不像言语的信号可在编码器中被分离成像言语的信号分量和不像言语的信号分量、并且通过相应的像言语的信号编码器和不像言语的信号编码器被编码，以及然后，在解码器中，在相应的像言语的信号解码器和不像言语的信号解码器中被解码并且被重新组合(recombine)。图4b是根据本发明的各方面的编码器和解码器方法或器件的示意性概念框图，其中以图4a方式的替代方式实现信号分离。图5a根据本发明的各方面的编码器和解码器方法或器件的示意性概念功能框图，其显示图4a的布置的修改，其中从相应的编码器分离像言语的信号编码器和不像言语的信号编码器共同的功能。图5b是根据本发明的各方面的编码器和解码器方法或器件的示意性概念功能框图，其显示图5a的布置的修改，其中从相应的编码器分离像言语的信号编码器和不像言语的信号编码器中的每一个共同的元件，以使得在编码器中，在组合的像言语的信号和不像言语的信号被分离成像言语的信号分量和不像言语的信号分量之前处理组合的像言语的信号和不像言语的信号，并且，在解码器中，对部分解码的组合信号进行公共解码 (commonly decode)0图6是可用于实现图4、5a、5b、7c和7d所示的信号分离器件或功能的基于频率分析的信号分离方法或器件的示意性概念功能框图。图7是根据本发明的各方面的统一的(unified)像言语的信号/不像言语的信号编码器的例子的第一变化的示意性概念功能框图。在该变化中，可通过以闭环方式将总体重构误差(overall reconstruction error)最小化来决定编码工具和它们的参数的选择。图7b是根据本发明的各方面的统一的像言语的信号/不像言语的信号编码器的例子的第二变化的示意性概念功能框图。在该变化中，通过响应于信号分类结果操作的模式选择工具确定编码工具的选择。可通过如图7a的例子中那样以闭环方式将总体重构误差最小化来决定参数。图7c根据本发明的各方面的统一的像言语的信号/不像言语的信号编码器的例子的第三变化的示意性概念功能框图。在该变化中，采用信号分离。图7d是显示图7c的变化的示意性概念功能框图，其中，分离路径是相互依赖的 (interdependent)(按图 4b 的方式)。图8a是可与图7a、7b、7c和7d的例子中的编码器中的任何编码器的一个版本一起使用的解码器的示意性概念功能框图。该解码器本质上与图7a和7b例子中的局部 (local)解码器相同。图8b是可与图7a、7b、7c和7d的例子中的编码器中的任何编码器的另一个版本一起使用的解码器的示意性概念功能框图。
具体实施例方式基于内容分析的音频分类音频内容分析可以帮助将音频段(audio segment)分类成几种音频类别(诸如，像言语的信号、不像言语的信号等)中的一种。利用输入的音频信号的类型的知识，音频编码器可以通过选择可适合于特定音频类别的模式而使它的编码模式适应(adapt)变化的信号特征。假定输入音频数据是压缩的数据，第一步骤可能是将它划分成可变长度的信号样本块，其中长的块长度(例如，在AAC(高级音频编码)感知编码的情况下为42.6毫秒)可用于信号的静止部分(stationary parts)，以及短的块长度(例如，在AAC的情况下为5. 3 毫秒)可用于信号的瞬变部分(transient parts)或者信号开始(onset)期间。仅以示例方式给出AAC样本块长度。具体的样本块长度对于本发明不关键。原理上，最佳的样本块长度可能是信号依赖的。作为替代方案，可以采用固定长度的样本块。然后，可将每一个样本块(段)分类成几种音频类别(诸如，像言语的、不像言语的、以及像噪声的)中的一种。分类器也可输出“输入的段属于具体的音频类别”的可能性的置信量度。只要置信度高于用户可定义的阈值，则可利用适于对识别的音频类别编码的编码工具来配置音频编码器，并且可按开环方式选择这样的工具。例如，如果所分析的输入信号以高置信度被分类为像言语的，根据本发明的各方面的多模式音频编码器或编码功能可以选择基于CELP的像言语信号编码方法来压缩段。类似地，如果所分析的输入信号以高置信度被分类为不像言语的，根据本发明的各方面的多模式音频编码器可以选择感知转换(perceptual transform) 编码器或者编码功能(诸如，AAC、AC-3、或者其仿真)来对段进行数据压缩。另一方面，当分类器的置信度低时，编码器可以选用编码模式的闭环选择。在闭环选择中，编码器使用可用的编码模式中的每一个来对输入段进行编码。给定比特预算，可以选择得到最高的感知质量(perceived quality)的编码模式。显然，闭环模式选择比开环模式选择方法要求更多计算。因此，使用分类器的置信度量度来在基于开环的模式选择和基于闭环的模式选择之间切换导致得到模式选择的混合方案，所述模式选择的混合方案在分类器置信度高时随时节省计算。图1和2示出根据本发明的各方面的音频分类分级结构决定树的两个例子。关于每一个例子分级结构，在识别具体的音频类别之后，音频编码器优选选择就编码工具和参数而言适合于该音频类别的编码模式。在图1音频分类分级结构决定树例子中，首先将输入音频识别为第一分级结构层次处的像言语的信号(决定节点102)或者不像言语的信号(决定节点104)。然后，像言语的信号被识别为较低的分级结构层次处的混合的浊音的(voiced)像言语的和清音的 (unvoiced)像言语的信号(决定节点106)、浊音的像言语的信号(决定节点108)、以及清音的像言语的信号(决定节点110)。不像言语的信号被识别为较低的分级结构层次处的不像言语的信号(决定节点112)或者噪声(114)。因此，5个分类结果混合的浊音的像言语的信号和清音的像言语的信号、浊音的像言语的信号、清音的像言语的信号、不像言语的信号、以及噪声。在图2的音频分类分级结构例子中，首先，输入音频被识别为第一分级结构层次处的像言语的信号(决定节点202)、不像言语的信号(决定节点204)、以及噪声(决定节点206)。然后，像言语的信号被识别为较低的分级结构层次处的混合的浊音的像言语的信号和清音的像言语的信号(208)、浊音的像言语的信号(决定节点210)、以及清音的像言语的信号(决定节点212)。不像言语的信号被识别为较低的分级结构层次处的声乐(vocals) (决定节点214)和非声乐(non-vocals)(决定节点216)。因此，6个分类结果混合的浊音的像言语的和清音的像言语的信号、浊音的像言语的信号、清音的像言语的信号、声乐、非声乐、以及噪声。备选地，也可基于音频信号的统计量将音频信号分类。特别是，不同类型的音频和像言语的信号编码器和解码器可提供一组丰富的信号处理组(诸如，LPC分析、LTP分析、MDCT转换等)，并且在许多情况下，这些工具中的每一个可仅适用于对具有一些特定统计量特性的信号进行编码。例如，LTP分析是用于对具有强的谐波能量(harmonic energy)的信号(诸如，像言语的信号的发声段(voice segments))进行编码的非常强大的工具。然而，对于不具有强的谐波能量的其他信号，应用LTP分析通常不导致任何编码增益。下面在表1中给出像言语的信号/不像言语的信号编码工具以及它们所适合的信号类型和不适合的信号类型的不完全列表。清楚的是，为了经济的比特使用，将期望基于可用的像言语的信号/不像言语的信号编码工具的适合性(suitability)将音频信号段分类，并且对于每一个段分配正确的工具组。因此，图3中示出根据本发明的各方面的音频分类分级结构的另一个例子。音频编码器选择就编码工具与参数而言适合于该音频类别的编码模式。表1、像言语的信号/不像言语的信号编码工具
权利要求
一种码激励线性预测CELP音频编码的方法，采用通过LPC参数控制的LPC综合滤波器；各自具有码矢量的多个码本；提供较适合于像言语的信号而较不适合于不像言语的信号的激励的至少一个码本与提供较适合于不像言语的信号而较不适合于像言语的信号的激励的至少一个其他的码本；以及多个增益因子，每一个增益因子与码本关联，所述方法包含对音频信号应用线性预测编码LPC分析以生成LPC参数；通过将所述音频信号和从码本激励得到的所述音频信号的重构之间的差异的量度最小化来从至少两个码本选择码矢量和/或关联的增益因子，所述码本包括提供较适合于不像言语的信号的激励的码本和提供较适合于像言语的信号的激励的码本；以及产生可由CELP音频解码器用于重构音频信号的输出，所述输出包括LPC参数、码矢量和增益因子。
2.根据权利要求1所述的方法，其中通过所述线性预测编码综合滤波器对从码本激励输出得到的各信号中的一些进行滤波。
3.根据权利要求2所述的方法，其中通过所述线性预测编码综合滤波器对从其激励输出较适合于像言语的信号而较不适合于不像言语的信号的码本得到的一个或多个信号进行滤波。
4.根据权利要求3所述的方法，其中不通过所述线性预测编码综合滤波器对从其激励输出较适合于不像言语的信号而较不适合于像言语的信号的码本得到的一个或多个信号进行滤波。
5.根据权利要求1 4中的任一项所述的方法，其中提供较适合于像言语的信号而较不适合于不像言语的信号的激励输出的所述至少一个码本包括生成像噪声的激励的码本和生成周期性激励的码本，并且提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述至少一个其他的码本包括生成对仿真感知音频编码器有用的正弦曲线激励的码本。
6.根据权利要求5所述的方法，进一步包含将长期预测LTP分析应用于所述音频信号以生成LTP参数，其中生成周期性激励的所述码本是通过所述LTP参数控制的、并且接收至少周期性激励和像噪声的激励的时间延迟的组合作为信号输入的适应性码本，并且其中所述输出进一步包括所述LTP参数。
7.根据引用权利要求1的权利要求6所述的方法，其中所述适应性码本选择性地或者接收周期性激励、像噪声的激励和正弦曲线激励的时间延迟的组合作为信号输入，或者仅接收周期性激励和像噪声的激励的时间延迟的组合作为信号输入，并且其中所述输出进一步包括关于所述适应性码本是否在激励的组合中接收正弦曲线激励的信息。
8.根据权利要求1 7中的任一项所述的方法，进一步包含将音频信号分类成多个音频类别中的一个；响应于所述分类，选择操作模式；以及以开环方式排它地选择一个或多个码本来贡献激励输出。
9.根据权利要求8所述的方法，进一步包含确定对操作模式的所述选择的置信度水平，其中存在至少两个置信度水平，所述至少两个置信度水平包括高置信度水平，并且仅当置信度水平为高时才以开环方式排它地选择一个或多个码本来贡献激励输出。
10.根据权利要求1 9中的任一项所述的方法，其中所述最小化以闭环方式将所述音频信号的重构和所述音频信号之间的差异最小化。
11.根据权利要求1 10中的任一项所述的方法，其中所述差异的所述量度是感知加权的量度。
12.一种码激励线性预测CELP音频编码的方法，采用通过LPC参数控制的LPC综合滤波器；各自具有码矢量的多个码本；提供较适合于像言语的信号而较不适合于不像言语的信号的激励的至少一个码本与提供较适合于不像言语的信号而较不适合于像言语的信号的激励的至少一个其他的码本；以及多个增益因子，每一个增益因子与码本关联，所述方法包含将音频信号分离成像言语的信号分量和不像言语的信号分量，对所述音频信号的像言语的信号分量应用线性预测编码LPC分析以生成LPC参数；通过改变与提供较适合于像言语的信号而较不适合于不像言语的信号的激励输出的所述码本或每一个码本关联的码矢量选择和/或增益因子，改变与提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述码本或每一个码本关联的码矢量选择和/或增益因子，将LPC综合滤波器输出和所述音频信号的像言语的信号分量之间的差异最小化；以及提供可由CELP音频解码器用于再生成所述音频信号的近似的输出，所述输出包括与每一个码本关联的码矢量选择和/或增益、以及所述LPC参数。
13.根据权利要求12所述的方法，其中所述分离将所述音频信号分离成像言语的信号分量和不像言语的信号分量。
14.根据权利要求12所述的方法，其中所述分离从所述音频信号分离像言语的信号分量，并且通过从所述音频信号减去所述像言语的信号分量的重构来得到不像言语的信号分量的近似。
15.根据权利要求12所述的方法，其中所述分离从所述音频信号分离不像言语的信号分量，并且通过从所述音频信号减去不像言语的信号分量的重构来得到像言语的信号分量的近似。
16.根据权利要求12 15中任一项所述的方法，进一步包括提供第二线性预测编码 LPC综合滤波器，并且其中通过所述第二线性预测编码综合滤波器对不像言语的信号分量的重构进行滤波。
17.根据权利要求12 16中任一项所述的方法，其中提供较适合于像言语的信号而较不适合于不像言语的信号的激励输出的所述至少一个码本包括生成像噪声的激励的码本和生成周期性激励的码本，并且提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述至少一个其他的码本包括生成对于仿真感知音频编码器有用的正弦曲线激励的码本。
18.根据权利要求17所述的方法，进一步包含对所述音频信号的像言语的信号分量应用长期预测LTP分析以生成LTP参数，其中，生成周期性激励的所述码本是受所述LTP参数控制的、并且接收周期性激励和像噪声的激励的时间延迟的组合作为信号输入的适应性码本。
19.根据权利要求12所述的方法，其中响应于所述像言语的信号，改变与提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述码本或每一个码本关联的码本矢量选择和/或增益因子。
20.根据权利要求12所述的方法，其中改变与提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述码本或每一个码本关联的码本矢量选择和/或增益因子，以减少所述不像言语的信号与从所述这样的码本或每一个这样的码本重构的信号之间的差异。
21.一种码激励线性预测CELP音频解码的方法，采用通过LPC参数控制的LPC综合滤波器；各自具有码矢量的多个码本；提供较适合于不像言语的信号而较不适合于像言语的信号的激励的至少一个码本与提供较适合于不像言语的信号而较不适合于像言语的信号的激励的至少一个其他的码本；以及多个增益因子，每一个增益因子与码本关联，所述方法包含接收所述参数、码矢量和增益因子；从至少一个码本激励输出得到用于所述LPC综合滤波器的激励信号；以及从所述LPC滤波器的输出、或者从所述LPC综合滤波器的输出与所述码本中的一个或多个的激励的组合得到音频输出信号，所述组合受与所述码本中的每一个关联的码矢量和 /或增益因子的控制。
22.根据权利要求21所述的方法，其中提供较适合于像言语的信号而较不适合于不像言语的信号的激励输出的所述至少一个码本包括生成像噪声的激励的码本和生成周期性激励的码本，以及，提供较适合于不像言语的信号而较不适合于像言语的信号的激励输出的所述至少一个其他的码本包括生成对仿真感知音频编码器有用的正弦曲线激励的码本。
23.根据权利要求22所述的方法，其中生成周期性激励的所述码本是受所述LTP参数控制的、并且接收至少周期性激励和像噪声的激励的时间延迟的组合作为信号输入的适应性码本，并且所述方法进一步包括接收LTP参数。
24.根据权利要求23所述的方法，其中所有码本的激励被应用于LPC滤波器，并且所述适应性码本选择性地或者接收周期性激励、像噪声的激励和正弦曲线激励的时间延迟的组合作为信号输入，或者仅接收周期性激励和像噪声的激励的时间延迟的组合作为信号输入，并且其中所述方法进一步包含接收关于所述适应性码本是否在激励的组合中接收正弦曲线激励的信息。
25.根据权利要求21 24中任一项所述的方法，其中所述从所述LPC滤波器的输出得到音频输出信号包括后滤波。
26.一种适于执行权利要求1 25中任一项所述方法的装置。
27.一种存储在计算机可读介质上的计算机程序，用于使得计算机执行权利要求1 25中任一项所述的方法。
全文摘要
本发明涉及可包括像言语的信号分量和不像言语的信号分量两者的音频信号的编码。它描述码激励线性预测(CELP)音频编码和解码方法，采用通过LPC参数控制的LPC综合滤波器；各自具有码矢量的多个码本；提供较适合于不像言语的信号的激励的至少一个码本以及提供较适合于像言语的信号的激励的至少一个码本；以及多个增益因子，每一个增益因子与码本关联。所述编码方法和装置通过将所述音频信号和从码本激励得到的所述音频信号的重构之间的差异的量度最小化来从码本选择码矢量和/或关联的增益因子。所述解码方法和装置从LPC参数、码矢量和增益因子生成重构的输出信号。
文档编号G10L19/12GK101971251SQ200980108779
公开日2011年2月9日申请日期2009年3月12日优先权日2008年3月14日
发明者R·拉达克里希南, 俞容山, 格兰特·A·戴维森, 罗伯特·L·安德森申请人:杜比实验室特许公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：俞容山;Ｒ.拉达克里希南;罗伯特.Ｌ.安德森;格兰特.Ａ.戴维森
技术所有人：杜比实验室特许公司
我是此专利的发明人