基于celp的语音代码之间的代码转换方案的制作方法

文档序号:2821013阅读:282来源:国知局
专利名称:基于celp的语音代码之间的代码转换方案的制作方法
有关申请的交叉参考本申请要求共同拥有的下列美国临时申请的优选权、分别是2002年1月8日提出的60/347,270、2002年3月12日提出的60/364,403、2002年10月25日提出的60/421,446、2002年10月25日提出的60/421,449以及2002年10月25日提出的60/421,270,这里在实际应用上结合作为参考。
在联邦政府资助的研究或开发下作出发明权利的陈述不适用参考“序列列表”,一种在光盘上提交的表格或计算机程序列表附录不适用发明背景本发明一般涉及处理信息的一些技术。尤其,本发明提供一种方法和设备,用于从一个基于CELP的标准到另一个基于CELP的标准和/或在单个标准但是不同的模式中转换CELP帧。在整个本说明书中,尤其在下面,提供本发明的进一步的详细说明。
编码是把原始信号(话音、图像、视频等)转换成会接纳发送或存储的格式的过程。通常编码导致大量的压缩,但是一般包含重要的信号处理来达到。编码的结果是根据给定压缩格式的经编码参数的比特流(帧的序列)。通过使用使信号成模型的各种技术除去统计上的和感知上的冗余信息来得到压缩。因此把经编码的格式称为“压缩格式”或“参数空间”。解码器取得经压缩比特流,并且再产生原始信号。在语音编码的情况中,压缩一般导致信息丢失。
已知在不同压缩格式之间的转换的过程和/或减少以前编码信号的比特率的过程为代码转换。可以如此进行来节省带宽,或连接不兼容的客户和/或服务器装置。代码转换与直接压缩处理的不同在于代码转换机(transcoder)只可以访问经压缩信号而不能访问原始信号。
使用诸如“级联”之类的平滑(brute force)技术(它具有跟随在解除压缩过程后面的再压缩过程)可以完成代码转换。因为通常需要大量处理和可能发生延迟,以对信号进行解除压缩然后再压缩,可以考虑压缩空间或参数空间中的代码转换。这种代码转换有助于压缩格式之间的映射,同时保留在任何可能的参数空间中。这就是复杂的“智能(smart)”代码转换算法开始起作用的时侯。虽然在代码转换中已经有所进步,但是希望进一步改进代码转换技术。在整个本说明书中,尤其在下面,将更完整地描述传统技术中的限制的进一步详细说明。
发明概要根据本发明,提供处理信息的一些技术。尤其,本发明提供一种方法和设备,用于从一种基于CELP的标准到另一种基于CELP的标准和/或在单个标准但是不同的模式中进行帧的转换。在整个本说明书中,尤其在下面,将提供本发明的进一步详细说明。
在一个特定的实施例中,本发明提供一种设备,用于从一种基于CELP的标准到另一种基于CELP的标准和/或在单个标准但是不同的模式中进行帧的转换。该设备具有一个比特流去除封装模块,用于从一个源编解码器获取一个或多个CELP参数。该设备还具有耦合到比特流去除封装模块的一个内插器模块。内插器模块适用于在不同帧大小、子帧大小、和/或源编解码器和目的编解码器的取样速率之间的内插。把一个映射模块耦合到内插器模块。映射模块适用于把来自源编解码器的一个或多个CELP参数映射到目的编解码器的一个或多个CELP参数。该设备具有耦合到映射模块的目的比特流封装模块。目的比特流封装模块适用于根据来自目的编解码器的至少一个或多个CELP参数构成至少一个目的输出CELP帧。把一个控制器至少耦合到目的比特流封装模块、映射模块、内插器模块以及比特流去除封装模块。最好,控制器适用于管理一个或多个模块的操作,并且适用于接收来自一个或多个外部应用程序的指令。控制器适用于把状态信息提供给一个或多个外部应用程序。
在另外的特定实施例中,本发明提供一种方法,用于对基于CELP的经压缩的话音比特流进行从源编解码器到目的编解码器的代码转换。该方法包括处理源编解码器输入CELP比特流使之对来自输入CELP比特流的至少一个或多个CELP参数去除封装,如果存在包括帧大小、子帧大小、和/或目的编解码器格式的取样速率的多个目的编解码器参数中的一个或多个以及包括帧大小、子帧大小、和/或源编解码器格式的取样速率的多个源编解码器参数中的一个或多个的差异,则从源编解码器格式到目的编解码器格式内插多个去除封装的CELP参数中的一个或多个。该方法包括对目的编解码器的一个或多个CELP参数进行编码,并且通过至少封装目的编解码器的一个或多个CELP参数而处理目的CELP比特流。
在另外的特定实施例中,本发明提供一种方法,用于对基于CELP的经压缩的话音比特流进行从源编解码器到目的编解码器格式的处理。该方法包括从来自应用程序过程的多个控制信号中传送一个控制信号,并且至少根据来自应用程序的控制信号从多个不同的CELP映射策略中选择一个CELP映射策略。该方法还包括使用所选择的CELP映射策略执行映射过程,以把一个或多个CELP参数从源编解码器格式映射到目的编解码器格式的一个或多个CELP参数。
再进一步,本发明提供一种系统,用于对基于CELP的经压缩的话音比特流进行从源编解码器到目的编解码器格式的处理。该系统包括一个或多个存储器。这种存储器可以包括一个或多个代码,用于从来自应用程序过程的多个控制信号中接收一个控制信号。还包括一个或多个代码,用于根据至少来自应用程序的控制信号从多个不同CELP映射策略中选择一个CELP映射策略。一个或多个存储器还包括一个或多个代码,用于使用所选择的CELP映射策略执行映射过程,以把一个或多个CELP参数从源编解码器格式映射到目的编解码器格式的一个或多个CELP参数。根据实施例,还可以有用于执行这里描述的功能的、以及本说明之外的、可以与本发明结合的功能的其它计算机代码。
使用本发明得到许多益处。根据实施例,可以得到这些益处中的一个或多个。
●减少代码转换过程的计算复杂性。
●减少通过代码转换过程的延迟。
●减少代码转换需要的存储器的数量。
●引入动态速率控制。
●通过嵌入的话音活动检测器支持寂静(silence)帧。
●提供可以使用各种参数映射策略的框架。
●提供一般的代码转换基础结构以适应当前和将来的基于分集CELP的编解码器。
代码转换发明可以得到这些益处中的一个或多个。在一个特定实施例中,代码转换设备包括●源CELP参数去除封装模块,它从输入编码CELP比特流获取CELP参数;●CELP参数内插器,它把输入源CELP参数转换成目的CELP参数,该目的CELP参数对应于源和目的编解码器之间的子帧大小差异;如果源和目的编解码器的子幀大小是不同的,则使用参数内插。
●目的CELP参数映射和调谐引擎,它把CELP参数从所述内插器模块转换到目的CELP编解码器参数;●目的CELP代码封装器,它把经映射的CELP参数封装到目的CELP代码帧中;●高级特征管理器,它管理在CELP—到—CELP代码转换中的任选功能和特征;●控制器,它管理整个代码转换过程;●状态报告功能,它提供代码转换过程的状态。
源CELP参数去除封装模块是没有格式滤波器和后-滤波器的简化的CELP解码器。
CELP参数内插器包括与一个或多个CELP参数有关的一组内插器。
目的CELP参数映射和调谐模块包括参数映射策略切换模块,以及下列参数映射策略中的一个或多个CELP参数直接空间映射的一个模块,分析激励空间映射的一个模块,分析经滤波的激励空间映射的一个模块。
本发明在一个子幀一个子幀的基础上执行代码转换。即,当代码转换系统接收(源压缩信息的)一个帧时,代码转换机可以在其上开始进行操作,并且产生输出子幀。一旦已经产生了足够数量的子幀,就可以产生(根据目的格式的压缩信息的)帧,并且如果通信是目的的话,就可以发送到通信信道。如果存储是目的的话,则可以按需要存储所产生的帧。如果通过源和目的格式标准定义的帧的持续期是相同的,则单个输入帧将产生单个输出帧,否则将需要缓冲另外的输入帧,或产生多个输出幀。如果子幀的持续期是不同的,则将需要子幀参数之间的内插。因此,代码转换操作包括四种操作(1)比特流去除封装,(2)子幀缓冲和源CELP参数的内插,(3)映射和调谐到目的CELP参数,以及(4)封装代码以产生输出帧。
所以在接收到帧时,代码转换机去除比特流的封装以产生包含在帧中的每个子幀的CELP参数(

图10,方框(1))。感兴趣的参数是LPC系数、激励(从自适应和固定码字产生)、以及节距滞后。注意,对于产生优良质量的低复杂性解决方案,只需要对激励而不是对语音波形的整个合成进行解码。如果需要子幀内插,则在此时通过智能内插引擎来完成。
现在子幀处于一种形式,该形式会接纳通过目的参数映射和调谐模块的处理(图10,方框(5))。独立于激励CELP参数而映射短期LPC滤波器系数。可以使用在LSP伪—频率空间中的简单线性映射,以产生用于目的编解码器的LSP系数。可以按计算复杂性的成本相应地给出较佳质量输出的许多方法来映射激励CELP参数。在本文件中已经描述了三种如此的映射策略,并且是映射和调谐策略模块的一部分(图10,方框(4))●CELP参数直接空间映射(DSM);●分析激励空间域;●分析经滤波的激励空间域映射和调谐策略的选择是通过映射和调谐策略切换模块的(图10,方框(3))。
由于为了减少计算负担而三种方法对质量折衷,所以在设备由于大量同时的信道而过载的情况下,可以使用它们,以在质量方面提供适度的降质。因此代码转换器的性能可以适应于可用的资源。另一方面,可以使用只产生要求的质量和性能的一种策略来构造代码转换系统。在这种情况中,将不结合映射和调谐策略切换模块(图10,方框(3))。
如果可应用于目的标准的话,则此时还可以使用话音活动检测器(在参数空间中操作)来减少输出的带宽。然后,可以把经映射的参数封装到目的比特流格式帧中(图10,方框(7)),并且产生而用于发送或存储。
本发明包括用于在基于CELP的语音编码标准之间执行智能代码转换的算法和方法。本发明还包括单个标准中的代码转换,以便执行速率控制(通过代码转换到较低模式或通过嵌入的话音活动检测器引入寂静帧)。
由控制模块来管理整个代码转换过程(图10,方框(8)),所述控制模块根据代码转换的状态以及外部指令来发送命令。
为了适应不同的代码转换要求,本发明的设备提供添加任选特征和功能的可能性(图10,方框(6))。
从下面结合附图的描述中,对本发明的其它特征和优点将更为明了,在所有的附图中,用相同的标记作相应的识别。
附图简述在所附的权利要求书中特别陈述相信是新颖的本发明的目的、特征和优点。通过参考连同附图的下列说明,可以在本发明的组织和操作方式两方面对发明与进一步的目的和优点一起有较好的理解。
图1是一般CELP编码器的解码器级的简化方框图;图2是一般CELP编码器的编码器级的简化方框图;图3是示出编解码器的数学模型的简化方框图;图4是示出级联转换编解码器(transcodec)的数学模型的简化方框图;图5是示出智能转换编解码器的数学模型的简化方框图;图6是基于CELP的代码转换的传统设备中之一的说明;图7是基于CELP的代码转换的传统设备中之一的说明;图8是简化方框图,示出CELP编解码器之间的一般代码转换;图9是简化方框图,示出用于GSM-AMR以及G.723.1的子幀内插;图10描绘根据本发明的一个实施例构成的一个系统的简化方框图,以把从源CELP编解码器的输入CELP比特流代码转换成目的编解码器的输出CELP比特流;图11是源编解码器CELP参数去除封装模块更详细的简化方框图;图12是简化方框图,示出对于G.723.1到GSM-AMR的子帧以及一个取样一个取样参数的内插;图13是简化方框图,示出通过源编解码器LPC系数以及目的编解码器经编码的LPC系数校正的激励;图14是简化方框图,示出更详细的CELP参数映射的参数映射和调谐模块;图15是更详细的目的CELP参数调谐模块的简化方框图16是简化方框图,示出封装在GSM-AMR帧中的目的CELP代码的本发明的详细说明根据本发明,提供处理信息的技术。尤其,本发明提供一种方法和设备,用于从一种基于CELP的标准到另一种基于CELP的标准和/或在单个标准但是不同的模式中转换CELP帧。在整个本说明书中,尤其在下面,提供本发明的进一步的详细说明。
本发明包括用于执行基于CELP(码激励线性预测)的编码方法和标准之间的代码转换的算法和方法。最感兴趣的是通过诸如国际电信联盟(ITU)或欧洲电信标准协会(ETSI)之类的团体标准化的CELP编码方法。本发明还包括在单个标准中的代码转换,以便执行速率控制(通过代码转换到较低模式或通过嵌入的话音活动检测器引入寂静帧)。
一般可以把语音编码技术分类成波形编码器(例如,来自ITU的G.711、G.726、G.722标准)以及通过合成分析(AbS)类型的编码器(例如,来自ITU的G.723.1以及G.729标准,以及来自ETSI的GSM-AMR标准以及来自电信工业协会(TIA)的增强型可变速率编解码器(EVRC)标准、可选择模式声码器(SMV)标准)。波形编码器在时间域中操作,它们是基于一个取样一个取样的方法,该方法利用语音取样之间的相关性。通过合成分析的编码器尝试通过简化的源(声门)的模型以及滤波器(声域)的模型来模仿人类语音产生系统,这些模型形成在帧基础(一般使用10-30毫秒的帧大小)上的输出语音频谱。
引入通过合成分析类型的编码器,按低比特率提供高质量语音,以增加需要的计算量为代价。压缩技术是节约通信接口中资源的一种意味深长的方法。
在数学上,所有的语音编解码器都用一维模拟语音信号x0(1)启动,对该信号不变地取样和量化,以得到数字域表示式,x(n)=Q(x0(nT))。语音信号的取样速率f=1/T一般是8kHz或16kHz,并且一般把取样信号量化到最多16—比特。
然后,可以考虑基于CELP的编解码器作为一种算法,该算法使用语音产生模型,在经取样的语音x(n)和一些参数空间θ之间映射,即,它对数字语音进行编码和解码。所有基于CELP的算法都在语音帧(可以进一步把帧分成数个子帧)上操作。在某些编解码器中,语音帧相互重叠。可以把语音帧定义为在某个时刻n开始的语音取样的矢量,即,x~i=x(n)x(n+1)...x(n+L-1)T]]>其中,L是语音帧的长度(取样数)。注意,帧指数i与第一帧取样n有线性关系,iL 对于非重叠帧n={i(L-K) 对于重叠帧。其中K是帧之间的重叠取样数。
现在,压缩(有损耗编码)过程是把语音帧 映射到参数θi的一种功能,而解码过程从参数θi映射回原始语音帧 的近似值。通过解码器产生的语音帧与原始编码的语音帧是不相等的。设计编解码器以产生感觉上尽可能与输入语音相似的输出语音,即,当处理参数时,编码器必须产生如此的参数,这些参数使输入语音帧和通过解码器产生的语音帧之间的某些感觉标准测量值最大化。
一般,从输入到参数,从参数到输出的映射需要所有以前的输入或参数的知识。例如,这可以通过把编解码器中的状态S保存在基于CELP的方法使用的自适应密码本的构造中而得到。必须同步地保存编码器状态和解码器状态。通过只根据双方(编码器和解码器)都有的数据,即,参数,来更新状态,就可以达到这一点。图3示出编码器、信道以及解码器的一般模型。
在基于CELP的模型中使用的帧参数θi包括用于语音信号(在物理上与声域、口腔和鼻腔以及嘴唇有关)的短期预测的线性预测系数(LPC),以及由自适应和固定代码构成的激励信号。使用自适应代码来形成语音中的长期音调信息的模型。代码(自适应和固定)具有相关联的密码本,该密码本是对于特定CELP编解码器预定义的。图1示出典型的CELP解码器,其中通过增益因子对自适应和固定密码本矢量独立地进行定标,然后,进行组合和滤波,以产生合成的语音。通常这个语音通过后一滤波器,以除去模型引入的人工产物。
在图2中示出的CELP编码(分析)过程包括对语音信号进行预处理以除去不需要的频率分量,并且应用一个窗口功能,接着获取短期LPC参数。这一般使用Levinson-Durbin算法来完成。把LPC参数转换成线频谱对(LineSpectral Pairs(LSP)),以促进量化和子帧内插。然后,通过短期LPC滤波器使语音反—滤波,以产生剩余激励信号。对这剩余进行可感知的加权,以提高质量,并且进行分析,以寻找语音音调的估计值。使用闭环的一个分析一个分析的方法来确定最优的音调。一旦找到音调,就从剩余中减去激励的自适应密码本分量,并且找到最优的固定码字。更新编码器内部的存储器,以反映编解码器状态(诸如自适应密码本)的改变。
代码转换的最简单的方法是被称为级联代码转换的平滑方法,见图4。这个方法对输入的经压缩的比特执行完全的解码,以产生合成的语音。然后,用目标标准对合成的语音进行编码。这种方法遭遇到对信号进行再编码的大量计算,以及从语音波形的预—和后—滤波引入的质量下降问题,以及通过编码器的向前看要求(look-ahead-requirements)引入的潜在的延迟。
在文章中已经出现与图5中说明的方法相似的“智能”代码转换的方法。然而,这些方法基本上仍是再构造语音信号,然后,执行大量工作来获取各种CELP参数,诸如LPC和音调。即,这些方法仍在语音信号空间中操作。尤其,对于合成语音的产生只使用激励信号,该激励信号已经通过远端编码器(在远端的编码器,该远端已经根据一种压缩格式产生了经压缩的语音)与原始语音最优地匹配。然后,使用合成的语音来计算新的最优激励。由于在闭环搜索中结合脉冲响应滤波操作的要求,这变成计算强度极大的操作。
图6说明US 6,260,009 B1使用的方法。从输入激励参数和输出量化共振峰滤波器系数产生通过搜索器的作为目标信号使用的再构造的信号。由于在源和目的编解码器中的量化的共振峰滤波器系数之间的差异,这导致搜索器目标信号中的降质,最后,来自代码转换的输出语音质量大大地降低。见图6。在整个本说明书中,尤其在下面,可以找到其他限制。
图7说明另一种“智能”代码转换方法。已经公布了(US2002/0077812 A1)。这种方法通过直接映射每个CELP参数忽略CELP参数之间的交互作用而执行代码转换。这种方法只应用于在源和目的CELP编解码器之间要求极有限条件的特定情况中。例如,它要求Algebraic CELP(ACELP)以及在源和目的编解码器两者中相同的子帧大小。对于大多数基于CELP的代码转换,它不产生优良质量的语音。这种方法只适合于GSM-AMR模式中之一,并不包括GSM-AMR中的所有模式。
下面详细讨论本发明的一种方法和设备。在下面的说明中,为了说明的目的,陈述许多特定的细节,以便提供对本发明的彻底理解。为了说明的目的和为了举例的目的而使用GSM-AMR和G.723.1的情况。这里描述的方法是一般性的,并且应用于CELP编解码器的任何对之间的代码转换。熟悉本技术领域的有关人员会理解,可以使用其他的步骤、配置以及安排而不偏离本发明的精神和范围。
本发明包括算法和方法,用于执行基于CELP的语音编码标准之间的智能代码转换。本发明还包括单个标准中的代码转换,以便执行速率控制(通过代码转换到较低模式或通过嵌入的话音活动检测器引入寂静帧)。下面部分讨论本发明的细节。
本发明在一个子帧一个子帧的基础上执行代码转换。即,当代码转换系统接收到一个帧时,代码转换机可以开始在它的子帧上的操作,并且产生输出子帧。一旦已经产生了足够数量的子帧,就可以产生一个帧。如果通过源和目的标准定义的帧的持续期是相同的,则一个输入帧将产生一个输出帧,否则将需要缓冲每个输入帧或产生多个输出帧。如果子帧具有不同的持续期,则将需要在子帧参数之间内插。因此代码转换操作包括四种操作(1)比特流去除封装,(2)子幀缓冲和源CELP参数的内插,(3)映射和调谐到目的CELP参数,以及(4)封装代码以产生输出帧。(见图8)。
图10是方框图,说明根据本发明的基于CELP的编解码器代码转换设备的原理。该方框包括源比特流去除封装模块、智能内插引擎、参数映射和调谐模块、任选高级特征模块、控制模块以及目的比特流封装模块。
参数映射和调谐模块包括映射和调谐策略切换模块以及参数映射和调谐策略模块。
通过控制模块管理代码转换操作。
接收到一个帧时,代码转换机去除比特流的封装以产生包含在帧中的每个子帧的CELP参数。感兴趣的参数是LPC系数、激励(从自适应和固定码字产生)以及音调滞后。
注意只需要对激励解码,而不是全部语音波形的合成。这大大地减少了源编解码器比特流去除封装的复杂性。对于CELP参数直接空间映射(DSM)代码转换策略,感兴趣的还有密码本增益和固定码字。如果需要子帧内插,则在此时完成。
现在子帧处于一种形式,该形式会接纳通过图14示出的目的参数映射和调谐模块的处理。独立于激励CELP参数而映射短期LPC滤波器系数。可以使用在LSP伪—频率空间中的简单线性映射,以产生用于目的编解码器的LSP系数。还可以使用更复杂的非—线性内插。可以按计算复杂性的成本相应地给出较佳质量输出的许多方法来映射激励CELP参数。在本文件中已经描述了三种如此的映射策略,并且是参数映射和调谐策略模块的一部分(图10,方框(4))●CELP参数直接空间映射(DSM);●分析激励空间域;●分析经滤波的激励空间域映射和调谐策略的选择是通过映射和调谐策略切换模块的(图10,方框(3))。
在下面部分中详细讨论这三种方法。由于为了减少计算负担而这三种方法对质量折衷,所以在设备由于大量同时的信道而过载的情况下,可以使用它们,以在质量方面提供适度的降质。因此代码转换器的性能可以适应于可用的资源。另一方面,可以使用只产生要求的质量和性能的一种策略来构造代码转换系统。在这种情况中,将不结合映射和调谐策略切换模块(图10,方框(3))。
如果可应用于目的标准的话,则此时还可以使用话音活动检测器(在参数空间中操作)来减少输出的带宽。
参数映射和调谐模块的输出是目的CELP编解码器代码。把它们根据编解码器CELP帧格式封装到目的比特流帧中。需要封装过程,以把输出比特放到目的CELP解码器可以理解的格式中。如果应用是为了存储,则可以封装目的CELP参数或可以按应用特定格式存储。如果根据多媒体协议传送帧,则还可以改变封装过程,例如,在封装过程中实施比特扰频。
此外,本发明的设备提供添加将来任选信号处理功能或模块的功能。
子帧内插当不同标准的子帧表示信号域中不同时间持续期时,或当使用不同取样速率时,可能需要子帧内插。例如,G.723.1使用30毫秒持续期的帧(每子帧7.5毫秒),而GSM-AMR使用20毫秒持续期的帧(每子帧5毫秒)。这在图9中形象化地示出。在两种不同类型的参数上执行子帧内插(1)一个取样一个取样的参数(诸如激励和码字矢量),以及(2)子帧参数(诸如LSP系数以及音调滞后估计值)。通过考虑一个取样一个取样的参数的离散时间指数以及拷贝到目标子帧中的合适位置来映射它们。如果通过不同CELP标准使用不同的取样速率,则可能需要向上或向下取样。通过某些内插功能来内插子帧参数,以在目标子帧中产生参数的平滑估计值。智能内插算法可以改进话音代码转换,不只是在计算性能方面,而且更重要的是在话音质量方面。简单的内插功能是线性内插器。
作为一个例子,图9示出需要三个GSM-AMR帧来描述两个G.723.1帧就可以描述的相同的语音信号持续期。同样,对于每两个G.723.1子帧需要三个GSM-AMR子帧。如上所述,存在两类参数全子帧参数(例如,LSP系数)以及一个取样一个取样的参数(例如,自适应和固定码字)。通过计算重叠子帧的加权和来线性地转换表示为θ的子帧参数,并且通过拷贝合适的取样来形成表示为v[·]的一个取样一个取样的参数。对于从G.723.1子帧到GSM-AMR子帧的内插,示出分析公式如下θigsm=θ[2i/3]g.723.1---imod3=0,2]]>θigsm=12(θ[2i/3]g.723.1+θ[2i/3]g.723.1)---imod3=1]]>vigsm[n]=v[(40i+n)/60]g.723.1[(40i+n)mod60]---∀i,n]]>其中i=0是第一GSM-AMR帧的第一子帧,i=4是第二GSM-AMR帧的第一子帧,等等。图12描绘这个过程。
应该把LSP参数(它们是全子帧参数)内插在伪—频域中,即f=cos-1(q)。这导致较佳质量的输出。在内插之前不需要变换其它子帧参数。
注意上述分析公式是从简单的线性内插器得到的。任何合适的内插方案(诸如齿槽(spline)、正弦曲线的、等等)都可以替代该公式。此外,每个CELP参数(LSP系数、滞后、音调增益、码字增益以及等等)可以使用不同的内插方案来得到最佳感知质量。
通过LSP系数的LSP参数映射以及激励矢量校正虽然几乎所有基于CELP的音频编解码器都使用相同的方法来得到LPC系数,但是还存在一些次要的差异。这些差异是由于不同窗口大小和形状、每个子帧的不同LPC内插、不同子帧大小、不同的LPC量化方案、以及不同的查找表而引起的。
为了进一步改进通过上述子帧内插方法产生的音频代码转换的质量,通过应用来自源和目的编解码器的LPC数据校正用作为代码转换中的目标信号的激励矢量。
可以使用下面两种方法来提高感知质量。
方法1LSP系数的线性变换在LSP系数之间转换的一般方法是经过线性变换,q′=Λq+b其中q’是目的LSP矢量(在伪—频域中),q是源(原始)LSP矢量,A是线性变换矩阵,以及b是偏置项。在最简单的情况中,A减少到身份矩阵(identitymatrix),而b减少到零。对于G.723.1到GSM-AMR代码转换机的实施例,在GSM-AMR编解码器中使用的DC偏置项与G.723.1编解码器使用的一个DC偏置项不同,使用上述公式中的b项来补偿该差异。
方法2通过LSP系数的激励矢量校正在每个子帧中通过源LSP系数合成经解码的源激励矢量以转换到语音域,然后,使用目的编解码器的经量化的LP参数进行滤波,以形成代码转换中的目标信号。这个校正是任选的,当在LSP参数中有显著差异时,它可以大大地改善感知语音质量。图13描绘激励校正方法。
参数映射和调谐模块本部分讨论映射CELP激励参数的三种策略。按连续计算复杂性和输出质量的排序来表示它们。本发明的核心是这样的事实,即,可以直接映射激励而无需再构造语音信号。这意味着由于信号不需要象传统技术要求那样通过短期脉冲响应的滤波,所以在闭环密码本搜索期间节省了大量的计算。这种映射工作因为输入比特流已经包含根据产生语音的源CELP编解码器的最优激励。本发明使用这个事实来执行代替语音域的激励域中的快速搜索。
如上所述,具有每个都具有依次较佳的性能的激励映射的三种方法,允许代码转换机适应于可用的计算资源。
CELP参数直接空间映射这个策略是最简单的代码转换方案。映射是基于源和目的参数之间的物理意义的相似性的,并且使用分析公式直接执行代码转换而无需任何迭代或搜索。这种方案的优点在于它不需要大量存储器,并且消耗几乎为零的MIPS,但是它仍可以产生智能的声音,即使质量有所降低。注意本发明的CELP参数直接空间映射方法与图7中示出的现有技术的设备不同。这个方法是一般性的,在不同帧或子帧大小方面,它应用于所有类型的基于CELP的代码转换。
激励空间域中的分析这个策略比前一个策略更先进之处在于搜索自适应和固定密码本两者,并且通过目的CELP标准定义按通常方式估计的增益,除非在激励域而不是在语音域中定义它们。首先使用来自输入CELP子帧的音调通过局部搜索来确定音调成分(pitch contribution)作为初始估计值。一旦找到,就从激励减去音调成分,并且通过最优地匹配剩余部分来确定固定密码本。该级联方法的优点在于不需要从CELP标准使用的自动相关方法来计算开环音调估计值,但是作为替代,可以从经解码的CELP子帧的音调滞后来确定。也是在激励域中,而不是语音域中,执行搜索的,以致不需要音调和密码本搜索期间的脉冲响应滤波。这节约了大量的计算而没有折衷输出质量。
在经滤波的激励空间域中的分析在该情况中,仍把LP参数从源编解码器直接映射到目的编解码器,并且使用经解码的音调滞后作为目的编解码器的开环音调估计值。仍在激励域中执行闭环音调搜索。然而,在经滤波的激励空间域执行固定密码本搜索。滤波器类型的选择,以及是否把一个或两个搜索的目标矢量转换到这个域,要取决于所要求的质量以及复杂性要求。
可应用各种滤波器,包括滤除不规则性(smooth irregularities)的一个低通滤波器、补偿源和目的编解码器中激励特征之间的差异的一个滤波器、以及增强可感知的重要信号特征的一个滤波器。优点在于,不像标准编码中的目标信号计算那样使用经加权的LP合成滤波器,这个滤波器的参数(阶数(order)、频率加重/去除加重、相位)全部是可调谐的。因此,这种策略允许调谐而改进特定编解码器对之间的代码转换质量,以及保证减少复杂性的质量折衷。
寂静帧代码转换和产生某些基于CELP的标准实施话音活动检测器(VAD),它允许在无语音期间的不连续发送(DTX)和舒适噪声产生(CNG)。在使用VAD中,存在重要的比特率优点。需要这些帧之间的代码转换,以及在源编解码器没有产生寂静帧的情况中,为目的编解码器产生寂静帧。帧通常包括一些参数,用于在解码器处产生合适的舒适噪声。可以使用简单的代数方法对这些参数进行代码转换。
本发明的实施例例子下面部分展示对于G.723.1和GSM-AMR语音编码标准的本发明的实施例。本发明不限于这些标准。它包括所有基于CELP的音频编码标准。熟悉本技术领域的任何人员会理解如何使用这些方法来进行其它基于CELP的编码标准之间的代码转换。在描述较佳实施例之前,首先提供GSM-AMR和G.723.1编解码器的简单说明。
GSM-AMR编解码器GSM-AMR编解码器使用比特率为12.2、10.2、7.95、7.40、6.70、5.90、5.15以及4.75千比特/秒的八个源编解码器。
编解码器是基于码激励线性预测(CELP)编码模型的。使用第10阶线性预测(LP),或短期的,合成滤波器。使用所谓的自适应密码本方法来实施长期的,或音调,合成滤波器。
在CELP语音合成模型中,通过添加来自自适应和固定(革新)密码本的两个激励矢量来构成短期LP合成滤波器输入处的激励信号。通过馈送从这些通过短期合成滤波器的密码本中正确地选择的两个矢量来合成语音。使用通过分析而合成的搜索过程(该过程中,根据可感知的加权失真测量,原始和合成语音之间的误差最小)来选择密码本中的最优激励序列。在通过分析而合成的搜索技术中使用的感知加权滤波器使用未量化的LP参数。
编解码器在20毫秒(对应于按8000个取样/秒的取样频率的160个取样)的语音帧上操作。在160个语音取样的每一个处分析语音信号,以获取CELP模型的参数(LP滤波器系数、自适应和固定密码本指数以及增益)。对这些参数进行编码和发送。在解码器处,对这些参数进行解码,并且通过LP合成滤波器滤除再构成的激励信号来合成语音。
对于12.2千比特/秒模式,每帧执行两次LP分析,而对于其它模式,执行一次。对于12.2千比特/秒模式,把两组LP参数转换成线频谱对(LSP),并且使用具有38比特的分裂矩阵量化(SMQ)一起量化。对于其它模式,把单个LP参数组转换成线频谱对(LSP),并且使用分裂矢量量化(SVQ)进行量化。
把语音帧分割成每个为5毫秒(40个取样)的四个子帧。每个子帧发送自适应和固定密码本参数。根据子帧使用经量化的和未量化的LP参数或它们的内插形式。根据感知的加权语音信号,每隔一个子帧(除了5.15和4.75千比特/秒模式之外,该两模式每帧进行一次)估计开环音调滞后。
然后,对于每个子帧重复下列操作●通过加权合成滤波器滤除LP剩余部分来计算目标信号,其中已经通过滤除LP剩余部分和激励之间的误差而更新了滤波器的初始状态(这和从经加权的语音信号减去加权合成滤波器的零输入响应的普通方法等效)。
●计算加权合成滤波器的脉冲响应。
●然后,通过搜索开环音调滞后,使用目标和脉冲响应,执行闭环音调分析(寻找音调滞后和增益)。使用取样分辨率为1/6或1/3的分数音调(根据模式)。
●通过除去自适应密码本分量(滤除自适应码矢量)而更新目标信号,并且在固定代数密码本搜索中使用这个新的目标(寻找最优革新码字)。
●自适应和固定密码本的增益是分别用4和5比特量化的标量,或用6-7比特量化的矢量(具有施加于固定密码本增益的移动平均值(MA)预测)。
●最后,为了寻找下一个子帧中的目标信号而更新滤波器存储器(使用确定的激励信号)。
在每个20毫秒的语音帧中,产生95、103、118、134、148、159、204或244比特的比特分配,对应于4.75、5.15、5.90、6.70、7.40、7.95、10.2以及12.2千比特/秒的比特率。
G.723.1编解码器G.723.1编解码器有两个与之相关联的比特率,即,5.3和6.3kbps。两个速率是编码器和解码器必须遵循的部分。有可能在任何30毫秒帧边界上在两个速率之间切换。
编解码器是基于通过合成编码的线性预测分析原理的,并且试图使感知的加权误差信号最小。编码器在每个为240个取样的块(帧)上操作。在8KHz取样速率时,这等于30毫秒。每个块首先进行高通滤波,以除去DC分量,然后,分割成每个为60个取样的四个子帧。对于每个子帧,使用未处理的输入信号计算第10阶线性预测编码器(LPC)滤波器。使用预测分裂矢量量化器(PSVQ)来量化最后子帧的LP滤波器。使用未量化的LPC系数来构造短期感知加权滤波器,使用该滤波器对整个帧进行滤波,以及得到感知加权语音信号。
对于每两个子帧(120个取样),使用加权的语音信号计算开环音调周期LOL。在120个取样的块上执行这个音调估计。在从18到142个取样的范围内搜索音调周期。
从此时,在每子帧60个取样的基础上处理语音。
使用以前计算的经估计的音调周期,构造谐波噪声成形滤波器。使用LPC合成滤波器、共振峰感知加权滤波器以及谐波噪声成形滤波器的组合,以创建脉冲响应。然后,使用脉冲响应进行进一步的计算。
使用音调周期估计值LOL以及脉冲响应计算闭环音调预测值。使用第五阶音调预测值。计算音调周期作为围绕开环音调估计值的一个小的差值。然后从初始目标矢量中减去音调预测值分量。把音调周期和差值两者都发送到解码器。
最后,近似激励的非周期性分量。对于高比特率,使用多脉冲最大似然比量化(MP-MLQ)激励,而对于低比特率,使用代数密码本激励。
第一实施例-GSM-AMR到6.723.1图17是根据本发明的第一实施例的方框图,说明从GSM-AMR到G.723.1的代码转换机。GSM-AMR比特流包括长度从最高速率模式12.2kbps的244比特(31字节)到最低速率模式4.75 kbps编解码器的95比特(12字节)。总共有八个模式。八个GSM-AMR操作模式中的每一个产生不同的比特流。由于30毫秒持续期的G.723.1帧包括一个半的GSM-AMR帧,所以需要两个GSM-AMR帧来产生单个G.723.1帧。然后可以在第三个GSM-AMR帧到达时产生下一个G.723.1帧。所以每处理三个GSM-AMR帧产生两个G.723.1帧。
使用相同的技术对GSM-AMR语音产生模型中的短期滤波器使用的10LSP参数进行编码,但是对于不同的操作模式按不同的比特流格式。在GSM-AMR标准文件中给出再构造LSP参数的算法一旦已经产生每个子帧的短期滤波器参数,就需要通过组合自适应码字和固定(代数)码字来形成激励矢量。根据1/6或1/3分辨率音调滞后参数,使用60-抽头(tap)内插滤波器来构造自适应码字。然后构造固定码字,如通过标准和形成的激励所定义x[n]=g~pv[n]+g~cc[n]]]>其中x是激励,v是经内插的自适应码字,c是固定码矢量,而 和 分别是自适应和固定代码增益。然后使用这个激励来更新GSM-AMR去除封装器的存储器状态,并且通过G.723.1比特流封装器进行映射。
通过形成激励矢量的线性组合来寻找每个子帧的自适应码字,并且寻找对通过GSM-AMR去除封装器构造的目标激励信号x{}的最优匹配。组合是五个连续滞后的以前激励的加权和。这可通过公式最佳地说明v[n]=Σj=-22βju[n-L+j],0≤n≤59]]>其中v[]是再构造的自适应码字,u[]是以前的激励缓冲器,L是包括18和143之间的(整数)音调滞后(从GSM-AMR去除封装模块确定),而βj是滞后加权值,它确定增益和滞后相位。搜索βj的矢量表,使自适应码字v[]和激励矢量x[]之间的匹配最优化。
一旦找到激励的自适应码字分量,就从激励减去这个分量,留下剩余部分准备由固定密码本编码。计算每个子帧的剩余信号为,x2[n]=x[n]-v[n],n=0,…,59其中x2[]是固定密码本搜索的目标,x[]是从GSM-AMR去除封装导出的激励,而v[]是(经内插和经定标的)自适应码字。
对于G.723.1编解码器的高和低速率模式,固定密码本是不同的。高速率使用MP-MLQ密码本,它允许在任何位置处,偶数子帧每子帧六个脉冲,而奇数子帧每子帧五个脉冲。低速率模式使用代数密码本(ACELP),它允许在有限制位置处的每子帧四个脉冲。两种密码本都使用网格标志来表示是否应该偏移码字使之移动一个位置。除了由于是在激励域执行搜索而不是在语音域执行搜索,没有使用脉冲响应滤波器之外,通过在标准中定义的方法来搜索这些密码本。
在完成每个子帧的处理时需要更新编解码器的(持久的)存储器。这是如此完成的首先使以前的激励缓冲器u[]移位60个取样(即,一个子帧),以致丢弃了最老的取样,然后把激励从当前子帧拷贝到缓冲器顶部的60个取样,u[n]=u[n+60],-85≤n<0g~pv[n]+g~cc[n],0≤n≤59]]>其中相对于当前子帧的第一取样设置指数n,而其它参数已经在以前定义过了。
把所有经映射的参数都编码到输出G.723.1比特流中,系统准备处理下一个帧。
第二实施例6.723.1到GSM-AMR图18是根据本发明的第二实施例的方框图,说明G.723.1到GSM-AMR的代码转换机。G.723.1比特流包括高速率(6.3kbps)编解码器的长度192比特(24字节)的帧,或低速率(5.3kbps)编解码器的160比特(20字节)的帧。这些帧具有极相似的结构,不同之处仅在于固定密码本参数的表示。
对于高和低速率两者,按相同的方式对用于形成短期声域滤波器模型的10LSP参数进行编码,并且可以从G.723.1帧的比特2到25获取。只对第四子帧的LSP进行编码,并且使用帧之间的内插,以再产生其它三个子帧的LSP。编码使用三个查找表,并且通过从这些表格得到的三个子矢量的结合来再构造LSP矢量。每个表格具有256个矢量输入,前面两个表格具有3—单元子矢量,而最后的表格具有4—单元子矢量。组合这些给出10—单元LSP矢量。
通过组合以前的激励矢量来构造每个子帧的自适应码字。组合是五个连续滞后处的以前激励的加权和。通过公式能较佳地说明这个,v[n]=Σj=-22βju[n-L+j],0≤n≤59]]>
其中v[]是再构造的自适应码字,u[]是以前的激励缓冲器,L是包括18和143之间的(整数)音调滞后,而βj是通过音调增益参数确定的滞后加权值。
直接从比特流获取滞后参数L。第一和第三子帧使用滞后的全部动态范围,而第二和第四子帧对滞后编码作为从以前子帧的偏移。通过表格的查找来确定滞后加权参数βj。作为自适应码字去除封装的结果,可以通过计算确定分数音调滞后和相关联的增益的近似值。
Li-Σj=-22jβi,j2Σj=-22βi,j2]]>对于G.723.1编解码器的高和低速率模式,固定密码本是不同的。高速率模式使用MP-MLQ密码本,它允许在任何位置处,偶数子帧每子帧六个脉冲,而奇数子帧每子帧五个脉冲。低速率模式使用代数密码本(ACELP),它允许在有限制位置处的每子帧四个脉冲。两种密码本都使用网格标志来表示是否应该偏移码字使之移动一个位置。在G.723.1标准文件中给出从经编码的比特流产生码字的算法。
在完成每个子帧的处理时需要更新编解码器的(持久的)存储器。这是如此完成的首先使以前的激励缓冲器u[]移位60个取样(即,一个子帧),以致丢弃了最老的取样,然后把激励从当前子帧拷贝到缓冲器顶部的60个取样,u[n]=u[n+60],-85≤n<0g~pv[n]+g~cc[n],0≤n≤59]]>其中相对于当前子帧的第一取样设置指数n,而其它参数已经在以前定义过了。
代码转换机的GSM-AMR参数映射部分取得如上所述的经内插的CELP参数,并且使用它们作为搜索GSM-AMR参数空间的基础。当接收时,对LSP参数简单地编码,而使用其它参数,即,激励和音调滞后,作为GSM-AMR空间中声音搜索的估计值。下面的描绘(figure)示出为了完成代码转换而必须发生在每个子帧上的主要操作。
对于与目标激励的最佳匹配,通过搜索多达最多143个滞后的以前激励矢量而形成自适应码字。从经内插的子帧确定目标激励。可以根据模式通过1/6或1/3间隔来内插以前的激励。通过搜索关于音调滞后(是从G.723.1去除封装模块确定的)的一个小区域来寻找最优滞后。搜索这个区域以寻找最优整数滞后,然后再寻找而确定滞后的分数部分。该过程使用24—抽头内插滤波器,以执行分数搜索。第一和第三子帧的处理与第二和第四子帧的处理不同。然后,形成经内插的自适应码字v[]为,v[n]=Σi=09u[n-L-i]b60[t+6i]+u[n-L+1+i]b60[6-t+6i]]]>其中v[]是以前的激励缓冲器,L是(整数)音调滞后,t是按1/6分辨率的分数音调滞后,而b60是60-抽头内插滤波器。
计算和量化音调增益,以致可以对它进行编码和发送到解码器,并且还用于计算固定密码本目标矢量。所有模式都按相同方式对每个子帧计算音调增益,gp=xTvvTv]]>其中gp是未量化的音调增益,x是自适应密码本搜索的目标,以及v是(经内插的)自适应码字矢量。12.2kbps和7.95kbps模式独立地量化自适应和固定密码本增益,而其它模式使用固定和自适应增益的联合量化。
一旦找到激励的自适应密码本分量,就从激励减去这个分量,留下剩余部分准备用于通过固定密码本的编码。计算每个子帧的剩余信号为,x2[n]=x[n]-g~pv[n],n=0,···,39]]>其中x2[]是固定密码本搜索的目标,x[]是自适应密码本搜索的目标,g^p是经量化的音调增益,以及v[]是(经内插的)自适应。
设计固定密码本搜索,以在已经除去自适应密码本分量之后寻找对于剩余信号的最佳匹配。这对于非话音的语音以及对于启动自适应密码本是很重要的。由于已经发生了大量原始语音的分析,所以在代码转换中使用的密码本搜索可以比在编解码器中使用的密码本搜索更简单。还有,在其上执行密码本搜索的信号是代替合成语音的经再构造的激励信号,因此已经具有更会接纳固定密码本编码的一种结构。
根据以前四个子帧的能量,使用移动平均值预测来量化固定密码本增益。对实际和预测增益之间的校正因子进行量化(通过对表格的查找),并且发送到解码器。在GSM-AMR标准文件中给出确切的细节。
在完成每个子帧的处理时,需要更新用于编解码器的(持久的)存储器。这是如此进行的首先使以前的激励缓冲器u[]移位40个取样(即,一个子帧),以致丢弃最老的取样,然后从当前子帧把激励拷贝到缓冲器的顶部40个取样,u[n]=u[n+40],-114≤n<0g~pv[n]+g~cc[n],0≤n≤39]]>
其中相对于当前子帧的第一取样设置指数n,而其它参数以前都已经定义过了。
在已经说明和描述当前所认为的作为本发明的例子的实施例的同时,熟悉本技术领域的人员会理解,可以进行各种其它的修改,以及可以用等效物来替代,而并不偏离本发明的真实范围。此外,可以按本发明的学说作出许多修改来适应特定的情况而不偏离这里描述的中心发明思想。
权利要求
1.一种设备,用于从一种基于CELP的标准到另一种基于CELP的标准和/或在单个标准但是不同的模式中进行CELP帧的转换,包括比特流去除封装模块,用于从一个源编解码器获取一个或多个CELP参数;耦合到比特流去除封装模块的一个内插器模块,内插器模块适用于在不同帧大小、子帧大小、和/或源编解码器和目的编解码器的取样速率之间的内插;耦合到内插器模块的一个映射模块,映射模块适用于把来自源编解码器的一个或多个CELP参数映射到目的编解码器的一个或多个CELP参数;耦合到映射模块的目的比特流封装模块。目的比特流封装模块适用于根据来自目的编解码器的至少一个或多个CELP参数构成至少一个目的输出CELP帧;以及耦合到至少目的比特流封装模块、映射模块、内插器模块以及比特流去除封装模块的一个控制器,控制器适用于管理一个或多个模块的操作,并且适用于接收来自一个或多个外部应用程序的指令,控制器适用于把状态信息提供给一个或多个外部应用程序。
2.如权利要求1所述的设备,其特征在于,所述控制器是单个控制器或多个控制器。
3.如权利要求1所述的设备,其特征在于,所述映射模块和所述目的比特流封装模块是在同一模块中的。
4.如权利要求1所述的设备,其特征在于,所述映射模块是单个模块或多个模块。
5.如权利要求1所述的设备,其特征在于,所述内插模块是单个模块或多个模块。
6.如权利要求1所述的设备,其特征在于,所述比特流封装模块包括比特流处理器,所述比特流处理器适用于在源CELP编解码器输入帧中按一个或多个CELP参数的第一格式获取信息;耦合到所述比特流处理器的LSP解码模块,所述LSP解码模块适用于使用至少来自源CELP编解码器输入帧的信息而输出一个或多个LSP系数;耦合到所述比特流处理器的解码模块,所述解码模块适用于对信息解码以从源CELP编解码器输入帧输出音调滞后参数以及音调增益参数;耦合到所述比特流处理器的固定密码本解码模块,所述固定密码本解码模块适用于对信息解码以输出固定密码本矢量;耦合到所述比特流处理器的自适应码字解码模块,所述自适应码字解码模块适用于对信息解码以输出自适应密码本分量矢量;以及耦合到所述固定密码本解码模块的激励发生器,所述激励发生器适用于使用至少固定密码本矢量和自适应密码本矢量以输出激励矢量。
7.如权利要求1所述的设备,其特征在于,所述内插器模块包括LSP过程,当源编解码器和目的编解码器具有不同的子帧大小时,所述LSP过程适用于把所述源编解码器的一个或多个LSP系数转换成所述目的编解码器的一个或多个LSP系数;自适应密码本过程,当源编解码器和目的编解码器具有不同的子帧大小时,所述自适应密码本过程适用于把来自所述源编解码器的音调滞后和音调增益转换到所述目的编解码器的音调滞后和音调增益;CELP参数缓冲器,当源编解码器和目的编解码器具有不同的子帧大小时,所述CELP参数缓冲器适用于保存为内插而需要缓冲的一个或多个CELP参数。
8.如权利要求1所述的设备,其特征在于,所述参数映射和调谐模块包括参数映射和调谐策略切换模块,所述策略切换模块适用于根据多个策略选择一个CELP参数映射策略;参数映射和调谐策略模块,所述映射和调谐策略模块适用于输出一个或多个目的CELP参数。
9.如权利要求8所述的设备,其特征在于,多个策略包括CELP参数直接空间映射模块;经滤波的激励空间域分析模块;以及激励空间域中分析模块。
10.如权利要求8所述的设备,其特征在于,所述参数映射和调谐策略模块包括LSP系数转换器,它对目的LSP系数进行编码;CELP激励映射单元,它从内插取得包括音调滞后、增益、以及激励矢量的CELP激励参数,以得到经编码的CELP激励参数。
11.如权利要求10所述的设备,其特征在于,所述CELP激励映射单元包括CELP参数直接空间映射的模块,它使用无需任何迭代的分析公式而产生经编码的目的CELP参数;在激励空间域映射中的分析模块,它通过搜索激励空间域而产生经编码的目的CELP参数;在经滤波的激励空间域映射中的分析模块,它通过搜索在激励空间域中的自适应闭环和经滤波的激励空间中的固定密码本而产生经编码的目的CELP参数;
12.如权利要求1所述的设备,其特征在于,所述目的比特流封装模块包括多个帧封装设备,设备中的每一个都能够适用于从多个用于选择目的CELP编码器的应用中预选择一个应用,所选择的目的CELP编码器是包括目的CELP编码器的多个CELP编码器中的一个。
13.如权利要求1所述的设备,其特征在于,所述控制器包括控制单元,它接收外部指令和控制每个信号处理模块;状态单元,它根据请求把诸如帧、计数、误差滞后等代码转换信息发送到外部。
14.如权利要求1所述的设备,其特征在于,可以从线性内插或非线性内插选择所述内插模块。
15.如权利要求7所述的设备,其特征在于,所述CELP参数缓冲器包括激励矢量缓冲器,所述激励矢量缓冲器适用于存储等待在下一个子帧或帧中映射的、再构造的激励矢量;LSP系数缓冲器,它存储等待在下一个子帧或帧中映射的、内插之前或之后的LSP系数;CELP其它参数缓冲器,它存储等待在下一个子帧或帧中映射的、内插之前或之后的音调滞后、音调增益、密码本增益和指数。
16.一种方法,用于对基于CELP的经压缩的话音比特流进行从源编解码器到目的编解码器的代码转换,所述方法包括处理源编解码器输入CELP比特流使之对来自输入CELP比特流的至少一个或多个CELP参数去除封装;如果存在包括帧大小、子帧大小、和/或目的编解码器格式的取样速率的多个目的编解码器参数中的一个或多个以及包括帧大小、子帧大小、和/或源编解码器格式的取样速率的多个源编解码器参数中的一个或多个的差异,则从源编解码器格式到目的编解码器格式内插多个去除封装的CELP参数中的一个或多个;对目的编解码器的一个或多个CELP参数进行编码;以及通过至少封装目的编解码器的一个或多个CELP参数而处理目的CELP比特流。
17.如权利要求16所述的方法,其特征在于,所述处理源编解码器输入包括把输入比特流帧转换成与一个或多个CELP参数相关联的的信息;把信息解码成一个或多个CELP参数;根据至少一个或多个CELP参数来再构造激励矢量;把CELP参数输出到内插器。
18.如权利要求16所述的方法,其特征在于,所述内插包括把来自源编解码器的一个或多个LSP系数内插到目的编解码器的一个或多个LSP系数;把来自源编解码器的不同于LSP系数的其它CELP参数内插到目的编解码器的其它CELP参数;以及如果激励矢量不需要校正,这把源激励矢量传送到编码过程。
19.如权利要求18所述的方法,进一步包括使用线性变换过程来转换一个或多个LSP系数。
20.如权利要求18所述的方法,进一步包括使用至少一个或多个源解码LPC系数把源编解码器激励矢量转换成合成语音矢量;量化目的LPC系数;使用至少量化的目的LPC系数把合成语音矢量转换回经校正的激励矢量;以及把经校正的激励矢量传送到另一个过程。
21.如权利要求16所述的方法,其特征在于,所述编码包括量化目的LPC系数;根据来自参数映射和调谐策略切换模块的控制信号选择CELP映射策略中之一;·CELP参数直接空间映射;·在激励空间域中分析;·在经滤波的激励空间域中分析。
22.如权利要求21所述的方法,其特征在于,所述CELP参数直接空间映射的操作包括操作对来自经内插的音调滞后参数的音调滞后进行编码;对来自经内插的音调增益参数的音调增益进行编码;对来自分析形式的固定密码本的指数进行编码;对固定密码本增益参数的增益进行编码;
23.如权利要求21所述的方法,其特征在于,在激励空间域映射中的分析操作包括操作从经内插的音调滞后参数选择音调滞后作为初始值;在激励空间中的闭环中搜索音调滞后;在激励空间中搜索音调增益;构造固定密码本搜索的目标信号;在激励空间中搜索固定密码本指数;在激励空间中搜索固定密码本增益;更新以前的激励矢量。
24.如权利要求21所述的方法,其特征在于,在经滤波的激励空间域映射中的分析操作包括操作从经内插的音调滞后参数选择音调滞后作为初始值;在激励空间中的闭环中搜索音调滞后;在激励空间中搜索音调增益;构造固定密码本搜索的目标信号;在经滤波的激励空间中搜索固定密码本指数;在经滤波的激励空间中搜索固定密码本增益;更新以前的激励矢量。
25.如权利要求21所述的方法,其特征在于,所述选择不是只限于上述三种策略,可以选择三种策略的组合作为新的映射策略。
26.如权利要求1,外加可以执行从一种语音编码标准到另一种语音编码标准的寂静帧的快速转换的寂静帧代码转换单元。
27.如权利要求1,但是其中参数映射和调谐模块包括用于产生寂静帧的话音活动检测器。话音活动检测器根据CELP空间中的参数作出它的语音/寂静判定。
28.如权利要求1,但是外加一种系统,用于改变所使用的激励映射策略,从而提供一种机构,以适应于可用的计算资源,并且允许在负载下有适度的质量降低。
29.执行激励映射而无需反回到语音信号域。
30.一种方法,用于从源编解码器到目的编解码器格式处理基于CELP的经压缩的话音比特流,所述方法包括从一个应用过程传送来自多个控制信号的控制信号;根据来自所述应用的至少控制信号从多个不同的CELP映射策略选择一个CELP映射策略;以及使用所选择的CELP映射策略执行映射过程,以把一个或多个CELP参数从源编解码器格式映射到目的编解码器格式的一个或多个CELP参数。
31.如权利要求30所述的方法,其特征在于,所述多个CELP映射策略包括CELP参数直接空间映射;或在激励空间域中分析;或在经滤波的激励空间域中分析。
32.如权利要求30所述的方法,其特征在于,所述选择一个CELP映射策略是为了在设置过程和构造过程期间的预定应用。
33.如权利要求30所述的方法,进一步包括在一个切换模块处接收控制信号,把所述切换模块耦合到多个映射策略中的每一个。
34.如权利要求30所述的方法,其特征在于,根据计算所选择的CELP映射策略的资源特征而提供所述控制信号。
35.如权利要求30所述的方法,其特征在于,在存储器中的存储库中提供多个映射策略中的一个或多个。
36.如权利要求31所述的方法,进一步包括对目的编解码器的一个或多个CELP参数进行编码;以及通过至少封装目的编解码器的一个或多个CELP参数来处理目的CELP比特流。
37.如权利要求36所述的方法,进一步包括把经封装的目的CELP比特流传送到目的编解码器。
38.一种系统,用于从源编解码器到目的编解码器格式处理基于CELP的经压缩的话音比特流,所述系统包括一个或多个代码,用于从来自应用过程的多个控制信号接收一个控制信号;一个或多个代码,用于根据至少来自所述应用的控制信号从多个不同的CELP映射策略选择一个CELP映射策略;以及一个或多个代码,用于使用所选择的CELP映射策略执行映射过程,以把一个或多个CELP参数从源编解码器格式映射到目的编解码器格式的一个或多个CELP参数。
39.如权利要求38所述的系统,其特征在于,多个CELP映射策略包括针对CELP参数直接空间映射的一个或多个代码;或针对在激励空间域中分析的一个或多个代码;或针对在经滤波的激励空间域中分析的一个或多个代码。
40.如权利要求38所述的系统,其特征在于,所选择的CELP映射策略是为了预定应用的。
41.如权利要求38所述的系统,进一步包括在策略切换模块中提供的针对接收控制信号的一个或多个代码,把所述策略切换模块耦合到多个映射策略中的每一个。
42.如权利要求38所述的系统,其特征在于,根据计算所选择的CELP映射策略的资源特征而提供所述控制信号。
43.如权利要求38所述的系统,其特征在于,在存储器中的存储库中提供针对多个映射策略的一个或多个代码。
44.如权利要求43所述的系统,进一步包括针对对目的编解码器的一个或多个CELP参数进行编码的一个或多个代码;以及针对通过至少封装目的编解码器的一个或多个CELP参数来处理目的CELP比特流的一个或多个代码。
45.如权利要求44所述的系统,进一步包括针对把目的CELP比特流传送到目的编解码器的一个或多个代码。
46.如权利要求44所述的系统,进一步包括针对把目的CELP比特流传送到存储位置的一个或多个代码。
全文摘要
一种方法,用于对基于CELP的经压缩的话音比特流进行从源编解码器到目的编解码器的代码转换。该方法包括处理源编解码器输入CELP比特流,使之去除来自输入CELP比特流的至少一个或多个CELP参数的封装,并且,如果包括帧大小、子帧大小和/或目的编解码器格式的取样速率的多个目的编解码器参数中的一个或多个和包括帧大小、子帧大小和/或源编解码器格式的取样速率的多个源编解码器参数中的一个或多个存在差异,则从源编解码器格式到目的编解码器格式内插多个去除封装的CELP参数中的一个或多个。该方法包括对目的编解码器的一个或多个CELP参数进行编码,并且通过至少封装一个或多个目的编解码器的CELP参数来处理目的CELP比特流。
文档编号G10L19/16GK1701353SQ03805519
公开日2005年11月23日 申请日期2003年1月8日 优先权日2002年1月8日
发明者M·A·贾布里, J·王, S·戈徳 申请人:迪里辛姆网络控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1