用于谱包络表示的向量量化的方法和设备的制作方法

文档序号:2830054阅读:202来源:国知局

专利名称::用于谱包络表示的向量量化的方法和设备的制作方法
技术领域
:本发明涉及信号处理。
背景技术
:语音编码器将语音信号的谱包络的表征以线谱频率(linespectralfrequency,LSF)的向量或类似表示的形式发送到解码器。为了有效传输,对这些LSF进行量化。
发明内容根据一个实施例,一种量化器经配置以对输入值(例如,线谱频率或其一部分的向量)的平滑值进行量化,以产生对应的输出值,其中所述平滑值基于縮放因子和前一个输出值的量化误差。图la展示根据实施例的语音编码器E100的框图。图lb展示语音解码器E200的框图。图2展示通常由标量量化器执行的一维映射的实例。图3展示如由向量量化器执行的多维映射的一个简单实例。图4a展示一维信号的一个实例,且图4b展示此信号在量化后的版本的实例。图4c展示如由图5中所示的量化器230a量化的图4a的信号的实例。图4d展示如由图6中所示的量化器230b量化的图4a的信号的实例。图5展示根据实施例的量化器230的实施230a的框图。图6展示根据实施例的量化器230的实施230b的框图。图7a展示语音信号的频率与对数幅值曲线的实例。图7b展示基础线性预测编码系统的框图。图8展示窄带编码器A120的实施A122的框图。图9展示窄带编码器B110的实施B112的框图。图10a是宽带语音编码器A100的框图。图10b是宽带语音编码器A100的实施A102的框图。图lla是对应于宽带语音编码器A100的宽带语音解码器B100的框图。图Ub是对应于宽带语音编码器A102的宽带语音解码器B102的实例。具体实施例方式由于量化误差,重建在解码器中的谱包络可能显示过度波动。这些波动可能在经解码信号中产生不良的"颤音"质量。实施例包含经配置以使用谱包络参数的暂时噪声修整量化(temporalnoiseshapingquantization)来执行高质量的宽带语音编码的系统、方法和设备。特征包含例如高频带LSF的系数表示的固定或自适应修匀。本文描述的特定应用包含对窄带信号与高频带信号进行组合的宽带语音编码器。除非其上下文明确地限制,否则术语"计算"在本文中用来指示其任何通常意义,例如计算、产生和从值列表中选择。本实施方式和权利要求书中使用术语"包括"的地方,并不排除其它元件或操作。术语"A基于B"用来指示其任何通常意义,包含情况(i)"A等于B"和(ii)"A至少基于B"。术语"因特网协议(InternetProtocol)"包括如IETF(InternetEngineeringTaskForce,因特网工程任务组)RFC(RequestforComments,请求注解)791中所描述的第4版,和例如第6版的随后版本。语音编码器可根据声源-滤波器模型来实施,所述语音编码器将输入的语音信号编码成一组描述滤波器的参数。举例来说,语音信号的谱包络由表示声道的共振且称为共振峰的若干峰值来表征。图7a展示所述谱包络的一个实例。大多数语音编码器将至少此粗略频谱结构编码成一组参数,例如滤波器系数。图la展示根据实施例的语音编码器E100的框图。如此实例中所示,可将分析模块实施为线性预测编码(linearpredictioncoding,LPC)分析模块210,其将语音信号SI的谱包络编码成一组线性预测(LP)系数(例如,全极点滤波器的系数1/A(z))。分析模块通常将输入信号处理成一系列不相重叠的帧,其中针对每个帧计算一组新系数。帧周期通常是可能期望信号在此期间局部稳定的周期;一个常见实例是20毫秒(等效于8kHz的取样速率下160个样本)。低频带LPC分析模块的一个实例经配置以计算一组十个LP滤波器系数,以便表征低频带语音信号S20的每个20毫秒帧的共振峰结构,且高频带LPC分析模块的一个实例经配置以计算一组六个(或者,八个)LP滤波器系数,以便表征高频带语音信号S30的每个20毫秒帧的共振峰结构。还有可能实施分析模块以将输入信号处理成一系列重叠帧。分析模块可经配置以直接分析每个帧的样本,或可首先根据窗口函数(例如,汉明窗口(Hammingwindow))对样本进行加权。分析还可在大于所述帧的窗口(例如30毫秒窗口)上执行。此窗口可以是对称的(例如,5-20-5,使得其包含紧接在20毫秒帧之前和之后的5毫秒),或不对称的(例如,10-20,使得其包含前一个帧的最后IO毫秒)。LPC分析模块通常经配置以使用Levinson-Durbin递归或Leroux-Gueguen算法来计算LP滤波器系数。在另一实施中,分析模块可经配置以针对每个帧计算一组倒谱系数(cepstmlcoefficient),而不是一组LP滤波器系数。通过对滤波器参数进行量化,可显著减小语音编码器的输出速率,且对再现质量具有相对较小的影响。线性预测滤波器系数难以被有效地量化,且通常被语音编码器映射成另一表示,例如线谱对(linespectralpair,LSP)或线谱频率(linespectralfrequency,LSF),以供量化和/或熵编码。图la中所示的语音编码器E100包含LP滤波器系数到LSF变换器220,其经配置以将LP滤波器系数组变换成LSF的对应向量。LP滤波器系数的其它一对一表示包含部分自相关系数(parcorcoefficient);对数面积比率值(log-area-ratiovalue);导抗谱对(immittancespectralpair,ISP);以及导抗谱频率(ISF,immittancespectralfrequencies),其可用于GSM(全球移动通信系统)AMR-WB(自适应多速率宽带)编解码器。通常,一组LP滤波器系数与一组对应LSF之间的变换是可逆的,但实施例还包含变换无法在没有误差的情况下可逆的语音编码器的实施。语音编码器通常包含量化器,其经配置以对窄带LSF组(或其它系数表示)进行量化,且输出此量化的结果,作为滤波器参数。通常使用向量量化器来执行量化,所述向量量化器将输入向量编码成指向表或码本中的对应向量条目的索引。所述量化器还可经配置以执行经分类向量量化。举例来说,所述量化器可经配置以基于已经在同一个帧(例如,在低频带信道中和/或在高频带信道中)内编码的信息来选择一组码本中的一者。所述技术通常以额外码本存储为代价来提供增加的编码效率。图lb展示对应的语音解码器E200的框图,其包含经配置以对经量化的LSFS3进行反量化的反向量化器310,和经配置以将经反量化的LSF向量变换成一组LP滤波器系数的LSF到LP滤波器系数变换器320。根据LP滤波器系数配置的合成滤波器330通常由激励信号驱动,以产生输入语音信号的合成再现S5。激励信号可基于随机噪声信号和/或基于如由编码器发送的残差的量化表示。在例如宽带语音编码器A100和解码器B100(如本文参看(例如)图10a、图10b和图lla、图llb所描述)的某些多频带编码器中,用于一个频带的激励信号从用于另一频带的激励信号导出。LSF的量化引入随机误差,所述随机误差从一个帧到下一个帧常常不相关。此误差可能导致经量化的LSF不如未经量化的LSF平滑,且可能降低经解码信号的感知质量。与未经量化的LSF向量相比,LSF向量的独立量化通常会一帧一帧地增加频谱波动的量,且这些频谱波动可能会导致经解码的信号听起来不自然。Knagenhjelm和Kleijn提出一种复杂的解决方案,其中在解码器中执行经反量化的LSF参数的修匀。这减少了频谱波动,却是以额外延迟作为代价。本申请案描述方法,所述方法在编码器侧使用暂时噪声修整,使得可在没有额外延迟的情况下减少频谱波动。量化器通常经配置以将输入值映射到一组离散输出值中的一者。有限数目个输出值是可用的,使得一个范围的输入值映射到单个输出值。因为与原始输入值相比,指示对应输出值的索引可用较少的位传输,所以量化增加了编码效率。图2展示通常由标量量化器执行的一维映射的实例。所述量化器同样可以是向量量化器,且通常使用向量量化器对LSF进行量化。图3展示由向量量化器执行的多维映射的一个简单实例。在此实例中,将输入空间划分成若干个Voronoi区域(例如,根据最近邻标准(nearest-neighborcriterion))。量化将每个输入值映射到表示对应Voronoi区域(通常,形心)的值,此处将其展示为一个点。在此实例中,将输入空间划分成六个区域,使得任一输入值都可由一个仅具有六个不同状态的索引表示。如果输入信号非常平滑,那么根据量化的输出空间中的值之间的最小步矩,有时可能会出现经量化的输出不及原来平滑的情况。图4a展示仅在一个量化等级(在此处仅展示一个所述等级)内变化的平滑一维信号的一个实例,且图4b展示在量化之后的此信号的实例。即使图4a中的输入仅在小范围内变化,但图4b中的所得输出含有更多突然转变且不及原来平滑。所述效应可能会引起听得见的非自然信号(artifact),且可能需要针对LSF(或待量化的谱包络的其它表示)减少此效应。举例来说,可通过并入临时噪声修整来改进LSF量化性能。在根据一个实施例的方法中,在编码器中,针对语音的每个帧(或其它区块),对谱包络参数的向量估计一次。对参数向量进行量化,以便有效地传输到解码器。在量化之后,存储量化误差(界定成经量化的与未经量化的参数向量之间的差)。在对帧N的参数向量进行量化之前,使帧N-l的量化误差减少縮放因子,且添加到帧N的参数向量。在当前经估计的谱包络与前一个经估计的谱包络之间的差相对较大时,可能希望缩放因子的值较小。在根据一个实施例的方法中,针对每个帧计算LSF量化误差向量并使其乘以具有比1.0小的值的縮放因子&。在量化之前,将前一个帧的经縮放量化误差添加到LSF向量(输入值VIO)。所述方法的量化操作可由例如以下的表达式来描述*+-1)--l)]),其中W^是与帧/t有关的经修匀的LSF向量,y(W是与帧7z有关的经量化的LSF向量,g(,)是最近邻量化操作,且6是缩放因子。根据实施例的量化器230经配置以产生输入值V10(例如,LSF向量)的平滑值V20的经量化的输出值V30,其中平滑值V20基于縮放因子&V40和前一个输出值V30a的量化误差。可应用所述量化器来在没有额外延迟的情况下减少谱波动。图5展示量化器230的一个实施230a的框图,其中可为此实施所特有的值由下标a指示。在此实例中,通过从如由反向量化器Q20反量化的当前输出值V30a减去平滑值V20a的当前值来计算量化误差。将所述误差存储到延迟元件DEIO。平滑值V20a本身是当前输入值V10与如縮放(例如乘以)了缩放因子V40的前一个帧的量化误差的和。替代地,还可以在将量化误差存储到延迟元件DE10之前应用缩放因子V40的方式来实施量化器230a。图4c展示如响应于图4a的输入信号由量化器230a产生的(经反量化的)输出值V30a序列的实例。在此实例中,6的值固定在0.5。可看到图4c的信号比图4a的波动信号平滑。可能需要使用递归函数来计算反馈量。举例来说,可相对于当前输入值而不是相对于当前平滑值来计算量化误差。所述方法可由例如以下的表达式来描述润=W"A/,WW=x(n)+W"-1)--l)],其中x(W是与帧n有关的输入LSF向量。图6展示量化器230的实施230b的框图,其中可为此实施所特有的值由下标b指示。在此实例中,通过从如由反向量化器Q20反量化的当前输出值V30b减去当前输入值V10来计算量化误差。将误差存储到延迟元件DEIO。平滑值V20b是当前输入值V10与如缩放(例如乘以)了缩放因子V40的前一个帧的量化误差的和。替代地,还可以在将量化误差存储到延迟元件DE10之前应用縮放因子V40的方式来实施量化器230b。还有可能实施230a中与实施230b相反,使用縮放因子V40的不同值。图4d展示如响应于图4a的输入信号由量化器230b产生的(经反量化的)输出值V30b序列的实例。在此实例中,Z的值固定在0.5。可看到图4d的信号比图4a的波动信号平滑。应注意,可通过替换或添增根据如图5或图6所示的布置的现存量化器Q10来实施如本文所示的实施例。举例来说,量化器Q10可实施为预测向量量化器、多级量化器、分裂向量量化器(splitvectorquantizer)或根据针对LSF量化的任何其它方案来实施。在一个实例中,&的值固定在0与1之间的所需值。或者,可能需要动态地调整縮放因子6的值。举例来说,可能需要依据未经量化的LSF向量中已经存在的波动的程度来调整縮放因子6的值。在当前LSF向量与前一个LSF向量之间的差较大时,縮放因子接近于零,且几乎没有噪声修整结果。在当前LSF向量与前一个LSF向量只有少许不同时,縮放因子接近于l.O。以此方式,可能保持谱包络随时间的转变,从而在语音信号改变时,使频谱失真减到最小,同时在语音信号从一个帧到下一个帧相对恒定时,可减少频谱波动。可使6的值与相邻LSF之间的距离成比例,且可使用向量之间的各个距离中的任何一者来确定LSF之间的变化。通常使用欧几里得范数(Euclideannorm),但还可使用其它距离,包含曼哈顿距离(Manhattandistance)(l-范数)、切比雪夫(Chebyshev)距离(无穷大范数)、马哈拉诺比斯距离(Mahalanobisdistance)、汉明距离(Hammingdistance)。可能需要使用经加权的距离测量来确定相邻LSF向量之间的变化。举例来说,可根据例如以下的表达式来计算距离A"i>'(")2其中Z指示当前LSF向量,f指示前一个LSF向量,P指示每个LSF向量中的元素的数目,下标z'指示LSF向量元素,且c指示加权因子的向量。可选择值c来强调感知上更显著的较低频率分量。在一个实例中,。具有值1.0,其中i从l到8;0.8,其中i=9;以及0.4,其中i=10。在另一实例中,可根据例如以下的表达式来计算相邻LSF向量之间的距离A其中vv指示可变加权因子的向量。在一个所述实例中,M具有值P(7/,其中f表示在对应频率/下估算出的LPC功率谱,且r是具有典型值(例如)0.15或0.3的常数。在另一实例中,根据在ITU-TG.729标准中使用的对应加权函数来选择vv的值分别针对vv的最低和最高元素,选择接近0和0.5的边界值来代替Zw和Z,+;。在所述情况下,c,可具有如上文指示的值。在另一实例中,除q和g具有值1.2之外,c,具有值1.0。从逐帧基础上的图4a到图4d可了解,本文所描述的临时噪声修整方法可能增加量化误差。然而,虽然量化操作的绝对平方误差可能增加,但潜在优势是量化误差可移动到频谱的不同部分。举例来说,量化误差可移动到较低频率,因此变得更加平滑。当输入信号也平滑时,可获得更平滑的输出信号,其是输入信号和经修匀的量化误差的和。图7b展示如应用于窄带信号S20的谱包络的编码的基本声源滤波器布置的实例。分析模块计算一组表征对应于一段时间(通常为20毫秒)期间的语声的滤波器的参数。根据那些滤波器参数配置的白化滤波器(也称为分析或预测误差滤波器)去除谱包络以对信号进行频谱修平。所得经白化信号(也称为残差)与原始语音信号相比,具有较少能量,且因此具有较少变化,且更容易编码。由残差信号的编码引起的误差也可能在频谱上更均匀地散布。滤波器参数和残差通常经量化,以便在信道上有效地传输。在解码器处,根据滤波器参数配置的合成滤波器由基于残差的信号激励,以产生原始语声的合成版本。合成滤波器通常经配置以具有转移函数,其为白化滤波器的转移函数的倒数。图8展示窄带编码器A120的基础实施A122的框图。如图8可见,窄带编码器A122还通过使窄带信号S20经过根据所述滤波器系数组配置的白化滤波器260(也称为分析或预测误差滤波器),来产生残差信号。尽管还可使用IIR实施,但在此特定实例中,将白化滤波器260实施为FIR滤波器。此残差信号将通常含有语音帧的感知上重要的信息,例如与音调相关的长期结构,其未在窄带滤波器参数S40中表示。量化器270经配置以计算此残差信号的量化表示,以便作为经编码的窄带激励信号S50而输出。所述量化器通常包含向量量化器,其将输入向量编码成指向表或码本中的对应向量条目的索引。或者,所述量化器可经配置以发送一个或一个以上参数,根据所述参数,可在解码器处动态地产生向量,而不是像在稀疏码本(sparsecodebook)方法中那样从存储器中检索。所述方法用于例如代数CELP(codebookexcitationlinearprediction,码本激励线性预测)的编码方案,以及例如3GPP2(ThirdGenerationPartnership2,第三代合作伙伴计划2)EVRC(EnhancedVariableRateCodec,增强型可变速率编解码器)的编解码器中。需要窄带编码器A120根据相同滤波器参数值产生经编码的窄带激励信号,所述滤波器参数值将可由对应窄带解码器使用。以此方式,所得经编码窄带激励信号可能已经在一定程度上是那些参数值的不理想性(例如,量化误差)的原因。因此,需要使用将在解码器处可用的相同系数值来配置白化滤波器。在如图8中所示的编码器A122的基础实例中,反向量化器240对窄带滤波器参数S40进行反量化,LSF到LP滤波器系数变换器250将所得值映射回到对应的LP滤波器系数组,且使用这组系数来配置白化滤波器260,从而产生残差信号,所述残差信号由量化器270量化。窄带编码器A120的某些实施经配置以通过在一组码本向量中识别与残差信号最匹配的一者,来计算经编码的窄带激励信号S50。然而,应注意,还可在实际上不产生残差信号的情况下,实施窄带编码器A120来计算残差信号的量化表示。举例来说,窄带编码器A120可经配置以使用若干个码本向量来产生对应的合成信号(例如,根据当前滤波器参数组),且在感知上加权的域中选择与所产生的信号相关联的与原始窄带信号S20最匹配的码本向量。图9展示窄带解码器B110的实施B112的框图。反向量化器310对窄带滤波器参数S40进行反量化(在此情况下,反量化成一组LSF),且LSF到LP滤波器系数变换器320将LSF变换成一组滤波器系数(例如,如上文参考窄带编码器A122的反向量化器240和变换器250所描述)。反向量化器340对窄带残差信号S40进行反量化,以产生窄带激励信号S80。基于滤波器系数和窄带激励信号S80,窄带合成滤波器330对窄带信号S90进行合成。换句话说,窄带合成滤波器330经配置以根据经反量化滤波器系数对窄带激励信号S80进行频谱修整,从而产生窄带信号S90。窄带解码器B112还将窄带激励信号S80提供到高频带编码器A200,其使用窄带激励信号S80来导出高频带激励信号S120,如本文所述。在如下文所述的某些实施中,窄带解码器B110可经配置以将与窄带信号相关的额外信息(例如频谱倾斜(spectraltilt)、音调增益(pitchgain)与迟滞以及语音模式)提供到高频带解码器B200。窄带编码器A122和窄带解码器B112的系统是综合分析语音编解码器的基础实例。通过公共交换电话网(publicswitchedtelephonenetwork,PSTN)的语音通信传统上已将带宽限制于300-3400kHz的频率范围中。用于语音通信的新网络(例如蜂窝式电话和网络电话(voiceoverIP,VoIP))可以不具有相同的带宽限制,且可能希望通过所述网络来发射和接收包含宽带频率范围的语音通信。举例来说,可能希望支持向下扩展到50Hz且域向上扩展到7或8kHz的音频频率范围。还可能希望支持其它应用,例如高质量音频或音频/视频会议,其可能具有在传统PSTN限制外的范围中的音频语音内容。一种宽带语音编码方法涉及缩放窄带语音编码技术(例如,一种方法经配置以对0-4kHz的范围进行编码),以覆盖宽带频谱。举例来说,可以较高速率对语音信号进行取样,以使其包含较高频率下的分量,且窄带编码技术可重新经配置以使用更多滤波器系数来表示此宽带信号。然而,例如CELP(码本激励线性预测)的窄带编码技术计算量较大,且宽带CELP编码器可能消耗过多的处理循环才可应用于许多移动和其它嵌入式应用。使用所述技术来将宽带信号的整个频谱编码到所需质量还可能导致带宽不可接受地大幅增加。此外,之前会需要对所述经编码信号进行代码转换,即使其窄带部分可传输到仅支持窄带编码的系统中和/或由仅支持窄带编码的系统解码。图10a展示宽带语音编码器A100的框图,其分别包含独立的窄带和高频带语音编码器A120和A200。窄带和高频带语音编码器A120和A200中的一者或两者可经配置以使用如本文所揭示的量化器230的实施,来执行LSF(或另一系数表示)的量化。图Ua展示对应的宽带语音解码器B100的框图。可实施滤波器组A110和B120以根据在与本申请案一起申请的专利申请案"SYSTEMS,METHODS,ANDAPPARATUSFORSPEECHSIGNALFILTERING"(代理人案号050551)中揭示的原理和实施,依据宽带语音信号S10,产生窄带信号S20和高频带信号S30,所述专利申请案中的此类滤波器组的揭示内容以引用的方式并入本文中。可能需要实施宽带语音编码,使得经编码信号的至少窄带部分可通过窄带信道(例如,PSTN信道)发送,而不需要代码转换或其它重大修改。还可能需要宽带编码扩展的效率(例如)来避免可在应用(例如无线蜂窝式电话和通过有线和无线信道的广播)中被服务的用户的数目显著减少。一种宽带语音编码的方法涉及根据经编码窄带谱包络外推高频带谱包络。然而,虽然可在带宽无任何增加且不需要代码转换的情况下实施所述方法,但一般不能根据窄带部分的谱包络准确地预测语音信号的高频带部分的粗略谱包络或共振峰结构。宽带语音编码器A100的一个特定实例经配置以在约8.55kbps(千位/秒)的速率下对宽带语音信号S10进行编码,其中约7.55kbps用于窄带滤波器参数S40和经编码的窄带激励信号S50,且约lkbps用于高频带编码参数(例如,滤波器参数和/或增益参数)S60。可能需要将经编码的低频带信号和高频带信号组合成单个位流。举例来说,可能需要将经编码信号一起进行多路复用,以供传输(例如,通过有线、光学或无线传输信道)或供存储,作为经编码的宽带语音信号。图10b展示宽带语音编码器A102的框图,所述宽带语音编码器A102包含多路复用器ABO,其经配置以将窄带滤波器参数S40、经编码的窄带激励信号S50和高频带编码参数S60组合成经多路复用的信号S70。图lib展示宽带语音解码器BIOO的对应实施B102的框图。可能希望多路复用器A130经配置以将经编码的低频带信号(包含低频带滤波器参数S40和经编码的低频带激励信号S50)作为经多路复用的信号S70的可分离的子流而嵌入,使得可独立于经多路复用的信号S70的另一部分(例如高频带和/或极低频带信号)来恢复并解码经编码的低频带信号。举例来说,经多路复用的信号S70可经布置以使得可通过去掉高频带编码参数S60来恢复经编码的低频带信号。所述特征的一个潜在优势是不需要在将经编码的宽带信号传递到支持对低频带信号的解码但不支持对高频带部分的解码的系统之前,对所述经编码的宽带信号进行代码转换。如本文所描述包含噪声修整量化器和/或低频带、高频带和/或宽带语音编码器的设备还可包含电路,所述电路经配置以将经编码信号传输到传输信道(例如有线、光学或无线信道)中。所述设备还可经配置以对信号执行一个或一个以上信道编码操作,例如误差校正编码(例如,速率相容巻积编码),和/或误差检测编码(例如,循环冗余编码),和/或一层或一层以上网络协议编码(例如,以太网、TCP/IP、cdma2000)。可能需要将低频带语音编码器A120实施为综合分析语音编码器。码本激励线性预测(CELP)编码是综合分析编码的一个通用种类,且所述编码器的实施可执行残差的波形编码,包含例如从固定和自适应码本选择条目、误差最小化操作和/或感知加权操作的操作。综合分析编码的其它实施包含混合激励线性预测(MELP)、代数CELP(ACELP)、松弛CELP(RCELP)、规则脉冲激励(RPE)、多脉冲CELP(MPE),以及向量总和激励的线性预测(VSELP)编码。相关编码方法包含多频带激励(MBE)和原型波形内插(PWI)编码。标准化综合分析语音编解码器的实例包含欧洲电信标准协会-全球移动通信系统(ETSI-GSM)全速率编解码器(GSM06.10),其使用残差激励的线性预测(RELP);GSM增强的全速率编解码器(ETSI-GSM06.60);国际电信联盟(ITU)标准11.8kb/sG729附件E编码器;针对临时标准(IS)-136(时分多址方案)的IS-641编解码器;GSM自适应多速率(GSM-AMR)编解码器;以及4GV(Fourth-GenerationVocoder)编解码器(加利福尼亚州,圣地亚哥市的QUALCOMM公司)。RCELP编码器的现存实施包含增强型可变速率编解码器(EnhancedVariableRateCodec,EVRC)(如在电信工业协会(TIA)IS-127中所描述),以及第三代合作伙伴计划2(3GPP2)可选模式声码器(SelectableModeVocoder,SMV)。可根据这些技术中的任一者或任何其它语音编码技术(无论是已知的还是有待开发的)来实施本文所描述的各种低频带、高频带和宽带编码器,其中所述任何其它语音编码技术将语音信号表示为(A)描述滤波器的一组参数和(B)残差信号的量化表示,所述残差信号提供用于驱动所描述的滤波器以再现所述语音信号的激励的至少一部分。如上文所提及,本文所描述的实施例包含可用于执行嵌入式编码的实施,其支持与窄带系统的兼容性,且不需要代码转换。对高频带编码的支持还可用于在成本基础上区分芯片、芯片集、装置,和/或具有有向后兼容性的宽带支持的网络和仅具有窄带支持的网络。本文所描述的对高频带编码的支持还可结合用于支持低频带编码的技术来使用,且根据所述实施例的系统、方法或设备可支持从(例如)约50或100Hz至多达约7或8kHz的频率分量的编码。如上文所提及,将高频带支持添加到语音编码器可改进清晰度,尤其就摩擦音的区别而论。虽然通常听者可从特定语境中导出所述区别,但高频带支持可充当语音识别和其它机器解译应用(例如,用于自动语音菜单导航和/或自动呼叫处理的系统)中的启用特征。根据实施例的设备可嵌入到用于无线通信的便携式装置中,例如蜂窝式电话或个人数字助理(PDA)。或者,所述设备可包含在另一通信装置中,所述通信装置例如是VoIP手机、经配置以支持VoIP通信的个人电脑,或经配置以发送电话或VoIP通信的网络装置。举例来说,根据实施例的设备可在用于通信装置的芯片或芯片集中实施。视特定应用而定,所述装置还可包含例如语音信号的模拟-数字转换和/或数字-模拟转换的特征、用于对语音信号执行放大和/或其它信号处理操作的电路,和/或用于发射和/或接收经编码的语音信号的射频电路。明白地涵盖并揭示了实施例可包含第60/667,901号和第60/673,965号美国临时专利申请案(本申请案主张其权利)和/或与本申请案一起申请且在上文列出的相关申请案中所揭示的其它特征中的任何一个或一个以上特征,且/或与所述特征一起使用。所述特征包含根据窄带激励信号S80和窄带残差信号S50的规则化或其它变化,来改变高频带信号S30和/或高频带激励信号S120。所述特征包含LSF的自适应修匀,其可在本文所描述的量化之前执行。所述特征还包含增益包络的固定或自适应修匀,以及增益包络的自适应衰减。提供所描述的实施例的前述呈现,以使所属领域的技术人员能够制造或使用本发明。对这些实施例的各种修改是可能的,且本文所呈现的一般原理同样可应用于其它实施例。举例来说,实施例可部分或整体实施为硬连线电路、制作成专用集成电路的电路配置,或加载到非易失性存储器中的固件程序,或作为机器可读代码,从数据存储媒体加载或加载到数据存储媒体中的软件程序,所述代码是可由逻辑元件阵列执行的指令,所述逻辑元件例如是微处理器或其它数字信号处理单元。数据存储媒体可以是存储元件阵列,其例如是半导体存储器(其可包含(但不限于)动态或静态随机存取存储器(RAM)、只读存储器(ROM)和/或快闪RAM),或铁电、磁阻、双向、聚合或相变存储器;或盘媒体,例如磁盘或光盘。应将术语"软件"理解为包含源代码、汇编语音代码、机器代码、二进制代码、固件、宏代码、微代码、可由逻辑元件阵列执行的任何一个或一个以上指令集或指令序列,以及所述实例的任何组合。噪声修整量化器,高频带语音编码器A200,宽带语音编码器A100和A102以及包含一个或一个以上所述设备的布置的实施的各种元件可实施为驻留在(例如)同一芯片上或芯片集中的两个或两个以上芯片之间的电子和/或光学装置,尽管还涵盖无所述限制的其它布置。所述设备的一个或一个以上元件可整体或部分地实施为一个或一个以上的指令集,其经布置以执行一个或一个以上固定或可编程逻辑元件(例如,晶体管、门)阵列,所述阵列例如是微处理器、嵌入式处理器、IP核、数字信号处理器、现场可编程门阵列(FPGA)、专用标准产品(ASSP)以及专用集成电路(ASIC)。一个或一个以上的所述元件还有可能具有共用结构(例如,用于在不同时间执行对应于不同元件的代码部分的处理器、经执行以在不同时间完成对应于不同元件的任务的指令集,或在不同时间针对不同元件执行操作的电子和/或光学装置的布置)。此外,一个或一个以上的所述元件有可能用于完成不直接与所述设备的操作有关的任务,或执行不直接与所述设备的操作有关的其它指令集,所述任务例如是与嵌入有所述设备的装置或系统的另一操作有关的任务。实施例还包含如本文(例如)通过对经配置以执行所述方法的结构实施例的描述而明确揭示的语音处理、语音编码以及高频带突发抑制的额外方法。这些方法中的每一者都还可明白地实施(例如,在如上文所列举的一个或一个以上数据存储媒体中)为一个或一个以上指令集,其可由包含逻辑元件(例如,处理器、微处理器、微控制器或其它有限状态机)阵列的机器读取且/或执行。因此,不希望本发明限于上文所示的实施例,而希望本发明符合与本文中以任何方式揭示的原理和新颖特征相一致的最广范围。权利要求1.一种用于信号处理的方法,所述方法包括对语音信号的第一帧和第二帧进行编码,以产生对应的第一和第二向量,其中所述第一向量表示所述第一帧期间所述语音信号的谱包络,且所述第二向量表示所述第二帧期间所述语音信号的谱包络;产生第一经量化向量,所述产生包含对基于所述第一向量的至少一部分的第三向量进行量化;计算所述第一经量化向量的量化误差;计算第四向量,所述计算包含将所述量化误差的经缩放版本添加到所述第二向量的至少一部分;以及对所述第四向量进行量化。2.根据权利要求l所述的方法,其中所述计算量化误差包含计算所述第一经量化向量与所述第三向量之间的差。3.根据权利要求l所述的方法,其中所述计算量化误差包含计算所述第一经量化向量与所述第一向量的至少一部分之间的差。4.根据权利要求1所述的方法,所述方法包含计算经縮放的量化误差,所述计算包括将所述量化误差乘以縮放因子,其中所述縮放因子基于所述第一向量的至少一部分与所述第二向量的对应部分之间的距离。5.根据权利要求4所述的方法,其中所述第一向量和所述第二向量中的每一者包含多个线谱频率。6.根据权利要求l所述的方法,其中所述第一向量和所述第二向量中的每一者包含多个线性预测滤波器系数的表示。7.根据权利要求l所述的方法,其中所述第一向量和所述第二向量中的每一者包含多个线谱频率。8.—种数据存储媒体,其具有描述根据权利要求l所述的方法的机器可执行指令。9.一种设备,其包括语音编码器,其经配置以将语音信号的第一帧编码成至少第一向量,且将语音信号的第二帧编码成至少第二向量,其中所述第一向量表示所述第一帧期间所述语音信号的谱包络,且所述第二向量表示所述第二帧期间所述语音信号的谱包络,量化器,其经配置以对基于所述第一向量的至少一部分的第三向量进行量化,以产生第一经量化向量;第一加法器,其经配置以计算所述第一经量化向量的量化误差;以及第二加法器,其经配置以将所述量化误差的经縮放版本添加到所述第二向量的至少一部分,以计算第四向量;其中所述量化器经配置以对所述第四向量进行量化。10.根据权利要求9所述的设备,其中所述第一加法器经配置以基于所述第一经量化向量与所述第三向量之间的差来计算所述量化误差。11.根据权利要求9所述的设备,其中所述第一加法器经配置以基于所述第一经量化向量与所述第一向量的至少一部分之间的差来计算所述量化误差。12.根据权利要求9所述的设备,所述设备包含乘法器,其经配置以基于所述量化误差与縮放因子的乘积来计算经縮放的量化误差,其中所述设备包含逻辑,其经配置以基于所述第一向量的至少一部分与所述第二向量的对应部分之间的距离来计算所述縮放因子。13.根据权利要求12所述的设备,其中所述第一向量和所述第二向量中的每一者包含多个线谱频率。14.根据权利要求9所述的设备,其中所述第一向量和所述第二向量中的每一者包含多个线性预测滤波器系数的表示。15.根据权利要求9所述的设备,其中所述第一向量和所述第二向量中的每一者包含多个线谱频率。16.根据权利要求9所述的设备,所述设备包括用于无线通信的装置。17.根据权利要求9所述的设备,所述设备包括经配置以传输依从一个版本的因特网协议的多个包的装置,其中所述多个包描述所述第一经量化向量。18.—种设备,其包括用于对语音信号的第一帧和第二帧进行编码以产生对应的第一和第二向量的装置,其中所述第一向量表示所述第一帧期间所述语音信号的谱包络,且所述第二向量表示所述第二帧期间所述语音信号的谱包络;用于产生第一经量化向量的装置,所述产生包含对基于所述第一向量的至少一部分的第三向量进行量化;用于计算所述第一经量化向量的量化误差的装置;以及用于计算第四向量的装置,所述计算包含将所述量化误差的经縮放版本添加到所述第二向量的至少一部分;其中所述用于产生第一经量化向量的装置经配置以对所述第四向量进行量化。19.根据权利要求18所述的设备,其中所述用于计算量化误差的装置经配置以基于所述第一经量化向量与所述第三向量之间的差来计算所述量化误差。20.根据权利要求18所述的设备,其中所述用于计算量化误差的装置经配置以基于所述第一经量化向量与所述第一向量的至少一部分之间的差来计算所述量化误差。21.根据权利要求18所述的设备,所述设备包含用于计算经縮放量化误差的装置,所述计算包括将所述量化误差乘以縮放因子,其中所述设备包括逻辑,其经配置以基于所述第一向量的至少一部分与所述第二向量的对应部分之间的距离来计算所述縮放因子'。22.根据权利要求21所述的设备,其中所述第一向量和所述第二向量中的每一者包含多个线谱频率。23.根据权利要求18所述的设备,所述设备包括用于无线通信的装置。全文摘要根据实施例,一种量化器经配置以对输入值(例如,线谱频率的向量)的平滑值进行量化,以产生对应的输出值,其中所述平滑值基于缩放因子和前一个输出值的量化误差。文档编号G10L19/06GK101180676SQ200680018140公开日2008年5月14日申请日期2006年4月3日优先权日2005年4月1日发明者科恩·贝尔纳德·福斯申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1