用于对语音信号中的过渡帧进行编码的方法和设备的制作方法

文档序号:5832501阅读:335来源:国知局

专利名称::用于对语音信号中的过渡帧进行编码的方法和设备的制作方法
技术领域
:本发明涉及一种用于鉴于传送并且合成声音信号(例如语音信号或音频信号)而对这种声音信号进行数字编码的技术。更具体地说,但并非排除性地,本发明涉及一种方法和设备,用于对声音信号(例如语音信号或音频信号)中的过渡帧(transitionframe)和跟随所述过渡的帧(framesfollowingthetransition)进4亍编码,以减少万一帧#察除(frameerasure)而在所述解码器处的误码传^番(errorpropagation),并且/或者在浊音(voiced)分段的开始(起始帧(onsetframe))处主要增强编码效率。具体地说,所述方法和设备通过例如过渡帧和跟随所述过渡的帧中的声门脉沖形状的码书(codebookofglottalimpulseshape)来替换典型地在预测编码器中所使用的自适应码书。声门形状码书可以是独立于以往激励(pastexcitation)的固定码书,藉此,一旦所述帧擦除完成,编码器和解码器就使用相同的激励,从而对于纯信道(clear-channel)合成的收敛性非常快。在传统CELP中的起始帧编码中,使用与当前激励非常不同的先前清音(unvoiced)或无效(inactive)帧的类似噪声的激励来更新以往激励緩冲器。另一方面,所提出的技术可以非常精确地建构激励的周期部分。
背景技术
:语音编码器将语音信号转换为数字比特流,所述数字比特流在通信信道上被传送,或被存储在存储介质中。对语音信号进行数字化,也就是说,以通常每采样16比特对其进行采样和量化。语音编码器扮演的角色是,在保持良好主观语音质量的同时,以更少数量的比特来表示这些数字采样。语音解码器或合成器对已传送或存储的比特流进行操作,并且将其转换回语音信号。码激励线性预测(CELP,Code-ExcitedLinearPrediction)编码是用于实现主观质量与比特率之间的良好折衷的最佳现有技术之一。这种编码技术形成了既在无线应用中又在有线应用中的若干语音编码标准的基础。在CELP编码中,在通常被称为帧的M采样的连续块中处理采样后的语音信号,其中,M是典型地与10-30ms对应的预定数字。每个帧都计算并且传送线性预测(LP)滤波器。LP滤波器的计算典型地需要从后续帧预计(lookahead)5-15ms语音分段。M采样帧被划分为被称为子帧的更小的块。通常子帧的数量是三个或四个,这产生了4-10ms子帧。在每一子帧中,通常从两个分量一一以往激励和创新(innovative)固定码书激励一一获得激励信号。从以往激励形成的分量一般被称为自适应码书或音调激励。表征激励信号的参数被编码并且^皮传送到解码器,在解码器处,重构的激励信号被用作LP滤波器的输入。CELP型语音编解码器严重依赖于预测而实现它们的高性能。所使用的预测可以是不同种类的,但通常包括使用包含以往帧中所选择的激励信号的自适应码书。CELP编码器通过在以往激励中搜索与当前正编码的分段最相似的分段而利用浊音语音信号的准周期性。在解码器中也维持同样的以往激励信号。于是编码器足以发送用于解码器的延迟参数和增益,以重构与在编码器中使用的相同激励信号。使用从固定码书中选择的创新来对先前语音分段与当前编码的语音分段之间的演进(差异)进行进一步建模。以下在此将更详细地描述CELP技术。基于CELP的语音编码器中固有的强预测的问题出现于当编码器和解码器的状态变为失去同步时,存在传输误码(擦除的帧或分组)。归因于预测,擦除的帧的影响因此不限于擦除的帧,而是一般在若干跟随帧期间在擦除之后继续传播。自然,感知影响可能是十分恼人的。从清音语音分段到浊音语音分段的过渡(例如无音(consonant)语音的辅音或周期与元音之间的过渡)或两个不同浊音分段之间的过渡(例如两个元音之间的过渡)对于帧擦除掩蔽是最有问题的情况。当从清音语音分段到浊音语音分段(浊音起始)的过渡丟失时,刚好在浊音起始帧之前的帧为清音的或无音的,并且因此,在以往激励(自适应码书)的緩冲器中找不到有意义的周期性激励。在编码器处,以往周期性激励在起始帧期间在自适应码书中建立起来,并且通过使用这个以往周期性激励而对跟随浊音帧进行编码。多数帧误码掩蔽技术使用来自最后正确地接收到的帧的信息来掩蔽丟失的帧。当起始帧丟失时,将因此而使用先前帧(清音帧或无音帧)的类似噪声的激励来更新解码器以往激励緩冲器。因此,在丟失的油音起始之后,在解码器处,在自适应码书中,激励的周期部分完全丟失,并且解码器可以釆用若干帧来从这种丢失进行恢复。在丟失浊音到浊音过渡的情况下,出现相似的情况。在此情况下,在过渡帧之前在自适应码书中存储的激励典型地具有与在过渡之后在自适应码书中存储的激励非常不同的特性。再次,由于解码器通常通过使用以往帧信息来掩蔽丢失的帧,因此编码器和解码器的状态将十分不同,并且合成的信号可能遭受重大失真。
发明内容因此,本发明的目的在于提供一种方法和设备,用于对预测话音和/或音频编码器中的过渡帧进行编码,以改进编码器对于丟失帧的强健性并且/或者增加编码效率。本发明的另一目的在于通过以非预测的例如声门形状码书搜索来替换帧间依赖的自适应码书搜索而消除误码传播,并且增加基于CELP的编解码器中的编码效率。与传统CELP编码相比,该技术无需额外的延迟、可忽略的附加复杂度,并且不增加比特率。更具体地说,根据本发明一方面,提供一种在预测型声音信号编解码器中使用的过渡模式方法,用于在所述声音信号中的过渡帧和/或跟随所述过渡的帧中产生替换自适应码书激励的过渡模式激励,所述方法包括提供过渡模式码书,以用于生成独立于以往激励的码矢量集合;将码书索引供应给所述过渡模式码书;通过所述过渡模式码书并且响应于所述码书索引,生成与所述过渡模式激励对应的集合的码矢量之一。根据本发明第二方面,提供一种在预测型声音信号编解码器中使用的过渡模式设备,用于在所述声音信号中的过渡帧和/或跟随所述过渡的帧中产生替换自适应码书激励的过渡模式激励,所述过渡模式设备包括输入端,用于接收码书索引;过渡模式码书,用于生成独立于以往激励的码矢量集合。所述过渡模式码书响应于所述索引,用于在所述过渡帧和跟随所述过渡的帧中生成与所述过渡模式激励对应的集合的码矢量之一。根据本发明第三方面,提供一种编码方法,用于在所述声音信号中的过述编码方法包括生成码书搜索目标信号;提供过渡模式码书,用于生成独立于以往激励的码矢量集合,所述集合的所述码矢量每个与各个过渡模式激励对应;搜索所述过渡^^式码书,用于找寻与优化地对应于所述码书搜索目标信号的过渡模式激励对应的所述集合的码矢量。根据本发明第四方面,提供一种编码器设备,用于在所述声音信号中的过渡帧和/或跟随所述过渡的帧中产生替换自适应码书激励的过渡模式激励,所述编码器设备包括码书搜索目标信号的生成器;过渡模式码书,用于生成独立于以往激励的码矢量集合,所述集合的所述码矢量每个与各个过渡模式激励对应;所述过渡模式码书的搜索器,用于找寻与优化地对应于所述码书搜索目标信号的过渡模式激励对应的所述集合的码矢量。根据本发明第五方面,提供一种解码方法,用于在所述声音信号中的过述解码方法包括接收码书索引;将所述码书索引供应给过渡模式码书,以用于生成独立于以往激励的码矢量集合;通过所述过渡模式码书并且响应于所述码书索引,生成与所述过渡模式激励对应的集合的码矢量之一。根据本发明第六方面,提供一种解码器设备,用于在所述声音信号中的所述解码器设备包括输入端,用于接收码书索引;过渡模式码书,用于生成独立于以往激励的码矢量集合。所述过渡模式码书响应于所述索引,用于在所述过渡帧和跟随所述过渡的帧中生成与所述过渡模式激励对应的集合的码矢量之一。给定仅参照附图通过示例的方式,在阅读本发明说明性实施例的以下非限定性描述时,本发明的前述和其它目的、优点和特征将变得更清楚。在附图中图la是基于CELP的编码器的示意性框图;图lb是基于CELP的解码器的示意性框图;图2是用于擦除掩蔽的帧分类状态机的示意性框图;图3是具有一个浊音过渡帧和一个起始帧的语音信号的分段的示例;图4是示出用于在语音起始中选择TM(过渡模式)帧的分类规则的功能框图,其中,N—T1VLFRAMES表示用于防止使用TM编码技术的连续帧的数量,"clas"表示帧分类,VOICED—TYPE表示ONSET、VOICED和VOICEDTRANSITION分类;16图5a是划分为四(4)个子帧的语音信号的帧的示例的示意性说明,示出时域中的语音信号;图5b是划分为四(4)个子帧的语音信号的帧的示例的示意性说明,示出LP残差信号;图5c是划分为四(4)个子帧的语音信号的帧的示例的示意性说明,示出在编码器中使用TM编码技术而构建的第一阶段激励信号;图6示出显示对于声门形状码书构建而使用的具有17个釆样长度的八个声门脉沖的图,其中,x轴表示离散时间索引,而y轴表示脉沖的幅度;图7是CELP编码器的TM部分的示例的示意性框图,其中,k'表示声门形状码书索引,并且G(z)是成形滤波器;图8是计算Ck'(公式(16)的准则中的分子的平方根)的图形表示,其中,矢量/矩阵的加阴影部分为非零的;图9是计算Ek'(公式(16)的准则的分母)的图形表示,其中,矢量/矩阵的加阴影部分为非零的;图IO是计算巻积矩阵ZT的图形表示;在该示例中,成形滤波器G(z)仅具有三(3)个非零系数(L1/2=l);图11是CELP解码器的TM部分的示例的示意性框图12a是滤波器Q(z)的结构的示例的示意性框图12b是声门形状码矢量修改的示例的图线,其中,重复的脉冲是虚线;图13是包括滤波器Q(z)的CELP编码器的TM部分的示意性框图14是示出当以声门形状码书搜索而在子帧的部分中使用自适应码书搜索时具有两个脉沖构造的声门形状码矢量的图线;图15是示出于在下一子帧的前L1/2个位置中出现第二声门脉冲的情况下的声门形状码矢量构造的图线;图16是在EV-VBR(嵌入式可变比特率)编解码器实现方式中使用的编码器的TM部分的示意性框图17a是示出时域中的语音信号的示例的图线;图17b是示出与图17a的语音信号对应的LP残差信号的图线;图17c是示出无误码条件下的第一阶段激励信号的图线;图18a-图18c是示出起始构造比较的示例的图线,其中,图18a的图线表示输入语音信号,图18b的图线表示不使用TM编码技术的EV-VBR编解码器的输出合成语音,图18c的图线表示使用TM编码技术的EV-VBR编解码器的输出合成语音;图19a-图19c是示出在帧擦除的情况下的TM编码技术的效果的示例的图线,其中,图19a的图线表示输入语音信号,图19b的图线表示不使用TM编码技术的EV-VBR编解码器的输出合成语音,图19c的图线表示使用TM编码技术的EV-VBR编解码器的输出合成语音;图20是示出在配置TRANSITIONJJ的一帧中的第一阶段激励信号的示例的图线;图21是示出在配置TRANSITION—1_2的一帧中的第一阶段激励信号的示例的图线;图22是示出在配置TRANSITIONJ—3的一帧中的第一阶段激励信号的示例的图线;图23是示出在配置TRANSITION—1—4的一帧中的第一阶段激励信号的示例的图线;图24是示出在配置TRANSITION_2的一帧中的第一阶段激励信号的示例的图线;图25是示出在配置TRANSITION_3的一帧中的第一阶段激励信号的示例的图线;图26是示出在配置TRANSITION—4的一帧中的第一阶段激励信号的示例的图线;图27是示出使用语音编码和解码设备的语音通信系统的示意性框图。具体实施例方式本发明非限定说明性实施例涉及一种方法和设备,其目的在于克服以上所描述的情形中的误码传播,并且增加编码效率。更具体地说,根据本发明非限定说明性实施例的方法和设备实现一种声音信号(例如语音信号或音频信号)中的过渡帧和跟随所述过渡的帧的特殊编码(称为过渡模式(TM)编码)技术。TM编码技术在过渡帧和跟随所述过渡的帧中通过新的声门脉冲形状的码书(下文中指定为声门形状码书)来替换CELP编解码器的自适应码书。声门形状码书是独立于以往激励的固定码书。因此,一旦帧擦除完成,编码器和解码器就使用相同的激励,藉此,对于纯信道合成的收敛性非常快。于在过渡帧丢失的情况下在跟随过渡的帧中使用TM编码技术有助于防止误码传播的同时,在过渡帧中也使用TM编码技术的另一目的在于增加编码效率。例如,恰在浊音起始之前,自适应码书通常包含对于对浊音分段的开始进行编码不十分高效的类似噪声的信号。TM编码技术背后的构思因此在于以含有简化量化版本的声门脉冲的更好的码书来补充自适应码书,以对浊音起始进行编码。所提出的TM编码技术可以用在任何CELP型编解码器或预测编解码器中。作为示例,在嵌入式可变比特率编解码器(在文中其它部分将称为EV-VBR编解码器)的ITU-T标准化活动中的候选编解码器中实现TM编码技术。虽然将结合EV-VBR编解码器框架来描述本发明非限定说明性实施例,但应注意,本发明原理和构思不限于对于EV-VBR编解码器的应用,而是应用于使用预测编码的任何其它编解码器。此外,虽然将结合语音信号来描述本发明非限定说明性实施例,但应注意,本发明并不限于对于语音信号的应用,而是其原理和构思可以应用于包括音频信号的任何其它类型的声音信号。语音帧可以粗略分类为四(4)个以下语音分类之一(将在以下描述中更详细地解释该情况)-由缺少语音活动所表征的无音帧;-由朝向更高频率的非周期结构和能量聚集所表征的清音语音帧;-具有其中能量主要聚集在低频率的纯准周期特性的浊音语音帧;-被分类为具有快速变化特性的过渡的任何其它帧。在EV-VBR编解码器中,已经为这些分类中的每一个设计了专用编码模式。通常可以声明,通过舒适噪声生成来处理无音帧,通过优化的清音编码模式来处理清音语音帧,通过优化的浊音编码模式来处理浊音语音帧,并且以通用代数CELP(ACELP)技术来处理所有其它帧。在EV-VBR编解码器框架中,因此引入TM编码技术作为在EV-VBR编码方案中的又一编码才莫式,以对过渡帧和跟随所述过渡的帧进行编码。图27是描述使用语音编码和解码的语音通信系统的示意性框图。该语音通信系统支持语音信号穿过通信信道905的传输和再现。虽然通信信道905可以包括例如有线链路、光链路或光纤链路,但它典型地至少部分地包括射频链路。射频链路一般支持需要例如可以通过蜂窝电话来找寻的共享带宽资19源的多路同时语音通信。虽然未示出,但可以通过通信系统的单个设备实施例中的存储设备来替换通信信道905,其记录并且存储已编码语音信号,以用于稍后回;^文。仍然参照图27,麦克风901产生模拟语音信号,该模拟语音信号被供应给模数(A/D)转换器902,A/D转换器902用于将其转换为数字形式。语音编码器903对数字语音信号进行编码,藉此产生编码参数集合,所述编码参数集合被编码为二进制形式,并且被传递给信道编码器904。在通过通信信道905发送编码参数的二进制表示之前,可选信道编码器将冗余添加到编码参数的二进制表示。在接收机侧,信道解码器906利用接收到的比特流中的上述冗余信息来检测并且校正传输中已经产生的信道误码。语音解码器卯7将从信道解码器906接收到的比特流转换为编码参数集合,以用于创建合成数字语音信号。在语音解码器907中重构的合成数字语音信号在数模(D/A)转换器908中被转换为模拟形式,并且在扬声器单元909中被回放。关于CELP的简短背景语音编解码器包括两个基本部分编码器和解码器。编码器对音频信号进行数字化,选取有限数量的表示语音信号的编码参数,并且将这些参数转换为数字比特流,该数字比特流通过通信信道而被发送到解码器。解码器将语音信号重构为与初始语音信号尽可能相似。目前,普遍的语音编码技术是基于线性预测(LP)的,并且更具体地说,是基于CELP技术的。在基于LP的编码中,凭借通过全极点合成滤波器1/A(z)对激励信号进行滤波来合成语音信号。在CELP中,激励典型地包括两个部分从自适应码书选择第一阶段激励信号,而从固定码书选择第二阶段激励信号。通常说来,自适应码书激励对激励的周期部分进行建模,而固定码书激励被添加以对语音信号的演进进行建模。正常地按典型地20ms的帧来处理语音,并且每帧一次地发送LP滤波器系数。在CELP中,每个帧被进一步划分为若干子帧,以对激励信号进行编码。子帧长度典型地是5ms。参照图la和图lb,CELP背后的主要原理被称为"分析合成",其中,在编码处理(分析)期间已经尝试(分析)可能的解码器输出,并且此后将其与初始语音信号进行比较。搜索使得在感知加权域中输入语音信号s(n)与合成的语音信号s'(n)之间的均方误差最小,其中,离散时间索引n=0,1,……,N-l,N是子帧长度。感知加权滤波器W(z)采用频率掩蔽效应,并且典型地从LP滤波器被推导出。在以下公式(l)中给出了感知加权滤波器W(z)的示例<formula>formulaseeoriginaldocumentpage21</formula>其中,因子yi和Y2控制感知加权量,并且关系0<Y2<Yi$1成立。这种传统感知加权滤波器对于NB(200-3400Hz的窄带带宽)信号运作良好。可以在参考文献[l]中找到用于WB(50-7000Hz的宽带带宽)信号的感知加权滤波器的示例。发送到解码器的比特流对于浊音帧包含以下编码参数LP合成滤波器的量化参数、自适应码书索引和固定码书索引、以及自适应部分和固定部分的增益。自适应码书搜索在加权语音域中执行基于CELP的编解码器的自适应码书搜索,以确定延迟(音调周期)t和音调增益gp,并且构建被称为自适应码矢量v(n)的激励信号的准周期部分。音调周期强烈依赖于特定扬声器,并且其精确的确定关键地影响合成语音的质量。在EV-VBR编解码器中,三个阶段过程用于确定音调周期和增益。在第一阶段,对于每一帧计算三个开环音调估计T。p---个估计用于每一10ms半帧,一个用于10ms预计(lookahead)——使用感知加权语音信号Sw(n)和归一化校正计算。在第二阶段,对于关于每个帧的估计的开环音调周期T。p周围的整数周期执行闭环音调搜索。一旦找到优化的整数音调周期,第三搜索阶段就遍历这个优化的整数值周围的分数(fraction)。通过使得初始语音与合成语音之间的均方加权误差最小来执行闭环音调搜索。通过使得以下项最大化来实现该情况<formula>formulaseeoriginaldocumentpage21</formula>"-o(2)其中,x"n)是目标信号,并且通过在周期t的以往激励信号v(n)与加权合成滤波器H(z)的脉冲响应h(n)的巻积来计算第一阶段贡献信号(也称为滤波后的自适应码矢量)yi(n):乂(")=*.(3)通过凭借感知加权滤波器W(z)来处理输入语音信号s(n)而获得感知加权输入语音信号sw(n)。通过LP合成滤波器1/A(z)与感知加权滤波器W(z)的级联来形成滤波器H(z)。在从其中减去滤波器H(z)的零输入响应之后,目标信号x"n)与感知加权输入语音信号Sw(n)对应。通过使得信号x!(n)与第一阶段贡献信号y"n)之间的均方误差最小化来求解出音调增益。通过以下公式来表示音调增益》,("Xy,(")"=0(4)音调增益于是由0SgpSl.2定界,并且典型地,一旦找到创新就与固定码书增益联合地被量化。在基于CELP的编解码器中,因此从来自先前帧的激励信号重构当前处理的帧的开始中的激励信号。这种机制对于在信号是准周期性的,并且缺少传输误码的情况下的语音信号的浊音分段十分高效。在帧擦除的情况下,来自先前帧的激励信号丟失,并且编码器和解码器的各个自适应码书不再相同。在跟随擦除的帧中,解码器其后使用具有不正确内容的自适应码书继续合成语音。因此,帧擦除不仅在擦除的帧期间使得合成语音质量降级,而且它还可能使得在若干后续帧期间的合成语音质量降级。传统掩蔽技术一般是基于重复先前正确发送的帧的波形的,但这些技术仅在语音信号的特性是准平稳(例如在稳定的浊音分段中)的情况下的信号部分中高效地起作用。在此情况下,编码器和解码器的各个自适应码书之间的差异一般非常小,并且合成信号的质量并不受很大影响。然而,如果擦除落入过渡帧中,则这些技术的效率十分有限。在使用基于CELP的编解码器的通信系统中,在帧擦除率(FER)典型地是3%至5%的情况下,合成语音质量于是明显下降。甚至在纯信道传输中,自适应码书的效率在过渡帧中也是有限的;CELP编码器使用自适应码书来利用在过渡期间低的或丟失的语音中的周期性,藉此编码效率下降。具体地说,这是这样的浊音起始的情况当前帧的以往激励信号和优化激励信号被十分弱地校正,或者一点也不被校正。22固定码书搜索基于CELP的编解码器中的固定(创新)码书(FCB)搜索的贡献的目的在于使得在使用自适应码书之后的残余误差最小,即fW腸l「1Zh(")-gc-;4"(")n'"=0」(5)其中,gc是固定码书增益,并且第二阶^^贡献信号(也称为滤波后的固定码矢量)yf)(")是与h(n)进行巻积的固定码书矢量ck(n)。通过从自适应码书目标减去自适应码书贡献而更新目标信号Xi(n),以获得*2(》=咖1,禍,(6)可以例如通过使用参考文献[2]中描述的代数码书来实现固定码书。如果Ck表示在索引k的代数码矢量,则通过使得以下准则最大来搜索代数码书其中,H是具有对角线h(0)和下对角线h(1),…,h(N-l)的下三角Toeplitz巻积矩阵。矢量d=H、2是更新后的目标信号X2(n)与h(n)(也称为后向滤波后的目标矢量)之间的相关,矩阵0=HTH是h(n)的相关的矩阵。上标T表示矩阵或矢量转置。通常在固定码书搜索之前计算d和O二者。参考文献[l]讨论了如果固定码书的代数结构仅包含少数非零元素,则对于所有可能的索引k计算最大化准则是十分快的。相似的过程用在将在以下可见的过渡模式(TM)编码技术中。CELP被认为是另外对于本领域技术人员公知的,并且因此,将不在该说明书中进一步进行描述。EV-VBR编解码器中的帧分类EV-VBR编解码器中的帧分类是基于参考文献[3]中描述的VMR-WB(可变速率多模式宽带)分类的。通过考虑掩蔽和恢复策略来完成VMR-WB分类。换句话说,按以下方式对任何帧进行分类如果跟随帧遗失,则掩蔽可以是优化的,或者如果先前帧丟失,则恢复可以是优化的。由于可以在解码器处无模糊地推导出对于帧擦除掩蔽处理所使用的某些分类,因此无需发送它们。使用五种独特的分类,并且如下进行定义-UNVOICED分类包括所有清音语音帧和没有有效语音的所有帧。如果浊音偏移帧的结束倾向于是清音,则它也可以被分类为清音,并且对于清音帧所设计的掩蔽在其丢失的情况下可以用于跟随帧。-UNVOICEDTRANSITION分类包括在结束处具有可能的浊音起始的清音帧。然而,浊音起始仍然太短或者并非足够良好地被构建,而无法使用对于浊音帧所设计的掩蔽。UNVOICEDTRANSITION帧可以仅跟随被分类为UNVOICED或UNVOICEDTRANSITION的帧。-VOICEDTRANSITION分类包括具有相对弱的浊音特性的浊音帧。这些帧典型地是具有快速改变特性(元音之间的过渡)或持续整个帧的浊音偏移的浊音帧。VOICEDTRANSITION帧可以^叉跟随被分类为VOICEDTRANSITION,VOICED、或ONSET的帧。-VOICED分类包括具有稳定特性的浊音帧。VOICED帧可以仅跟随被分类为VOICEDTRANSITION,VOICED、或ONSET的帧。-ONSET分类包括跟随被分类为UNVOICED或UNVOICEDTRANSITION的帧的具有稳定特性的所有浊音帧。被分类为ONSET的帧与其中起始已经被足够良好地构建以使用对于丟失的浊音帧所设计的掩蔽的浊音起始帧对应。对于跟随被分类为ONSET的帧的帧擦除所使用的掩蔽技术在传统的基于CELP的编解码器中与跟随被分类为VOICED的帧相同,差别在于当特殊技术可以用于任意地重构丢失的起始时的恢复策略。根据本发明非限定说明性实施例,在此情况下成功地使用TM编码技术。图2中概括了分类状态示图。使用2个比特来传送分类信息。从图2可见,由于在解码器处可以无模糊地区分UNVOICEDTRANSITION分类和VOICEDTRANSITION分类(UNVOICEDTRANSITION帧可以仅跟随UNVOICED帧或UNVOICEDTRANSITION帧,VOICEDTRANSITION帧可以仅跟随ONSET帧、VOICED帧或VOICEDTRANSITION帧),因此可以将它们分组在一起。—以下参数用于分类归一化相关^"、谱倾斜测度e't、音调稳定性计数器pc、在当前帧E^的结束处的语音信号的相对帧能量以及过零计数器zc。在以下详细分析中可见,这些参数的计算使用预计。预计允许估计跟随帧中的语音信号的演进,化JL因此,可以通过考虑未来语音信号行为来完成分类。平均归一化相关^"被计算作为后半帧的最大归一化相关的平均值,并且预计使用以下公式及V-0.5(C加冊(rf,)+C朋加(rf2)).(8)最大归一化相关Cn。加被计算作为开环音调搜索的一部分,并且与加权语音信号的两个邻近音调周期的最大化归一化相关对应。谱倾斜参数e't包含关于能量的频率分布的信息。用于一个谱分析的谱倾斜被估计作为低频率中聚集的能量与高频率中聚集的能量之间的比率。在此,所使用的倾斜测度是在被定义为低频率能量和高频率能量比率的谱倾斜测度etiit(O)和e他(l)的对数域中的平均。也就是说<=101oH(l》.音调稳定性计数器pc评估音调周期的变化。如下对其进行计算PC=1;1-;0I+I;2_;0I(10)值T—、T。p,和T。p2分别与来自当前帧的前一半、当前帧的后一半以及预计的开环音调估计对应。相对帧能量Erel被计算作为当前帧能量与长期有效语音能量平均之间的以dB为单位的差。最后的参数是在语音信号的20ms分段上计算的过零参数zc。分段开始于当前帧的中间,并且使用预计的两个子帧。在此,过零计数器zc在该间隔期间对语音信号符号从正到负改变的次数进行计数。为了更强健地进行分类,连同形成价值函数fm—起考虑分类参数。为此,首先在0至1之间对分类参数进行缩放,从而典型用于清音语音信号的参数值转译为0,并且典型用于浊音语音信号的每一参数值转译为1。在它们之间使用线性函数。使用以下公式来获得特定参数px的缩放版本ps:<formula>formulaseeoriginaldocumentpage25</formula>对于参数中的每一个,已经通过实验求解出了函数系数kp和Cp,从而归因于在存在帧误码的的情况下所使用的掩蔽和恢复技术而导致的信号失真最小。表l中总结了所使用的值。表1-信号分类参数和它们的各个缩放函数的系数。<table>tableseeoriginaldocumentpage25</column></row><table>pc音调稳定性计数器-0.071431.857Erei相对帧能量0.050.45zc过零计数器-0.042.4于是价值函数fm已经被定义为/m=*(《+《+W、+《'+),(12)其中,上标s表示参数的缩放版本。如下对于UNVOICED分类进行第一分类判断如果(locaLVAD-0)或(Erei〈-8),则分类=UNVOICED。(13)其中,local—VAD代表本地语音活动检测。如果不满足上述条件(13),则使用价值函数fm和表2中总结的以下规则来进行分类。表2-在编码器处的信号分类规则。先前帧分类规则当前帧分类ONSETVOICEDVOICEDTRANSITIONfm>0.66VOICED0.66〉fm>0.49VOICEDTRANSITIONfm<0.49UNVOICEDUNVOICEDTRANSITIONUNVOICEDfm>0.63ONSET0.63>fm>0.585UNVOICEDTRANSITIONfm《0.49UNVOICED以两个比特对分类信息进行编码,如以上在此所解释的那样。尽管事实是仅在通用帧中发送改进帧擦除掩蔽的补充信息,但对于每一帧都执行分类。由于分类状态机使用关于先前帧的分类的信息,因此该操作需要将分类状态机保持为最新。然而,分类是直接用于对于UNVOICED帧或VOICED帧专用的编码类型的。因此,浊音帧总是被分类为VOICED,而清音帧总是被分类为UNVOICED。用于TM编码的帧选择如先前所讨论的,所描述的技术通过声门形状码书来替换基于CELP的编码器中的自适应码书,以改进对于帧擦除的强健性,并且增强当处理非平稳语音帧时的编码效率。这意味着该技术不通过使用以往激励来构建第一阶段激励信号,而是从声门形状码书选择第一阶段激励信号。仍然从传统的CELP固定码书选择第二阶段激励信号(总激励的创新部分)。任何这些码书不使用来自以往(先前发送的)语音帧的信息,藉此消除了对于基于CELP的编码器固有的帧误码传播的主要原因。系统性地使用TM编码技术(来对所有帧进行编码)将极大地限制误码传播,但在无误码条件下,编码效率和合成语音质量将降低。作为编解码器的纯信道性能与其对于信道误码的强健性之间的折衷,TM编码技术可以仅应用于过渡帧以及跟随每一过渡帧的若干帧。对于帧擦除强健性,TM编码技术可以用于跟随过渡的浊音语音帧。如先前所介绍的那样,这些过渡基本上包括浊音起始以及两个不同浊音声音之间的过渡。为了选择待使用TM编码技术进行编码的有关帧,对过渡进行检测。虽然可以使用过渡的任何检测器,但非限定说明性实施例使用以上在此所描述的EV-VBR框架的分类。TM编码^支术可以应用于对如上所述的过渡(浊音起始或两个不同浊音声音之间的过渡)帧以及若干后续帧进行编码。TM帧(使用TM编码技术所编码的帧)的数量对于纯信道条件下与有信道误码的条件下的编解码器性能之间的折衷是重要的。如果使用TM编码技术仅对过渡(浊音起始或两个不同浊音声音之间的过渡)帧进行编码,则编码效率增加。例如,可以通过增加分段信噪比(SNR)来测量这种增加。使用以下公式来计算SNR:&(14)其中,Esd是当前帧的输入语音信号的能量,Ee是这个输入语音信号与当前帧的合成语音信号之间的误码的能量。然而,使用TM编码技术仅对过渡帧进行编码对于误码强健性并没有太多帮助;如果过渡(浊音起始或两个不同浊音声音之间的过渡)帧丟失,则由于将使用标准CELP过程对跟随帧进行编码,因此误码将传播。另一方面,如果在过渡(浊音起始或两个不同浊音声音之间的过渡)帧之前的帧丢失,则即使在不使用TM编码技术的情况下,这种丟失的先前帧对于性能的影响也并不是严重的。在浊音起始过渡的情况下,在起始之前的帧有可能是清音,并且自适应码书贡献不太重要。于在两个浊音声音之间的过渡的情况下,在过渡之前的帧通常是相当平稳的,并且在帧擦除之后,编码器和解码器中的27自适应码书状态一般是相似的。为了增加强健性,可以使用TM编码技术对跟随过渡(浊音起始或两个不同浊音声音之间的过渡)的帧进行编码。如果纯信道性能增强并非重要的,则可以仅在跟随过渡帧的帧中使用TM编码技术。基本上,连续TM帧的数量取决于我们想要考虑进行保护的连续帧擦除的数量。如果仅考虑隔离的擦除(即一次一个隔离的帧擦除),则仅对跟随过渡(浊音起始或两个不同浊音声音之间的过渡)帧的帧进行编码是足够的。如果过渡(浊音起始或两个不同浊音声音之间的过渡)帧丢失,则不使用以往激励信号对跟随帧进行编码,并且误码传播受破坏。然而,应指出,如果正确地发送过渡(浊音起始或两个不同浊音声音之间的过渡)帧,但跟随帧丟失,则由于下一帧已经正在使用经典CELP编码,因此将无法防止误码传播。然而,如果在过渡(浊音起始或两个不同浊音声音之间的过渡)的结束已经良好地建立了至少一个音调周期,则失真将有可能是有限的,如图3所示。当将TM编码技术实现到某些现有编解码器中,并且当前帧和编码模式的分类已知时,可以使用以下方案来设置用于TM编码的起始和跟随帧。作为先前所使用的连续TM帧的计数器的参数状态被存储在编码器状态存储器中。如果该参数状态的值是负数,则可以使用TM编码。如果参数状态并非负数,但小于或等于用于保护的连续帧擦除的数量,并且帧的分类是ONSET、VOICED或VOICEDTRANSITION,则帧被表示为TM帧(更多细节见图4)。换句话说,如果N—TM—FRAMES>state>0,则帧被表示为TM帧,其中,N—TM—FRAMES是防止使用TM编码技术的连续帧的数量。如果期望通信信道特性是这样的一般一次擦除多于一个的隔离的帧(即,帧擦除具有成批出现的趋势),则最佳解决方案可以是使用TM编码技术来保护两个或甚至更多的连续帧擦除。然而,纯信道条件下的编码效率将下降。如果关于信道的反馈在编码器中是可用的,则可以使得连续TM帧的数量适应于传输条件。在本发明非限定说明性实施例中,考虑跟随过渡(浊音起始或两个不同浊音声音之间的过渡)帧的多达两个TM帧,这与能够处理两个连续帧擦除的设计对应。以上所描述的判断基本上使用固定数量(无论该数量在传输之前是固定的还是取决于传输信道条件)的跟随过渡(浊音起始或两个不同浊音声音之间的过渡)帧的TM帧。纯信道性能与帧误码强健性之间的折衷也可以是基28于闭环分类的。更具体地说,在我们想要保护不受先前帧擦除或者想要判断它是否为起始帧的帧中,并行计算两个可能的编码模式既使用通用(CELP)编码模式又使用TM编码技术来处理帧。例如,其后使用SNR测度来对这两种方法的性能进行比较;更多细节参见以下题为"EV-VBR编解码器中的TM编码技术性能"的部分。当通用(CELP)编码模式的SNR与TM编码技术的SNR之间的差大于给定阈值时,应用通用(CELP)编码模式。如果通用(CELP)编码模式的SNR与TM编码技术的SNR之间的差小于给定阈值,则应用TM编码技术。根据需要多强大的帧擦除保护和起始编码确定来选取所述阔1直。用于声门形状码书搜索的子帧选择在先前部分中,描述了用于选4奪使用TM编码技术进行编码的帧的原因和机制。现将示出,为了实现以给定比特率的纯信道性能以及TM帧之前的帧中存在擦除的情况下的性能之间的最佳折衷,通常是更有效的是,并非在所有子帧中使用声门形状码书。首先,声门形状码书搜索仅在帧中的第一音调周期中是重要的。由于更高效的标准自适应码书搜索不再使用以往帧的激励(当搜索自适应码书时,搜索激励,直到大约以往的一个音调周期),因此可以使用它们来对跟随音调周期进行编码。因此,在不包含帧的第一音调周期的部分的子帧中没有理由采用声门形状码书搜索。相似地,当声门形状码书搜索用于增加浊音起始帧中的编码效率时,在开始浊音分段的第一音调周期上使用该声门形状码书搜索。原因在于,对于第一音调周期,自适应码书包含类似噪声的信号(先前分段不是浊音),并且以量化的声门脉冲来替换它一般增加了编码效率。然而,对于跟随音调周期,已经在自适应码书中建立了周期激励,并且使用该码书将得到更好的结果。为此,关于浊音起始位置的信息至少对于子帧分辨率(subframeresolution)是可用的。比特分配的进一步优化涉及具有长于子帧长度的音调周期的帧。假定声门形状码书包含声门脉冲的量化形状,则该码书最佳地适合于在包含声门脉冲的子帧中使用。在其它子帧中,其效率较低。在非限定说明性实施例中,假定在语音编码应用中比特率一般很有限,并且声门形状码书的编码对于低比特率语音编码需要相对更大量的比特,则选取其中仅在每帧一个子帧中使用并且搜索声门形状码书的比特分配。为了选取待以声门形状码书进行编码的子帧,寻找LP残差信号中的第一声门脉沖。可以使用以下简单过程。在范围中搜索LP残差信号中的最大采样,其中,T。p是前一半帧的开环音调周期,0与帧开始对应。在浊音起始帧的情况下,并且如果可以容易地确定起始的开始,则0表示子帧的开始,起始开始位于此处。其后,在具有最大残差信号能量的子帧中将采用声门形状码书。此外,最大的位置给出了声门脉冲位置可以近似地所处的位置的信息,并且对于复杂度减少可以利用这种情形,如稍后将描述的那样。注意,由于声门形状码书搜索仅替换自适应码书搜索,因此在TM帧的每个子帧中完成固定码书搜索。将如下处理(未使用声门形状码书所编码的)其它子帧。如果使用声门形状码书搜索的子帧不是帧中的第一子帧,则仅使用固定CELP码书对该帧的前面子帧中的激励信号进行编码;这意味着第一阶段激励信号为零。如果声门形状码书子帧不是帧中的最后子帧,则使用标准CELP编码(即,使用自适应码书搜索和固定码书搜索)来处理该帧的跟随子帧。在图5a-图5c中,示出第一声门脉冲出现在第2子帧中的情况的情形。在图5b中,u(n)是LP残差信号。当使用声门形状码书来建立第一阶段激励信号,以qk,(n)来表示它,或者当使用自适应码书来建立它时,以v(n)来表示它。在该示例中(图5c),第一阶段激励信号在第l子帧中为零,声门形状码矢量在第2子帧中,自适应码书矢量在最后两个子帧中。为了进一步增加编码效率并且优化比特分配,才艮据音调周期在TM帧的特定子帧中使用不同的处理。当将第一子帧选取为TM帧时,确定LP残差信号中具有第2声门脉冲的子帧。这种确定是基于音调周期值的,并且其后可能出现以下四种情形。在第一情形中,第2声门脉沖在第l子帧中,使用标准CELP编码(自适应码书搜索和固定码书搜索)来处理第2子帧、第3子帧和第4子帧。在第二情形中,第2声门脉沖在第2子帧中,再次使用标准CELP编码来处理第2子帧、第3子帧和第4子帧。在第三情形中,第2声门脉冲在第3子帧中。由于在待使用自适应码书来搜索的LP残差信号的第2子帧中没有声门脉冲,因此仅使用固定码书搜索来处理第2子帧。使用标准CELP编码来处理第3子帧和第4子帧。在最后(第四)情形中,第2声门脉沖在第4子帧(或下一帧)中,仅使用固定码书搜索来处理第2子帧和第3子帧,使用标准CELP编码来处理第4子帧。以下稍后在示例性实现方式中提供更详细的讨论。表3示出可能的编码配置的名称及其出现率统计。换句话说,表3对于通过TM编码技术处理的帧给出在每一子帧中第一声门脉沖和第二声门脉冲出现的分布。表3与TM编码技术用于仅对浊音起始帧和一个后续帧进行编码的情形对应。该实验中的语音信号的帧长度是20ms,子帧长度是5ms,并且使用32个男人和32女人的语音来进行该实验(如果并未不同地提及,则在以下描述中所提及的所有其它实验中也使用相同的语音数据库)。表3-TM的编码模式配置以及当处理语音信号时它们的出现率。编码配置第一(如果有关,则第二)声门脉冲的位置所使用的码书的类型(GS-声门形4犬,A=自适应,F二固定)质量[%]第一子帧第二子帧第三子帧第四子帧TRANSITION—1_1GS+FA+FA+FA+F25.5TRANSITION—1—2lA1禽liHGS+FA+FA+FA+F28.4TRANSITION—1—3GS+FFA+FA+F16.3TRANSITION丄4|A1i|禽iGS+FFFA+F3.0TRANSITION_2FGS+FA+FA+F21.2TRANSITION—3iiihiFFGS+FA+F4.6TRANSITION_4U11*1FFFGS+F1.0声门形状码书在原理上,声门形状码书包括特定位置处放置的声门脉冲的量化归一化的形状。因此,码书搜索既包括选择最佳形状,又包括确定特定子帧中其最佳位置。在它的最简单的形式中,可以通过单位脉沖来表示声门脉冲的形状,并且无需对其进行量化。在此情况下,仅确定它在子帧中的位置。然而,这种简单码书的性能十分有限。另一方面,如果声门形状码书项的长度L与音调周期的长度对应,并且31如果表示大量声门脉冲形状,则将有可能实现最佳表示。由于声门脉冲的长度和形状随扬声器和帧而变化,因此用于搜索并且存储这种码书的复杂度和存储器需求将太大。作为折衷,必须限制声门脉冲的长度及其数量。在非限定说明性实施例中,声门形状码书包括八(8)个不同的声门脉冲形状,并且每一声门脉冲的长度是L47个采样。已经选择量化的形状,从而绝对最大值在该长度的中间值左右。在声门形状码书搜索期间,以索引k'来校准这个中间值,索引k'表示当前子帧中的声门脉冲的位置,并且从间隔[O,N-l]中被选取,N是子帧长度。由于17个采样的码书项长度小于子帧长度,因此将其余采样设置为零。声门形状码书被设计为表示尽可能多的现存声门脉沖。使用基于k平均算法[4]的训练处理;使用多于三(3)个小时的包括以若干不同语言进行说话的很多不同扬声器的言词的语音信号来训练声门形状码书。从该数据库中,已经从LP残差信号提取了声门脉冲,并且其被截断为最大绝对值左右的17个釆样。从通过k平均算法选择的十六(16)个形状中,已经使用分段SNR质量测度而通过实验将形状的数量进一步减少到八(8)个形状。困6示出所选声门形状码书。显然,可以使用其它手段来设计声门形状码书。声门形状码书搜索可以通过若千方式来完成声门形状码书的实际实现。例如,可以与CELP中的固定码书搜索相似地执行搜索。在此情况下,通过将声门脉冲形状的中心放置在子帧中所有可能的位置处来构建码书。例如,对于六十四(64)个采样和八(8)个声门脉冲形状的子帧长度,获得大小64x8=512个码矢量的声门形状码书。根据另一示例,与自适应码书搜索相似,可以将码书项连续放置在以往激励中的所有潜在的位置处,并且可以通过与在自适应码书搜索中所使用的相似方式来选择最佳形状/位置组合。在后一实现中,通过长期CELP滤波器来自动完成所有音调周期重复,并且以完整大小的形状来表示声门脉沖(在更宽泛的情况下,与其中声门形状截断是必须的第一实现对照,如稍后将讨论的那样)。非限定说明性实施例使用其中码书搜索与代数CELP(ACELP)中的固定码书搜索相似的配置。在该方法中,对于候选形状中的每一个,将形状表示为成形滤波器G(z)的脉冲响应。因此,可以通过仅包含通过成形滤波器G(z)滤波的一个非零元素的码矢量来表示与以不同位置为中心的声门脉沖形状对应的码矢量(对于子帧大小N,存在用于潜在声门脉沖位置k'的N个单个脉冲矢量)。因为声门脉冲位置k'处于具有L个采样的奇数长度的声门形状的中间,并且k'来自范围[O,N-l],所以对于最前L1/2=(L-l)/2个釆样和最后L1/2=(L-l)/2个采样,必须截断声门形状。由于这种情况使得成形滤波器G(z)为非因果滤波器,因此在声门脉沖搜索期间,将考虑这种情况。图7示出编码器的TM部分的配置,图ll示出解码器的TM部分的配置。如上所述,TM部分代替编码器/解码器的自适应码书部分。在搜索期间,可以将成形滤波器G(z)的脉冲响应与滤波器H(z)的脉冲响应合并。现将描述用于对于由成形滤波器G(z)呈现的声门脉冲的特定形状搜索优化声门脉沖中心位置k'的过程和对应码书搜索器。因为从若干候选形状(在图6所示的非限定说明性实施例中使用八(8)个形状)选取滤波器G(z)的形状,所以对于码书的每一声门形状,必须重复搜索过程,以找寻优化脉沖形状和位置。为了确定TM编码参数,所述搜索确定目标矢量Xl与通过加权合成滤波器H(z)所滤波的以位置k'为中心的声门形状码矢量之间的均方误差。与CELP相似,可以通过按以下形式求解准则的最大值来执行所述搜索其中,yi是滤波后的声门形状码矢量。设qk,表示以位置k'为中心的声门形状码矢量,pk,表示具有指示位置k'的一(1)个非零元素的位置码矢量,则qk,可以写为qk,=G.pk,,其中,G是表示声门脉冲的形状的Toeplitz矩阵。因此,与固定码书搜索相似,可以写出以下公式<formula>formulaseeoriginaldocumentpage33</formula>(16)其中,H是加权合成滤波器的下三角Toeplitz巻积矩阵。如稍后将讨论的那样,矩阵ZT的列与滤波后的位移版本的声门脉冲形状或其截断后的表示对应。注意,假设本文中的所有矢量为列矢量(Nx1矩阵)。对于三(3)个采样以及N-4的脉冲长度的转置形式(t)的矩阵G的示例将具有以下形式g(O)00g(o)000g(o)g(一i)g(o)(17)其中,g(n)为非因果成形滤波器G(z)的脉冲响应的系数。在以下描述中,对于位于范围[-I^2,Li/2]内的n,由值g(n)给出非因果成形滤波器G(z)的系数。因为事实是位置码书Pk.仅具有一个非零元素,所以准则(16)的计算十分简单,并且可以使用以下公式来表示X=(《W,。(18)从公式(18)可见,仅需要计算矩阵(Dg的对角线矩阵。图8和图9示出对于一个声门形状码矢量计算准则(18)的图形表示。如已经提及的那样,通过预先计算后向滤波的目标矢量dg和相关矩阵Og而在ACELP代数码书搜索中典型地使用公式(18)。然而,假定成形滤波器G(z)的非因果性质,则这种情况不能直接应用于前Lw个位置。在这些情形中,使用更复杂的搜索,其中,某些计算出的值仍然可以重新用于将复杂度保持在低级别。下文中将对此进行描述。我们以Zk,表示矩阵zT的第(k'+l)行,其中,如下计算矩阵Z1(图10)。假定成形滤波器G(z)的非因果性质,在两个阶段中计算矩阵Z1,以使得计算复杂度最小。首先计算该矩阵的前1^1/2+l行。对于矩阵ZT的其余部分(矩阵ZT的最后N-L1/2-1行),以与ACELP固定码书搜索相似的方式使用准则(18)。现将描述如何计算矩阵ZT和准则(18)的详细描述。在第一阶段中,计算与范围内的位置k'对应的矩阵ZT的前面L1/2+l行。对于这些位置,将不同的截断声门形状用于该范围内的每一位置k'。在第一运算中,使用以下公式来计算位置k'=0的声门形状响应与脉冲响应h(n)之间的巻积34<formula>formulaseeoriginaldocumentpage35</formula>(19)其中,优点在于这样的事实成形滤波器G(z)仅具有L^+l个非零系数,即,g(O),g(l),...,g(Lw)为非零系数。在第二运算中,如下重新使用z。(n)的值来计算位置k'=1的声门形状码书响应与脉冲响应H(z)之间的巻积Zl(n)(矩阵ZT=t^HT是具有某些零负斜率对角线的矩阵,但该矩阵ZT不再是如图IO所示的Toeplitz和三角矩阵)z'(O)-g(-l)A(O)对于n-1,…,N-lW")"。("-l)+g(-l);i(")(20)对于以下行,重新^使用^^式(21)中的递归对于"1,…,N画l々(")^V—1)+g(-fcX")(21)对于所有k'SL^重复递归(21)。对于k'-L,成形滤波器G(z)已经具有L个非零系数,并且因此通过下式获得矩阵ZT的第(L^+1)行、(0)=g(-丄,,2),)对于nM,…,N-l""'广11"u(22)此时,已经计算出矩阵ZT的前L^+1行。这些行不包括零系数(图10)。其后可以使用以下公式对于范围内的k'计算准则(18)。<formula>formulaseeoriginaldocumentpage35</formula>(23)在第二阶段中,计算矩阵ZT的其余部分,并且对于范围[乙1/2+1,N-1]内的位置k'估计准则(18)。优点在于这样的事实使用如根据公式(22)所描述的那样已经计算出的巻积^/2(")的系数来建立矩阵ZT的行L1/2+1,...,N-l。差别在于,仅需要一部分系数来计算这些行。也就是说,每一行与向右位移1并且在开始处加上零的先前行对应z,)=0对于n=l,…,N-1=z"'("—"(24)对于范围[1^/2+1,N-l]内的k'重复该运算。在所述第二阶段中,可以按与上述部分固定码书搜索中所描述的相似方式来计算准则(18),以进一步减少计算复杂度。对于最后位置k^N-l(这是矩阵ZT的最后一行)首先估计准则(18)。对于k'-N-1,由以下7>式提供准则(18)的分子和分母A(w-1)=£攀-卜^2+,>』(o,'■0(25)以及,-i,w-由于矩阵ZT的某些系数为零(图10),因此仅!^1/2+1次乘法(而非公式(23)中所使用的N次乘法)用于计算准则(18)的分子和分母。当使用图IO的示例(L1/2=l)时,使用公式(25)和公式(26)计算出的准则(18)可以被简化如下w-'、(w-i,;v-i)"~(0)+^,'(i)z"(1)'(27)在接下来的步骤中,对于分母计算,可以再次重新使用某些先前计算出的值。对于位置N-2,使用以下公式计算准则(18)的分母0g(w-2,w-2)=^(w-1,w-1)+z』(丄|/2+i)Zlw,(a,2+1).(28)使用具有改变的求和索引的公式(25)来计算分子《(w-2)='f拳-2-i,/2+(/).(29)以相似的方式,对于所有位置k'〉L^计算准则(18)的分子和分母。以上所描述的过程允许对于表示来自声门脉沖的第一形状的码矢量求解准则(18)的最大值。对于所有其它声门脉冲形状,将使用先前描述的过程继续进行搜索。准则(18)的最大值搜索继续作为声门形状码书搜索,以求解与一个声门形状和构成搜索结果的一个位置k'对应的准则(18)的一个最大值。当搜索声门脉沖中心位置k'时,还有可能使用子采样分辨率;然而,这将导致增加的复杂度。更具体地说,这将需要对声门脉冲形状进行上采样,以增加分辨率,并且以不同分辨率提取不同位移的版本。这与使用更大的声门形状码书是等同的。36理想地,对于所有可能的声门脉冲位置k'计算准则(18)。在非限定说明性实施例中,仅在位置k'的期望位置周围的受约束的范围中执行搜索,以进一步减少计算复杂度。所述期望的位置处于范围[kmin,km狀]中,0<kmin<kmax<N,并且可以对于来自上述部分"用于声门形状码矢量搜索的子帧选择,,中所描述的那样从LP残差信号最大值求解第一声门形状而确定。其后执行声门形状码书搜索,并且对于第一声门形状找寻位置k'。对于第二声门形状搜索而如下设置新的范围[kmin,kmax]:化m/n-/f一△,=(30)典型地,A-4。相似地,公式(30)用于定义第二形状等等的所选位置周围的第三形状的:t叟索范围。在以下示例中,假设初始搜索范围是[N-15,N-7],L=17,N=64。搜索开始于计算值、2(")。其后,使用以下公式对于位置k^N-7估计准则(18):w-'、(w-7,w—7)-^&,(^,(0~~"°(31)为了对于位置k'=N-8计算准则,如下递归地计算分母(Pg(W-8,iV-8)=0g(W-7,W-7)+、(A/2+8)、+8).(32)以相同方式,对于直到k'=N-15的所有其余位置计算分母。通过使用以下公式按与公式(29)相似的方式分离地对于范围[N-15,N-7]内的每个位置计算准则(18)的分子'-0(33)待在声门形状码书搜索中确定的最后参数是增益gp,可以在公式(4)中对其进行计算,差别在于其在自适应码书搜索中不受束缚。原因在于,使用具有与实际激励信号脉冲的能量十分不同的能量的归一化量化声门形状来构建滤波后的声门形状码矢量。与声门脉冲位置和声门形状有关的索引被发送到解码器。图11示出解码器中的滤波后的声门形状码矢量重构。应注意,当子帧包含多于一个的声门脉沖时,在具有期望的声门形状码书搜索子帧中不再需要发送音调周期长度,存在这样的情形语音信号的音调周期短于子帧长度,并且在此情况下,子帧可以包含多于一个的声门脉冲(尤其在配置TRANSITION—1—1中)。在此情况下,必须对所有声门脉沖进行建模。给定音调周期限制和子帧长度,则在该非限定说明性实施例中,子帧不能包含多于两个的声门脉沖。可以通过两种不同的方法来解决这些情形。第一种较筒单的方法通过与参考文献[l]中所描述的AMR-WB(自适应多速率宽带)中所使用的周期增强(音调锐化)相似的过程来解决这些情形,其中,使用线性滤波器按音调周期基本地重复脉冲。如图12a所示,因此通过以下形式的自适应重复滤波器来处理声门形状码矢量qk,(n):例如可以通过标准闭环音调搜索方法来确定音调周期To。参数a对第二脉冲的能量有影响,并且在非限定说明性实施例中,已经被设置为a=0.85。这种技术将正确位置处的丢失声门脉冲添加到声门形状码矢量。图12b以虛线脉冲示出这种情况。当声门脉冲中心位置k'与音调周期To之和小于子帧长度N(即(k'十TQ)<N)时,出现这种情形。但也是在脉沖位置k'与音调周期之和超过子帧长度的情形中,当使用代数码书中的音调锐化时,音调周期值也用于建立固定码矢量。将重复滤波器Q(z)插入滤波器G(z)与H(z)之间的编解码器的TM部分,如对于编码器在图13的框图中所示的那样。在解码器中进行相同的改变。与音调锐化相似,可以在码书搜索之前将重复滤波器Q(z)的脉冲响应添加到G(z)和H(z)的脉沖响应,从而在将搜索的复杂度保持在低级别的同时,在搜索期间考虑这两个脉冲。用于在一个子帧中建立具有两个声门脉冲的声门形状码矢量的另一方法是在一部分子帧中使用自适应码书搜索。使用声门形状码书搜索来建立声门形状码矢量qk,(n)的前面To个采样,并且其后使用自适应搜索来建立子帧中的其它采样,如图14所示。这种方法更复杂,但更精确。为了进一步增加编码效率,即使第二声门脉沖出现在下一子帧的前L1/2个位置之一中,也可以使用上述过程(图15)。在这种情形中,即,当k'和To满足N《(k'+T0)<(N+Lv2)时,在当前子帧的结束处仅使用声门形状的少数采样(少于^/2+l)。在非限定说明性实施例中使用这种方法。这种方法具有限制,因为在这些情形中发送的音调周期值被限制为To<N(这是有效编码的问题),但理想地,其值应该被限制为To$N+L1/2。因此,如果第二声门脉沖出现在下一子帧的开始处,则重复过程不能用于第一声门脉冲的前L1/2声门脉冲位置k'中的某些。EV-VBR编解码器中的TM编码技术的实现方式技术。EV-VBR使用12.8kHz的内部采样频率和20ms的帧长度。每一帧被划分为N=64个釆样的四个子帧。EV-VBR分类过程已经适用于选择待使用TM编码技术进行编码的帧。在这种实现方式中,在如图16所描述的两个步骤中对声门形状码书贡献的增益进行量化,其中,G(z)是成形滤波器,k'是声门形状的中心的位置,gm是TM增益(即声门形状码矢量的粗略量化能量)。以与使用公式(4)的音调增益相同的方式来找寻TM增益gm,仅有差别是其不受束缚。其后,通过3比特标量量化器对其进行量化,并且对于符号使用一个比特。其后使用该增益gm对声门形状码矢量进行缩放。在找到对于滤波后的激励信号的两个贡献(第一阶段贡献信号和第二阶段共享信号,即滤波后的声门形状码书贡献和滤波后的代数码书贡献)之后,使用标准EV-VBR增益矢量量化(VQ)结合第二阶段激励信号增益量化来进一步调整第一阶段激励信号的增益。以此方式,在TM编码中也可以使用为通用编码模式或浊音编码模式设计的EV-VBR的增益量化码书。当然,使用其它不同方法执行增益量化是落入本发明范围内的。对于子帧中的所有位置(即范围[O,N-l]内),理论上应该进行声门脉沖中心位置W的搜索。然而,如上所述,给定待尝试的声门形状的数量,则这种搜索计算量很大,并且,在实践中,仅可以在LP残差信号中的最大绝对值的位置周围的若干釆样的间隔中进行搜索。可以将搜索间隔设置为当前帧中的LP残差信号中的第一声门脉冲最大值的位置周围的±4个釆样。以此方式,处理复杂度近似地与使用自适应码书搜索和固定码书搜索的EV-VBR通用编码相同。表4列出所发送的与TM编码技术有关的参数以及对应比特数量。当To^N时,发送参数To,其用于在一个子帧中两个脉冲的情况下确定滤波器Q(z)39或者对于第二声门脉冲执行自适应搜索。在此未示出对于TM帧所使用的但与通用ACELP处理共同的其余参数(帧标识比特、LP参数、自适应激励的音调延迟、固定码书激励、第1阶段码书增益和第2阶段码书增益)。当将TM参数添加到比特流时,初始分配给其它EV-VBR参数的比特的数量减少,以保持恒定的比特率。可以例如从固定码书激励比特以及增益量化中减少这些比特。表4-对于使用TM所编码的子帧发送的比特流中的参数。标签涵义比特数量ID酉己置标识l誦4形状声门脉沖形状3k'声门脉冲中心的位置6gmTM增益sign(gm)TM增益的符号1T0闭环音调周期(如果可应用)5以下在此示出EV-VBR中使用的比特分配表。我们回顾,当声门形状码书搜索未应用于第一子帧时,仅发送固定码书及其增益,以对声门形状码书子帧之前的子帧中的激励信号进行编码。对于配置TRANSITION_l_3和TRANSITION_l_4出现相同情形。在这些情况下,有可能将所有子帧的固定码书保持为与初始通用ACELP编码相同的大小或甚至很大的大小。EV-VBR编解码器中的TM技术性能在该部分,陈述EV-VBR编解码器实现方式中的TM编码技术的性能的某些示例。在图17中,对于纯信道条件示出TM编码技术的影响的示例。图17a示出输入语音信号,图17b示出LP残差信号,图17c示出第一阶段激励信号,其中,在前三(3)个帧中使用TM编码技术。如期望的那样,在每一帧的开始,残差信号与第一阶段激励信号之间的差异是更显著的。因为使用标准自适应码书搜索,所以朝着帧的结束,第一阶段激励信号更接近地与残差信号对应。表5和表6总结了使用SNR值测量的TM编码技术的性能的某些示例。在第一示例(表5)中,以核心(内部)采样频率Fs-8kHz(即子帧长40码器中实现TM技术,使用具有长度十七(17)个采样的十六(16)个形状的声门形状码书,并且测试窄带输入信号。从表5可见,使用TM编码技术对浊音起始帧进行编码增强了输出语音信号的质量(见对于1和2TM帧的分段SNR值和加权分段SNR值)。如果使用TM编码技术对浊音起始帧和一个跟随帧进行编码,则可以观测到进一步的SNR增加。然而,如果还使用TM编码技术对跟随浊音起始帧的多于一个的帧进行编码,则SNR值减少。加权SNR是由以帧长度所归一化的帧能量所加权的SNR,以dB为单位。表5-TM编码技术对NB信号的影响的SNR测量比较。<table>tableseeoriginaldocumentpage41</column></row><table>表6总结了具有核心(内部)采样频率&=12.8kHz、WB输入语音信编解码器的性能的示例。主要因为更长的子帧长度N,所以即佳j又在一个帧中使用TM编码技术,当使用TM编码技术时,SNR值对于纯信道也示出某种降级。主要是因为声门形状脉冲的有限长度而导致这种情况。与NB示例比较,在子帧中的第一阶段激励信号中出现更多的零值。该示例中使用TM编码技术的好处在于FE(帧擦除)保护。表6-TM编码技术对WB信号的影响的SNR测量比较。<table>tableseeoriginaldocumentpage41</column></row><table>2(在起始帧之后2帧中的TM)7.387.108.353(在起始帧+2帧中的TM)7.367.088.31还应注意,即使当在擦除的帧之后的帧中使用TM编码技术时,在纯信道和噪声信道中在合成语音之间也仍然存在某种细小差别。这是因为编码器和解码器内部状态不仅取决于以往激励信号,而且还取决于很多其它参数(例如滤波器存储器、ISF(导抗语频率)量化器存储器.......)。当然,当使用无存储器LP参数量化优化TM编码并且对于TM帧重置所有内部状态时,有可能测试变量。对在标准通用编码模式下EV-VBR编解码器使用所有存储器的这种方式进行重置,以确保在帧擦除之后的解码器内部状态与其在无误码条件下的状态相同。然而,对于该变量,无误码条件下的语音质量明显下降。因此,当不进行附加存储器重置时,在无误码条件下的高性能与对于擦除的帧或分组的强健性之间要进行折衷。表7总结了TM编码技术的计算复杂度问题。在最坏的情况下,TM编码技术将编码器中的复杂度增加1.8WMOPS(加权的每秒兆次运算)。解码器中的复杂度仍然近似相同。表7-TM编码技术的复杂度(最坏情况和平均值)。配置编码器WMOPS解码器WMOPS最大平均最大平均初始(无TM编码)36.53134.6997.0535.278使用TM编码技术38.34634.7437.0555.281以下附图示出用于浊音起始帧建模(图18a-18c)以及用于帧误码传播緩和(图19a-19c)的TM编码技术的性能。在该示例中,一次仅在一个帧中使用TM编码技术。示出了输入语音信号的分段(图18a和图19a)、图18b和图19b所示的在不使用TM编码技术的情况下由EV-VBR解码器处理的对应输出合成语音信号、以及在使用TM编码技术的情况下使用标准EV-VBR解码器处理的输出合成语音信号(图18c和图19c)。既在对浊音起始帧(图18的第2帧)进行建模中,又在对帧误码传播(图19的第4帧和第5帧)进行限制中,都可以观测到TM编码技术的好处。EV-VBR解码器中所使用的帧擦除掩蔽技术是基于使用20ms长度(与一个帧长度对应)的额外解码器延迟的。这说明,如果帧丟失,则通过未来帧参数的知识来掩蔽该帧。我们假设表示为m-l、m和m+l的三(3)个连续帧,并且进一步假设当帧m丢失时的情形。于是,考虑到确定编解码器参数,可以计算最后正确接收到的帧m-l以及跟随正确接收到的帧m+l的内插,具体地说,但并非排除性地,包括(由ISF-导抗谱频率表示的)LP滤波器系数、闭环音调周期To、音调和固定码书增益。对于稳定的浊音分段,内插有助于更精确地估计丢失的帧参数。然而,当编解码器参数快速变化时,对于过渡分段,内插一般是失败的。为了解决这个问题,甚至在对于当前帧m+l中的第一阶段激励构建不使用内插的情况下,可以在每个TM帧中发送音调周期的绝对值。这对于配置TRANSITIONJ—4和TRANSITION—4是尤其有效的。TM帧中发送的其它参数是前面帧的ISF。在CELP型的编码器中,对于每个子帧,通常在先前帧ISF与当前帧ISF之间内插ISF参数。这样确保LP合成滤波器从一个子帧到另一子帧的平滑演进。在帧擦除的情况下,在帧擦除之前的帧的ISF(而非擦除的帧ISF)通常用于跟随擦除的帧中的内插。然而,在过渡分段期间,ISF快速变化,并且最后的良好帧ISF可能与丢失的擦除的帧的ISF十分不同。由先前帧的ISF来替换丟失帧ISF可能因此导致重大的伪像(artefact)。如果可以发送以往帧ISF,则可以在擦除先前帧的情况下将它们用于TM帧中的ISF内插。稍后,将描述当每一TM帧之前的帧丟失时对于ISF内插所使用的LP系数的不同估计。TM编码技术进入EV-VBR编解码器的最终实现方式假设使用TM对起始/过渡帧之后的仅一个帧进行编码。以此方式,对于TM编码和解码,选择活动语音帧的大约6.3%。另一类别的测试关注于编码效率的增加。当在编码器中逐侧计算两个变量(采用TM编码技术以及不采用TM编码技术),并且将具有较高SNR的变量选取为输出信号时,在闭环搜索中进行分类。表8总结了具有8kb处理比特率的EV-VBR编解码器的结果。在WB的情况下,对活动语音帧的28%进行分类,以使用TM编码技术进行编码,并且实现了分段SNR中的0.203dB的增加。在NB的情况下,对活动语音帧的25%进行分类,以使用TM编码技术进行编码,并且实现了分段SNR中的甚43至0.300dB的增加。遗憾的是,这种客观测试增加并未被主观收听测试确认,主观收听未报告釆用TM编码技术的编解码器与不采用TM编码技术的编解码器之间的偏好。虽然不存在语音质量降级,并且与产生远更高FE保护的开环分类相比,TM帧的总数量高四(4)倍,但归因于增加的复杂度,在的EV-VBR编解码器实现方式中最好不使用这种分类和相似的结果分类。TM编码技术的编解码器之间的分段SNR和SNR测度比较。TM编码帧数量分段SNR[dB]SNR[dB]无TM的编解码器、WB信号7.348.89带TM的编解码器、WB信号7.549.04无TM的编解码器、NB信号7.5810.62带TM的编解码器、NB信号7.8810.97EV-VBR编解码器中的TM编码技术的比特分配表在ITU-T标准的EV-VBR编解码器候选中实现了TM编码技术。以下表9示出以上在此介绍的初始通用模式和所有TM编码模式的比特分配表。在EV-VBR编解码器中使用这些配置。表9-EV-VBR编解码器中使用的通用编码才莫式和所有TM配置的比特分配表(ID代表配置标识,ISF代表导抗谱频率,FCB代表固定码书、subfr是子帧)。44<table>tableseeoriginaldocumentpage45</column></row><table><table>tableseeoriginaldocumentpage46</column></row><table><table>tableseeoriginaldocumentpage47</column></row><table>1TMsubfr./£1TMsubfr./£177Wsubfr./031stsubfr.gain32ndsubfr.gain53"1subfr.pitch3TM形状6TM位置1TM增益符号3TM增益值53rdsubfr.gains84msubfr.pitch54thsubfr.gains121stsubfr.FCS202ndsubfr.FCS203rdsubfr.FC8204thsubfr.FC8总计160比特1T/Wsubfr./D1r/Wsubfr./。177Wsubfr./D31stsubfr.gain22ndsubfr.gain33rdsubfr.gain84thsubfr.pitch3TM形状6TM位置1TM增益符号3TM增益值54thsubfr.gains201s'subfr.FCS202ndsubfr.FC8203rdsubfr.FC8204thsubfr.FC8总计160比特48存在对于表9中的配置TRANSITION_2的一种期望。仅在当决定在跟随浊音起始帧的帧中仅使用的TM编码技术时的情形中可以使用该比特分配表(使用通用编码模式对浊音起始帧进行编码,并且使用TM编码技术对跟随浊音起始帧的仅一个帧进行编码)。在该情形中,在第二子帧中,音调周期To是T(^N,并且需要在第2子帧中发送该参数。但如果在浊音起始帧中也使用TM编码技术,则可能出现以下情形。音调周期小于N,但浊音起始可以仅在第2子帧开始(例如,第一子帧仍然包含清音信号)。在此情况下,必须发送音调周期To。在该情形中,使用不同的比特分配表,使用五(5)个比特在第2子帧中发送参数To,并且在一个子帧中,使用更短的固定码书(见表IO)。对于配置TRANSITION—3也出现相同情形。然而,因为对于另一参数编码并未良好地使用所节省的比特,所以在该非限定说明性实施例中,无论如何,在此发送音调周期(无论是否使用TM编码技术对起始帧进行编码)。在不同过渡模式配置中可以使用其它比特分配。例如,在包含声门脉沖的子帧中,可以将更多的比特分配给固定码书。例如,在TRANSITION—3模式下,在第二子帧中可以使用具有十二(12)个比特的FCB,而在第三子帧中可以使用具有二十八(28)个比特的FCB。当然,除了12比特FCS之夕卜,在不同编码器实现方式中可以使用20比特的FCS。表10-如果在起始帧中也使用TM,则配置TRANSITION_2的比特分配表。TRANSmON_2a#比特参数2编码器类型1A/8細36/SFs3能量估计117Afsubfr./。17^subfr./。31s'subfr.G3in52Msubfrpitch3TM形状67VW位置1TM增益符号3TM增益值52ndsubfr.Gains83rdsubfr.Pitch53rdsubfr.gains54thsubfr.Pitch54lhsubfr.Gains20subfr.FC8202ndsubfr.FCS123rdsubfr.TO124thsubfr.FC8总计158比特50如果存在可用带宽,则可以通过发送更多信息以用于更好的帧擦除(FE)保护来实现进一步的增强。VMR-WB编解码器是使用FE保护比特的某些部分的编解码器的示例。例如,在速率集合II中的VMR-WB中的通用完全速率编码类型中使用每帧十四(14)个保护比特。这些比特表示帧分类(2比特)、合成语音能量(6比特)和声门脉沖位置(6比特)。当浊音起始帧丟失时,在解码器中人工插入声门脉冲。因为TM编码技术不使用以往激励信号,所以这些FER保护比特对于TM帧中的激励构建不是非常重要;TM编码技术使用当前(TM)帧中发送的参数来构建激励信号。然而,可以对于其它参数的传输而采用这些比特。在实现方式的示例中,这些比特可以用于在当前TM帧中发送先前帧的ISF参数;然而,十二(12)个比特而非三十六(36)个比特是可用的)。这些ISF用于在帧擦除的情况下的更精确的LP滤波器系数重构。在EV-VBR编解码器中,以四个子帧为中心计算LP参数集合,而第一子帧、第二子帧和第三子帧使用当前帧和先前帧之间的LP滤波器参数的线性内插。对ISP(导抗语对)执行内插。设q4(m)是在帧的4个子帧处的ISP矢量,并且q4(m-l)是在以往帧m-l的第4子帧处的ISP矢量。由以下公式给出在第1子帧、第2子帧和第3子帧处的内插ISP矢量<formula>formulaseeoriginaldocumentpage51</formula>然而,在擦除先前帧的情况下,这种内插并不直接适合于TM编码技术。当TM帧之前的帧丢失时,可以假设最后正确接收到的帧是清音。在这种情形中,以不同内插常数对于丢失帧重构ISF矢量是更高效的,并且我们是否具有来自可用的FER保护比特的某些ISF信息并不是重要的。通常,内插更强烈地使用先前帧ISF。可以例如通过使用以下公式在解码器处给出丟失帧m的ISP矢量<formula>formulaseeoriginaldocumentpage52</formula>(36)跟随增强接收到的TM帧m+l其后使用由公式(35)描述的LP系数内插。此外,作为非限定性示例,给出公式(36)中的内插系数。最终系数可以是不同的,并且此外,当来自先前帧的某些ISF信息可用时,期望4吏用内插系数的一个集合,而当来自先前帧的ISF信息不可用时(即,比特流中没有帧擦除保护),期望使用另一集合。EV-VBR编解码器中TM帧中的音调周期和增益编码于在EV-VBR编解码器中所使用的通用编码模式下,对于每个子帧发送音调周期的值To。在第1子帧和第3子帧中,使用8比特编码,同时传递具有小数(在范围[Tmin,911/2]中,To的1/2)或整数(对于范围[92,T皿]中,To)分辨率的音调周期值。在第2子帧和第4子帧中,使用delta搜索,并且以五(5)个比特对总是具有小数分辨率的音调周期值进行编码。delta搜索表示范围[Top-8,Top+71/2]内的搜索,其中,Top是最接近于先前(第1或第3)子帧的小数音调周期的整数。音调周期的值在EV-VBR编解码器中受限为范围[Tmin,T飄]内的值,其中,Tmin=34,Tmax=231。在原理上按与AMR-WB+编解码器[5]相同的方式,在EV-VBR编解码器中对音调增益gp和固定码书增益gc进行编码。首先,对于帧中的所有子帧计算非预测缩放固定码书能量的估计,并且每帧一次以三(3)个比特对其进行量化(见表9中的参数能量估计)。其后,对于每个子帧使用五(5)个比特在一个步骤中对音调增益gp和固定码书增益gc进行矢量量化。如下对估计的固定码书能量进行计算和量化。首先,使用以下公式在每一子帧k中计算LP残差能量广1W一1、£re.'w=ioiog|0士jy("),〔wsj(37)其中,u(n)是LP残差信号。其后,通过以下公式求解每子帧的平均残差能量(38)通过移除自适应码书贡献的估计来从残差能量估计固定码书能量。通过移除与从帧中所执行的两个开环音调分析所获得的平均归一化相关有关的能量来完成所述估计。使用以下公式其中,f是对于当前帧的每一半个帧从开环音调分析所获得的归一化音调相关的平均值。估计出的缩放固定码书能量不取决于先前帧能量,并且因此,增益编码原理对于帧擦除是强健的。一旦求解出固定码书能量的估计,就计算音调增益和固定码书增益校正估计出的缩放固定码书能量用于计算估计的固定码书增益和校正因子y(真实固定码书增益与估计的固定码书增益之间的比率)。值y是使用每子帧五(5)个比特连同音调增益一起量化的矢量。对于量化器的设计,使用修正的k平均方法[4]。音调增益在码书初始化期间净皮限制在间隔O;1.2>内,在迭代码书改进期间被限制在间隔<0;oo>。类似地,校正因子y在初始化期间限于〈0;5>,并且在码书改进期间限于<0;00>。修正的k平均算法寻找使得以下准则最小(40)当使用TM编码技术时,没有重要声门脉冲的子帧可以不要求发送音调周期以及音调和固定码书增益二者,并且可以仅计算固定码书贡献。以下是所有TM配置的列表和描述配置TRANSITIONS—1(图20)——在这种配置中,一个或两个第一声门脉沖出现在使用声门形状码书搜索处理的第一子帧中。这说明第一子帧中的音调周期值可以具有小于子帧长度的最大值(即Tmin〈To〈N)。关于整数分辨率,可以通过五(5)个比特对其进行编码。使用具有小数分辨率的5比特delta搜索来求解下一子帧中的音调周期。即,当在第一子帧中使用声门形状码书时,这是TM编码技术的最多比特需求配置,并且对于Q(z)滤波器确定或对于第一子帧的部分中的自适应码书搜索而发送音调周期To。这种配置在第一子帧中使用上述过程。此外,当仅一个声门脉冲出现在第一子帧中时,在EV-VBR编解码器中使用这种配置。在此,音调周期To保持T()〈N,并且其在固定码书搜索中用于周期增强[l]。处理TRANSITION_l_2(图21)——当使用配置TRANSITION—1_2时,使用声门形状码书搜索来处理第一子帧。音调周期是不需要的,并且使用自适应码书搜索来处理所有跟随子帧。因为已知第二子帧包含第二声门脉沖,所以音调周期最大值保持1^2!^-1。这个最大值可以借助声门脉冲位置k'的知识而进一步减少。其后整个范围中关于小数分辨率^f吏用七(7)个比特对第二子帧中的音调周期值进行编码。在第三子帧和第四子帧中,关于小数分辨率使用采用五(5)个比特的delta搜索。配置TRANSITION—1—3(图22)——当使用配置TRANSITION—1—3时,在不使用音调周期的情况下再次使用声门形状码书搜索来处理第一子帧。因为LP残差信号的第二子帧不包含声门脉冲,并且自适应搜索是无用的,所以在第二子帧中以零来替换第一阶段激励信号。在第二子帧中不发送自适应码书参数(To和gp),并且节省的比特用于第三子帧中的FCB大小增加。因为第二子帧包含最少的有用信息,所以仅使用12比特FCB,而在第四子帧中使用20比特FCB。使用具有音调周期最大值(3.N-l-k')和最小值(2N-k')的自适应码书搜索来构建第三子帧中的第一阶段激励信号;因此仅使用在所有范围上具有小数分辨率的音调周期的7比特编码。关于音调周期值5比特ddta搜索编码,再次使用自适应搜索来处理第四子帧。在第二子帧中,仅发送固定码书增益gc。因此,对于增益量化,仅需要两(2)个或三(3)个比特,而非采用传统ACELP编码在子帧中所使用的5比特量化器(即,当发送增益gp和ge时)。对于所有以下配置,这也是有效的。关于增益量化器应该使用两(2)个比特还是三(3)个比特进行判断,以适于帧中可用的比特的数量。配置TRANSITION_l_4(图23)——当使用配置TRANSITION_l_4时,使用声门形状码书搜索来处理第一子帧。再次,不需要发送音调周期。但因为LP残差信号在第二子帧并且也在第三子帧中不包含声门脉冲,所以对于这两个子帧,自适应码书搜索是无用的。再次,由零来替换这些子帧中的第一阶段激励信号,并且节省的比特用于FCB大小增加,从而所有子帧可以受益,并且使用20比特FCB。仅在第四子帧中发送音调周期值,并且其最小值是(3-N-1-k')。音调周期的最大值受Tm狀限制。在第四子帧中是否出现第二声门脉冲是不重要的(如果k'+Tmax2N,则第二声门脉冲可以出现在下一帧中)。对于帧掩蔽,在解码器处使用音调周期的绝对值;因此,在当第二声门脉冲出现在下一帧中时的情形中发送音调周期的这个绝对值。当TM帧m+l之前的帧m丟失时,来自帧m-l和m+l的音调周期值的正确知识有助于成功地在帧m中重构合成信号的丟失部分。配置TRANSITION_2(图24)——当第一声门脉沖出现在第二子帧中并且^f吏用TM编码:技术<又对浊音起始帧之后的帧进4亍编码时(即,以遗留(legacy)通用编码对浊音起始帧进行编码),仅在第三子帧和第四子帧中发送音调周期。在此情况下,在第一子帧中仅发送固定码书参数。图24所示的帧假设当在浊音起始帧中不使用TM时的配置。如果在浊音起始帧中还使用TM,则使用配置TRANSITION一2a,其中,在第二子帧中发送音调周期To,以使用以上所描述的过程。配置TRANSITION—3(图25)——当第一声门脉冲出现在第三子帧中并且使用TM编码技术仅对浊音起始帧之后的帧进行编码时(即,以遗留通用编码对浊音起始帧进行编码),仅在第四子帧中发送音调周期。在此情况下,在第一子帧和第二子帧中仅发送固定码书参数。在比特流中对于第三子帧仍然发送音调周期。然而,如果未使用TM编码技术来对浊音起始帧进行编码,则音调周期是无用的。仅当使用TM编码技术对浊音起始帧进行编码时,该值才是有用的。配置TRANSITION_4(图26)——当第一声门脉冲出现在第四子帧中并且使用TM编码技术仅对浊音起始帧之后的帧进行编码时(即,以遗留通用编码对浊音起始帧进行编码),在该子帧中不使用音调周期值信息。然而,在解码器处在帧掩蔽中使用音调周期(当TM帧之前的帧丢失时,对于丢失帧重构而使用该值)。因此,仅在第四子帧中发送音调值,并且在第一子帧、第二子帧和第三子帧中仅发送固定码书参数(不需要增益音调gp)。节省的比特允许在每个子帧中使用20比特FCB。虽然已经结合本发明非限定说明性实施例在前面的描述中描述了本发明,但在不脱离本发明范围和精神的情况下,在所附权利要求的范围内,可以按意愿修改所述非限定说明性实施例。参考文献〖1B.BESSETTE.R.SALAMI.R.LEFEBVRE,M.JEUNEK,丄ROTOLA-PUKKILA,丄VAINIO,H,隨KKOLA,andK.JARVINEM,'TheAdaptiveMuifrRateWidebandSpeechCodec(AMR-柳)",SpecialIssueofIEEETransacttonsonSpeechandAudioProcessing,Vol..10,No.8,pp.620>636,November2002,〖2R.SAUMI,C.LAFLAMME,J-P.ADOUL'andD,MASSALOUX,"Atoflquality8kb/sspeechcodecforHiepersonalcommunfcationssystem(PCS)",IEEETrans,onVehicularTechnology,Vol.43,No.3,pp.808^816,August1994,p〗3GPP2Tech.Spec,v1.0."Source-ControlledVariabte-RateMuKimode翻ebandSpeediCodec(VMR-WB),ServiceOptions62and63forSpreadSpectrumSystems,"Apr.2005:http://www.3gpp2.org:S.P,Uoyd,"LeastsquaresquarrtizattoninPCM,"旺ETransactionsonWotmationTheory,Vol.28,No.2,pp.March1982.问3GPPTech.Spec,26.290,'AdaptiveMutti'Rate,WWeb加d(AMR-WB+》codec;Transcodingfunctions,'June2005.,问"Extendedhigh-teveldescripttonoftheQ9EV-VBRbaselinecodec,"ITU-TSG16Tedi.Cont,C0M16"C199F1"E,June2007,5权利要求1.一种在预测型声音信号编解码器中使用的过渡模式设备,用于在所述声音信号中的过渡帧和/或跟随所述过渡的帧中产生替换自适应码书激励的过渡模式激励,所述过渡模式设备包括输入端,用于接收码书索引;过渡模式码书,用于生成独立于以往激励的码矢量集合,所述过渡模式码书响应于所述索引,以在所述过渡帧和/或跟随所述过渡的帧中生成与所述过渡模式激励对应的集合的码矢量之一。2.如权利要求1中定义的过渡模式设备,其中,所述过渡模式码书包括独立于以往激励的固定码书。3.如权利要求1中定义的过渡模式设备,其中,所述预测型声音信号编解码器包括解码器,藉此,在操作中,在所述过渡帧和/或跟随所述过渡的帧中以过渡模式激励来替换所述自适应码书激励会减少万一帧擦除而在所述解码器处的误码传播,并且/或者会增加编码效率。4.如权利要求1中定义的过渡模式设备,其中,所述过渡模式码书包括声门脉沖形状的码书。5.如权利要求1中定义的过渡模式设备,其中,所述声音信号包括语音信号,并且其中,从包括包含浊音起始的帧和包含两个不同浊音声音之间的过渡的帧的群组中选择所述过渡帧。6.如权利要求1中定义的过渡模式设备,其中,所述过渡帧和/或跟随所述过渡的帧包括若干帧所跟随的过渡帧。7.如权利要求6中定义的过渡模式设备,其中,所述过渡帧和跟随所述过渡帧的若干帧是连续帧。8.如权利要求1中定义的过渡模式设备,其中,所述过渡帧和/或跟随所述过渡的帧包括至少一个跟随所述过渡的帧。9.如权利要求1中定义的过渡模式设备,其中,所述预测型编解码器是CELP型编解码器,并且其中,所述过渡模式码书在所述过渡帧和/或跟随所述过渡的帧中替换所述CELP型编解码器的自适应码书。10.如权利要求1中定义的过渡模式设备,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,并且其中,在所述子帧的第一部分中使用所述过渡模式码书,并且在所述子帧的第二部分中使用所述预测型编解码器的预测型码书。11.如权利要求1中定义的过渡模式设备,其中,所述码书包括声门形状码书,其包括由在所述码矢量中的特定位置处放置的声门脉冲形状形成的码矢量。12.如权利要求11中定义的过渡模式设备,其中,所述声门形状码书包括预定数量的不同形状的声门脉冲,并且其中,每一形状的声门脉冲位于所述码矢量中的多个不同位置处,以形成所述声门形状码书的多个不同码矢量。13.如权利要求11中定义的过渡模式设备,其中,所述声门形状码书包括仅包含一个非零元素的码矢量的生成器;以及成形滤波器,其用于处理仅包含一个非零元素的码矢量,以产生表示以不同位置为中心的声门脉冲形状的码矢量。14.如权利要求13中定义的过渡模式设备,其中,所述预测型声音信号编解码器包括编码器,其包括加权合成滤波器,用于处理表示以不同位置为中心的声门脉沖形状的来自所述成形滤波器的所述码矢量。15.如权利要求13中定义的过渡模式设备,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,所述声门形状码书还包括重复滤波器,其位于所述成形滤波器的下游,用于当每子帧存在多于一个的声门脉冲时,在音调周期已经逝去之后,重复所述声门脉冲形状。16.如权利要求11中定义的过渡模式设备,其中,所述声门形状脉冲包括最前采样和最后采样,其中,预定数量的所述最前采样和所述最后采样被17.如权利要求13中定义的过渡模式设备,还包括放大器,其用于将增益施加到表示以不同位置为中心的声门脉冲形状的所述码矢量。18.—种编码器设备,用于在所述声音信号中的过渡帧和/或跟随所述过渡的帧中产生替换自适应码书激励的过渡模式激励,所述编码器设备包括码书搜索目标信号的生成器;过渡模式码书,用于生成独立于以往激励的码矢量集合,所述集合的所述码矢量每个与各个过渡模式激励对应;所述过渡模式码书的搜索器,用于找寻与优化地对应于所述码书搜索目标信号的过渡模式激励对应的所述集合的码矢量。19.如权利要求18中定义的编码器设备,其中,所述过渡模式码书包括独立于以往激励的固定码书。20.如权利要求18中定义的编码器设备,其中,所述过渡模式码书包括声门脉冲形状的码书。21.如权利要求20中定义的编码器设备,其中,所述搜索器将给定准则应用于所述声门脉沖形状的码书的每个声门脉冲形状,并且找寻与所述准则的最大值对应的集合的码矢量作为优化地对应于所述自适应码书搜索目标信号的码矢量。22.如权利要求21中定义的编码器设备,其中,所述搜索器通过从包括以下项的群组中选择过渡模式参数来标识找到的码矢量过渡模式配置标识、声门脉冲形状、在找到的码矢量中的声门脉沖形状中心的位置、过渡才莫式增益、过渡模式增益的符号以及闭环音调周期。23.如权利要求18中定义的编码器设备,其中,所述声音信号包括语音信号,并且其中,从包括包含浊音起始的帧和包含两个不同浊音声音之间的过渡的帧的群组中选择所述过渡帧。24.如权利要求18中定义的编码器设备,其中,所述过渡帧和/或跟随所述过渡的帧包括若干帧所跟随的过渡帧。25.如权利要求24中定义的编码器设备,其中,所述过渡帧和跟随所述过渡帧的若干帧是连续帧。26.如权利要求18中定义的编码器设备,其中,所述过渡帧和/或跟随所述过渡的帧包括至少一个跟随所述过渡的帧。27.如权利要求18中定义的编码器设备,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,并且其中,所述搜索器搜索所述子帧的第一部分中的所述过渡模式码书以及所述子帧的第二部分中的编码器设备的预测型码书。28.如权利要求18中定义的编码器设备,其中,所述过渡模式码书包括声门形状码书,其包括由在所述码矢量中的特定位置处放置的声门脉冲形状形成的码矢量。29.如权利要求28中定义的编码器设备,其中,所述声门形状码书包括预定数量的不同形状的声门脉冲,并且其中,每一形状的声门脉冲位于所述码矢量中的多个不同位置处,以形成所述声门形状码书的多个不同码矢量。30.如权利要求28中定义的编码器设备,其中,所述声门形状码书包括仅包含一个非零元素的码矢量的生成器;以及成形滤波器,其用于处理仅包含一个非零元素的码矢量,以产生表示以不同位置为中心的声门脉冲形状的码矢量。31.如权利要求30中定义的编码器设备,包括加权合成滤波器,用于处理表示以不同位置为中心的声门脉冲形状的来自所述成形滤波器的所述码矢量。32.如权利要求30中定义的编码器设备,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,所述声门形状码书还包括重复滤波器,其位于所述成形滤波器的下游,用于当每子帧存在多于一个的声门脉冲时,在音调周期已经逝去之后,重复所述声门脉沖形状。33.如权利要求28中定义的编码器设备,其中,所述声门形状脉沖包括最前采样和最后采样,其中,预定数量的所述最前采样和所述最后采样被截断。34.如权利要求31中定义的编码器设备,还包括放大器,其用于将增益施加到表示以不同位置为中心的声门脉冲形状的所述码矢量。35.如权利要求18中定义的编码器设备,还包括创新码书搜索目标信号的生成器;创新码书,用于生成每个与各个创新激励对应的创新码矢量集合;所述创新码书的搜索器,用于找寻与优化地对应于所述创新码书搜索目标信号的创新激励对应的所述集合的创新码矢量;和所述过渡模式激励和所述创新激励的加法器,用于产生声音信号合成滤波器的全局激励。36.如权利要求35中定义的编码器设备,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,并且其中,取决于一个或多个声门脉冲在所述子帧中所处的位置,所述编码器设备包括用于使用所述过渡模式码书、所述自适应码书以及所述创新码书中的至少一个对所述子帧进行编码的装置。37.—种解码器设备,用于在所述声音信号中的过渡帧和/或跟随所述过渡的帧中产生替换自适应码书激励的过渡模式激励,所述解码器设备包括输入端,用于接收码书索引;过渡模式码书,用于生成独立于以往激励的码矢量集合,所述过渡模式码书响应于所述索引,以在所述过渡帧和/或跟随所述过渡的帧中生成与所述过渡模式激励对应的集合的码矢量之一。38.如权利要求37中定义的解码器设备,其中,所述过渡模式码书包括独立于以往激励的固定码书。39.如权利要求37中定义的解码器设备,其中,以所述过渡帧和/或跟随所述过渡的帧中的过渡模式激励来替换所述自适应码书激励会减少万一帧擦除而在所述解码器设备处的误码传播,并且/或者会增加编码效率。40.如权利要求37中定义的解码器设备,其中,所述过渡模式码书包括声门脉沖形状的码书。41.如权利要求37中定义的解码器设备,其中,所述声音信号包括语音信号,并且其中,从包括包含浊音起始的帧和包含两个不同浊音声音之间的过渡的帧的群组中选择所述过渡帧。42.如权利要求37中定义的解码器设备,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,并且其中,在所述子帧的第一部分中使用所述过渡模式码书,并且所述解码器设备包括在所述子帧的第二部分中所使用的预测型码书。43.如权利要求37中定义的解码器设备,其中,所述过渡模式码书包括声门形状码书,其包括由在所述码矢量中的特定位置处放置的声门脉冲形状形成的码矢量。44.如权利要求43中定义的解码器设备,其中,所述声门形状码书包括预定数量的不同形状的声门脉沖,并且其中,每一形状的声门脉冲位于所述码矢量中的多个不同位置处,以形成所述声门形状码书的多个不同码矢量。45.如权利要求43中定义的解码器设备,其中,所述声门形状码书包括仅包含一个非零元素的码矢量的生成器;以及成形滤波器,其用于处理仅包含一个非零元素的码矢量,以产生表示以不同位置为中心的声门脉冲形状的码矢量。46.如权利要求45中定义的解码器设备,还包括放大器,其用于将增益施加到表示以不同位置为中心的声门脉冲形状的所述码矢量。47.如权利要求37中定义的解码器设备,还包括输入端,用于接收创新码书索引;创新码书,用于生成创新码矢量集合,所述创新码书响应于所述创新码的集合的创新码矢量之一;和所述过渡模式激励和所述创新激励的加法器,用于产生声音信号合成滤波器的全局激励。48.—种在预测型声音信号编解码器中使用的过渡模式方法,用于在所述过渡模式激励,所述过渡模式方法包括提供过渡模式码书,以用于生成独立于以往激励的码矢量集合;将码书索引供应给所述过渡模式码书;和通过所述过渡模式码书并且响应于所述码书索引,生成与所述过渡模式激励对应的集合的码矢量之一。49.如权利要求48中定义的过渡模式方法,其中,所述过渡模式码书包括独立于以往激励的固定码书。50.如权利要求48中定义的过渡模式方法,其中,所述预测型声音信号编解码器包括解码器,藉此,在操作中,在所述过渡帧和/或跟随所述过渡的帧中以过渡模式激励来替换所述自适应码书激励会减少万一帧擦除而在所述解码器处的误码传播,并且/或者会增加编码效率。51.如权利要求48中定义的过渡模式方法,其中,所述过渡模式码书包括声门脉沖形状的码书。52.如权利要求48中定义的过渡模式方法,其中,所述声音信号包括语音信号,并且其中,所述方法包括从包括包含浊音起始的帧和包含两个不曰同浊音声音之间的过渡的帧的群组中选择所述过渡帧。53.如权利要求48中定义的过渡模式方法,其中,所述过渡帧和/或跟随所述过渡的帧包括若干帧所跟随的过渡帧。54.如权利要求53中定义的过渡模式方法,其中,所述过渡帧和跟随所述过渡帧的若干帧是连续帧。55.如权利要求48中定义的过渡模式方法,其中,所述过渡帧和/或跟随所述过渡的帧包括至少一个跟随所述过渡的帧。56.如权利要求48中定义的过渡模式方法,其中,所述预测型编解码器是CELP型编解码器,并且所述方法包括在所述过渡帧和/或跟随所述过渡的帧中以所述过渡-漠式码书替换所述CELP型编解码器的自适应码书。57.如权利要求48中定义的过渡模式方法,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,并且所述方法包括在所述子帧的第一部分中使用所述过渡模式码书,并且在所述子帧的第二部分中使用所述预测型编解码器的预测型码书。58.如权利要求48中定义的过渡模式方法,其中,提供过渡模式码书包括提供声门形状码书,其包括由在所述码矢量中的特定位置处放置的声门脉冲形状形成的码矢量。59.如权利要求58中定义的过渡模式方法,其中,提供声门形状码书包括提供包括预定数量的不同形状的声门脉冲的声门形状码书,并且通过将每一形状的声门脉冲定位在所述码矢量中的多个不同位置处而在所述声门形状码书中形成多个不同码矢量。60.如权利要求58中定义的过渡模式方法,包括在所述声门形状码书中,生成仅包含一个非零元素的码矢量,并且通过成形滤波器处理仅包含一个非零元素的所述码矢量,以产生表示以不同位置为中心的声门脉冲形状的码矢量。61.如权利要求60中定义的过渡模式方法,其中,所述预测型声音信号编解码器包括编码器,其包括加权合成滤波器,所述方法还包括通过所述加权合成滤波器处理表示以不同位置为中心的声门脉沖形状的来自所述成形滤波器的所述码矢量。62.如权利要求60中定义的过渡模式方法,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,并且其中,生成所述码矢量之一包括当每子帧存在多于一个的声门脉冲时,在音调周期已经逝去之后,重复所述声门脉冲形状。63.如权利要求58中定义的过渡模式方法,其中,所述声门形状脉冲包括最前采样和最后釆样,所述方法包括截断预定数量的所述最前釆样和所述最后釆样。64.如权利要求60中定义的过渡模式方法,还包括将增益施加到表示以不同位置为中心的声门脉冲形状的所述码矢量。65.—种编码方法,用于在所述声音信号中的过渡帧和/或跟随所述过渡的帧中产生替换自适应码书激励的过渡模式激励,所述编码方法包括生成码书搜索目标信号;提供过渡模式码书,用于生成独立于以往激励的码矢量集合,所述集合的所述码矢量每个与各个过渡模式激励对应;搜索所述过渡模式码书,用于找寻与优化地对应于所述码书搜索目标信号的过渡模式激励对应的所述集合的码矢量。66.如权利要求65中定义的编码方法,其中,提供所述过渡模式码书包括提供独立于以往激励的固定码书。67.如权利要求65中定义的编码方法,其中,提供过渡模式码书包括提供声门脉沖形状的码书。68.如权利要求67中定义的编码方法,其中,搜索所述过渡模式码书包找寻与所述准则的最大值对应的集合的码矢量作为优化地对应于所述自适应码书搜索目标信号的码矢量。69.如权利要求68中定义的编码方法,其中,搜索所述过渡模式码书包括通过从包括以下项的群组中选择过渡模式参数来标识找到的码矢量过渡模式配置标识、声门脉沖形状、在找到的码矢量中的声门脉沖形状中心的位置、过渡模式增益、过渡模式增益的符号以及闭环音调周期。70.如权利要求65中定义的编码方法,其中,所述声音信号包括语音信号,并且所述方法还包括从包括包含浊音起始的帧和包含两个不同浊音声音之间的过渡的帧的群组中选择所述过渡帧。71.如权利要求65中定义的编码方法,其中,所述过渡帧和/或跟随所述过渡的帧包括若干帧所跟随的过渡帧。72.如权利要求71中定义的编码方法,其中,所述过渡帧和跟随所述过渡帧的若干帧是连续帧。73.如权利要求65中定义的编码方法,其中,所述过渡帧和/或跟随所述过渡的帧包括至少一个跟随所述过渡的帧。74.如权利要求65中定义的编码方法,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,并且其中,搜索所述过渡模式码书包括搜索所述子帧的第一部分中的所述过渡模式码书,并且搜索所述子帧的第二部分中的编码器设备的预测型码书。75.如权利要求65中定义的编码方法,其中,提供过渡模式码书包括提供声门形状码书,其包括由在所述码矢量中的特定位置处放置的声门脉沖形状形成的码矢量。76.如权利要求75中定义的编码方法,其中,提供声门形状码书包括提供包括预定数量的不同形状的声门脉沖的声门形状码书,并且通过将每一形状的声门脉冲定位在所述码矢量中的多个不同位置处而在所述声门形状码书中形成多个不同码矢量。77.如权利要求75中定义的编码方法,其中,在所述声门形状码书中生成独立于以往激励的码矢量集合包括生成仅包含一个非零元素的码矢量,并且通过成形滤波器处理所述仅包含一个非零元素的码矢量,以产生表示以不同位置为中心的声门脉冲形状的码矢量。78.如权利要求77中定义的编码方法,包括通过加权合成滤波器处理表示以不同位置为中心的声门脉冲形状的来自所述成形滤波器的所述码矢量。79.如权利要求77中定义的编码方法,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,并且其中,所述方法还包括当存在每子帧多于一个的声门脉沖时,在音调周期已经逝去之后,重复所述声门脉冲形状。80.如权利要求75中定义的编码方法,其中,所述声门形状脉冲包括最前采样和最后采样,所述方法包括;截断预定数量的所述最前采样和所述最后采样。81.如权利要求78中定义的编码方法,还包括将增益施加到表示以不同位置为中心的声门脉冲形状的所述码矢量。82.如权利要求65中定义的编码方法,还包括生成创新码书搜索目标信号;提供创新码书,以用于生成每个与各个创新激励对应的创新码矢量集合;搜索所述创新码书,用于找寻与优化地对应于所述创新码书搜索目标信号的创新激励对应的所述集合的创新码矢量;将所述过渡模式激励与所述创新激励相加,以产生声音信号合成滤波器的全局激励。83.如权利要求82中定义的编码方法,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,并且其中,取决于一个或多个声门脉冲在所述子帧中所处的位置,所述编码方法包括使用所述过渡模式码书、所述自适应码书以及所述创新码书中的至少一个对所述子帧进行编码。84.—种解码方法,用于在所述声音信号中的过渡帧和/或跟随所述过渡的帧中产生替换自适应码书激励的过渡模式激励,所述解码方法包括接收码书索引;将所述码书索引供应给过渡模式码书,以用于生成独立于以往激励的码矢量集合;通过所述过渡模式码书并且响应于所述码书索引,生成与所述过渡模式激励对应的集合的码矢量之一。85.如权利要求84中定义的解码方法,其中,所述过渡模式码书包括独立于以往激励的固定码书。86.如权利要求84中定义的解码方法,其中,以所述过渡帧和/或跟随所述过渡的帧中的过渡模式激励来替换所述自适应码书激励会减少万一帧擦除而在所述解码器设备处的误码传播,并且/或者会增加编码效率。87.如权利要求84中定义的解码方法,包括提供声门脉冲形状的码书作为所述过渡模式码书。88.如权利要求84中定义的解码方法,其中,所述声音信号包括语音信号,并且其中,所述方法包括从包括包含浊音起始的帧和包含两个不同浊音声音之间的过渡的帧的群组中选择所述过渡帧。89.如权利要求84中定义的解码方法,其中,所述过渡帧和/或跟随所述过渡的帧每个包括多个子帧,并且其中,所述方法包括在所述子帧的第一部分中使用所述过渡模式码书,并且在所述子帧的第二部分中使用预测型码书。90.如权利要求84中定义的解码方法,包括提供包括由i所述码矢量中的特定位置处放置的声门脉冲形状形成的码矢量的声门形状码书作为所述过渡模式码书。91.如权利要求90中定义的解码方法,其中,所述声门形状码书包括预定数量的不同形状的声门脉沖,并且其中,所述方法包括通过将每一形状的声门脉冲定位在所述码矢量中的多个不同位置处而形成所述声门形状码书的多个不同码矢量。92.如权利要求90中定义的解码方法,其中,由所述声门形状码书通过以下操作生成集合的码矢量生成仅包含一个非零元素的码矢量,并且通过成形滤波器处理所述仅包含一个非零元素的码矢量,以产生表示以不同位置为中心的声门脉冲形状的码矢量。93.如权利要求92中定义的解码方法,还包括将增益施加到表示以不同位置为中心的声门脉冲形状的所述码矢量。94.如权利要求84中定义的解码方法,还包括提供创新码书,以用于生成创新码矢量集合;将创新码书索引供应给所述创新码书;通过所述创新码书并且响应于所述创新码书索引,生成与所述创新激励对应的集合的创新码矢量之一;和将所述过渡模式激励与所述创新激励相加,以产生声音信号合成滤波器的全局激励。全文摘要提供一种在预测型声音信号编解码器中使用的过渡模式设备和方法,用于在所述声音信号中的过渡帧和/或跟随所述过渡的帧中产生替换自适应码书激励的过渡模式激励,包括输入端,用于接收码书索引;过渡模式码书,用于生成独立于以往激励的码矢量集合。所述过渡模式码书响应于所述索引,用于在所述过渡帧和跟随所述过渡的帧中生成与所述过渡模式激励对应的集合的码矢量之一。还提供一种使用上述过渡模式设备和方法的编码设备和方法以及解码设备和方法。文档编号G01L19/08GK101578508SQ200780048077公开日2009年11月11日申请日期2007年10月24日优先权日2006年10月24日发明者瓦克拉夫·艾克斯勒,米兰·杰利内克,雷德万·萨拉米申请人:沃伊斯亚吉公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1