增强的amr编码器快速固定码本搜索方法

文档序号：2822390阅读：175来源：国知局

专利名称：增强的amr编码器快速固定码本搜索方法
技术领域：
本发明涉及移动通信领域，具体涉及3GPP中增强的AMR编码器快速固定码本搜索方法。
背景技术：
已经被3GPP吸收为标准的自适应多速率语音编码(AMR)主要应用于未来WCDMA移动通信系统中。编码器可支持八种源编码速率，从而按照当前信道的条件更智能的分配信源编码和信道编码的所占比例。因此，有限的无线网络资源得到更加有效合理的利用。
AMR编码采用了代数码激励线性预测(ACELP)模型。在8000Hz的采样速率下，编码器对20毫秒160个采样点的语音帧进行处理，提取代数码本线性激励预测模式的参数(LP滤波器的参数，自适应和固定码本的索引和增益)，对参数进行编码并传送。在接收端，解码参数，并由相应的参数构建LP合成滤波器来合成语音信号。
然而，代数码本搜索却占整个编码过程40％计算量，直接影响AMR语音编码效率。尽管标准中使用的深度优先码本搜索方法既简单又有效，但它的计算量仍然很大。现今，大量研究工作仍着重于码本搜索算法设计和DSP实现。脉冲替代算法虽然可以大大的减少计算复杂度。然而，脉冲替代算法是一个非最优算法，若初始码本找得不准，就得不出较优的搜索码本。因此，在与AMR标准上搜索算法性能基本一样前提下，一个可极大减少计算复杂性的快速码本搜索算法就具有极高的战略意义。

发明内容
(一)要解决的技术问题本发明的目的是提供一种有效的、且能极大减少计算量的增强的AMR编码器快速固定码本搜索方法。
(二)技术方案为达到上述目的，本发明有以下步骤1)首先定义一个相邻语音帧的相关性系数的门限值，这个门限值为语音帧码本的搜索提供基准；2)对每个子帧都要计算它与前一子帧的相关系数，然后与步骤1)所述的门限值进行比较；3)对于步骤2)中比较的结果，如果大于步骤1)所述的门限值，那么就采用改进的脉冲替代算法；如果小于步骤1)所述的门限值，就采用AMR标准中建议的深度优先树算法。
其中，相关系数为当前子帧与前一子帧的固定码本相关度，其数学表达式为δ=Σn=140x2f(n)x2(n)Σn=140[x2f(n)]2×Σn=140[x2(n)]2]]>上式中，x2f为前一子帧的固定码本搜索目标信号，x2为当前子帧的固定码本搜索目标的信号。
其中，所述改进的脉冲替代算法包括步骤第一步是选取初始化码本矢量，即调用上一子帧的最佳码本结果作为初始化码本；第二步是脉冲替代过程，需要计算每个脉冲在码本矢量中的贡献，每次替换码本矢量中贡献最小的脉冲。
(三)有益效果由于采用以上技术方案，本发明与已有技术相比，在保证提供和现有技术相当的编码质量和效果的前提下，其码本搜索的运算量减小为原算法的50％-70％。
1)语音信号处理的运算量减少可以简化搜索程序，降低编码器总的实现复杂度，从而降低移动通信设备成本和功耗。
2)运算量的减少加快码本的搜索过程，从而降低了编码时延。在语音通信中，对语音信号的端到端传输有很强的实时要求，语音编解码器所产生的编码时延是重要的影响因素之一，而其中的固定码本搜索算法所引入的时延又是编码时延的主要部分。因此，通过改进码本搜索算法而降低编码时延，对保证移动通信的语音质量具有进步作用。

图1是本发明相邻语音子帧之间相关系数的概率分布图；图2是本发明所提方法与AMR标准中建议的深度优先树算法比较示意图。
图中correlation coefficient、相关系数；probability density、概率分布；pulse replacement times、脉冲替代次数；computationlaod、计算量；standardlized algorithm、AMR标准中算法；ourproposed method、本发明所提方法。
具体实施例方式
以下实施例用于说明本发明，但不用来限制本发明的范围。
为了充分公开本发明的内容，在介绍本发明的具体实施方法之前，首先介绍码本搜索原理。
在AMR标准中，搜索最佳固定码本的目标是使得输入语音信号和合成语音信号的均方误差最小。均方误差定义为εk＝‖x2-gHck‖2，其中x2为固定码本搜索目标信号(等同于自适应码本目标信号减去自适应码本贡献)，H是由感知加权合成滤波器脉冲响应h(n)生成的下三角托普利兹卷积矩阵，g为码本增益，ck为序号为k的固定码本矢量。码本矢量是一个40维，每个脉冲幅度为+1或-1的向量。
基于理论分析，寻求最佳码本矢量的过程，也就是寻找Qk=(Ck)2Ek=(dTck)2ckTφck]]>的最大值的过程，这等同于求εk的最小值。其中，d是目标信号x2(n)和感知加权滤波器脉冲响应h(n)的进行相关运算得到的矢量，而φ是h(n)的自相关矩阵。由于在码本矢量ck中只有一部分是非零脉冲，在标准中推荐使用深度优先树算法作为快速码本搜索的算法。定义b(n)为归一化了的矢量d(n)和长时预测残差信号resLTP(n)的和，表达式如下b(n)=resLTP(n)Σi=0i=39resLTP(i)resLTP(i)+d(n)Σi=0i=39d(i)d(i)]]>为了简单起见，我们以12.2kb/s速率模式的码本搜索为例，其它速率模式类似。当码本速率为12.2kb/s时，每个码本矢量包含有10个非零脉冲。这些非零脉冲在矢量中的位置可以划分成5个轨道，每个轨道中包括两个非零脉冲。码本的结构如表1所示。
表1 12.2kb/s模式下的代数码本结构

AMR标准中建议的深度优先树算法包括两个阶段。第一阶段是搜索每个轨道上的所有位置，找出每个轨道的b(n)局部最大值及其对应的位置，从5个局部最大值中选出全局最大值，其脉冲位置作为i0。第二阶段是将脉冲i1的位置设置为其余四个局部最大值的一个，重复此操作4次以保证四个局部最大值都被取到。每次设置完i1后，将其他脉冲位置成对的、按顺序的在嵌套循环中搜出，即分别对应{i2，i3}，{i4，i5}，{i6，i7}和{i8，i9}。最后得出i1在四个不同位置的四个码本，通过对他们的比较，从中得出最优的固定码本。
所述脉冲替代算法就是计算每个脉冲的贡献并替换掉贡献最少的一个脉冲。在此方法中，首先选定一个初始码本，然后把每非零脉冲置为每个轨道的局部最优位置，接着执行脉冲替代算法。每一步，首先选出的是贡献最少的脉冲，并用同一轨道中其他的贡献大的脉冲位子进行替代。直到新的搜索码本与迭代前相同，迭代过程结束。
下面对本发明的具体实施方法进行说明。
在通常情况下，由于语音信号的变化具有一定的连续性，因此两个相邻语音帧的相关性很强，相关系数可能会很大。一个语音帧由四个语音子帧组成，所以对于相邻的语音子帧也可以得到类似的结论。这样的话，我们在进行当前语音帧的码本搜索时，可以利用上一子帧的最优码本结果，从而降低搜索算法的复杂度。然而，有时语音信号会发生急剧变化，此时相邻子帧之间的相关性就比较小。在这种情况下，仍然使用AMR标准中建议的深度优先树算法。
鉴于以上分析，本发明的码本搜索方法描述如下首先定义一个相关性系数的门限；对每个子帧都要计算一次它与前一子帧的相关性系数，然后与这个门限值相比较；如果大于定义的门限值，那么就采用改进的脉冲替代算法；否则，就采用AMR标准中建议的深度优先树算法。
设x2f为前一子帧的固定码本搜索目标信号，x2为当前子帧的固定码本搜索目标信号，则定义当前子帧与前一子帧的固定码本相关度为δ=Σn=140x2f(n)x2(n)Σn=140[x2f(n)]2×Σn=140[x2(n)]2]]>δ的值越大，说明相邻子帧的相关性越大，两子帧对应的最佳固定码本越类似。在这种情况下，当前帧的码本搜索可以利用前一帧的码本搜索结果。因此，我们定义一个δ0，并且δ0的值是由通过大量的统计数据得到的。如果δ＜δ0，仍采用AMR标准中建议的深度优先树算法；否则，当前子帧采用脉冲替换算法进行最佳码本搜索，码本初始值为上一帧的最佳固定码本。
门限值δ0的确定是建立在对大量语音数据的测试基础上的，我们将AMR标准自带的22个语音文件作为测试数据。
首先，采用AMR标准中给出的搜索算法得到语音文件中每个语音子帧的码本搜索结果。然后使用我们提出的码本搜索算法先设定δ0的值为一个较小值，搜索出这些语音文件的每个语音子帧的码本矢量，并将此矢量与采用标准算法得到的结果进行比较，统计两种算法得到的码本矢量相同的子帧数量，将其数量总值与22个语音文件中所有子帧的数量之比作为我们算法的准确率。如果准确率小于90％，则认为准确率太低，以某一步长增大δ0，采用我们提出的算法重新进行码本搜索，将搜索结果与标准算法的结果进行比较得到新的准确率，直到准确率达到90％以上，停止循环，确定当前δ0为需要的门限值。
在我们搜索δ0的过程中，我们选的初始值为0.4，步长为0.05，最后搜索得到的门限值为0.6，此时我们的算法准确率达到了90％以上，取得了与标准算法相当的通信效果。实际中，依据具体环境下语音数据的特点和对通信质量的要求，对此门限值进行动态的调整。
下面以AMR 12.2kb/s编码模式为例说明本发明的方法。具体码本搜索步骤如下(1)计算当前子帧与前一子帧的相关性系数δ，并与门限值δ0进行比较，如果δ＞δ0，执行步骤(2)；如果δ＜δ0，执行步骤(3)；(2)对当前子帧的码本搜索采用AMR标准中建议的深度优先树算法。
(3)采用改进的脉冲替代算法对此语音子帧进行码本搜索。
改进的脉冲替代算法的第一步是选取初始化码本矢量，我们调用上一子帧的最佳码本结果作为初始化码本。第二步是脉冲替代过程，需要计算每个脉冲在码本矢量中的贡献，每次替换码本矢量中贡献最小的脉冲。脉冲替代步骤如下(a)假设将第m个脉冲舍去后，其余脉冲的总贡献为Qk，m，Qk，m可通过Qk的表达式求出。那么此脉冲的贡献越小，Qk，m的值反而越大。因此对于有10个非零脉冲的码本(i0，i1，i2，i3，i4，i5，i6，i7，i8，i9)，计算出10个Qk，m值，令其中Qk，m的最大值为Qk，m0，则第m0个脉冲的贡献最小，将其用此轨道上的其他位置进行替换。
(b)计算此轨道上所有可用的位置进行替换后得到的Qk，找出最大的Qk值并将其对应的位置设为m0的新位置。这样得到了新的码本失量且Qk可以稳步的增大。然后转向步骤(a)，再次进行替换迭代。如果不存在比原来大的Qk，则终止脉冲替换程序，此码本矢量即为所求的最佳码本。
下面结合附图对本发明的效果进行对比分析。
在这部分中，我们将对比AMR标准中建议的深度优先树算法和本发明所提出方法的计算复杂度。假定仅考虑一个子帧的代数码本搜索的计算复杂度。分析码速率为12.2kb/s的编码模式，其它速率具有相同的结论。
当采用AMR标准中建议的深度优先树算法时，对于每一个语音子帧，如果i0给定，i1可以有四种不同的选择。如果i0和i1同时给定，四个脉冲对(i2，i3)，(i4，i5)，(i6，i7)，(i8，i9)将以嵌套的形式进行成对搜索，因此运算量为(8×8)×4＝256。再加上i1的四种不同取值，总计运算量为256×4＝1024。
按照本发明所提出的码本搜索方法，每个子帧可以任意选择两种算法。采用改进的脉冲替代算法时，由于我们的初始化码本矢量是给定的，因此运算量体现在脉冲的替代过程中。每替代一个脉冲，需要的计算量为(10+10)，假设需要进行N次替代，则总计算量为(10+10)×N＝20N。一般来说，N的取值不会太大，因此运算量要比标准算法的运算量小很多。假设δ＞δ0的概率为p，则一个子帧内固定码本搜索的运算量为1024(1-p)+p×20N。显然，运算量的大小会随着p和N值变化而变化。表2中对标准算法和我们所提算法复杂度的比较进行了描述。
表2 当N＝30时算法复杂度比较

注意当δ的值比较小的时候，如果下一个子帧的码本被选作初始码本的话，在使用脉冲替代算法后，码本搜索的结果可能不是最优的。经过对大量的语音信号进行测试后，我们发现当δ大于0.6时，改进的脉冲替代算法和AMR标准算法的性能几乎相同。因此，当把δ的值设为0.6时，本发明所提出的码本搜索方法就能提供和AMR标准算法相同的性能了。
同时，我们从大量语音信号中得到了相邻子帧之间相关系数的统计数据。基于这个统计数据，我们可以得到相关系数δ的概率分布，如图1所示。
由于p定义为δ＞δ0的概率，我们可以得到它的表达式p=&Integral;δ>δof(δ)dδ.]]>因此，根据δ的概率分布，当δ0＝0.6时，p＝0.66。这样就可以保证我们算法的计算量-1024(1-p)+p×20N可以得到很好的性能。基于大量的实验可以知道，N的值通常不会大于40。图2给出了在这种情况下本发明的方法和AMR标准算法的计算量的比较。很显然，本发明提出方法的计算量要远小于AMR标准算法，其计算量减小为AMR标准算法50％-70％。当采用其它速率的编码模式时也可以得到类似的结论。
权利要求
1.一种增强的AMR编码器快速固定码本搜索方法，其特征在于，有以下步骤1)、首先定义一个相邻语音帧的相关系数的门限值，这个门限值为语音帧码本的搜索提供基准；2)、对每个子帧都要计算它与前一子帧的相关性系数，然后与步骤1)所述的门限值进行比较；3)、对于步骤2)中比较的结果，如果大于步骤1)所述的门限值，那么就采用改进的脉冲替代算法；如果小于步骤1)所述的门限值，就采用AMR标准中建议的深度优先树算法。
2.如权利要求1所述的一种增强的AMR编码器快速固定码本搜索方法，其特征在于相关系数为当前子帧与前一子帧的固定码本相关度，其数学表达式为δ=Σn=140x2f(n)x2(n)Σn=140[x2f(n)]2×Σn=140[x2(n)]2]]>其中，x2f为前一子帧的固定码本搜索目标信号，x2为当前子帧的固定码本搜索目标的信号。
3.如权利要求1所述的一种增强的AMR编码器快速固定码本搜索方法，其特征在于，所述改进的脉冲替代算法包括步骤第一步是选取初始化码本矢量，即调用上一子帧的最佳码本结果作为初始化码本；第二步是脉冲替代过程，需要计算每个脉冲在码本矢量中的贡献，每次替换码本矢量中贡献最小的脉冲。
全文摘要
本发明涉及移动通信领域。本发明公开的增强的AMR编码器快速固定码本搜索方法包括1)首先定义一个相邻语音帧的相关性系数的门限值，为语音帧码本的搜索提供基准；2)对每个子帧都要计算它与前一子帧的相关系数，然后与步骤1)所述的门限值进行比较；3)对于步骤2)中比较的结果，如果大于步骤1)所述的门限值，那么就采用改进的脉冲替代算法；如果小于步骤1)所述的门限值，就采用AMR标准中建议的深度优先树算法。
文档编号G10L19/00GK1760975SQ20051008674
公开日2006年4月19日申请日期2005年10月31日优先权日2005年10月31日
发明者郭群峰, 张翼飞, 王鑫娜, 郭更生, 王民申请人:连展科技(天津)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭群峰;张翼飞;王鑫娜;郭更生;王民
技术所有人：连展科技(天津)有限公司
我是此专利的发明人