Amr语音编码中lsp系数量化的快速码本搜索的方法

文档序号:2830745阅读:468来源:国知局
专利名称:Amr语音编码中lsp系数量化的快速码本搜索的方法
技术领域
本发明涉及移动通信技术领域,特别涉及语音编码技术领域,具体是指自适应多速率 (AMR)语音编码中LSP系数量化的快速码本搜索的方法。
背景技术
自适应多速率(AMR)语音编码是由3GPP制定的应用于第三代移动通信WCDMA系统 中的语音压缩编码。它以更加智能的方式解决信源和信道编码的速率分配问题。使得无线资 源的配备和利用更加和高效。它支持八种速率12.2kb/s, 10.2kb/s, 7.95 kb/s, 7.40 kb/s, 6.70 kb/s, 5.90kb/s, 5.15 kb/s和4.75 kb/s,此外,它还包括低速率(1.80 kb/s )的背景噪声编码 模式。
AMR语音编码采用的方案是代数码本激励线性预测(ACELP)技术,它是基于码本激 励线性预测(CELP)的技术。编码器输入为8kHz采样,16比特量化的线性PCM编码,编 码操作以20ms语音为一帧,即160个样点。发送端编码器提取ACELP模型参数进行传输, 接收端译码器再根据这些参数构成的激励信号合成出重建的语音信号。
AMR语音编码根据其实现功能大致可分为LPC分析、基音搜索、代数码本搜索三大部 分。其中LPC分析完成的主要功能是获得10阶LPC滤波器的10个系数,并将它们转化为 线谱对参数LSF,以及对LSF进行量化;基音搜索包括了开环基音分析和闭环基音分析两部 分,以获得基音延迟和基音增益这两个参数;代数码本搜索则是为了获得代数码本索引和代 数码本增益,还包括了对码本增益的量化。这里我们所讨论的是编码器中LSP系数的量化, 因此,对于编码器和译码器的其他部分不做过多的介绍。
线性预测分析在12.2 kb/s模式下每帧分析两次,得到了两组线性预测参数,在其他七种 模式下每帧分析一次,得到了 一组线性预测参数。线性预测参数在编码前都要转化为线谱对 参数,在12.2 kb/s模式下采用分裂矩阵量化法(SMQ, Split Matatrix Quantization)进行量化; 在其他七种模式下采用分裂矢量法(SVQ, Split Vector Quantization )进行量化。下面以12.2 kb/s 模式所采用的分裂矩阵量化法(SMQ)进行详细的介绍
分裂矩阵量化法(SMQ)的基本依据是每一个频率分量对幅度i普的影响仅限于各自的频率区域内。其基本思路是将特征矢量[/;,/2,...,_/;。]这个io维的矢量分成几个小矢量,然后分
别对每一个小矢量再进行矢量量化。具体量化过程介绍如下
首先,将每一帧得到的两组线谙对(LSP)参数用频率域(LSF)表示为
/ = larccos《,, / = 1,2,',、10 2;r
(1)
其中,/ e
Hz是线谱对频率,/、 = 8000Hz是采样频率,则LSF系数的矢量可表
示为fd^b;(')/2(')…y;(。')j, f(2) = b;(2)/2(2)'..y;(02)j。
其次,求出当前帧去掉均值后的LSF矢量和z(2)("):
1 10
(i)
,(2)
f(2)(")_,2)
1,2,…,10
(2)
其中,f,")和f,")是当前帧LSF矢量,/(1)和,(2)是当前帧LSF矢量的第/(/ = 1,2,...,10) 个值,这里矢量与均值的差是指矢量中的每一个值分别与均值相减后的值构成的一个新矢量。 然后,用一阶滑动平均(MA)预测法求出当前帧的LSF预测残差矢量rW(")和r^("):
! (')(")= Z(')(")-p(")
"2)(") = z(2)(")-p(")
(3)
其中,rW( ) = k(、(". .{J , r(2)( ) = k(2V2(".. .r/。2)j; —阶滑动平均(MA )预测式
"2) A(2)
p(") = 0.65r (n-l)是当前帧LSF矢量的预测值,这里的r ("-l)是前一帧量化后的第二个 LSF残差矢量。
接着,将上述计算所得的LSF残差矢量一(")和r^(w)组成的矩阵进行分裂,并进行矢量 量化。也就是将矩阵[r^07)rW("f (T表示矩阵转置)分裂为5个2><2 = 4个元素的子阵,这 5个子阵(子矢量)是按如下方式进行划分的第一个子阵为s一r = [r/1^(1、(2、(21,用 7比特进行量化;第二个子阵为^^r:[^V,^Vff,用8比特进行量化;第三个子阵为 w63r = [r5(l、(1、(2、(2)]",用8 +1比特(1比特是附加符号位)进行量化;第四个子阵为 wV^^W2)^)]7,用8比特进行量化;第五个子阵为s—r^^V^9(2、(。2)]1,用6比特进
行量化。这5个子阵的量化矢量^^,r称为重构矢量或量化码本。最后,分别将5个子阵(子矢量)与其量化矢量(重构矢量)r以欧氏距离作 为失真测度(使下式的加权误差最小),即
、W、
,("')
2广1
(4)
、("
其中,^V,是指第X/ = 1,2,3,4,5)个子阵(子矢量)的第= 1,2,3,4)个元素,w~ 。是
指第X/ = 1,2,3,4,5)个量化矢量表的第&(^ = 0,1,…,W) (N的取值对应于5个量化矢量,分别
为127, 255, 255, 255, 63 )个索引号的第/(z'= 1,2,3,4)个元素,w,("')(/= 1,2,…,10,w = 1或2
(子矢量的前两个元素对应于附=1,后两个元素对应于附=2 ))是加权LSP失真检测因子, 其表达式为
<formula>formula see original document page 6</formula>
其中,《W = yJ;') —yj) ( /)— = 0, = 4000 )。根据欧氏失真测度,通常采用全搜索 方法就可以找到失真最小的重构矢量,将其索引号A作为输出,完成LSF矢量的量化。这里,
以第一个子阵为例来说明量化过程将第一个子阵(子矢量)= [^Vj'V,Vff与《^ r (码 本中所有索引号的量化矢量的值)以式(4)作为失真测度进行计算(全搜索),求出失真最 小的量化矢量(重构矢量),将其索引号A用7比特编码作为量化输出。
从上面的分析可以看出,全搜索方法是性能最优的一种方法,当然也是复杂度最高的一 种方法。这里我们仍以第一个子阵的量化为例,来分析其计算复杂度。由(4)式可得,每计 算出一个五,需要4次加法和8次乘法。对于第一个子阵,其码本空间大小为127,即要计 算出127个五,也就是127x4- 508次加法和127x8二1016次乘法。虽然,目前数字信号处理 器(DSP)技术已经有了突飞猛进的发展,但在实时语音处理过程中,过多的使用全搜索的 方法仍然不是一个明智的选择。因此需要寻找在性能没有任何损失的情况下能降低计算复杂 度的方法。

发明内容
本发明的目的是克服了上述现有技术中的缺点,提供一种能够有效降低计算复杂度、提 高运算效率、算法筒单快捷、工作性能稳定可靠、适用范围较为广泛的AMR语音编码中LSP系数量化的快速码本:l叟索的方法。
为了实现上述的目的,本发明的AMR语音编码中LSP系数量化的快速码本搜索的方法 如下
为了便于描述,这里定义加权欧氏子距离为
<formula>formula see original document page 7</formula>
实际计算时,加权欧氏子距离采用下面的迭代公式:
<formula>formula see original document page 7</formula>
显然,£4=£,即当"=4日于,加权欧氏子距离即为最终的加权欧氏距离。 该AMR语音编码中LSP系数量化的快速码本搜索的方法,其主要特点是,所述的方法 包括以下步骤
(1 )初始化设置系统输出的量化码字索引号、当前最小欧氏距离及系统码本中的当前量 化码字索引号;
(2)将系统累加计数w设置为1;
(3 )系统在当前量化码字索引号下,根据语音信号中频率分量的特征矢量所分裂的子矢 量与当前量化码字索引号所对应的重构矢量进行加权欧氏子距离(系统累力口计数"=1)计算 处理,并将计算结果作为失真测度,与当前最小欧氏距离进行比较处理操作;
(4) 如果所述的加权欧氏子距离小于当前最小欧氏距离,则将系统累加计数w增加1, 并重复上述步骤(3),即根据语音信号中频率分量的特征矢量所分裂的子矢量与当前量化码 字索引号所对应的重构矢量进行加权欧氏子距离(系统累加计数"+ + )计算处理,并将计算 结果作为失真测度,与当前最小欧氏距离进行比较处理操作;
(5) 反之,则将当前量化码字索引号增加1,并重复上述步骤(2),即(系统累加计数 = 1 );
(6) 如果当系统累加计数 7 = 4时,加权欧氏子距离(即最终的加权欧氏距离)仍然小 于当前最小欧氏距离,则将系统中的当前最小欧氏距离设置为该加权欧氏距离,并将系统输 出的量化码字索引号设置为当前量化码字索.引号;
(7) 将当前量化码字索引号增加1,重复上述步骤(2),即(系统累加计数/7 = 1 ),直 到遍历完系统码本中全部量化码字。该AMR语音编码中LSP系数量化的快速码本搜索的方法中的初始化设置系统码本中的 当前量化码字索引号及当前最小欧氏距离,包括以下步骤 (11)设置系统输出的量化码字索引号为!力cfec = 0;
(12 )设置初始最小欧氏距离为系统在计算中所出现的最大值cfof—Am力=MAX; (13)设置当前量化码字索引号为A=0。 该AMR语音编码中LSP系数量化的快速码本搜索的方法中的进行加权欧氏子距离计算 处理操作,并将计算结果作为失真测度,包括以下步骤
(21 )才艮据公式(7 )计算加权欧氏子距离& ,并将该式改写为下式
其中,+ =为当前的值与前一个《_,进行累加运算符,为第 > 个子矢量的第f个元
素,7 = 1,2,3,4,5, / = 1,2,3,4, 《,为第j'个子矢量的第A个索引号的第/个元素, yt二0,l,…,W, w,)为加权LSP失真检测因子,/ = 1,2,.",10,附=1或2,其表达式为
其中,《("')=_ 乂,) ( /。("') = o, y;(「') = 40oo;
(22 )将所得到的加权欧氏子距离《作为失真测度,并与所述的当前最小欧氏距离进行
比较;
(23) 如果加权欧氏子距离小于当前最小欧氏距离,则返回加权欧氏子距离小于当前最 小欧氏距离的结果;
(24) 如果加权欧氏子距离大于等于当前最小欧氏距离,则返回加权欧氏子距离大于等 于当前最小欧氏距离的结果。
该AMR语音编码中LSP系数量化的快速码本搜索的方法中的N的取值分别为127、 255 、 255、 255、 63。
该AMR语音编码中LSP系数量化的快速码本搜索的方法中的w-l对应于子矢量的前两 个元素,附=2对应于子矢量的后两个元素。
采用了该发明的AMR语音编码中LSP系数量化的快速码本搜索的方法,由于在计算加
= l,-'.,4;
()< 450权欧氏距离的过程中,每次计算加权和后均进行判断,从而避免了大量的不必要的冗余计算, 并在没有任何性能损失的前提下,降低了计算复杂度,提高了系统的执行效率,较好地满足 了实时语音处理的性能和效率需要,同时工作性能稳定可靠,适用范围较为广泛,为AMR 技术应用于第三代移动通信中奠定了坚实的基础。


图1为本发明的AMR语音编码中LSP系数量化的快速码本搜索的方法的工作流程图。
具体实施例方式
为了能够更清楚地理解本发明的技术内容,特举以下实施例详细说明。 请参阅图l所示,该AMR语音编码中LSP系数量化的快速码本搜索的方法,其中包括 以下步骤
(1 )初始化设置系统输出的量化码字索引号、当前最小欧氏距离及系统码本中的当前量 化码字索引号,包括以下步骤
(a)设置系统输出的量化码字索引号为/wcfec = 0;
(b )设置初始最小欧氏距离为系统在计算中所出现的最大值cfcf一附/w = MAX; (c)设置当前量化码字索引号为/t = 0; (2 )将系统累加计数w设置为1;
(3)系统在当前量化码字索引号下,根据语音信号中频率分量的特征矢量所分裂的子矢 量与当前量化码字索引号所对应的重构矢量进行加权欧氏子距离(系统累加计数"=1 )计算 处理,并将计算结果作为失真测度,与当前最小欧氏距离进行比较处理操作,包括以下步骤 (a)根据以下公式计算加权欧氏子距离《
五0=0:
^2 j-1
"=1,.",4;
其中,+ =为当前的值与前一个£二进行累加运算符,w^r,为第7个子矢量的第/个
元素,7 = 1,2,3,4,5 , / = 1,2,3,4, 为第)个子矢量的第A个索引号的第/个元
素,A = 0,l,",iV, N的取值分别为127、 255、 255、 255、 63, 为加权LSP失真 ;险测因子,/ = 1,2,...,10, w= 1或2,其中附=1对应于子矢量的前两个元素,附=2对应于子矢量的后两个元素,其表达式为
3.347-^^", ,)<450
(m) j 450 ' '
w〉 ' = "j
L8 — !(《W—450),其它 . 1050、' "
其中,t/,("') = 一 ( = o , = 4000 ;
(b) 将所得到的加权欧氏子距离《作为失真测度,并与所述的当前最小欧氏距离进 行比较;
(c) 如果加权欧氏子距离小于当前最小欧氏距离,则返回加权欧氏距离小于当前最 小欧氏距离的结果;
(d) 如果加权欧氏子距离大于等于当前最小欧氏距离,则返回加权欧氏距离大于等 于当前最小欧氏距离的结果;
(4) 如果所述的加权欧氏子距离小于当前最小欧氏距离,则将系统累加计数"增加1, 并重复上述步骤(3),即根据语音信号中频率分量的特征矢量所分裂的子矢量与当前量化码 字索引号所对应的重构矢量进行加权欧氏子距离(系统累加计数"+ + )计算处理,并将计算 结果作为失真测度,与当前最小欧氏距离进行比较处理操作;
(5) 反之,则将当前量化码字索引号增加1,并重复上述步骤(2),即(系统累加计数 w = l );
(6 )如果语音信号中频率分量的特征矢量所分裂的子矢量与当前量化码字索引号所对应 的重构矢量进行了加权欧氏距离计算处理后得到的加权欧氏距离(系统累加计数"=4 )仍然 小于当前最小欧氏距离,则将系统中的当前最小欧氏距离设置为该加权欧氏距离,并将系统 输出的量化码字索51号设置为当前量化码字索引号;
(7 )将当前量化码字索? 1号增加1,重复上述步骤(2 ),即(系统累加计数"=1 ),直 到遍历完系统码本中全部量化码字。
在实际使用当中,本发明的AMR语音编码中LSP系数量化的快速码本搜的方法的基本 原理和思想如下
考察上述公式(4),其中的£是由四个数的平方和组成,即每一项都是非负数,这一点 为我们提供了简化计算的可能。假设当前最小的欧氏距离失真测度为£、其索引号为〖,现 在进行,在计算£时,进行三次求和运算,从而可以在每次求和运算之前,先进行判断,如 果当前值已经大于五、则不再进行余下的运算。
下面以12.2kb/s模式SMQ第一个子阵的量化为例进行说明。这里,码本共包含128个码字,即码本空间大小为128,每个码字的索引号为& = 127, 每个码字为4维矢量。
首先设置初始量化码字索引号/mfec = 0,设置初始最小欧氏距离为计算中可能出现的 最大值在rt,二MI。然后从索引号* = 0开始,进行码本搜索。因为码字为4维矢量,因此
在对每个序号的码本进行欧氏距离的计算过程中,需要进行三次求和运算,从而可以采用上 述的快速码本搜索方法来减少运算量。
在每次求和计算之后,和当前的最小距离cZ/w,做比较。如果该值tfor已经大于^^^ ,
则该码字显然不是我们用来量化所需要的码字,就进行下一个码字的计算。如果求和计算所 得值"/W仍小于dWmm ,则继续进行之后的求和运算,并不断的与进行比较。
如果所有三次求和运算完成后,该值仍小于ifefrain ,则把把该值赋给fifafmin , cfofmin = cfcf ,并把当前的索引号赋给/wfec, /mfec = A:。接着用同样的方法进行下一个码字 的计算。
采用了上述的AMR语音编码中LSP系数量化的快速码本搜索的方法,由于在计算加权 欧氏距离的过程中,每次计算加权和后均进行判断,从而避免了大量的不必要的冗余计算, 并在没有任何性能损失的前提下,降低了计算复杂度,提高了系统的执行效率,较好地满足 了实时语音处理的性能和效率需要,同时工作性能稳定可靠,适用范围较为广泛,为AMR 技术应用于第三代移动通信中奠定了坚实的基础。
在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种 修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限 制性的。
权利要求
1、一种AMR语音编码中LSP系数量化的快速码本搜索的方法,其特征在于,所述的方法包括以下步骤(1)初始化设置系统输出的量化码字索引号、当前最小欧氏距离及系统码本中的当前量化码字索引号;(2)将系统累加计数设置为1;(3)系统在当前量化码字索引号下,根据语音信号中频率分量的特征矢量所分裂的子矢量与当前量化码字索引号所对应的重构矢量进行加权欧氏子距离计算处理,并将计算结果作为失真测度,与当前最小欧氏距离进行比较处理操作;(4)如果所述的加权欧氏子距离小于当前最小欧氏距离,则将系统累加计数增加1,并重复上述步骤(3),即根据语音信号中频率分量的特征矢量所分裂的子矢量与当前量化码字索引号所对应的重构矢量进行加权欧氏子距离计算处理,并将计算结果作为失真测度,与当前最小欧氏距离进行比较处理操作;(5)反之,则将当前量化码字索引号增加1,并重复上述步骤(2);(6)如果当系统累加计数为4时,加权欧氏子距离仍然小于当前最小欧氏距离,则将系统中的当前最小欧氏距离设置为该加权欧氏距离,并将系统输出的量化码字索引号设置为当前量化码字索引号;(7)将当前量化码字索引号增加1,重复上述步骤(2),直到遍历完系统码本中全部量化码字。
2、 根据权利要求1所述的AMR语音编码中LSP系数量化的快速码本搜索的方法,其特 征在于,所述的初始化设置系统码本中的当前量化码字索引号及当前最小欧氏距离,包括以 下步骤(11 )设置系统输出的量化码字索引号为z> fec = 0;(12) 设置初始最小欧氏距离为系统在计算中所出现的最大值tfcrjw7^MAX;(13) 设置当前量化码字索引号为A:=0。
3、 根据权利要求2所述的AMR语音编码中LSP系数量化的快速码本搜索的方法,其特 征在于,所述的进行加权欧氏子距离计算处理并进行失真测度比较处理操作,包括以下步骤(21 )根据以下公式计算加权欧氏子距离《£0=0;其中,+ =为当前的值与前一个《_,进行累加运算符,为第y个子矢量的第/个元AW素,y = l,2,3,4,5, / = 1,2,3,4, w/^,为第j'个子矢量的第A:个索引号的第/个元素, A = 0,1,.'、W, w")为加权LSP失真检测因子,f = l,2,...,10,附=1或2,其表达式为,3.347-^^,("'), 450其中,",('")=/S')—A) ( /0W = o, =棚;(22 )将所得到的加权欧氏子距离《作为失真测度,并与所述的当前最小欧氏距离进行比较;(23) 如果加权欧氏子距离小于当前最小欧氏距离,则返回加权欧氏子距离小于当前最 小欧氏距离的结果;(24) 如果加权欧氏距离大于等于当前最小欧氏距离,则返回加权欧氏子距离大于等于 当前最小欧氏距离的结果。
4、 根据权利要求3所述的AMR语音编码中LSP系数量化的快速码本搜索的方法,其特 征在于,所述的N的取值分别为127、 255、 255、 255、 63。
5、 根据权利要求3所述的AMR语音编码中LSP系数量化的快速码本搜索的方法,其特 征在于,所述的附=1对应于子矢量的前两个元素,/ = 2对应于子矢量的后两个元素。
全文摘要
本发明涉及一种AMR语音编码中LSP系数量化的快速码本搜索的方法,包括在以加权欧氏距离作为失真测度的计算过程中,其中间结果不断的与已有最小距离做比较,如果这个结果已经大于该最小距离,则可终止对该码字距离的继续计算,从而可以尽快地筛选掉那些已经不符合要求的码字。采用该种AMR语音编码中LSP系数量化的快速码本搜索的方法,在计算加权欧氏距离时每次计算加权和后均进行判断,从而避免了大量的不必要的冗余计算,在没有任何性能损失的前提下,降低了计算复杂度,提高了系统的执行效率,较好地满足了实时语音处理的性能和效率需要,同时工作性能稳定可靠,适用范围较为广泛,为AMR技术应用于第三代移动通信中奠定了坚实的基础。
文档编号G10L19/14GK101630510SQ200810040720
公开日2010年1月20日 申请日期2008年7月18日 优先权日2008年7月18日
发明者薛奕冰, 许大山 申请人:上海摩波彼克半导体有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1