一种代数码本的搜索方法、装置及语音编码器的制作方法

文档序号：2829453阅读：233来源：国知局

专利名称：一种代数码本的搜索方法、装置及语音编码器的制作方法
技术领域：
本发明属于语音编码领域，尤其涉及语音编码中代数码本的搜索方法、装置以及语音编码器。

背景技术：
语音编码是压缩语音信号的数字表示而使表达这些信号所需的比特需求最小的算法，目前主要分为波形编码、参数编码和混合编码三类。波形编码具有适应能力强、话音质量高等优点，但所需要的比特率较高。参数编码的比特率一般很低，但其编码质量较差，合成出的语音自然度较低。混合编码克服了波形编码和参数编码的缺点，同时又结合了两者的长处，在4-16kb/s速率上可以得到高质量的合成语音。代数码激励线性预测(Algebraic Code-excited LinearPrediction，ACELP)语音编码作为一种混合语音编码方法，在国际电信联盟(International Telecommunications Union，ITU)的许多语音编码标准如G.722.2、G.723.1、G.729等中得到了应用。
随机激励信号是码激励线性预测(Code-excited Linear Prediction，CELP)语音编码模型的一个主要组成部分。ACELP语音编码算法采用一个包含若干非零脉冲的随机码矢量来描述随机激励信号。非零脉冲的幅度只能是+1或-1，其位置由代数码本进行描述。代数码本中存放的是随机激励矢量非零脉冲可能出现的位置。当编码速率小于8kb/s时，ACELP语音编码算法通常采用代数多子码本结构，每个子码本的不同之处在于码本中非零脉冲可能出现的位置不同。综合权衡比特数与编码质量，每个代数子码本通常包含4个轨道，每个轨道存放某一个或几个非零脉冲可能出现的位置。一个子码本的具体形式如下表所示，其中，每个子码本都有2种模式，占用1个比特，每个子码本包含4个轨道，即表中m0、m1、m2、m3可能出现的位置，在低速率条件下，每个轨道一般占用3-4比特，即有8或16个候选位置。
在大多数ACELP语音编码算法中，代数码本多采用全搜索算法，即遍历4个轨道中所有的位置组合，使得通过随机码矢量所合成的语音质量最高。如图1所示，在编码中，由基音周期选择某一个子码本，每个码本包含4个轨道，循环控制4个轨道中四个脉冲的位置，将四个脉冲相加后得到随机激励矢量，将随机激励矢量输入到感觉加权滤波器得到感觉加权的合成语音信号，根据使残差目标矢量与合成语音信号的加权误差最小的原则选取四个脉冲位置，即使下式e最大可求得四个脉冲位置，至此得到由基音周期选择的某个代数子码本索引im
式中，r(i)，i＝0，1，…，Nc-1为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，残差目标矢量x′0为加权输入语音减去感觉加权合成滤波器的零输入响应与自适应码本贡献后的矢量，_(i，j)，i，j＝0，1，…，Nc-1为h(n)的协方差矩阵；Nc为随机激励矢量中非零脉冲的个数；mi为非零脉冲可能出现的位置；si，脉冲幅度，这里只能为+1或-1。
感觉加权合成滤波器的表达式如下其中，αi为线性预测系数、γ为展宽因子，通常为0.8～0.9之间，p为滤波器阶数。
由于代数码本全搜索的时间复杂度与代数码本所占用的比特数成指数关系，当代数码本所占用的比特数增加时，代数码本全搜索算法的复杂度会迅速增加并导致语音编码算法难以实时实现，从而影响算法的应用价值。

发明内容
本发明的目的在于提供一种代数码本的搜索方法，旨在解决现有技术中存在的代数码本全搜索的时间复杂度较高，当代数码本所占用的比特数增加时，导致语音编码算法难以实时实现，从而影响算法的应用价值的问题。
本发明的另一目的在于提供一种代数码本的搜索装置。
本发明的另一目的在于提供一种语音编码器。
本发明是这样实现的，一种代数码本的搜索方法，其中，每个代数码本包含多个子码本，每个子码本包含多个轨道，每个轨道存放一个或者多个非零脉冲可能出现的位置，所述方法包括 A.将每个子码本所包含的多个轨道分解为多条路径，所述多条路径组成待搜索路径组，每条路径包含多个非零脉冲可能出现的位置； B.根据非零脉冲在路径中的轨道位置确定所述待搜索路径组中各条路径的最优索引； C.从所述待搜索路径组中选取固定路径和至少一条动态路径，对所有固定路径和动态路径组合循环搜索，获取动态路径对应的最优代数子码本索引，并将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引。
所述路径的最优索引为满足以下条件的路径索引其中，Ix为路径x的最优索引，p(j)为对应于索引j的轨道位置，r′(n)为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，sx为路径x的非零脉冲幅度，为+1或者-1。
所述动态路径对应的最优代数子码本索引为在对所有固定路径和动态路径组合进行循环搜索过程中，使下式e最大的代数码本索引im
其中，r′(i)，i＝0，1，…，Nc-1为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，_(i，j)，i，j＝0，1，…，Nc-1为h(n)的协方差矩阵，Nc为随机激励矢量中非零脉冲的个数，mi为动态路径中非零脉冲可能出现的位置，si为脉冲幅度。
在对轨道进行分解时，根据轨道长度将一个轨道分解为一条或者两条路径。
当一个轨道分解为两条路径时，所述轨道中的偶数项位置为一条路径，奇数项位置为一条路径。
在将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引时，当一个轨道只含有1条路径时，路径索引即为轨道索引；当一个轨道含有2条路径时，由下式将路径索引转换为轨道索引
其中，ci为轨道i的索引，Ii为路径i的索引，a路径为轨道的偶数项，b路径为轨道的奇数项。
一种代数码本的搜索装置，其中，每个代数码本包含多个子码本，每个子码本包含多个轨道，每个轨道存放一个或者多个非零脉冲可能出现的位置，所述装置包括轨道路径分解模块，用于将每个子码本所包含的多个轨道分解为多条路径，所述多条路径组成待搜索路径组，每条路径包含多个非零脉冲可能出现的位置；最优索引搜索模块，用于根据非零脉冲在路径中的轨道位置确定所述待搜索路径组中各条路径的最优索引；以及路径循环搜索模块，用于从所述待搜索路径组中选取固定路径和至少一条动态路径，对所有固定路径和动态路径组合循环搜索，获取动态路径对应的最优代数子码本索引，并将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引。
所述路径的最优索引为满足以下条件的路径索引其中，Ix为路径x的最优索引，p(j)为对应于索引j的轨道位置，r′(n)为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，sx为路径x的非零脉冲幅度，为+1或者-1。
所述动态路径对应的最优代数子码本索引为在对所有固定路径和动态路径组合进行循环搜索过程中，使下式e最大的代数码本索引im:
其中，r′(i)，i＝0，1，…，Nc-1为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，_(i，j)i，j＝0，1，…，Nc-1为h(n)的协方差矩阵，Nc为随机激励矢量中非零脉冲的个数，mi为动态路径中非零脉冲可能出现的位置，si为脉冲幅度。
在对轨道进行分解时，根据轨道长度将一个轨道分解为一条或者两条路径。
当一个轨道分解为两条路径时，所述轨道中的偶数项位置为一条路径，奇数项位置为一条路径。
在将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引时，当一个轨道只含有1条路径时，路径索引即为轨道索引；当一个轨道含有2条路径时，由下式将路径索引转换为轨道索引
其中，ci轨道i的索引，Ii为路径i的索引，a路径为轨道的偶数项，b路径为轨道的奇数项。
一种语音编码器，包括码本搜索装置，用于搜索码本中使残差目标矢量与合成语音信号的加权误差最小的脉冲位置；第一加法器，用于将根据码本搜索装置搜索的非零脉冲的位置对应的脉冲相加，输出随机激励矢量；感觉加权合成滤波器，用于将所述随机激励矢量进行感觉加权合成处理，输出感觉加权的合成语音信号；以及第二加法器，用于将残差目标矢量与合成语音信号相减，输出加权误差信号；其中，每个代数码本包含多个子码本，每个子码本包含多个轨道，每个轨道存放一个或者多个非零脉冲可能出现的位置；其特征在于，所述码本搜索装置包括轨道路径分解模块，用于将每个子码本所包含的多个轨道分解为多条路径，所述多条路径组成待搜索路径组，每条路径包含多个非零脉冲可能出现的位置；最优索引搜索模块，用于根据非零脉冲在路径中的轨道位置确定所述待搜索路径组中各条路径的最优索引；以及路径循环搜索模块，用于从所述待搜索路径组中选取固定路径和至少一条动态路径，对所有固定路径和动态路径组合循环搜索，获取动态路径对应的最优代数子码本索引，并将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引。
所述路径的最优索引为满足以下条件的路径索引其中，Ix为路径x的最优索引，p(j)为对应于索引j的轨道位置，r′(n)为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，sx为路径x的非零脉冲幅度。
所述动态路径对应的最优代数子码本索引为在对所有固定路径和动态路径组合进行循环搜索过程中，使下式e最大的代数码本索引im
其中，r′(i)，i＝0，1，…，Nc-1为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，_(i，j)，i，j＝0，1，…，Nc-1为h(n)的协方差矩阵，Nc为随机激励矢量中非零脉冲的个数，mi为动态路径中非零脉冲可能出现的位置，si为脉冲幅度。
在对轨道进行分解时，根据轨道长度将一个轨道分解为一条或者两条路径。
当一个轨道分解为两条路径时，所述轨道中的偶数项位置为一条路径，奇数项位置为一条路径。
在将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引时，当一个轨道只含有1条路径时，路径索引即为轨道索引；当一个轨道含有2条路径时，由下式将路径索引转换为轨道索引
其中，ci为轨道i的索引，Ii为路径i的索引，a路径为轨道的偶数项，b路径为轨道的奇数项。
本发明将代数子码本的轨道分解为多个路径，通过固定路径和动态路径组合搜索最终的码本索引，在保证编码质量的同时，有效地降低了码本搜索的实现复杂度，提高了编码算法的应用价值。

图1是现有技术中提供的语音编码中码本搜索的实现原理图；图2是本发明提供的语音编码中码本搜索的实现原理图；图3是本发明提供的语音编码器中码本搜索装置的结构图。

具体实施例方式 为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
本发明将代数子码本轨道分解为多个路径，通过固定路径和动态路径组合搜索最终的码本索引，在保证编码质量的同时，有效地降低了码本搜索的实现复杂度。
在语音编码中，输入语音信号经过预处理和线性预测分析得到感觉加权合成滤波器和目标矢量x0，对x0进行自适应码本搜索后可得到残差目标矢量X′0 x′0(n)＝X0(n)-gaxu(n) 式中，ga为自适应码本增益，x0(n)为加权输入语音减去感觉加权合成滤波器零输入响应后的信号，xu(n)为自适应码本作用于感觉加权合成滤波器的零状态响应。代数码本分为多个子码本，子码本的选择由每子帧的基音周期决定，无需传送附加信息。根据实验结果，在4kb/s ACELP语音编码算法中，子码本个数通常为3。
如图2所示，在本发明中，语音编码时首先通过基音周期从3个子码本中选取一个作为待搜索码本。为了提高搜索精度，本发明将码本中的4个轨道分解为若干条路径，每条路径包含8个非零脉冲可能出现的位置。轨道分解的路径数目越多，算法的复杂度越高，作为本发明的一个实施例，当轨道中的非零脉冲位置由3个比特表示(轨道长度为8)时，一个轨道就是一条路径。当轨道中的非零脉冲位置由4个比特表示(轨道长度为16)时，将一个轨道分解为2条路径。作为本发明的一个优选实施例，路径的具体分解方法为轨道i的a路径为轨道i的偶数项，轨道i的b路径为轨道i的奇数项。例如当每个轨道所分配的比特数分别为3、4、4、4(即轨道长度分别为8、16、16、16)时，将该4个轨道分解为路径0、路径1a、路径1b、路径2a、路径2b、路径3a和路径3b共7条路径，所有这些路径的集合组成待搜索路径组。这种路径分解方法可以使得每条路径都具有良好的轨道覆盖效果，当然，也可以有其他分解方法，例如将轨道中的前8个位置和后8个位置分别划分为一条路径，但是由于每条路径不能全部覆盖整个轨道，影响编码质量。
在待搜索路径组确定后，分别对各路径进行预搜索，找到各路径的最优索引，路径的最优索引就是满足下式的Ix 式中，Ix为路径x的最优索引；p(j)为对应于索引j的轨道位置；r′(n)为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积；sx为路径x的非零脉冲幅度，为+1或者-1。
最终的码本搜索在各路径的最优索引确定之后进行。码本搜索通过循环控制完成。作为本发明的一个实施例，每次循环时，从待搜索路径组中选择3条固定路径和1条动态路径，若某2条路径属于同一轨道，则只能选其中1条。
在实现时，算法的复杂度会随着动态路径的增多而快速增加，但是编码质量不会有明显的改善，因此从待搜索路径组中选取的动态路径的数目不能太多。
在搜索时，固定路径的路径索引使用预搜索得到的各路径最优索引，在搜索过程中，固定路径的索引是固定的。对于3条固定路径(设其最优索引分别为Ia、Ib、Ic)，使用其最优索引计算残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积r′(i)和h(n)的协方差矩阵_′(ij)

i＝0，1，…，N-1；j＝i，…，N-1 其中，N为子帧长，h(n)为感觉加权合成滤波器的冲激响应，其中i，j∈{Ia，Ib，Ic}。
对于动态路径，遍历其每个可选位置计算r′(i)和_′(i，j)，并找到使下式e最大的代数码本索引im:
式中，r(i)，i＝0，1，…，Nc-1为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积；_(i，j)，i，j＝0，1，…，Nc-1为h(n)的协方差矩阵；Nc为随机激励矢量中非零脉冲的个数；mi为非零脉冲可能出现的位置；si为脉冲幅度，这里只能为+1或-1。若该最大值emax大于前面路径循环搜索中所出现过的最大值Emax，则用emax代替Emax，并记录{Ia，Ib，Ic，im}。在对所有可能的固定路径和动态路径组合进行搜索之后，将最后记录的路径索引{Ia，Ib，Ic，im}转换为轨道索引{c0，c1，c2，c3}，即完成了固定码本的搜索。在转换时，当某个轨道只含有1条路径时，路径索引即为轨道索引。当某个轨道只含有2条路径时，由下式将路径索引转换为轨道索引
式中，ci为轨道i的索引；Ii为路径i的索引。
固定码本搜索完成后，将搜索出的四个脉冲相加后得到随机激励矢量，将随机激励矢量输入到感觉加权滤波器得到感觉加权的合成语音信号，根据使残差目标矢量与合成语音信号的加权误差最小的原则选取四个脉冲位置，即使下式e最大可求得四个脉冲位置，至此得到由基音周期选择的某个代数子码本索引i
式中，r(i)，i＝0，1，…，Nc-1为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，残差目标矢量x′0为加权输入语音减去感觉加权合成滤波器的零输入响应与自适应码本贡献后的矢量，_(i，j)，i，j＝0，1，…，Nc-1为h(n)的协方差矩阵；Nc为随机激励矢量中非零脉冲的个数；mi为非零脉冲可能出现的位置；si为脉冲幅度，为+1或-1。
图3示出了本发明提供的语音编码器中码本搜索装置的结构，通过码本搜索装置12搜索码本中使残差目标矢量与合成语音信号的加权误差最小的脉冲位置，其中轨道路径分解模块122将每个子码本所包含的多个轨道分解为多条路径，该多条路径组成待搜索路径组，每条路径包含多个非零脉冲可能出现的位置，最优索引搜索模块124根据非零脉冲在路径中的轨道位置确定待搜索路径组中各条路径的最优索引，路径循环搜索模块126从待搜索路径组中选取固定路径和至少一条动态路径，对所有固定路径和动态路径组合循环搜索，获取动态路径对应的最优代数子码本索引，并将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引。轨道路径分解、路径最优索引的判断搜索以及轨道索引转换等具体实现如上所述，不再赘述。
加法器14将根据码本搜索装置12搜索的非零脉冲的位置对应的脉冲相加，输出随机激励矢量。感觉加权合成滤波器16将随机激励矢量进行感觉加权合成处理，输出感觉加权的合成语音信号。加法器18将残差目标矢量与合成语音信号相减，输出加权误差信号。
以本发明在4kb/s散布脉冲码激励线性预测(Dispersed-pulse Code-excitedLinear Prediction DP-CELP)语音编码算法中的应用为例，输入语音为8kHz采样的线性脉冲编码调制(Pulse Code Modulation，PCM)信号，分析帧长为20毫秒，代数码本分为4个轨道，每个轨道所占用的比特数分别为3、4、4、4，即轨道长度分别为8、16、16、16。代数码本全搜索算法采用多重循环嵌套的方法，每子帧共需65536次循环，代数码本搜索部分的计算复杂度为85.2MOPS(Million Operations Per Second，每秒百万次操作)。本发明避免了全搜索的多重嵌套循环，在对代数码本进行搜索时，每子帧仅需512次循环。由于循环体内部与全搜索方法完全相同，因此，使用本发明后，代数数码本搜索部分的计算复杂度仅为0.67MOPS，约为全搜索方法的1/128。
以下使用平均失真测度D检验本发明对编码质量的影响其中，M为测试语句包含的子帧数。ei由下式给出式中，上标(i)表示第i子帧的输入参数；N为子帧长度；x0(n)为感觉加权语音减去加权合成滤波器零输入响应后的剩余信号；xu′(n)、tj′(n)分别为自适应码本输出的最佳矢量和代数码本输出的最佳随机码矢量通过感觉加权合成滤波器的零状态响应；

为第i子帧量化的自适应码本增益；

为第i子帧量化后的固定码本增益。
对大量语句作测试后的平均失真统计见下表。从表中可见，本发明的平均失真只比全搜索提高了0.4％，可以忽略不计。从这个角度看，本发明并未造成语音编码质量的任何下降。
为了进一步检验本发明的编码性能，对全搜索算法和本发明进行语音质量客观评测，评测软件为ITU-T的P.862客观评测标准语音质量的感知评价(Perceptual Evaluation of Speech Quality，PESQ)。汉语语音由16个句子组成，其中8句来自男性讲话，另外8句来自女性讲话。测试结果下表。从表中可以看出，本发明的平均意见分(Mean Opinion Score，MOS)仅比一般搜索算法降低了0.005，这在主观上是感觉不到的，与上表所表现的实验结果相一致。
综合上述检测结果可以看出，本发明几乎不会对编码语音质量产生影响，其复杂度仅为全搜索算法的1/128。
以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。
权利要求
1.一种代数码本的搜索方法，其中，每个代数码本包含多个子码本，每个子码本包含多个轨道，每个轨道存放一个或者多个非零脉冲可能出现的位置，其特征在于，所述方法包括
A.将每个子码本所包含的多个轨道分解为多条路径，所述多条路径组成待搜索路径组，每条路径包含多个非零脉冲可能出现的位置；
B.根据非零脉冲在路径中的轨道位置确定所述待搜索路径组中各条路径的最优索引；
C.从所述待搜索路径组中选取固定路径和至少一条动态路径，对所有固定路径和动态路径组合循环搜索，获取动态路径对应的最优代数子码本索引，并将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引。
2.如权利要求1所述的代数码本的搜索方法，其特征在于，所述路径的最优索引为满足以下条件的路径索引
其中，Ix为路径x的最优索引，p(j)为对应于索引j的轨道位置，r′(n)为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，sx为路径x的非零脉冲幅度，为+1或者-1。
3.如权利要求1所述的代数码本的搜索方法，其特征在于，所述动态路径对应的最优代数子码本索引为在对所有固定路径和动态路径组合进行循环搜索过程中，使下式e最大的代数码本索引im
其中，r′(i)，i＝0，1，…，Nc-1为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，_(i，j)，i，j＝0，1，…，Nc-1为h(n)的协方差矩阵，Nc为随机激励矢量中非零脉冲的个数，mi为动态路径中非零脉冲可能出现的位置，si为脉冲幅度。
4.如权利要求1、2或3所述的代数码本的搜索方法，其特征在于，在对轨道进行分解时，根据轨道长度将一个轨道分解为一条或者两条路径。
5.如权利要求4所述的代数码本的搜索方法，其特征在于，当一个轨道分解为两条路径时，所述轨道中的偶数项位置为一条路径，奇数项位置为一条路径。
6.如权利要求5所述的代数码本的搜索方法，其特征在于，在将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引时，当一个轨道只含有1条路径时，路径索引即为轨道索引；
当一个轨道含有2条路径时，由下式将路径索引转换为轨道索引
其中，ci为轨道i的索引，Ii为路径i的索引，a路径为轨道的偶数项，b路径为轨道的奇数项。
7.一种代数码本的搜索装置，其中，每个代数码本包含多个子码本，每个子码本包含多个轨道，每个轨道存放一个或者多个非零脉冲可能出现的位置，其特征在于，所述装置包括
轨道路径分解模块，用于将每个子码本所包含的多个轨道分解为多条路径，所述多条路径组成待搜索路径组，每条路径包含多个非零脉冲可能出现的位置；
最优索引搜索模块，用于根据非零脉冲在路径中的轨道位置确定所述待搜索路径组中各条路径的最优索引；以及
路径循环搜索模块，用于从所述待搜索路径组中选取固定路径和至少一条动态路径，对所有固定路径和动态路径组合循环搜索，获取动态路径对应的最优代数子码本索引，并将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引。
8.如权利要求7所述的代数码本的搜索装置，其特征在于，所述路径的最优索引为满足以下条件的路径索引
其中，Ix为路径x的最优索引，p(j)为对应于索引j的轨道位置，r′(n)为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，sx为路径x的非零脉冲幅度，为+1或者-1。
9.如权利要求7所述的代数码本的搜索装置，其特征在于，所述动态路径对应的最优代数子码本索引为在对所有固定路径和动态路径组合进行循环搜索过程中，使下式e最大的代数码本索引im
其中，r′(i)，i＝0，1，…，Nc-1为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，_(i，j)，i，j＝0，1，…，Nc-1为h(n)的协方差矩阵，Nc为随机激励矢量中非零脉冲的个数，mi为动态路径中非零脉冲可能出现的位置，si为脉冲幅度。
10.如权利要求7、8或9所述的代数码本的搜索装置，其特征在于，在对轨道进行分解时，根据轨道长度将一个轨道分解为一条或者两条路径。
11.如权利要求10所述的代数码本的搜索装置，其特征在于，当一个轨道分解为两条路径时，所述轨道中的偶数项位置为一条路径，奇数项位置为一条路径。
12.如权利要求11所述的代数码本的搜索装置，其特征在于，在将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引时，当一个轨道只含有1条路径时，路径索引即为轨道索引；
当一个轨道含有2条路径时，由下式将路径索引转换为轨道索引
其中，ci为轨道i的索引，Ii为路径i的索引，a路径为轨道的偶数项，b路径为轨道的奇数项。
13.一种语音编码器，包括
码本搜索装置，用于搜索码本中使残差目标矢量与合成语音信号的加权误差最小的脉冲位置；
第一加法器，用于将根据码本搜索装置搜索的非零脉冲的位置对应的脉冲相加，输出随机激励矢量；
感觉加权合成滤波器，用于将所述随机激励矢量进行感觉加权合成处理，输出感觉加权的合成语音信号；以及
第二加法器，用于将残差目标矢量与合成语音信号相减，输出加权误差信号；
其中，每个代数码本包含多个子码本，每个子码本包含多个轨道，每个轨道存放一个或者多个非零脉冲可能出现的位置；
其特征在于，所述码本搜索装置包括
轨道路径分解模块，用于将每个子码本所包含的多个轨道分解为多条路径，所述多条路径组成待搜索路径组，每条路径包含多个非零脉冲可能出现的位置；
最优索引搜索模块，用于根据非零脉冲在路径中的轨道位置确定所述待搜索路径组中各条路径的最优索引；以及
路径循环搜索模块，用于从所述待搜索路径组中选取固定路径和至少一条动态路径，对所有固定路径和动态路径组合循环搜索，获取动态路径对应的最优代数子码本索引，并将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引。
14.如权利要求13所述的语音编码器，其特征在于，所述路径的最优索引为满足以下条件的路径索引
其中，Ix为路径x的最优索引，p(j)为对应于索引j的轨道位置，r′(n)为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，sx为路径x的非零脉冲幅度，为+1或者-1。
15.如权利要求13所述的语音编码器，其特征在于，所述动态路径对应的最优代数子码本索引为在对所有固定路径和动态路径组合进行循环搜索过程中，使下式e最大的代数码本索引im
其中，r′(i)，i＝0，1，…，Nc-1为残差目标矢量x′0与感觉加权合成滤波器冲击响应h(n)的卷积，_(i，j)，i，j＝0，1，…，Nc-1为h(n)的协方差矩阵，Nc为随机激励矢量中非零脉冲的个数，mi为动态路径中非零脉冲可能出现的位置，si为脉冲幅度。
16.如权利要求13、14或15所述的语音编码器，其特征在于，在对轨道进行分解时，根据轨道长度将一个轨道分解为一条或者两条路径。
17.如权利要求16所述的语音编码器，其特征在于，当一个轨道分解为两条路径时，所述轨道中的偶数项位置为一条路径，奇数项位置为一条路径。
18.如权利要求17所述的语音编码器，其特征在于，在将搜索出的固定路径的最优索引和动态路径对应的最优代数子码本索引转换为对应的轨道索引时，当一个轨道只含有1条路径时，路径索引即为轨道索引；
当一个轨道含有2条路径时，由下式将路径索引转换为轨道索引
其中，ci为轨道i的索引，Ii为路径i的索引，a路径为轨道的偶数项，b路径为轨道的奇数项。
全文摘要
本发明适用于语音编码领域，提供了一种代数码本的搜索方法、装置及编码器，其中，每个代数码本包含多个子码本，每个子码本包含多个轨道，每个轨道存放一个或者多个非零脉冲可能出现的位置，所述方法将每个子码本所包含的多个轨道分解为多条路径，然后根据非零脉冲在路径中的轨道位置确定各条路径的最优索引，选取固定路径和动态路径，对所有固定路径和动态路径组合循环搜索获取对应的轨道索引。本发明将代数子码本的轨道分解为多个路径，通过固定路径和动态路径组合搜索最终的码本索引，在保证编码质量的同时，有效地降低了码本搜索的实现复杂度，提高了编码算法的应用价值。
文档编号G10L19/14GK101118748SQ20061006200
公开日2008年2月6日申请日期2006年8月4日优先权日2006年8月4日
发明者鲍长春, 窦庚欣, 睿范, 刘泽新, 李立雄申请人:北京工业大学, 华为技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：鲍长春;窦庚欣;范睿;刘泽新;李立雄
技术所有人：北京工业大学;华为技术有限公司
我是此专利的发明人

上一篇：一种卡拉ok人声播放方法
上一篇：电子耳蜗汉语声调的n度标记法的电刺激编码方法