多模式多级码本联合优化方法

文档序号：8473819阅读：173来源：国知局

多模式多级码本联合优化方法
【技术领域】
[0001] 本发明涉及低速率语音编码矢量量化技术领域，具体地说，涉及一种多模式多级码本联合优化方法。
【背景技术】
[0002] 随着音频技术的发展，低速率语音编码在无线通信、卫星通信等领域有着广泛的应用。
[0003] 在低速率语音编码中，由于受到存储量及运算量的限制，往往采用受约束的矢量量化方式，其中包括树型矢量量化、分类矢量量化、多级矢量量化、变换域矢量量化等，以降低码本的存储量和运算量。其中，以多级矢量量化最为常用。另一方面，分模式矢量量化虽然会增加一定的存储量，但是它可以在不额外增加比特的情况下，有效的降低量化误差。在低速率语音编码的众多应用领域中，往往时刻伴随着误码的存在。对于多模式多级矢量量化，一旦发生误码，不仅各级码本索引会出错，而且模式的选择也会出错，这样在解码端合成的参数往往与编码端的输入参数出现较大的偏差，严重影响合成语音的可懂度和舒适度。
[0004] 传统的分模式多级矢量量化，以信源最优为准则进行码本训练和码本的联合优化，由于不考虑信道误码情况，信源最优的多模式多级矢量量化的系统失真即为量化失真。这样训练出来的最优码字均匀分布在整个量化空间中，而一旦发生误码，整个系统失真也会比较大。
[0005] 基于上述情况，现有的多模式多级码本训练中，误码对系统失真的影响较大，影响了对反量化码字以及合成语音的质量。

【发明内容】

[0006] 本发明的目的在于提供一种多模式多级码本联合优化方法，以解决现有的多模式多级码本训练中，误码对系统失真的影响较大的技术问题。
[0007] 本发明提供一种多模式多级码本联合优化方法，包括：
[0008] 步骤1，输出待量化矢量；
[0009] 步骤2,对所述待量化矢量进行训练，获得各模式各级初始化码本，其中，级数为 M；
[0010] 步骤3,对所述各模式各级初始化码本进行码本索引的重排，获得新的码本；
[0011] 步骤4,对所述待量化矢量，利用新的码本，寻找使得系统失真最小的最优胞腔和量化索引；
[0012] 步骤5,对于第m级码本，利用本级的输入残差矢量和对应的量化索引，更新本级各模式最优码字，其中，m的初始值为1;
[0013]步骤6，比较m与M的值；
[0014] 如果m〈M，则将m的值加1，并返回步骤4;
[0015] 如果m=M，则进行步骤7 ;
[0016] 步骤7,判断迭代次数t是否达到预设值T，其中，t的初始值为1 ;
[0017] 如果t〈T，则将t的值加1，将m的值重置为1，并返回步骤4 ;
[0018] 如果t=T，则进行步骤8;
[0019] 步骤8,获取最后一次迭代得出的码本。
[0020] 优选的是，所述步骤1，具体为：
[0021] 在低速率语音编码中，对语音库根据分模式依据参数的量化索引作为模式的编号，输出待量化参数在各模式下待量化矢量。
[0022] 所述语音库优选为具有设定采样频率的、具有一定时长的、包含多种音色的标准中文语音库。所述设定采样频率优选为8kHz。
[0023] 优选的是，所述步骤2,具体为：
[0024] 将各模式待量化矢量作为码本训练和联合优化的输入矢量，分别采用基于模拟退火的码本训练方法，按照各级分配的比特数进行多级码本训练，获得各模式各级初始化码本。
[0025] 优选的是，所述步骤3,具体为：
[0026] 对所述各模式各级初始化码本，采用基于禁忌搜索的方法进行码本索引的重排，获得新的码本。
[0027] 优选的是，T的取值范围在20至40之间。
[0028] 本发明带来了以下有益效果：本发明提供的多模式多级码本联合优化方法中，通过多次迭代获得信道最优的多模式多级矢量量化的最优码本，其中的码字并不是当前胞腔的质心，而是各个胞腔质心通过误码转移概率加权平均得到的。相比于现有的信源最优的多模式多级矢量量化方式，本发明中最优码字之间的距离比较小，一旦发生误码，整个系统失真也会显著减小，从而减弱了误码对系统失真的影响，提高了系统的抗误码性能。因此，在多模式多级矢量量化和传输过程中，能够有效降低信道误码情况下反量化码字与输入参数的系统失真，并有效提高信道误码情况下合成语音的质量。
[0029] 本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
【附图说明】
[0030] 为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要的附图做简单的介绍：
[0031] 图1是本发明实施例提供的多模式多级码本联合优化方法的流程图。
【具体实施方式】
[0032] 以下将结合附图及实施例来详细说明本发明的实施方式，借此对本发明如何应用技术手段来解决技术问题，并达成技术效果的实现过程能充分理解并据以实施。需要说明的是，只要不构成冲突，本发明中的各个实施例以及各实施例中的各个特征可以相互结合，所形成的技术方案均在本发明的保护范围之内。
[0033] 本发明实施例提供一种多模式多级码本联合优化方法，可应用于低速率语音编码中。如图1所示，该方法包括：
[0034] Sl:输出待量化矢量。
[0035] 具体的，在低速率语音编码中，对语音库根据分模式依据参数的量化索引作为模式的编号，输出待量化参数在各模式下待量化矢量。其中，语音库优选为具有设定采样频率的、具有一定时长的、包含多种音色的标准中文语音库。
[0036] 本实施例中采用的语音库的采样频率为8kHz，时长可以为数个小时，其中包含不同性别、不同年龄的多种音色。对该语音库，线谱对参数每20ms提取10维系数，去预测、去均值后作为待量化参数，并利用清浊音参数的量化索引作为模式编号。
[0037] S2 :对待量化矢量进行训练，获得各模式各级初始化码本。
[0038] 具体的，将各模式待量化矢量作为码本训练和联合优化的输入矢量，分别采用基于模拟退火的码本训练方法，按照各级分配的比特数进行多级码本训练，获得各模式各级初始化码本。
[0039] 对于典型的多模式多级矢量量化器，U种模式M级的语音编码器Q将K维（K= 10) 的输入矢量X= [Xl，x2, . . .XK]映射到对应的模式U和索引/"=忙名，..4}，得到对应的码
【主权项】
1. 一种多模式多级码本联合优化方法，其特征在于，包括：步骤1，输出待量化矢量；步骤2,对所述待量化矢量进行训练，获得各模式各级初始化码本，其中，级数为M; 步骤3,对所述各模式各级初始化码本进行码本索引的重排，获得新的码本；步骤4,对所述待量化矢量，利用新的码本，寻找使得系统失真最小的最优胞腔和量化索引；步骤5,对于第m级码本，利用本级的输入残差矢量和对应的量化索引，更新本级各模式最优码字，其中，m的初始值为1 ; 步骤6,比较m与M的值；如果m〈M，则将m的值加1，并返回步骤4 ; 如果m=M，则进行步骤7; 步骤7,判断迭代次数t是否达到预设值T，其中，t的初始值为1 ; 如果t〈T，则将t的值加1，将m的值重置为1，并返回步骤4 ; 如果t=T，则进行步骤8 ; 步骤8,获取最后一次迭代得出的码本。
2. 根据权利要求1所述的方法，其特征在于，所述步骤1，具体为：在低速率语音编码中，对语音库根据分模式依据参数的量化索引作为模式的编号，输出待量化参数在各模式下待量化矢量。
3. 根据权利要求2所述的方法，其特征在于，所述语音库为具有设定采样频率的、具有一定时长的、包含多种音色的标准中文语音库。
4. 根据权利要求3所述的方法，其特征在于，所述设定采样频率为8kHz。
5. 根据权利要求1所述的方法，其特征在于，所述步骤2,具体为：将各模式待量化矢量作为码本训练和联合优化的输入矢量，分别采用基于模拟退火的码本训练方法，按照各级分配的比特数进行多级码本训练，获得各模式各级初始化码本。
6. 根据权利要求1所述的方法，其特征在于，所述步骤3,具体为：对所述各模式各级初始化码本，采用基于禁忌搜索的方法进行码本索引的重排，获得新的码本。
7. 根据权利要求1所述的方法，其特征在于，T的取值范围在20至40之间。
【专利摘要】本发明公开了一种多模式多级码本联合优化方法，属于低速率语音编码矢量量化技术领域，解决了现有的多模式多级码本训练中，误码对系统失真的影响较大的技术问题。该多模式多级码本联合优化方法包括：输出待量化矢量；对所述待量化矢量进行训练，获得各模式各级初始化码本；对所述各模式各级初始化码本进行码本索引的重排，获得新的码本；对所述待量化矢量，利用新的码本，寻找使得系统失真最小的最优胞腔和量化索引；利用输入残差矢量和对应的量化索引，更新各级各模式最优码字，并迭代至预设次数；获取最后一次迭代得出的码本。
【IPC分类】G10L19-107, G10L19-038
【公开号】CN104795074
【申请号】CN201510121820
【发明人】徐敬德, 崔慧娟, 唐昆
【申请人】清华大学, 信瑞递（北京）科技有限公司
【公开日】2015年7月22日
【申请日】2015年3月19日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐敬德;崔慧娟;唐昆;
技术所有人：清华大学;信瑞递（北京）科技有限公司;
我是此专利的发明人

上一篇：一种亚音识别压制系统及其识别方法
上一篇：一种音频数据的处理方法及装置的制造方法