多模式多级码本联合优化方法

文档序号:8473819阅读:173来源:国知局
多模式多级码本联合优化方法
【技术领域】
[0001] 本发明涉及低速率语音编码矢量量化技术领域,具体地说,涉及一种多模式多级 码本联合优化方法。
【背景技术】
[0002] 随着音频技术的发展,低速率语音编码在无线通信、卫星通信等领域有着广泛的 应用。
[0003] 在低速率语音编码中,由于受到存储量及运算量的限制,往往采用受约束的矢量 量化方式,其中包括树型矢量量化、分类矢量量化、多级矢量量化、变换域矢量量化等,以降 低码本的存储量和运算量。其中,以多级矢量量化最为常用。另一方面,分模式矢量量化 虽然会增加一定的存储量,但是它可以在不额外增加比特的情况下,有效的降低量化误差。 在低速率语音编码的众多应用领域中,往往时刻伴随着误码的存在。对于多模式多级矢量 量化,一旦发生误码,不仅各级码本索引会出错,而且模式的选择也会出错,这样在解码端 合成的参数往往与编码端的输入参数出现较大的偏差,严重影响合成语音的可懂度和舒适 度。
[0004] 传统的分模式多级矢量量化,以信源最优为准则进行码本训练和码本的联合优 化,由于不考虑信道误码情况,信源最优的多模式多级矢量量化的系统失真即为量化失真。 这样训练出来的最优码字均匀分布在整个量化空间中,而一旦发生误码,整个系统失真也 会比较大。
[0005] 基于上述情况,现有的多模式多级码本训练中,误码对系统失真的影响较大,影响 了对反量化码字以及合成语音的质量。

【发明内容】

[0006] 本发明的目的在于提供一种多模式多级码本联合优化方法,以解决现有的多模式 多级码本训练中,误码对系统失真的影响较大的技术问题。
[0007] 本发明提供一种多模式多级码本联合优化方法,包括:
[0008] 步骤1,输出待量化矢量;
[0009] 步骤2,对所述待量化矢量进行训练,获得各模式各级初始化码本,其中,级数为 M;
[0010] 步骤3,对所述各模式各级初始化码本进行码本索引的重排,获得新的码本;
[0011] 步骤4,对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和 量化索引;
[0012] 步骤5,对于第m级码本,利用本级的输入残差矢量和对应的量化索引,更新本级 各模式最优码字,其中,m的初始值为1;
[0013]步骤6,比较m与M的值;
[0014] 如果m〈M,则将m的值加1,并返回步骤4;
[0015] 如果m=M,则进行步骤7 ;
[0016] 步骤7,判断迭代次数t是否达到预设值T,其中,t的初始值为1 ;
[0017] 如果t〈T,则将t的值加1,将m的值重置为1,并返回步骤4 ;
[0018] 如果t=T,则进行步骤8;
[0019] 步骤8,获取最后一次迭代得出的码本。
[0020] 优选的是,所述步骤1,具体为:
[0021] 在低速率语音编码中,对语音库根据分模式依据参数的量化索引作为模式的编 号,输出待量化参数在各模式下待量化矢量。
[0022] 所述语音库优选为具有设定采样频率的、具有一定时长的、包含多种音色的标准 中文语音库。所述设定采样频率优选为8kHz。
[0023] 优选的是,所述步骤2,具体为:
[0024] 将各模式待量化矢量作为码本训练和联合优化的输入矢量,分别采用基于模拟退 火的码本训练方法,按照各级分配的比特数进行多级码本训练,获得各模式各级初始化码 本。
[0025] 优选的是,所述步骤3,具体为:
[0026] 对所述各模式各级初始化码本,采用基于禁忌搜索的方法进行码本索引的重排, 获得新的码本。
[0027] 优选的是,T的取值范围在20至40之间。
[0028] 本发明带来了以下有益效果:本发明提供的多模式多级码本联合优化方法中,通 过多次迭代获得信道最优的多模式多级矢量量化的最优码本,其中的码字并不是当前胞腔 的质心,而是各个胞腔质心通过误码转移概率加权平均得到的。相比于现有的信源最优的 多模式多级矢量量化方式,本发明中最优码字之间的距离比较小,一旦发生误码,整个系统 失真也会显著减小,从而减弱了误码对系统失真的影响,提高了系统的抗误码性能。因此, 在多模式多级矢量量化和传输过程中,能够有效降低信道误码情况下反量化码字与输入参 数的系统失真,并有效提高信道误码情况下合成语音的质量。
[0029] 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利 要求书以及附图中所特别指出的结构来实现和获得。
【附图说明】
[0030] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要的 附图做简单的介绍:
[0031] 图1是本发明实施例提供的多模式多级码本联合优化方法的流程图。
【具体实施方式】
[0032] 以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用 技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明 的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合, 所形成的技术方案均在本发明的保护范围之内。
[0033] 本发明实施例提供一种多模式多级码本联合优化方法,可应用于低速率语音编码 中。如图1所示,该方法包括:
[0034] Sl:输出待量化矢量。
[0035] 具体的,在低速率语音编码中,对语音库根据分模式依据参数的量化索引作为模 式的编号,输出待量化参数在各模式下待量化矢量。其中,语音库优选为具有设定采样频率 的、具有一定时长的、包含多种音色的标准中文语音库。
[0036] 本实施例中采用的语音库的采样频率为8kHz,时长可以为数个小时,其中包含不 同性别、不同年龄的多种音色。对该语音库,线谱对参数每20ms提取10维系数,去预测、去 均值后作为待量化参数,并利用清浊音参数的量化索引作为模式编号。
[0037] S2 :对待量化矢量进行训练,获得各模式各级初始化码本。
[0038] 具体的,将各模式待量化矢量作为码本训练和联合优化的输入矢量,分别采用基 于模拟退火的码本训练方法,按照各级分配的比特数进行多级码本训练,获得各模式各级 初始化码本。
[0039] 对于典型的多模式多级矢量量化器,U种模式M级的语音编码器Q将K维(K= 10) 的输入矢量X= [Xl,x2, . . .XK]映射到对应的模式U和索引/"=忙名,..4},得到对应的码
【主权项】
1. 一种多模式多级码本联合优化方法,其特征在于,包括: 步骤1,输出待量化矢量; 步骤2,对所述待量化矢量进行训练,获得各模式各级初始化码本,其中,级数为M; 步骤3,对所述各模式各级初始化码本进行码本索引的重排,获得新的码本; 步骤4,对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和量化 索引; 步骤5,对于第m级码本,利用本级的输入残差矢量和对应的量化索引,更新本级各模 式最优码字,其中,m的初始值为1 ; 步骤6,比较m与M的值; 如果m〈M,则将m的值加1,并返回步骤4 ; 如果m=M,则进行步骤7; 步骤7,判断迭代次数t是否达到预设值T,其中,t的初始值为1 ; 如果t〈T,则将t的值加1,将m的值重置为1,并返回步骤4 ; 如果t=T,则进行步骤8 ; 步骤8,获取最后一次迭代得出的码本。
2. 根据权利要求1所述的方法,其特征在于,所述步骤1,具体为: 在低速率语音编码中,对语音库根据分模式依据参数的量化索引作为模式的编号,输 出待量化参数在各模式下待量化矢量。
3. 根据权利要求2所述的方法,其特征在于,所述语音库为具有设定采样频率的、具有 一定时长的、包含多种音色的标准中文语音库。
4. 根据权利要求3所述的方法,其特征在于,所述设定采样频率为8kHz。
5. 根据权利要求1所述的方法,其特征在于,所述步骤2,具体为: 将各模式待量化矢量作为码本训练和联合优化的输入矢量,分别采用基于模拟退火的 码本训练方法,按照各级分配的比特数进行多级码本训练,获得各模式各级初始化码本。
6. 根据权利要求1所述的方法,其特征在于,所述步骤3,具体为: 对所述各模式各级初始化码本,采用基于禁忌搜索的方法进行码本索引的重排,获得 新的码本。
7. 根据权利要求1所述的方法,其特征在于,T的取值范围在20至40之间。
【专利摘要】本发明公开了一种多模式多级码本联合优化方法,属于低速率语音编码矢量量化技术领域,解决了现有的多模式多级码本训练中,误码对系统失真的影响较大的技术问题。该多模式多级码本联合优化方法包括:输出待量化矢量;对所述待量化矢量进行训练,获得各模式各级初始化码本;对所述各模式各级初始化码本进行码本索引的重排,获得新的码本;对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和量化索引;利用输入残差矢量和对应的量化索引,更新各级各模式最优码字,并迭代至预设次数;获取最后一次迭代得出的码本。
【IPC分类】G10L19-107, G10L19-038
【公开号】CN104795074
【申请号】CN201510121820
【发明人】徐敬德, 崔慧娟, 唐昆
【申请人】清华大学, 信瑞递(北京)科技有限公司
【公开日】2015年7月22日
【申请日】2015年3月19日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1