一种汉藏双语跨语言语音转换的方法及其系统与流程

文档序号:11867359阅读:来源:国知局

技术特征:

1.一种汉藏双语跨语言语音转换的方法,其特征在于,包括以下步骤:

A、通过设计相应的文本语料,录制语音语料,对所述语音语料进行切分与标注,基元归类和目录索引等,完成藏语拉萨话音节库和汉语普通话韵律特征分析库的建立;

B、利用五度字调模型建立基频模型,同时利用统计方法建立时长转换模型和停顿时长转换模型,完成韵律模型的建立;

C、输入藏语文本,利用决策树算法从建立的藏语拉萨话音节库中选取出合适的音节,完成基于波形拼接技术的语音转换;

D、利用STRAIGHT算法对转换的语音进行基频、时长、停顿时长等韵律参数的修改,完成韵律控制,输出汉语普通话语音。

2.根据权利要求1所述的一种汉藏双语跨语言语音转换的方法,其特征在于,所述步骤A中,所述藏语拉萨话音节库的建立包括如下步骤:

首先根据藏语进行藏语的文本语料的设计,然后根据设计的文本语料进行语音语料的录制,再进行切分及标注得到所有的音节信息,最后对藏语拉萨话的音节进行归类,建立目录索引,从而完成藏语拉萨话音节库建立。

3.根据权利要求1或2所述的一种汉藏双语跨语言语音转换的方法,其特征在于,所述步骤A中,所述汉语普通话韵律特征分析库的建立包括如下步骤:

首先根据汉语语料库的作用进行汉语的文本语料的设计,然后根据设计的文本语料进行语音语料的录制,再进行切分及标注得到所有的音节信息,最后对汉语的音节进行归类,而且对双字词,韵律短语进行切分和标注,建立目录索引,从而完成汉语普通话韵律特征分析库的建立。

4.根据权利要求1所述的一种汉藏双语跨语言语音转换的方法,其特征在于,所述步骤B包括如下步骤:

首先利用归一化非线性多项式声调模型,建立普通话的基频模型,利用五度字调模型建立基频曲线,以中值音高、调域和字调的五度调值为输入参数,生成所需声调的基频曲线,用于指导合成普通话语音;

通过统计同文本的汉语普通话和藏语拉萨话语料,对比分析了普通话和藏语的单音节、双音节的时长关系,以及不同层级停顿时长关系,利用统计的方法建立了时长转换模型和停顿时长转换模型,得到韵律模型。

5.根据权利要求1所述的一种汉藏双语跨语言语音转换的方法,其特征在于,所述步骤C包括如下步骤:

首先,输入藏语文本,对输入藏语的文本利用软件翻译成汉语,并对汉语文本进行文本分析,根据文本获取相应的汉语音节;

然后,依据所得的汉语音节,在该说话人的藏语拉萨话音节库中利用决策树查找与汉语音节发音相似的藏语音节,且位置和音质最佳;

最后,利用波形拼接合成技术,直接把从藏语拉萨话音节库中的查找的音节波形级联起来,输出连续语流,得到初步生成语音。

6.根据权利要求5所述的一种汉藏双语跨语言语音转换的方法,其特征在于,所述步骤C中还包括:

在输入藏语文本的同时进行操作者的麦克风语音采集。

7.根据权利要求1所述的一种汉藏双语跨语言语音转换的方法,其特征在于,所述步骤D包括如下步骤:

首先,利用STRAIGHT算法对初步生成语音提取音节基频,音节时长,音节频谱和周期索引等相关声学参数。

然后,在建立的韵律模型的指导下对提取的这些声学进行修改,从而进行韵律控制,输出自然度较高的汉语普通话语音。

8.一种藏汉双语跨语言语音转换系统,其特征在于,应用如权利要求1-7中任意一项所述的藏双语跨语言语音转换的方法。

9.根据权利要求1所述的一种藏汉双语跨语言语音转换系统,其特征在于,所述藏汉双语跨语言语音转换系统包括:

韵律模型训练单元,用于建立语音数据的韵律模型;

韵律控制单元,用于修改初步合成语音的声学参数。

10.根据权利要求9所述的一种藏汉双语跨语言语音转换系统,其特征在于,

所述律模型训练单元包括:语音分析子单元,用于提取语音库中语音数据的声学参数,主要提取基频、频谱和时长参数;目标韵律模型子单元,用于确定基频、频谱和时长参数;

所述韵律控制单元包括依次相连的韵律模型子单元和语音合成子单元,根据确定的韵律模型来修改初步合成语音中的声学参数从而完成韵律控制。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1