藏语拉萨话声调预测的方法及系统的制作方法

文档序号:8412499阅读:483来源:国知局
藏语拉萨话声调预测的方法及系统的制作方法
【技术领域】
[0001] 本发明涉及文本处理技术领域,具体涉及一种藏语拉萨话声调预测的方法及系 统。
【背景技术】
[0002] 近年来,随着信息社会的需求发展,用户对人机交互提出了更高的要求,高自然度 的语音合成效果已经成为高性能语音合成系统的重要标志。
[0003] 语音合成又称文语转换(Text to Speech)技术,文语转换过程是先将文字序列转 换成语音单元序列,再由系统根据语音单元序列生成语音波形。传统语音合成系统中主要 在合成前端实现文本规整、字词切分、韵律短语划分等,随后在合成后端根据前端处理结果 选择合适的语音拼接单元或合成参数实现带有停顿节奏的连续语音信号。
[0004] 准确的声调预测对语音合成效果的提高有重要意义,一般来说,声调语言的声调 信息都具有明确的定义,如泰语、越南语、中文等都有明确声调标记,确定一个音节的声调 可以通过查表的方式唯一确定,且上下文中存在的少量变调现象也遵循确定的变化规则, 因而语音合成中对声调的处理较为简单直接。而藏语拉萨话中每个藏语字都对应一个音 节,其孤立音节的声调由声母、韵母确定,声调似乎是冗余信息。不同于大多数声调语言的 少量简单的变调现象,连续藏语拉萨话语流中往往存在大范围的连读变调,相同的孤立音 节的声调在不同上下文环境下往往表现出不同的调型,因而在藏语拉萨话的连续语音合成 中需要对音节进行声调预测,以提高合成语音的自然度。
[0005] 传统的藏语拉萨话的音节声调确定主要采用基于规则的方法,这种基于规则的声 调确认方法无法满足藏语拉萨话语音合成系统的声调预测需求,主要体现在以下几方面:
[0006] 1.目前在语法语义研究领域,关于如何由特定的声母和韵尾环境确定藏语拉萨话 的声调还存在模糊性;
[0007] 2.连续藏语拉萨话中同一声调在不同上下文中具有不同的调值/调型,且变化规 律往往较为复杂,大多数声调语言中每个调类都对应一个调值/调型。藏语拉萨话单音节 的声调包括高调(53, 55)和低调(12,14),所述声调由5度调值描述。而在不同上下文环境 下,一方面是为了满足流畅的效果,藏语拉萨话有连读变调现象,而另一方面是藏语拉萨话 声调具有词性区分功能。当满足这个需求声调发生变化时,藏语拉萨话的相同调类往往表 现出不同的调值/调型。
[0008] 3.基于规则的单音节声调确定和两音节连读变调确定方法在连续藏语拉萨话中 往往存在大量的反例。如相同单词在担当不同词性功能时具有不同的声调,如当动词时的 声调和当名词时的声调则明显不同;而大批高频使用的功能词(虚词、词缀等)不仅不符合 单音节声调规律,且和其它音节组合时也不符合变调规律。
[0009] 显然传统的基于规则的藏语拉萨话声调定义及音节连读变调方法只适用于少量 数据,而无法满足大词汇量连续语音合成的需求。

【发明内容】

[0010] 本发明实施例提供一种藏语拉萨话声调预测的方法及系统,以提高藏语连续语流 中音节声调预测的准确性。
[0011] 为此,本发明实施例提供如下技术方案:
[0012] 一种藏语拉萨话声调预测的方法,包括:
[0013] 获取连续藏语文本;
[0014] 对所述文本进行分词,得到分词串,每个分词串包括一个或多个分词;
[0015] 确定所述分词中各音节的音节声调预测特征;
[0016] 根据所述音节的音节声调预测特征,利用预先训练得到的音节调型预测模型确定 所述音节的调型。
[0017] 优选地,所述确定所述分词中各音节的音节声调预测特征包括:确定所述分词中 各音节的调类。
[0018] 优选地,所述确定所述分词中各音节的调类包括:
[0019] 如果所述分词是多音词,则根据所述分词的词性查找预先建立的多音词表,确定 所述分词是否具有非正常调类;
[0020] 如果是,则根据所述多音词表获得所述分词中各音节的调类;
[0021] 如果否,则根据所述分词中各音节的声母属性及韵母属性,确定所述音节的声母 类别及韵母类别,然后根据所述音节的声母类别及韵母类别查找预先建立的调类对应关系 表确定所述音节的调类;
[0022] 如果所述分词不是多音词,则根据所述分词中各音节的声母属性及韵母属性,确 定所述音节的声母类别及韵母类别,然后根据所述音节的声母类别及韵母类别查找预先建 立的调类对应关系表确定所述音节的调类。
[0023] 优选地,所述方法还包括:
[0024] 获取不同声母属性、以及不同韵母属性;
[0025] 根据所述声母属性及韵母属性确定各自所属类别;
[0026] 建立所述调类对应关系表,所述调类对应关系表中包括:声母类别、韵母类别、以 及与不同声母类别和韵母类别组合相对应的音节调类。
[0027] 优选地,所述确定所述分词中各音节的音节声调预测特征还包括:
[0028] 确定所述分词中各音节的调类相关特征,所述调类相关特征包括:词法成分特征、 和/或位置特征。
[0029] 优选地,所述词法成分特征包括以下任意一种或多种:实词、实词词素、虚词、虚词 词素、词缀、词缀词素。
[0030] 优选地,所述方法还包括:
[0031] 确定各音节所属分词的声调预测相关特征;
[0032] 所述根据所述音节的音节声调预测特征,利用预先训练得到的音节调型预测模型 确定所述音节的调型包括:
[0033] 根据所述音节的音节声调预测特征、以及所述音节所属分词的声调预测相关特 征,利用预先训练得到的音节调型预测模型确定所述音节的调型。
[0034] 优选地,所述分词的声调预测相关特征包括:分词的词性、分词的词长、分词在短 语或句中的位置。
[0035] 优选地,所述方法还包括:按以下方式构建所述音节调型预测模型:
[0036] 采集藏语文本训练数据;
[0037] 对所述训练数据中各音节进行调型标注;
[0038] 根据所述训练数据及对应各音节的调型标注,训练得到音节调型预测模型。
[0039] -种藏语拉萨话声调预测的系统,包括:
[0040] 获取模块,用于获取连续藏语文本;
[0041] 分词处理模块,用于对所述文本进行分词,得到分词串,每个分词串包括一个或多 个分词;
[0042] 声调预测特征确定模块,用于确定所述分词中各音节的音节声调预测特征;
[0043] 预测模块,用于根据所述音节的音节声调预测特征,利用预先训练得到的音节调 型预测模型确定所述音节的调型。
[0044] 优选地,所述声调预测特征确定模块包括:
[0045] 调类确定单元,用于确定所述分词中各音节的调类。
[0046] 优选地,所述调类确定单元包括:
[0047] 检查单元,用于检查所述分词是否为多音词;
[0048] 查找单元,用于在所述分词是多音词时,根据所述分词的词性查找预先建立的多 音词表,确定所述分词是否具有非正常调类;
[0049] 第一确定单元,用于在所述分词具有非正常调类时,根据所述多音词表获得所述 分词中各音节的调类;
[0050] 第二确定单元,用于在所述分词是多音词但不具有非正常调类、或者所述分词不 是多音词时,根据所述分词中各音节的声母属性及韵母属性,确定所述音节的声母类别及 韵母类别,然后根据所述音节的声母类别及韵母类别查找预先建立的调类对应关系表确定 所述音节的调类。
[0051] 优选地,所述系统还包括:
[0052] 属性获取模块,用于获取不同声母属性、以及不同韵母属性;
[0053] 类别确定模块,用于根据所述声母属性及韵母属性确定各自所属类别;
[0054] 关系表建立模块,用于建立所述调类对应关系表,所述调类对应关系表中包括:声 母类别、韵母类别、以及与不同声母类别和韵母类别组合相对应的音节调类。
[0055] 优选地,所述声调预测特征确定模块还包括:
[0056] 调类相关特征确定单元,用于确定所述分词中各音节的调类相关特征,所述调类 相关特征包括:词法成分特征、和/或位置特征。
[0057] 优选地,所述系统还包括:
[0058] 声调预测相关特征确定模块,用于确定各音节所属分词的声调预测相关特征;
[0059] 所述预测模块,用于根据所述音节的音节声调预测特征、以及所述音节所属分词 的声调预测相关特征,利用预先训练得到的音节调型预测模型确定所述音节的调型。
[0060] 优选地,所述系统还包括:模型构建模块,所述模型构建模块包括:
[0061] 采集单元,用于采集藏语文本训练数据;
[0062] 标注单元,用于对所述训练数据中各音节进行调型标注;
[0063] 构建单元,用于根据所述训练数据及对应各音节的调型标注,训练得到音节调型 预测模型。
[0064] 本发明实施例提供的藏语拉萨话声调预测的方法及系统,预先基于训练方式构建 音节调型预测模型,对获取的连续藏语文本,首先对文本进行分词,得到分词串,确定所述 分词中各音节的音节声调预测特征,然后根据音节的音节声调预测特征,利用预先训练得 到的音节调型预测模型确定音节的调型,从而大大提高了连续文本的音节调型预测的准确 性。本发明实施例的方案可以应用于语音合成、语音教学等多种领域中,能够有效改善藏语 拉萨话语音的自然度。
【附图说明】
[0065]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1