汉语语音码语音合成方法

文档序号:6337256阅读:376来源:国知局
专利名称:汉语语音码语音合成方法
技术领域
本发明是一种用且仅用26个拉丁字母以词为单位,每一个音节包含汉语声、韵、调的汉 语语音码转换成语音的方法,该语音包括外语单词、词组或短语、汉语、汉语特定人、中国 方言、少数民族语言的语音,本发明申请中所称的"汉语"是指汉语普通话(以上以下均同), 本技术属于计算机语音合成技术领域。二. 背景技术随着计算机多媒体技术的发展,语音合成技术越来越受到人们广泛的重枧,目前许多实 用的各种以汉语为代表的语音合成系统已经被开发出来并投入实际应用中,给人们生活带来了极大的便利。比较典型的有安徽科大讯飞、北京清华大学等开发的汉语语音合成系统。但目前所有的汉语语音合成系统都是通过汉字或汉语拼音査找到与它对应的汉语语音文 件来进行语音合成的,而汉字或汉语拼音的计算机机内码都不能与当今世界计算机标准信息 交换代码ASCII码100%兼容,这就给计算机汉语信息处理带来了许多不便。三. 发明内容本发明的目的是提供一种汉语语音码语音合成方法来解决以上存在的弊端。语音合成时, 是通过汉语语音码査找到预先存储在计算机中与它对应的能播放成语音声音的文件来进行语 音合成的。具体来说本发明方法所采用的汉语语音码,它用且仅用26个拉丁字母作为码元,以词为 单位采用按词连写的方式对组成词的每一音节的声、韵、调先进行编码,再依照"声码+介码 +韵码+调码兼隔音节符号"的顺序进行编码的一种汉语语音码,由于26个拉丁字母在128个 ASCII码码符集范围内,因此一旦传统用于合成语音的汉字、汉语拼音改用汉语语音码进行 以汉语为主的语音合成后,世界上 一 切用于处理西,的所有软硬件资源都可以不加改造地用 于处理汉语语音码表达的汉语信息,处理完后在需要时输出该汉语语音码所表达的语音信息。四.具体实施方式
下面结合实施例对本发明的具体实施方式
作进 一 步的说明。(一)所采用的语音码的每一音节声、韵、调的编码方法可以采用类似以下的方法 (注括号内的符号均为汉语拼音符号,不带括号的字母为本发明所采用的汉语每一音 节声、韵、调的编码,以上以下叙述均同。)1、声码的编码b:(b) p: (p)m: ( m )f: (f)d: (d) t: (t)(n )1: ( 1 )g: (g)k: (k)h: (h) j: (zh)q:(ch), (q)x: (sh),(x ) n(r)z:(z )c: ( c )s二 ( s )y: (y)w: ( w )2、介码的编码i:(i)u: (u)y: ( U )3、韵码的编码a:(a)o: (o)e: (e)i: (i)u: ( u )y: (ii)(ao ) c: ( ai ) s : ( an ) x: ( ou ) w: ( ei ) n: ( en )(ua ) 1: ( uo )b: ( ang ) d: ( ong ) p: ( eng ) (ing)g: (ng)(无声母韵母) er: (er)(i)[只与(zh)、 i:ch)、 (sh)相拼] 4、调码的编码a :(-)阴平 e: ( /)阳平v: ( V )上声u: (\)去声 o:(不标)轻声(二)利用上述编码的汉语语音码表示可以采用如下的方法以单词为单位,这里将单个:又字看作单音节词,根据组成该单词的每个音节的《汉语拼 音方案》中的拼音,依次按"声码+介码+韵码+调码兼隔音节符号"的顺序编码,同一个单词 的多个音节不用空格隔开连写,单词与单词之间的编码用空格隔开。这里由于将独立运用的汉字看作单音节词,因此,本发明所采用的汉字编码的方法和汉 语单词音节编码的方法相同,在本发明中所采用的单词音节编码按词连写后得到单词汉语语 音码编码,我们将由若干个单词组成的一组词称为词组,本发明中所采用的词组的编码同汉 语句子的编码相同,由于单词可以表示词组和汉语句子,因此词组的编码和汉语句子的编码 都可以通过单词的编码实现,而不需要对词组和汉语句子另外制定一套专门的编码, 一般在 整句整篇以词为单位表示汉语信息时,在理解时一般不需要进行同音字词的选择,原则上听 起来不会产生歧义的句子,用编码表达时也不会产生歧义。当语音码转换成语音时,可以分别采用查汉语语音码与音节、单词、语段语音合成文件 对照表输出相应的语音。下面例举一些用本发明方法将汉语语音码转换成语音的例子比如wovmno huiu xrvydu hsuyyv laadqawnv.它是汉语语音码所表达的汉语信息,其意义用汉字表达为 "我们会使用汉语拉丁文。"1. 通过査汉语语音码和音节汉语语音合成文件对照表进行语音合成的方法查汉语语音码和音节汉语语音合成文件对照表后得到与语音码对应的汉语语音的声音文 件(为表述方便该声音文件用"相对应的音节汉语拼音.wav"表示,实际情况中是没有汉语 拼音符号的,它只是预先储存在计算机中,可以通过一定的声音播放软件播放的表示相应音 节汉语语音的声音文件)wov ( w6.wav) mno(men.wav) huiu( hui.wav) xrv(sM.wav ) ydu(y6ng.wav) hsu(Mn.wav) yyv(y。.wav) laa(M.wav)dqa(dTng.wav) wnv(wSn.wav).对査找到的代表该音节汉语语音的相应的声音文件用声音播放软件依次顺序播出,词与 词之间采用比同一单词音节之间更长的时间间隔来依次连续播出,这样会听起来更接近按词 朗读的效果,更符合人们听语音的习惯。2. 通过查汉语单词语音码和单词汉语语音合成文件对照表进行语音合成的方法查汉语单词语音码和单词语音合成文件对照表后得到预先储存在计算机中的与单词语音 码对应的以单词为单位的汉语语音的声音文件(为表述方便该以单词为单位的汉语声音文件 用"相坷应的以单词为单位的汉语拼音.wav"表示,实际情况是没有汉语拼音符号的,它只 是预先储存在计算机中,可以通过一定的声音播放软件播放的表示相应以单词为单位的汉语 语音的声音文件)wovmno(w6men.wav) huiu(hui.wav) xrvydu(sMydng.wav) hsuyyv(h&nyilwav) laadqawnv(lMlngwdn.wav).对查找到的以单词为单位代表该汉语语音的相应的声音文件用声音播放软件依次顺序播 出,词与词之间采用比同 一单词音节之间更长的时间间隔来依次连续播出,这样会听起来更接 近按词朗读的效果,更符合人们听语音的习惯。3.通过査汉语语音码串和最大匹配语段汉语语音合成文件对照表进行语音合成的方法 该方法采用最大匹配法,通过查以最大语段为单位的汉语语音码串和语段汉语语音合成 文件对照表输出相应的汉语语音。比如通过査预先储存在计算机中的最大语段为"wovmno huiu xrvydu我们会使用"和"hsuyyv laadqawnv汉语拉丁文"那么汉语语音合成按 下面的方式进行wovmno huiu xrvydu ( w6men hui sMy6ng.wav) hsuyyv laadqawnv (hanyG lSdIngvvdn.wav).(为表述方便上述该以语段为单位的汉语声音文件用"相对应的以该语段为单位的汉语 拼音.wav"表示,实际情况是没有汉语拼音符号的,它只是预先储存在计算机中,可以通过 一定的声音播放软件播放的表示相应以该语段为单位的汉语语音的声音文件)依次类推,上述三种情况中如果语音码对应的音节、单词、语段的汉语语音合成文件分 别换成汉语特定人、中国方言、少数民族语言的语音合成文件时,则计算机合成出来的就分 别是汉语特定人、中国方言、少数民族语言的语音。一般来说,由于外语的音节的声音与汉语音节的声音不能建立某种对应关系,外语的句 子的语序与汉语句子的语序也不同,只有汉语单词、词组或短语和外语单词、词组或短语之 间可以建立某种对应关系,因此汉语语音码与外语语音的合成只能在单词、词组或短语之间 进行,而不能在音节和音节或句子和句子之间进行。比如单词"wovmno我们"可以合成 英语单词(we. wav )的声音,词组或短语hsuyyv laadqawnv合成英语词组或短语(Chinese Latin, wav)的声音,(这里we. wav和Chinese Latin, wav分别代表预先储存在计算 机中的英语we和Chinese Latin的声音文件,可以通过声音播放软件播放),如果某种中 国方言或少数民族语言出现上述与外语同样的情况,我们也采取与外语同样的方法只进行单 词、词组或短语与短语之间的语音合成。在上述三种语音合成方法中第一种方法所需要的计算机语音文件储存空间最小,第三种 所需要的计算机语音文件储存空间最大。比如就汉语来说第一种音节合成的方法的优点是只要将1282个汉语有调音节预先录好 储存在计算机中就可以以不变应万变,这是因为所有的汉字的读音都包括在这1282个汉语有 调音节的语音的声音中,所有的包括新发展在内的汉语单词都是由这1282个汉语有调音节以 词为单位排列组合的结果。由于只有1282个汉语有调音节,因此系统的储存的空间开销小, 而且该系统的稳定性好,该方法的缺点是单词按音节来读不太符合人们的听语音的习惯,这 可以随着今后计算机音节语音合成拼接技术的不断发展而得到改善。今后如果汉语语音有了新的发展,我们只要将新产生出的汉语音节再作相应增加,该方 法便可以适应未来形势的发展需要。第二种以单词为单位的语音合成方法优点是由于预先录入计算机中的语音文件是按词来录入的,因此匹配输出回放后听起来也是按词来朗读,比较符合人们的听语言的习惯,存在
的缺点是由于语音文件是按词储存的,系统所占用的存储空间要比按音节合成方式所需要占 用的存储空间大,而且汉语单词增加了,与该单词对应的语音文件要同步制作并增加,系统 不能做到以不变应万变。第三种按最大语段匹配的方法需要准备大量的语料预先储存在计算机的语料库中,系统 开销就更大,但听起来的效果比前面两种更自然,这种方法也不能做到以不变应万变, 一般 用在听起来自然度要求较高的应用场合。对有些需要模仿人类发音时3型变化的机器人等语音合成系统,它在汉语语音合成时往 往需要知遵汉语每一个音节的声母、介母、韵母、声调信息才能进行汉语语音合成,由于本 发明所采用的汉语语音码含有汉语每一个音节的声母、介母、韵母、声调信息,因此可以根 据上面的汉语语音码与汉语拼音审母、介母、韵母、声调编码对照表,将汉语语音码转换成 汉语拼音声母、介母、韵母、声调的信息后,再输入到机器人汉语语音合成系统中进行汉语语音合成便可。比如对汉语语音码"wovmno",查上面汉语语音码与汉语拼音声母、介母、 韵母、声调编码对照表可以知道w代表汉语拼音的声母(w), o代表汉语拼音的韵母(o), v代表汉语拼音的第三声声调(V ), m代表汉语拼音的声母(m), n代表汉语拼音的韵母 (en), o代表汉语拼音的轻声(不标)。同理,用上述方法,我们可以将所有的任意多音节的汉语语音码转换成汉语拼音的声母、 介母、韵母、声调信息,输入到听需要的类似上面机器人的汉语语音合成系统中便可满足系 统的要求,达到我们所需要的目的。有时为了校对文章的方便,我们需要将汉语语音码文章中的标点符号和移行号朗读出来, 这就要对汉语语音码文章中的标点符号和移行号进行语音合成,为了使得汉语语音码所表达 的汉语信息与ASCII码100%兼容,这里我们特别规定汉语语音码文章中的标点符号和移行号分别与英文的标点符号和移行号相同,在具体语音合成时我们只要将相应的预先储存在计 算机中的标点符号和移行号的声音文件提取出来,用声音播放软件进行播放便可,比如 六种点号句号"."(jCih&o..wav )、问号"? " (wdnhSo.wav)、感叹号"!" (gantSnh&o .wav )、逗号","(d6iMo.wav )、冒号":"(m&oh&o.wav )、分号";"(传nMo.wav )。 七种标号引号""(ylnh纟o.wav)、括号()(ku6hSo.wav )、破折号"-" (pdzh6hSo.wav)、省略号…(shSnglu6h&o.wav)、着重号.(zhu6zh6ngh&o.wav)、书 名号(( ))(shOminghk).wav)、间隔号.(ji&ng^Mo.wav )。 一个移行号移行号"-"(yih&ngh&o.wav )。上面列出了本发明所采用的与英语相同的六种点号、七种标号和一个移行号,括号中的 ".wav"文件就是与标点符号或移行号发音相应的语音合成文件,当该语音合成文件是汉语 的语音合成文件时,则该标点符号或移行号朗读出来的声音便是汉语相应的标点符号或移行 号的声音,当该语音合成文件分别是汉语特定人、中国方言、少数民族语言的语音合成文件 时,则该标点符号或移行号朗读出来的声音便分别是汉语特定人、中国方言、少数民族语言 的相应的标点符号或移行号的声音。当输入的是用汉字或汉语拼音表达的汉语信息时,汉字或汉语拼音可以通过标准模块先转换成汉语语音码再进行上述外语单词、词组或短语、汉语、汉语特定人、中国方言、少数民族语言等的语音转换。
该标准模块进行汉字或汉语拼音转换成汉语语音码时,汉字先转换成汉语拼音,遇异音 同形字时将可能的汉语拼音全部列出,汉语拼音则无须先转换,然后再根据汉语音节语音码 的声码、介码、韵码、调码与汉语拼音编码对照表先转换成相应的汉语音节语音码串,然后 再查词库进行按词切分。对包括异音字引起的多种单词切分,可以依据汉语词法句法上下文 联系及统计规律等手段先进行判别后再进行单词分割,对已经分过词的汉字和汉语拼音转换 成汉语语音码后则不必再进行单:司切分,仍以原来的单词为单位进行转换。上述分割出的单 词采取同 一 单词的音节与音节之间连写,词与词之间空格的方式表示,在汉语信息表示处于汊语语音码状态时其标点符号和移行号的用法与英文标点符号和移行号的用法相同。下面例 举一些本发明方法中所采用的标准转换模块将汉字汉语拼音转换成汉语语音码的例子1. 对汉字首先将汉字通过螢表的方式转换成对应的汉语拼音 比如"我们会使用汉语拉丁文。"转换成拼音后成为w6 men hui sW y6ng h纟n yddTng wen。2. 对由汉字转换过来的或原有的汉语拼音则通过以上汉语拼音和语音码码表对照表将 汉语拼音转换成如下汉语语音码串。wov mno huiu xrv ydu hsu yyv laa dqa wnv.(音节和音节之间用空格隔开) 或woymnghuiyxryydyhs.yyyYla§dq§wnY.(音节和音节之间不用空格隔开) (熟练后mno中的轻音符o在不引起混音时可以省略,以上以下均同。) 为了让大家看清楚,这里将表示声调的字母加了下划线,语音码中的声调字母同时具隔 音节作用,实际语音码中声调无下划线,熟练语音码后,声调兼隔音节符能够方便区分出来。3. 将语音码串进行分词切割,最终完成语音码转换。通过查找预先分好词的汉语语音码单词词库,将同一个单词的多个音节连写,词与词之 间用空格隔开便得到以下我们最终需要的汉语语音码 wovmno huiu xrvydu hsuyyv laadqawnv.依次类推,用上述方法,我们可以将所有的任意多的汉字和汉语拼音转换成以词为单位 的汉语语音码,以这些汉语语音码组成的单词为基础,汉语信息经过所有与处理西码相同的 软硬件系统处理后,并根据需要采用按音节、单词、最大语段匹配的方式将汉语语音码合成 为外语单词、词组或短语、汉语、汉语特定人、中国方言、少数民族语言的语音,从而可以 方便地进行各种汉语信息和语音合成处理。
权利要求
1. 一种将汉语语音码转换成语音的方法,其特征在于所转换成的语音包括外语单词 词组或短语、汉语、汉语特定人、中国方言、少数民族语言的语音。
2. —种如权利要求书1所述的语音码转换成语音的方法,其特征在于所采用的汉语 语音码用且仅用26个拉丁字母,以词为单位采用按词连写的方式对组成词的每一音节声、韵、 调先进行编码,再依照"声码+介码+韵码+调码兼隔音节符号"的顺序依次进行编码。
3. —种如权利要求书1或2所述的语音码转换成语音的方法,其特征在于当语音码 转换成汉语语音时,采用查汉语语音码中的音节和汉语音节语音合成文件对照表输出相应的 汉语语音..
4. 一种如权利要求书1或2所述的语音码转换成语音的方法,其特征在于当语音码 转换成汉语语音时,除了采用以音节为单位进行语音转换外,还可以采用査以词为单位的汉 语语音码和汉语单词语音合成文件对照表输出相应的汉语语音。
5. —种如权利要求书1或2所述的语音码转换成语音的方法,其特征在干当语音码 转换成汉语语音时,除了采用以音节或以词为单位进行语音转换外,还可以通过最大匹配法, 采用查以最大语段为单位的汉语语音码串和汉语语段语音合成文件对照表输出相应的汉语语 音
6. —种如权利要求书3或4或5所述的语音码转换成语音的方法,其特征在干当将 汰语语音码或汉语语音码串所分别对应的音节、单词、语段的语音合成文件分别换成汉语特 定人、中国方言、少数民族语言的语音合成文件时,通过查汉语语音码或汉语语音码串与相 应音节、单词、语段的语音合成文件对照表,可以分别输出相应的汉语特定人、中国方言、 少数民族语言的语音。
7. —种如权利要求书1或2所述的语音码转换成语音的方法,其特征在于还可以采 用査以词、词组或短语为单位的汉语语音码和相应外语单词、词组或短语语音合成文件对照 表输出相应的外语单词、词组或短语的语音。
8. —种如权利要求书1或2所述的语音码转换成语音的方法,其特征在于对齊要输 入汉语每一个音节的声每、介母、韵母、声调信息才能进行汉语语音合成的系统,可以根据 汉语语音码与汉语拼音声母、介母、韵母、声调编码对照表,将汉语语音码转换成汉语拼音 声母、介母、韵母、声调的信息后,再输入到汉语语音合成系统中进行汉语语音合成。
9. 一种如权利要求书1或2所述的语音码转换成语音的方法,其特征在于当汉语信息表示处于汉语语音码状态时,其六种点号,七种标号和一个移行号采用与英文相同的形式, 语音^成时可以合成为相应的汉语、汉语特定人、中国方言、少数民族语言的语音。
10. —种如权利要求书1所述的语音码转换成语音的方法,其进一步特征在干当输入 的是用汉字或汉语拼音表达的汉语信息时,'汉字或汉语拼音可以通过标准模块先转换成汉语 语音码再进行上述外语单词或短语、汉语、汉语特定人、中国方言、少数民族语言的语音转 换。
全文摘要
本发明是一种汉语语音码转换成语音的方法,属于计算机语音合成技术领域。通过这种方法可以方便地将包含汉语声、韵、调用且仅用26个拉丁字母作码元的汉语语音码转换成汉语、汉语特定人、中国方言、少数民族语言、外语单词词组及其短语的语音,采用这种汉语语音码后,就克服了目前所有汉语语音合成只能用汉字或汉语拼音进行,且汉字和汉语拼音与ASCII码不能100%兼容的弊端,本发明能广泛应用于语音合成技术领域,给计算机语音信息处理提供了极大的便利。
文档编号G06F17/28GK101123089SQ20061002980
公开日2008年2月13日 申请日期2006年8月8日 优先权日2006年8月8日
发明者苗玉水 申请人:苗玉水
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1