汉语友声声数系统的技术方法

文档序号:6599384阅读:270来源:国知局
专利名称:汉语友声声数系统的技术方法
汉字是汉语的一个语音音节符号,也是汉语的语素符号。汉语语词是组成汉语句子中有一定意义的最基本单位,单音节的汉字往往只是组成汉语句子的备用单位。,目前国内外已有的计算机汉语语音系统有北京四达公司的“声威”语音系统、天津大学的“汉声卡”语音系统……等,这些汉语的语音系统都只能按单音节汉字的一个读音由计算机读出。
汉字不但同音字数量多,而且还广泛存在着同形多音多义的现象,比如“行”字,一般都认为只读“xíng”或“háng”,而实际上“行”字还读“héng”和“hàng”音。汉字的读音不同,往往意义也不同,像这样的汉字数量很多。如果计算机的语音系统不能准确的读出音节的声调和不同语句中汉字的正确读音,这样的系统不能称作“汉语语音系统”,而只能是汉字的“一个读音系统”。用这样的“语音”系统校对汉语文件时,由于系统对多音字只按一种读音处理,不但增加了听的困难,还直接影响对意义的理解;用来进行语音教学,还会不可避免的发生错误。再加上只能按汉语的单音节符号读汉字字音(一个汉字一个汉字的读汉字的音),势必离汉语的自然语音距离太远,这些问题存在,往往造成监听困难、意义理解错误。
本发明的基本思想是遵循汉语的语音规律,根据国际字符、多国汉字ISO标准字符集中或其它汉字字符集所涉及的汉语语音音节,建立起相应的汉语语音库,并建立单音节汉字和汉语词语与汉语语音音节的对照表(简称“汉语字、词语音转换表”),即根据每个汉字在有意义的语词中应有的读音一一注音加调,按照次序建立注音带调能区分多音字的词语数据库,当汉语音节数据通过软件程序与屏幕显示同步经发声器输出时,输出的数据首先要经过“汉语字、词语音转换表”分析转换,自动地按照汉语的书面符号所在语句中应有的正确读音,从语音库中取出相应的语音数据并通过语音卡放出符合语音标准的读音。这样的语音系统才是真正的汉语语音系统,而不是脱离语言环境的汉字读音系统。
汉语语言在其历史发展过程中,语言的节奏性、音乐感越来越强,语义的表达越来越丰富、准确,从而使汉语由古汉语的单音节词为主向双音节,甚至多音节(三个音节以上)词语发展。在现代汉语中,除了有约两千个单音节词外,大部分音节符号都是组词的备用单位,这是汉语语言的现实。因而只按汉语的单音节音来校对文稿也是很难准确理解其意义的。本发明在用声数输入法建立的文本输入或输出时,能将双音节和三音节、四音节……等多音节的词语,准确的按汉语自然语言的规律由计算机“读”出来,并能使输入和发声同步;当要校对其它方法输入的文本时,也可根据上述“汉语字、词语音转换表”来自动分词并确定正确的读音,使计算机文稿的校对读音和节奏都符合汉语的自然语言实际,从而提高了计算机语音校对的质量和实用价值。
从上述目标出发,目前我们已应用计算机的软、硬件结合的技术实现了一个可带声调和区别开多音汉字并能按照汉语的基本造句单位-词语来输出符合自然语言的新一代的汉语语音系统。我们首先将现代汉语的标准音节录音做成汉语语音数据库,再将国家、地区、国际标准规定的汉字的每一读音,以及现代汉语的八万多条二音节、三音节、四音节、五音节和五音节以上的多音节词语等,按音节语素实际组合中的正确读音,逐字或逐条词语音节标注语音符号、声调,整理形成数据库(或压缩数据库)。这样的语词库和汉语语音转换表组成的语音分析对照表存放在计算机的磁盘(硬)或内存(包括扩展内存),或固件中。利用以上两个基础数据库和“汉语字、词语音转换表”,形成汉语友声声数语音系统,实现对汉语数据、英文、俄文、希腊文字母、日文片假名和数字、符号数据库内容的有声校对。实现对句段读出和键入记录监听校对(电脑速记监听校对),并可进行速度、音量调控,发音屏蔽控制。利用这样的系统开发出的汉语学习系统进行电脑汉语教学,将是图、文、声和思维结合新的教学手段,可进行汉语拼音拼读、汉字识字,汉语词语、句子的汉语解释,也可进行相关母语语种的解释,供中国人或外国人学习汉语、汉字使用。这样一系列的技术配合,实际上是一个较为完整的集头脑思维、手指输入、电脑语音发声、语音文字的提示于一体的多媒体系统。它可以较好的完成教学、文件、现场电脑记录的语音校对与编辑等工作。
权利要求
1.汉语友声声数语音系统的技术方法,其特征是该方法将汉语音节按顺序排列,逐个和逐条将汉语字词进行注音加调,形成一个“汉语字、词语音转换表”数据库,并建立相应汉语语音库,用计算机软件或软、硬件结合的方法,实现计算机汉语信息数据显示或输入时同步发出相应字、词的标准读音,形成符合汉语语法规范的自然语音流;如果将“汉语字、词语音转换表”和汉语语音库固化,可以提高输出的速度,若将数据放在内存或硬磁盘中可降低成本,两种方法都能组成汉语友声声数语音系统;
2.根据权利要求1所述的汉语友声声数语音系统的技术方法,“汉语字、词语音转换表”特征是该技术按汉语语音音节的顺序,对汉字和汉语按照规范逐字逐条的进行注音加调,形成一个汉语字、词语音转换表;
3.根据权利要求1所述的汉语友声声数语音系统的技术方法,汉语语音库特征是依据国际字符集、多国汉字ISO标准字符集或其它汉字字符集所涉及的汉语语音音节,用录音或合成的方法建立相应的汉语语音库;
4.根据权利要求1所述的汉语友声声数语音系统的技术方法,其系统组成特征在于该友声声数语音系统,是由“汉语字、词语音转换表”、汉语语音库、汉语学习系统、语音校对系统组成的。
全文摘要
汉语友声声数语音系统的技术,是将汉语字词逐个音节加注拼音声调,并建立一个汉语字、词语音转换表和汉语语音库;通过智能化处理汉语数据,可自动分词、准确地发出符合汉语语法规范的标准声音,使汉语的语音输出接近自然语言,从而大大提高了汉语语音校对和教学的质量。
文档编号G06F3/16GK1084984SQ9310864
公开日1994年4月6日 申请日期1993年7月19日 优先权日1993年7月19日
发明者朱克勤, 唐懋宽, 罗四维, 李晋京, 唐学琴 申请人:北方交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1