四声码汉字输入方法

文档序号:6412371阅读:841来源:国知局

专利名称::四声码汉字输入方法
技术领域
:本发明涉及一种以汉语拼音为基础,区分韵母声调,用于计算机的汉字编码输入方法。目前通常使用的汉字编码方案可分为两大类1.字形编码,2.拼音输入法。字形编码的优点是分辨率高,重码少,输入速度较快,缺点是1.较难掌握。部件太多,无法规范。在二十多个键位上凌乱的布满了上百个字根,无规律可循,需要大量的死记硬背和反复练习来掌握和巩固熟练。其结果是难学易忘,给使用者带来很大负担。2.严重干扰思维。在拟稿时,人们谴词造句思维是以声音形式来表达的,而为了输入又不得不考虑字的几何形状,把字拆分为字根,思维不得不同时协调字音、字形两个方面的工作,难免会顾此失彼。由于这些缺点,实践已证明,字形编码并不适合非专业人员的使用。日本在这方面的经验也值得我们借鉴,在六十至七十年代他们也曾走过字型编码的道路,但由于遇到上述的种种困难,后来采用假名和罗马字输入的方法很快就取代了字型编码的方法。现在字型编码的方案在日本已经绝迹(见《科技日报》《汉语输入的发展方向是什么?》1995.9.20)。普通拼音输入法的优点是规范性,简易性。只要懂得汉语拼音,不需要专业训练很快就能够掌握。缺点是字音不分四声,分辨率低,重码多,许多字还需要翻页查找。由于不分四声,词组重码也较多,如输入“设计”一词会出现三个相同拼音编码但不同声调的词组射击、设计、涉及。重码的出现往往会分散人们的注意力,输入时目光不得不在手稿与屏幕间来回转换,无法盲打,降低输入速度。为了克服目前拼音输入方法的这些困难,人们已经开始认识到输入字音声调的重要性,有人开始使用声母、韵母、声调三键输入字音的方法。也有人继续采用两键输入声母、韵母的方案,然后靠等待声调循环的办法来控制四声(见专利公开号CN-1108400A)。三键输入法的缺点是在声母韵母相拼后再加声调,把韵母和声调完全分割开,不符合现行小学语文教学强调的声母直接与带声调的韵母相拼的规则,拼法较慢。而且所有字音都需打三键,第三键只能打1、2、3、4四个数字,这是一种浪费,没有充分发挥三键输入码的潜力和效能。靠等待声调循环的方法来控制四声也不宜提倡,因为打完韵母键后不抬手指等待所选用的声调,打字过程本身就不流畅,况且等待还需要时间,限制了速度的提高,不可能做到高速录入。另外,以上方法虽然区分四声,但同音同声调的字仍有一定的重码,还需做进一步改进。为了克服上述方法的这些困难,本发明根据汉语拼音韵母表中蕴藏的内在规律,按照字音四声的要求,结合键盘的具体形式而构成了一套新的韵母排列规则,并在此基础上增加了首末笔识别,大大减少了同音字的重码,形成了一种新型有效的拼音四声汉字编码输入方法。本发明的目的是这样实现的将键盘定义为若干个韵母键区和复合键区,每个韵母键区由四至五键组成,对应汉语拼音的四声及轻声;输入时若输入声母键后直接键入韵母区键,则为一键韵母键;若输入声母键后,再打复合键,然后打韵母键,则为两键韵母。正是靠两键韵母即复合键和韵母区键的组合可以反映出韵母表的构成规律.即有沿《汉语拼音韵母表》的纵向和横向两个方向对韵母进行分类的特点。方法一每一个复合键与若干个韵母区的组合都形成《汉语拼音韵母表》中的某一行韵母,每一个韵母区与各复合键的组合都形成《汉语拼音韵母表》中的某一列韵母,并且均带有四声及轻声(详见实施方案一)。方法二若干个复合键与每一个韵母区的组合都形成《汉语拼音韵母表》中的某一行韵母,每一复合键与各韵母区的组合都形成《汉语拼音韵母表》某一列中的韵母,并且均带有四声及轻声(详见实施方案二)。《汉语拼音韵母表》中的第三列和第四列即u和ü列可合并为一列。这样虽然出现韵母重码,但是声母与该两列韵母相拼后的拼音并没有重码,这样就保证了拼音编码的唯一性。在按以上方法输入了声母和韵母后,可能仍会出现一些同音同声调的汉字,为了区分这些重码,采用了简易的首末笔笔画识别法。方法是将汉字的基本笔画分为五种撇、捺、横、竖、折,并将键盘分为五个区,每区五个键,二十五个键位分别对应首末笔的二十五种组合形式,实现了用一键同时识别汉字的首笔和末笔笔画。对双字词组进行四声码编码,形成四声码词库,方法是第一字的四声码+第二字的四声码,不加识别笔,码长4至6键。采用单字和双字词组的四声码编码做为汉语字、词发音的编码。本发明的主要特点如下1.继承了普通拼音法的优点,简明直观,规范性好,容易掌握。韵母键经过合理优化排列,具有按韵母表的行、列纵横两个方向分类的特点,相关性极强,便于记忆,便于使用。选用出现频率较高的韵母做为一键韵母,缩短了平均码长,其中两键见音的字(一声一韵)占38%,三键见音的字(一声二韵)占62%。2.首屏见字,大量二级简码。与普通拼音码相比,四声码排除了3/4的其它声调的汉字,重码明显减少,汉字出现的顺序又是按高频先见的原则排列,所以绝大多数的汉字都可以在第一屏显现,不需要翻页。另外,汉语大约有1100个音,每个音的第一个字按空格键即可上屏,这1100个首字就是四声码的二级简码。按照《现代汉语频率词典》的统计,前一千个高频汉字在文章中出现的概率为91.26%,因此,在熟悉二级简码后很多常用字即可完全靠拼音盲打输入。3.采用了独创的首末笔笔画识别法,方法简单,一学即会,避免了普通形码需背诵大量字根的困难,但却具有很高的分辨率。通过它可以对同音汉字进行第二次筛选,打识别笔后整个一、二级字库的6763个汉字被化分为5268个编码。一级汉字字库的重码率已很少,但与二级字库间仍有少量重码,汉字单字的输入效率有很大的提高。4.词组容量大,重码低。在普通文章中,词组出现的频率很高,据统计汉字以单字形式出现的比例为33%,而以词组形式出现的比例竟达67%。实践业已证明,词组的应用无论是使汉字的输入速度还是准确程度都大为提高,是解决汉字输入瓶颈问题的一条有力捷径。然而词组的使用也存在着问题,最突出的问题就是重码。一方面人们为了提高速度,尽量扩充词组,多收集词汇,增加覆盖率,但是另一方面词库的容量是有限的,词组的增加使得词组与库容量的比例增大,重码也就随之增多,反过来又制约和影响着词组的使用效率。由此看来,增加词组的覆盖率和减少重码是一对矛盾。如何解决这一矛盾呢?办法是扩大词库的容量。以下是根据三种输入方法的组码规律得到的各词库容量1.双拼172.五笔363.四声120万按目前普通词库词组数量一万条考虑,可以看出在双拼输入法中,词组与词库容量的比值约为1∶17左右,词组重码现象比较严重,进一步扩充词组已没有意义。在五笔字型中,汉字和词组总数为1.7万,此比值约为1.7∶36,因此也有一定重码,而且常出现单字与词组重码的现象。四声码中此比值约为1∶120为各方案中最低,重码最少,而且单字不与词组重码。利用四声码可以进一步将词组总数扩充到二万至三万仍可较好的解决重码问题,这样可以将我们常遇到的一些次常用词汇也收入进来,增加词库的覆盖面,输入效率更高。5.多媒体发音,所听即所输。由于本输入法以音节为输入对象,区分四声,因此可以利用多媒体技术简易地实现所输入汉字的发音功能,从声音来判断键盘的输入是否正确。这种有效的语音反馈系统明显地改善了计算机输入过程中人机之间的相互关系,掌握了输入的主动性,可对所打内容心中有数,避免发生错误,提高准确性,使该方法的学习和使用变得更容易。这一点尤其对非专业人员帮助很大,有利于实现盲打。6.因是语音输入法,输入与思维保持一致,思考所打内容时即可下意识的敲击键盘进行输入。同时该方法完全符合现行语文教学的汉语拼音拼读方法。下面结合附图对本发明作进一步详细说明。图1为本发明所利用的《汉语拼音韵母表》;图2为本发明实施例一的键盘布置图;图3为依据图2的键盘布置组合而成的韵母表;图4为本发明实施例二的键盘布置图;图5为依据图4的键盘布置组合而成的韵母表;图6为依据图4的各韵母区复合键所代表的韵母表;图7为本发明首末笔识别的键盘布置图。本发明的具体实施方案(一)一、声母排列方法声母zh、ch、sh分别由a、u、i字母键代替,其它各声母用与其相同的英文字母键输入。二、韵母键的布置将键盘划分为三个韵母区和三行复合键区,见图2,每个韵母区有五个键,从左至右依次为该韵母的阴平、阳平、上声、去声和轻声五个声调键。韵母键分为一键韵母键和两键韵母键。输入时若输入声母键后直接键入韵母区键,则为一键韵母键。三个韵母区分别对应三组最常用的一键韵母i、u、ong和iong。若输入声母键后,再打复合键,然后打韵母键,则为两键韵母。因此输入某一音节时,有时需两键(一声一韵),有时需三键(一声二韵)。复合键区是这样安排的第一行的五个键都是以字母a为开头的韵母,分别为a、an、ang、ao、ai。第二行的四个键都是以e为开头的韵母,分别为e、en、eng、ei。第三行的二个键都是以o为开头的韵母,分别为o,ou。复合键与韵母区的组合是按照如图1所示的《汉语拼音韵母表》的内在规律布置的。其中各复合键与第一韵母区的组合为韵母表中第一列纯韵母,与第二韵母区的组合为韵母表中第二列韵母,与第三韵母区的组合为韵母表中第三列和第四列合并后的韵母;而每一个复合键与三个韵母区的组合又形成《汉语拼音韵母表》中的某一行韵母,以an为例an与韵母第一区的组合为韵母an的各声调键,an与韵母第二区的组合为韵母i与韵母an相拼后产生的韵母ian的各声调,an与韵母第三区的组合为韵母u和ü与韵母an相拼后产生的韵母uan和üan的各声调。复合键与韵母区键组合后形成的各韵母详见图3。虽然与韵母第三区相拼后产生了像uan和üan这样的韵母重码,但是当声母与这些韵母相拼后并不产生重码。如上例某一声母如能与uan相拼,则不能与üan相拼,不会出现两个音对应于同一编码的现象。需说明的是韵母ong和iong同在一键,但拼音不会出现重码现象。三、只有韵母没有声母的汉字的编码方法安、欧、昂等字只有韵母而无声母,在这种情况下采用方案(二)的韵母表,共五个韵母区,详见图4。其拼法为先按虚拟声母o或e键,出现五个汉字,然后每个韵母区对应一个这种韵母,这五个汉字分别为各区中有代表性的汉字。方法如下表<tablesid="table1"num="001"><tablewidth="777">虚拟声母第一区第二区第三区第四区第五区oa阿ai爱an安ao奥ang昂ee额o喔en恩ou欧er而</table></tables>共有十个这样的韵母。四、首末笔识别法。首先将汉字的笔画分为五大类,即撇、捺、横、竖、折。其中,点划归在捺类中,所有的汉字都是由这五种笔画构成的。我们取每个字的首笔和末笔做为识别笔。将键盘分为五个区,见图7。每个区的排列方式依次为撇起笔第一区,捺起笔第二区,横起笔第三区,竖起笔第四区,折起笔第五区。每个区五个键一、二、三、四、五键分别对应末笔为撇、捺、横、竖、折五种笔画。例如,输入″禾″字时,首笔为撇,末笔为捺,则识别笔为第一区第二键,字母″w″键。当输入″元″字时,首笔为横,末笔为折,识别笔为第三区第五键,即字母″g″键。这样就实现了一键同时识别字的首笔和末笔两个笔画。五、双字词组的输入方法与普通双拼一样,双字词组的输入方法是首先输入第一个字的四声码,然后再输入第二个字的四声码,不打识别笔。由于每个字的码长为2-3键,所以双字词组的总码长为4-6键。六、三字词组的输入方法输入三字词组只需依次输入三个单字的声母键。七、四字及四字以上多字词组的输入方法为避免与单字、双字和三字词组发生混淆,输入四字及四字以上词组时先输入字母″V″,然后再输入四个声母键,声母键分别为词组第一字、第二字、第三字和末字的声母键,如无重码直接上屏。八、平、翘舌声母混合输入由于很多人对区分平、翘舌音感到比较困难,为此特设置了平、翘舌音混合输入方法。用字母q代替zh和z,字母j代替ch和c,字母x代替sh和s。除了i以外,拼音中声母j、q、x与声母z、zh、c、ch、s、sh没有共同的韵母,因此,完全可以用j、q、x代替。但当与韵母i相拼时,需用jl、ql、xl来代替声母z、zh、c、ch、s、sh,这样就避免了重码。本发明的具体实施方案(二)本方案除具备方案一中的第一、三、四、五、六、七项功能之外,不同之处在于韵母键的布置和平、翘舌声母混合输入。一、韵母键的布置将键盘划分为五个韵母区和两列复合键区,见图4,每个韵母区有四个键,从左至右依次为该韵母的阴平、阳平、上声、去声四个声调键。五个韵母区分别对应五组最常用的一键韵母a和ia、e、an、i、ong和iong。复合键区是这样安排的六个键分为两列,t、g、b为第一列,y、h、n为第二列,每列中又分为上、中、下三键。其中两上键与各韵母区的组合为韵母表中的第一列纯韵母,两中键与各韵母区的组合为韵母表中的第二列韵母,两下键与各韵母区的组合为韵母表中第三列和第四列合并后的韵母。如图5、6所示,复合键与韵母区的组合还可以反应出按照《汉语拼音韵母表》的横向排列的特点当一列复合键与某一韵母区相拼时,对应于韵母表中的某一行。比如第二列复合键与第三区韵母相拼时相当于《汉语拼音韵母表》中的第十行,即en、in、uen、ün四个韵母。其中复合键的上键与该韵母区组合后为《汉语拼音韵母表》中该行最左边的纯韵母,即y与第三区相拼后为韵母en。中键与该韵母区相拼后为韵母i与左边纯韵母相拼后的结果,i与en相拼后为in,所以h键与第三区拼后即为in。当下键与该区相拼的时候,为韵母表中的u和ü与左边韵母相拼的结果,即为uen和ün,所以下键n和第三区拼后为uen和ün。需说明的是a和ia、ong和iong、o和uo韵母同在一键,但拼音不会出现重码现象。ua、u、ü键的位置是个特例,不符合上中下键间的拼音组合规律。轻声的处理将韵母区扩展到复合键区,以与每个韵母区相邻的复合键做为轻声键,形成每个韵母区五键的布局。二、平、翘舌声母混合输入采用字母q代替zh和z,字母j代替ch和c,字母x代替sh和s。当与i拼时,改用jg、qg、xg来代替,这样就避免了重码。权利要求1.一种用于计算机的四声码汉字输入方法,主要分两步进行,首先输入声母键,然后再输入韵母键,其特征在于a.韵母键包括有一键韵母键和两键韵母键,分别由键盘中定义的韵母键区及复合键区与韵母键区的组合而构成;b.每个韵母键区由四至五键组成,对应汉语拼音的四声及轻声;c.通过复合键区与韵母键区的组合,两键韵母键具有使韵母沿《汉语拼音韵母表》的纵向和横向两个方向分类的特点。2.根据权利要求1所述的四声码汉字输入方法,其特征在于每一个复合键与若干个韵母区的组合都形成《汉语拼音韵母表》中的某一行韵母,每一个韵母区与各复合键的组合都形成《汉语拼音韵母表》中的某一列韵母,并且均带有四声及轻声。3.根据权利要求1所述的四声码汉字输入方法,其特征在于若干个复合键与每一个韵母区的组合都形成《汉语拼音韵母表》中的某一行韵母,每一复合键与各韵母区的组合都形成《汉语拼音韵母表》某一列中的韵母,并且均带有四声及轻声。4.根据权利要求1所述的四声码汉字输入方法,其特征在于在两键韵母的构成中将《汉语拼音韵母表》中的第三列和第四列即u和ü列韵母合并为一列,形成三列韵母的布局,简化了键盘的布置。5.根据权利要求1所述的四声码汉字输入方法,其特征在于对只有韵母、而无声母的汉字采取虚拟声母的编码方法,以o、e两键作为虚拟声母,然后每个韵母区对应一个韵母,其中虚拟声母o后面对应的五个韵母分别为a、ai、an、ao、ang,虚拟声母e后面对应的五个韵母分别为e、o、en、ou、er。6.根据权利要求1、2、3、4、5所述的四声码汉字输入方法,其特征在于将汉字的基本笔画分为五种撇、捺、横、竖、折,并将键盘分为五个区,每区五个键,二十五个键位分别对应首末笔的二十五种组合形式,实现了用一键同时识别汉字的首笔和末笔笔画。7.根据权利要求1、2、3、4所述的四声码汉字输入方法,其特征在于采用j、q、x三个键分别代替c、ch、z、zh、s、sh三对声母键,不分平、翘舌音,混合输入,为避免重码,当与韵母i拼时由其它键来代替j、q、x。8.根据权利要求1、2、3、4所述的四声码汉字输入方法,其特征在于对双字词组进行四声码编码,形成四声码词库,方法是第一字的四声码+第二字的四声码,不加识别笔,码长4至6键。9.根据权利要求1、2、3、4所述的四声码汉字输入方法,其特征在于采用单字和双字词组的四声码编码做为汉语字、词发音的编码。全文摘要本发明提供了一种用于计算机的四声码汉字输入方法,主要由两步组成,先输入声母键,然后再输入韵母键,其中韵母键是由键盘中定义的韵母键区及复合键区与韵母键区的组合而构成;每个韵母键区由四至五键组成,对应汉语拼音的四声及轻声;韵母键经过合理优化排列,韵母具有按《汉语拼音韵母表》的纵、横两个方向分类的特点;本发明具有规律性强,便于记忆,简单易学,以及词组容量大,分辨率高,重码低,输入流畅,输入速度快等特点。文档编号G06F3/023GK1178344SQ9711884公开日1998年4月8日申请日期1997年10月24日优先权日1997年10月24日发明者陈澜申请人:陈澜
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1