首音码汉字输入法

文档序号:8281947阅读:932来源:国知局
首音码汉字输入法
【技术领域】
[0001 ] 本发明首音码汉字输入法涉及计算机信息处理技术领域。
【背景技术】
[0002]出生于40、50、60年代的人多有进行文字处理和上网交流信息的愿望,但他们苦于不熟悉借助于计算机键盘使用拼音输入汉字,终感遗憾。对于他们来说,输入汉字的速度并不是主要追求目标,准确度才是最重要的。一般文字处理和上网交流信息,能较熟练输入3500个常用字已足够,所以他们急切盼望有包括4000字左右的重码少、几乎不需翻页的输入法问世。现行所有的汉字输入法均存在如下缺陷:1.形码类输入法记忆因素太多,输入方法复杂,需要看字联形,对文字处理时思维有较大影响。2.音码类输入法重码多、需翻页。仅以涵盖由国家语言文字工作委员会和前国家教委联合发布的《现代汉语常用字表》中3500常用字的“小学生字典”为例,在4108个字中,只有18个全拼音字无重码,重码率高达99.6%,在388个全拼音字组中,有重码且需翻页的组多达164个,翻页率高达42.3%,最多的重码字达62个,这就意味着如果每页10个字的话,最多要翻7页,如果每页只有5个字,则最多要翻15页。而计算机操作系统自带的“微软拼音”单字库中既包含有简体字也包含有繁体字,重码率几乎接近100%。3.对于拼音不熟悉和拼音不准的人来说无法使用全拼音输入。

【发明内容】

[0003]本发明的目的在于为了解决以上缺陷,提供了一种只需要用汉字拼音的字首音进行编码的首音码汉字输入法。
[0004]本发明的技术方案为:一种首音码汉字输入法,该首音码汉字输入法将字的首音或偏旁部首字的首音与通用键盘直接挂钩,对于不是字的偏旁部首,按照字典上介绍的规则与键盘挂钩。
[0005]首音码单字取4码,按字首音、第一偏旁部首字首音、第二偏旁部首字首音、最后偏旁部首字首音的顺序编码。
[0006]首音码输入单字是以汉字的结构为码序的。现代汉字的间架结构可分为五大类型,这五大类型是:独体、左右、上下、包围、对称;
按汉字结构书写的次序为:先左后右,先上后下,先外后内,先外后内再封口 ;
对于左右、上下和两分体的杂合结构字除字的首音编码之外,只能取到两个编码,共计二码;
首音码的三字词组也是用三个汉字的字首音编码的,为了避免跟三字词组发生重码,对于二分体单字还要增加一个结构识别码;在首音码的编码方案中,左右型用U,上下型用i,杂合性用V ;对称字在取码时如果缺码,后面补上X ;
对于不可拆分成独立“字块”的独体字,编码方法是先重复取该字的两个首音,最后取该字的第一笔画首音; 字典中的一画偏旁部首都是汉字的基本笔画,有“横”、“竖”、“撇”、“捺”、“点”、“折”,在首音码中分别用它们的字首音h、S、p、n、d、z表示。
[0007]两字词组分别取第一字首音编码,第二字首音编码,第一字第二编码,第二字第二编码。三字词组就取3码,即每个字在首音码中的编码。
[0008]四字及多字词组采用“前三末一”的取码方法,分别取它们的字首音编码。
[0009]本发明的优点在于:准确性例如:“谢”字在“小学生字典”拼音Xie中排在第20位,在“新华字典”中排位在第35位,如果用全拼输入,肯定需要翻页。但用首音码在输入xysc后却可立即上屏,没有重码。要对音码完全取消重码几乎是不可能的,只要将重码降低至每页10个以下,就可以在不翻页的情况下准确输入汉字。经过对4000个汉字逐一进行编码,首音码的重码率为38.9%,翻页率为2.3%,之所以这么低是因为其中占75.8%的字的重码只有2、3个,仅需增加一个数字键即可选择输入,不需翻页。可以说,在减少重码和翻页问题方面,与其他音码相比较首音码占有绝对的优势。4000个汉字对于50岁以上的略懂拼音的中老年人来说应该足够使用,如果需要输入这4000个之外的字,可以用十分简易、便捷的“人工造词”方法,将其自动加入字库输入。易学性首音码不需要区分z、C、s和zh、ch、sh,不需要使用韵母和音调,非常容易学,对于一般智力的人,只要I至2小时就可以学会并掌握应用。国际性首音码只需要知道字的首音,对于同音的简体字和繁体字,输入方法几乎完全相同。例如:“杨”和“楊”两字,在“首音码”中编码都是:ymyu。所以,首音码可以在使用汉字的任何国家和地区的50岁以上的广大人群中进行推广应用。公益性用首音码打字,能巩固对汉字结构和笔顺等方面的知识,不像有些输入法那样,费了好大的劲总算背过其特有的字根和概念,却只能用于打字,对其他文化事业没有丝毫帮助,不能形成良性循环和相互促进。扩展性当前移动设备(手机、平板电脑等)都预装了全拼和手写输入法,全拼重码多,翻页麻烦;手写识别准确率不是很理想,不能书写词组输入。首音码的重码少,翻页率极低,词组丰富。如果象全拼那样在移动设备上预装首音码,将有助于加快信息的传播和交换。
【具体实施方式】
[0010]一种首音码汉字输入法 1.输入方法
首音码是将字的首音或偏旁部首字的首音与通用键盘直接挂钩的方法输入,对于不是字的偏旁部首,按照字典上介绍的约定俗成的方法与键盘挂钩,例如“芬”字的上部在字典的部首中注明为“草字头”,用C注音编码;
2.实施方式
首音码单字取4码,例如:“霸”的首音是b,“雨”的首音是1,“革”的首音是g,“月”的首音是1,“霸”字的编码即为bygy。
[0011]各类音码的区别主要在对单字的编码原理,首音码输入单字是以汉字的结构为码序的。现代汉字的间架结构可分为五大类型,这五大类型是:独体,如:“乙”字;左右(包括左中右),如:“材”、“锄”、“楼”、“飘”等字;上下(包括上中下),如:“忠”、“怠”、“想”、“霜”等字;包围(又称杂合),如:“庆”、“句”、“趟”、“风”、“区”、“凶”、“国”等字;对称,如:“坐”、“北”、“非”等字。
[0012]按汉字结构书写的次序为:先左后右,先上后下,先外后内,先外后内再封口。
[0013]对于左中右、上中下三分体字,可以按三个字块取码,对于左右、上下和两分体的杂合结构字除字的首音编码之外,就只能取到两个编码,例如:“材”字在首音码中可以取到的码是:“材”字的编码c,“木”字的编码m和“才”字的编码C。由于首音码的三字词组也是用三个汉字的字首音编码的,为了避免产生重码,对于二分体单字还要增加一个结构识别码。在首音码的编码方案中,左右型用U,上下型用i,杂合性用V。u、1、v在拼音里是不用的,正好用作结构识别,因此“材”字的全码是:cmcu。对称字在取码时如果缺码,后面补上X (在英文字母书写体中的X正好左右对称)。
[0014]对于不可拆分成独立“字块”(或称构成字的零件简称“构件”)的独体字,编码方法是先取两个整字首音码,再取该字第一笔画字音码。汉字的基本笔画有“横”、“竖”、“撇”、“捺”、“点”、“折”,在首音码中分别用它们的字首音h、s、p、n、d、z表示,所以“事”字在首首码中的编码是:ssh。
[0015]由于对独体字编码最后要取该字的第一笔画音,这里就会涉及到汉字书写的笔顺问题。按照国家语言文字工作委员会的规定,“九”字的笔顺是先撇后折,在首音码中的正确编码是:jjp,“力”字的笔顺是先折后撇,在首音码中的正确编码是:llz。
[0016]在首音码中,两字词组全码取四码,分别是:第一字首音编码,第二字首音编码,第一字第二编码,第二字第二编码。因此,“保证”的首音码全码是:bzry,它的简码是:bz,仅用两码。为了避免翻页,两字常用词组的每组简码控制在十个以内。三字词组就取3码,例如:
“计算机”在首音码中的编码是:jsj。四字及多字词组采用“前三末一”的取码方法,分别取它们的字首音编码。例如:“心有余而力不足”,在首音码中的编码是..耶。
【主权项】
1.一种首音码汉字输入法,其特征在于:该首音码汉字输入法将字的首音或偏旁部首字的首音与通用键盘直接挂钩,对于不是字的偏旁部首,按照字典上介绍的规则与键盘挂钩。
2.根据权利要求1所述首音码汉字输入法,其特征在于:首音码单字取4码,按字首首、第一偏芳部首字首首、第~■偏芳部首字首首、最后偏芳部首字首首的顺序编码。
3.根据权利要求1所述首音码汉字输入法,其特征在于:首音码输入单字是以汉字的结构为码序的;现代汉字的间架结构可分为五大类型,这五大类型是:独体、左右、上下、包围、对称; 按汉字结构书写的次序为:先左后右,先上后下,先外后内,先外后内再封口 ; 对于左右、上下和两分体的杂合结构字除字的首音编码之外,只能取到两个编码,共计二码; 首音码的三字词组也是用三个汉字的字首音编码的,为了避免跟三字词组发生重码,对于二分体单字还要增加一个结构识别码;在首音码的编码方案中,左右型用U,上下型用i,杂合性用V ;对称字在取码时如果缺码,后面补上X ; 对于不可拆分成独立“字块”的独体字,编码方法是先重复取该字的两个首音,最后取该字的第一笔画首音; 字典中的一画偏旁部首都是汉字的基本笔画,有“横”、“竖”、“撇”、“捺”、“点”、“折”,在首音码中分别用它们的字首音h、S、p、n、d、z表示。
4.根据权利要求1所述首音码汉字输入法,其特征在于:两字词组分别取第一字首音编码,第二字首音编码,第一字第二编码,第二字第二编码;三字词组就取3码,即每个字在首音码中的编码。
5.根据权利要求1所述首音码汉字输入法,其特征在于:四字及多字词组采用“前三末一”的取码方法,分别取它们的字首音编码。
【专利摘要】本发明公开一种首音码汉字输入法,该首音码汉字输入法将字的首音或偏旁部首字的首音与通用键盘直接挂钩,对于不是字的偏旁部首,按照字典上介绍的规则与键盘挂钩。本发明的优点在于:准确性,经过对4000个汉字逐一进行编码,首音码的重码率为38.9%,翻页率为2.3%。易学性,不需要使用韵母和音调,非常容易学。国际性,首音码只需要知道字的首音,对于同音的简体字和繁体字,输入方法几乎完全相同。公益性,用首音码打字,能巩固对汉字结构和笔顺等方面的知识。扩展性,首音码除了可以安装在计算机上应用之外,还可以扩展应用预装到移动设备(手机、平板电脑等)上。
【IPC分类】G06F3-023
【公开号】CN104598046
【申请号】CN201510083920
【发明人】谢书良
【申请人】谢书良
【公开日】2015年5月6日
【申请日】2015年2月16日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1