汉字大小字元输入法的制作方法

文档序号:6447505阅读:530来源:国知局
专利名称:汉字大小字元输入法的制作方法
技术领域
本发明涉及一种计算机汉字输入技术,特别是一种汉字大小字元输入法,能方便快捷地将汉字输入计算机。
背景技术
目前的计算机汉字输入方法有很多种,有音码、形码、音形结合码等。其中最早普及采用的是五笔字型输入法,它是一种形码输入法。虽然该输入法字根较多,输入速度较快,但重码率仍较高(在6763个一、二级汉字中产生大约250个重码,占2%),且该输入法的补充码需用字型结构来判断。此外,在一、二级汉字中,它的重码问题无处理方法可以解决(一般仍需要视检)。

发明内容
本发明的任务是提供一种汉字大小字元输入法,使得具有字元标准、拆字规范、规则易学。尤其是本输入法所产生的字与字重码率极低(1%)。而且,本输入法中字与字重码、字与词重码及词与词重码易于盲打识别处理。
本发明的任务是这样完成的本输入法主要是利用现有的26个英文字母键进行输入操作。其特征在于a.将汉字中的只有单个字元的独元字(如“木”、“口”、“子”等)、有两个或两个以上字元的复元字(如双元字“杏”、“打”等,如三元字“河”、“部”等,如四元字“照”、“资”等,如多元字“微”、“耀”等)中的字元(部件)分成“大字元”、“中字元”、“小字元”及“独元字末笔划字元”四类。其中的大字元主要是指包含较多汉字数量的“大部首”或“较大部首”,这些大字元共有26个,包括“艹”、“口”、“氵”、“日”、“人”、“亻”等(见附图),它们分别按其首笔划种类安排在26个英文字母键上,并居于本键各字元之首。其中的中字元是指大字元的简体或繁体,或与大字元形似的字元,并外加小括号,共有12个,包括(讠)、(钅)、(八)、(己巳)、(士)、(幺 )、(曰 )、 ( )、(車),它们分别安排在英文字母键上,并跟随其相关的大字元之后。其中的小字元是指大字元及中字元除外的字元,共有216个,包括“大”、“贝”、“丿”、“忄”、“广”、“虫”等,它们大多数也按其首笔划的种类各自分别安排在26个英文字母键上。
b.将其中的独元字末笔划字元,即小字元和中字元独元字的末字元,并外加中括号,包括[一]、[丨]、[丿]、[丶]、[乙],分别安排在英文字母T、R、E、W及Q键上,其元码,即前述的英文代码专门充当小字元及中字元独元字的末字元元码。
c.每个汉字编码的基本规则,即编码的方法是单字的全码(参与一个汉字编码的各个元码的总和)编为三位码或四位码。一个单字全码的编取(1)规定对独元字编为三位码,后加空格键,对其中属于大字元独元字的编码是该字元元码+F+J,如“木”字的编码为TFJ+空格键,“车”字的编码为ZFJ+空格键等。对其中属于小字元和中字元的独元字的,其编码是该字元元码+次笔划字元元码+该独元字末笔划字元元码,如“方”字的编码为SHE+空格键(方S、一H、[丿]E),“钅”字的编码为CHQ+空格键(钅C、一H、[乙]Q),“小”字的编码为JKW+空格键(小J、丿K、[丶]W),“己”字的编码为MHQ+空格键(己M、一H、[乙]Q)等。当独元字为双笔划小字元字或双笔划中字元字时,其末笔划也是它的次笔划,可以重复取用(但元码不同),如“二”字的编码为YHT+空格键(二Y、一H、[一]T),“十”字的编码为BJR+空格键(十B、丨J、[丨]R),“八”字的编码为DLW+空格键(八D、丶L、[丶]W),“儿”字的编码为KPQ+空格键(儿K、乙P、[乙]Q)等等。其中对属于单笔字或单笔划的,其编码是连续编取三个该字元(或笔划)元码,如“一”编码为HHH,“丨”编码为JJJ,“丿”编码为KKK,“丶”的编码为LLL,“乙”的编码为PPP等(2)规定对双元字编为三位码,后加空格键,即规定为首字元元码+末字元元码+实末笔划代码(以大字元或中字元先行时),或+虚末笔划代码(以小字元先行时)。+实末笔划代码的,如“扣”字的编码为BUH+空格键(扌B、口U、一H),“休”字的编码为ITL+空格键(亻I、木T、丶L),“幻”字的编码为APP+空格键(幺A、乙P、乙P),“分”字的编码为DAK+空格键(八D、刀A、丿K),“异”字的编码为MGJ+空格键(巳M、 G、丨J);+虚末笔划代码的,如“古”字的编码为BUG+空格键(十B、口U、{一}G),“闲”字的编码为ITS+空格键(门I、木T、{丶}S),“孔”字的编码为APA+空格键(子A、乙P、{乙}A),“千”字的编码为KBF+空格键(丿K、十B、{丨}F)等等;(3)规定对三元字编为四位码,即规定为首字元元码+次字元元码+末字元元码+实末笔划代码(以大字元或中字元先行时),或+虚末笔划代码(以小字元先行时)。+实末笔划代码的,如“维”字的编码为AIEH(纟A、亻I、 E、一H),“沙”字的编码为SJKK(氵S、小J、丿K、丿K),“英”字的编码为GRYL(艹G、冂R、大Y、丶L),等等。+虚末笔划代码的,如“难”字的编码为AIEG(又A、亻I、 E、{一}G),“秒”字的编码为SJKD(禾S、小J、丿K、{丿}D),“鞅”字的编码为GRYS。(革G、冂R、大Y、{丶}S),等等。(4)规定对所有四元及四元以上字(不论是以大字元或中字元先行,还是以小字元先行)编为四位码,即规定为首字元元码+次字元元码+第三字元元码+末字元元码。如“幕”字的编码为GFYJ(艹G、日F、大Y、丨J),“作”字的编码为IIJY(亻I、I、丨J、二Y),“商”字的编码为OSRU(ニO、 S、冂R、口U),“辈”字的编码为JNJZ(丨J、三N、丨J、车Z)。
d.词的编码的基本规则,即编码方法是所有词均编为四位码(1)规定对双字词编为前字的首字元元码+次字元元码+后字的首字元元码+次字元元码,如“生活”的编码为KYSK(丿K、Y、氵S、丿K),“奋斗”的编码为YVXB(大Y、田V、 X、十B),“今天”的编码为DLHY(人D、丶L、一H、大Y),等等;(2)规定对三字词的编码为首字的首字元元码+次字的首字元元码+末字的首字元元码+末字的次字元元码;如“委员会”的编码为SUDY(禾S、口U、人D、二Y),“浙江省”的编码为SSJK(氵S、氵S、小J、丿K),“俱乐部”的编码为IKWU(亻I、丿K、立W、口U),等等;(3)规定对四字及四字以上词编码为首字的首字元元码+次字的首字元元码+第三字的首字元元码+末字的首字元元码如“社会主义”的编码为ZDLL(礻Z、人D、丶L、丶L),“五谷丰登”的编码为FDNC(五F、八D、三N、癶C),“个人所得税”的编码为DDES(人D、人D、 E、禾S),等等。
本发明中所述的“实末笔划”是指汉字的横“一”、竖“丨”、撇“丿”、捺(点)“ 丶”、折“乙”这五种真实末笔划。它们分别位于英文字母H、J、K、L、P键上。它们专门充当以大字元及中字元先行的双元字及三元字的补充码,即双元字及三元字在取完各元码后,须加补充码才能得到全码。所述的“虚末笔划”是指汉字的五种虚拟末笔划,外加大括号,即{一}、{丨}、{丿}、{丶}、{乙},分别位于英文字母G. F. D. S. A键上,它们专门充当以小字元先行的双元字及三元字的补充码。
本发明中所述的“以大字元及中字元先行的双元字及三元字的补充码”,应该取该字的实末笔划代码,如江ST+“工”(末笔划为“一”)的实末笔划代码H一,如花GIV+“匕”(末笔划为“乙”)的实末笔划代码P乙;如分DA+“刀”(末笔划为“丿”)的实末笔划代码K丿,等等。而“以小字元先行的双元字及三元字的补充码”,应该取该字的虚末笔划代码,如主LY+“王”(末笔划为“一”)的虚末笔划代码G{一},如种SUJ+“丨”(单笔划字元的末笔划即为该笔划)的虚末笔划代码F{丨}。
本发明在采用上述输入法的基础上还可以提供重码字的盲打处理的方法,即利用数字键对246个重码字中的大部分字(约199个)进行识别处理(注另有47个字为无法盲打识别的死码字),即用数字键5代表横笔,4代表竖笔,3代表撇笔,2代表捺(点)笔,1代表折笔。利用警铃提示重码,识别步骤如下(1)如有未取码的字元(五元以上),取末二字元的末笔划代码;(2)如无未取码的字元(四元及四元以下),且为上下结构的,取数字0;(3)如无未取码的字元(四元及四元以下),且不是上下结构的,取该字首笔划代码。
词的重码识别也可处理。利用警铃提示重码,识别步骤如下(1)取连接键“;”;(2)取首字末字元元码或补充码(如末字元已被取码)+次字末字元元码或补充码(如末字元已被取码)。
本发明是依据国家语言文字工作委员会标准化委员会1997年颁布的《现代汉语通用字笔顺规范》和《信息处理用GB13000.1字符集汉语部件规范》的标准进行开发的。与现有五笔字型输入法比较,本发明除了具有字元标准、拆字规范、规则易学等特点外,输入时基本不用字型结构(仅在重码处理时,用了41个上下结构的字)。其最大的优点是在6763个一、二级汉字中,不但字与字重码率低(121个全码,占1%),而且大部分字与字重码可用数字键盲打识别。我们只要用比其它各种输入法少得多的记忆量(301个<254个字元+47个死码字>)就能实现全部一. 二级汉字的盲打输入。此外,字与词重码及词与词重码也可盲打识别,是一种理想的汉字输入法。
以下结合附图对本发明的输入方法作进一步详细说明。


图1是本发明提供的用于汉字大小字元输入法的专用键盘的实例(26个英文字母键上字元分布和部分数字键的示意图)。
具体实施例方式参照附图,本发明字元共有254个,大多数字元是以首笔划归类。其中“横”首笔字元(由两手食指负责)是位于键盘中线两侧第一列,即G、T、B、H、Y、N键(共6个);其中“竖”首笔字元(也由两手食指负责)是位于键盘中线两侧的第二列,即F、R、V、J、U键(共五个);其中“撇”首笔字元(由两手中指负责)是位于键盘中线两侧的第三列,即D、E、C、K、I键(共五个);其中“点”首笔字元(由两手无名指负责)是位于键盘中线两侧的第四列,即S、W、X、O、L键(共五个);其中“折”首笔字元(由两手小指负责)是位于键盘中线的第五列,即A、Q、P键,另有M键(食指负责),共四个键。此外,Z键的大字元为“车(車)”,小字元为其它首笔字元。另有一部分小字元安排在其规定键列的相邻一列里。“耳”、“白”、“饣”三个字元分别安排在Q、Z、N键上。
本发明还可提供一级简码(仅取首元码)、二级简码(仅取前两个元码)和三级简码(取前三个元码)。简码是在省去后面元码后打空格键形成的,如一H、水EP、首SKJ.等等。
本发明输入法还提供有容错码允许判断错误,少数汉字有两种全码,如丧BSWS、NSWS,蒙APYV、GPHV等等。
权利要求
1.一种汉字大小字元输入法,主要是利用现有键盘上的26个英文字母键进行输入操作,其特征在于a.将汉字中的只有单个字元的独元字及有两个或两个以上字元的复元字中的字元分成“大字元”、“中字元”、“小字元”和“独元字末笔划字元”四类,其中所述的大字元是指包含较多汉字数量的“大部首”或“较大部首”,它们共有26个,包括“艹”、“口”、“氵”、“日”、“人”、“亻”等,这些大字元分别按其首笔划种类安排在26个英文字母键上,并居于本键各字元之首,其中所述的中字元是指大字元的简体或繁体,或与大字元形似的字元,并外加小括号,共有12个,包括(讠)、(钅)、(八)、(己巳)、(士)、(幺 )、(曰 )、( )、(車),在字母键上它们跟随各自相关的大字元之后,其中所述的小字元是指大字元及中字元除外的字元,共有216个,包括“大”、“贝”、“丿”、“忄”、“广”、“虫”等,它们大多数也按其首笔划的种类分别各自安排在26个英文字母键上。b.将独元字末笔划字元,即小字元和中字元独元字的末字元,并外加中括号,包括[一]、[丨]、[丿]、[丶]、[乙],分别安排在英文字母T、R、E、W及Q键上,其元码,即前述的英文代码专门充当小字元及中字元独元字的末字元元码。c.每个汉字编码的基本规则,即编码的方法是单字的全码编为三位码或四位码,一个单字全码的编取(1)规定对独元字编为三位码,后加空格键,对其中属于大字元的独元字的,其编码是该字元元码+F+J,对其中属于小字元和中字元的独元字,其编码是该字元元码+次笔划字元元码+该独元字末笔划字元元码,当独元字为双笔划小字元字或双笔划中字元字时,其末笔划也是它的次笔划,可以重复取用,对其中属于单笔字或单笔划的,其编码是连续编取三个该字元(或笔划)元码;(2)规定对双元字编为三位码,后加空格键,即首字元元码+末字元元码+实末笔划代码(以大字元或中字元先行时),或+虚末笔划代码(以小字元先行时);(3)规定对三元字编为四位码,即首字元元码+次字元元码+末字元元码+实末笔划代码(以大字元或中字元先行时),或+虚末笔划代码(以小字元先行时);(4)规定对所有四元及四元以上字(不论是以大字元或中字元先行,还是以小字元先行)编为四位码,即首字元元码+次字元元码+第三字元元码+末字元元码。d.词的编码的基本规则,即编码方法是所有词均编为四位码,(1)规定对双字词编为前字的首字元元码+次字元元码+后字的首字元元码+次字元元码,(2)规定对三字词编为首字的首字元元码+次字的首字元元码+末字的首字元元码+末字的次字元元码,(3)规定对四字及四字以上词编为首字的首字元元码+次字的首字元元码+第三字的首字元元码+末字的首字元元码。
2.根据权利要求1所述的汉字大小字元输入法,其特征是所述的“实末笔划”是指汉字的横“一”、竖“丨”、撇“丿”、捺(点)“丶”、折“乙”这五种真实末笔划,它们分别位于英文字母H、J、K、L、P键上,专门充当以大字元及中字元先行的双元字及三元字的补充码,即双元字及三元字在取完各元码后,须加补充码才能得到全码,所述的“虚末笔划”是指汉字的五种虚拟末笔划,即{一}、{丨}、{丿}、{丶}、{乙},它们分别位于G.F.D.S.A字母键上,专门充当以小字元先行的双元字及三元字的补充码。
3.根据权利要求1所述的汉字大小字元输入法,其特征是所述的“以大字元及中字元先行的双元字及三元字的补充码”,应该取该字的实末笔划代码,而“以小字元先行的双元字及三元字的补充码”,应该取该字的虚末笔划代码。
4.根据权利要求1所述的汉字大小字元输入法,其特征是还可以提供重码字的盲打识别处理方法,即可以利用数字键对246个重码字中的大部分活码字进行识别处理,即用数字键5代表横笔,4代表竖笔,3代表撇笔,2代表捺(点),1代表折笔,识别步骤如下(1)如有未取码的字元(五元以上),取末二字元的末笔划代码,(2)如无未取码的字元(四元及四元以下),且为上下结构的,取数字0,(3)如无未取码的字元(四元及四元以下),且不是上下结构的,取该字首笔划代码。
5.根据权利要求1所述的汉字大小字元输入法,其特征是还可以提供重码词的盲打识别处理方法,其识别步骤如下(1)取连接键“;”,(2)取首字末字元元码或补充码(如末字元已被取码)+次字末字元元码或补充码(如末字元已被取码)。
全文摘要
汉字大小字元输入法,将汉字中只有单个字元的独元字及有两个以上字元的复元字中的字元分成“大字元”、“中字元”、“小字元”和“独元字末笔划字元”四类,其中26个大字元分别按其首笔划种类安排在26个字母键上,并居于本键各字元之首,12个中字元在字母键上位于大字元之后,216个小字元也按首笔划种类位于26个字母键上,将独元字末笔划字元分别安排在T、R、E、W及Q键上,编码的方法是单字的全码有三位码或四位码,独元字和双元字编为三位码,后加空格键,三元字和四元及四元以上字编为四位码,所有词编为四位码。与现有五笔字型输入法比较,本发明除了具有字元标准、拆字规范、规则易学等特点外,输入时基本不用字型结构,字与字重码率低(121个全码占1%),可用数字键盲打识别,是一种理想的汉字输入法。
文档编号G06F3/023GK1519686SQ03115119
公开日2004年8月11日 申请日期2003年1月20日 优先权日2003年1月20日
发明者郭松森 申请人:郭松森
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1