汉字编码及其键盘规范化的方法

文档序号:6600500阅读:527来源:国知局
专利名称:汉字编码及其键盘规范化的方法
技术领域
本发明涉及一种汉字编码的方法及其键盘布局,尤其是一种全面精简部件和规范汉字编码及其键盘的方法。
键盘输入汉字的方法很多,大致分三类一是拼音,熟悉键盘就能输入,由于汉字同音字多,大量选择影响输入速度;二是按笔画输入,笔画种类少,好学好,但要按五个键码才能输入一个字,速度慢;三是按汉字的部首输入,汉字部首多,重码较少,但难记难学,适宜专业人员掌握,普及到个人家庭有困难。中国专利91104767.0<<一种汉字取码速成方法>>提出将文字的信息元构成坐标系统,其元的集合按键元行列位置对应坐标取出使用。该码使用方便,不背口诀,一看就懂;但是,所取的码元中包括数字标点,输入时使用数字和标点不方便,重码率也较高。
本发明的目的是为了减少码元,码长和重码率,为了输入汉字从娃娃抓起,提供一种与小学语文汉字笔画,笔顺,字型,部首法等教学内容统一接轨的汉字检索,排序,电脑键盘输入方法,为了维护汉字的规范形象,对上述专利作进一步的改进。
发明是这样实现的,其由汉字字形的笔画,笔顺,部件,字型和声母等小学语文教学内容组合而成,将笔画(信息元)构成坐标系统,按键元行列位置对应坐标取出使用。其特征是(A),尊重汉字部件的完整,摈除在600余个部件中划出部首(或称字根,字元)范围的传统办法,本发明取码面向全部部件。(B),选少数机动码的部件作为部元,用西文字母作为代码,不占用数字和标点。(C),尊重汉字每个部件的独体性,不将一个部件肢解成两三个部首(或称字根字元)。(D),尊重汉字字型的完整性,按字型规范将一个合体字分成两个或三个部份,一个部份一个码,一个汉字最多三码,不将一个汉字形体人为肢解成四个部份,按规范字型取两个或三个形码,形码不足三码,就以音码补足。(E),遵循汉字字形的笔画,笔顺规范和国际电脑通用键盘的指法规范,将两个规范统一组合成一个具有规范特性的汉字输入方法。
在上述(B)中,所述部元和字母的具体对应是1,日=″S″(包括″甲″,″申″,″电″,″禺″,″曳″和″果″字的第一部份)2,月=″U″(包括″用″,″甩″)3,口=″N″(包括″足″,″可″和″福″字的第二部份)4,金=″H″(包括″钅″)
5,刀=″V″(包括″刃″,″刂″和″急″,″危″,″多″字的第一部份)6,手=″K″(包括″扌″和″看″字的第一部)7,土=″C″(包括″士″,″去″,″走″和″者″,″卖″,″戴″字的第一部份)8,木=″W″(包括″本″)9,山=″J″(包括″幽″字的第一部份)10,寸=″O″11,艹=″F″(包括″廿″,″世″,″革″,″其″和″带″字的第一部份)12,又=″I″(包括叉)13,示即礻=″L″(包括衤和″衣″及″衷″字的第一部份)14,宀=″G″(包括穴)15,白=“M”(包括臼、贝)中国的汉字,古称″独体为文,合体为字″,除了三百多个独体字以外,绝大部份是合体字。在合体字中,公知有左右型,左中右型,上下型,上中下型,内外型,包容型,半包容型,镶嵌型等。其中左右型最多,为了容易掌握,我们舍繁就简,就将左右型作为基本合体字,其余称为其它合体字。
在上述(D)中,所述合体字指先取其合体的两个部份的形码为第一码和第二码。第三码一般取音码。例如,明=SUM,址=CGZ,沈=OPS,惹=FUR,华=VRH,膏=YUG,竖=FYS等;但若左右型合体字的右部本身是一个其它合体字,或者其它合体字的续部是左右型或内外型合体字,则第三码取形码。例如,侯=VHB,森=WWW,操=KNW,持=KCO,薄=FOR等。
在上述(E)中,所述规范笔画笔顺,仅以部件的第一笔先明确左手三排和右手两排的击键分工能使第二笔能快一拍按哪一个手的五指分工的指位击键。这样处理,由于在输入每一个汉字时能按笔顺先首笔后续笔的识别过程和键盘输入时先手后指的动作过程保持心理同步一致而达到速度更快的目的。
上述第一笔的安排是横竖撇是左手字母键上中下三排,点折是右手字母键上中两排;所述第二笔的安排是横竖食指撇中指,点无名指折小指。大拇指击空格键。这样处理,由于五笔的顺序横竖撇点折的规范和西文键盘的指法规范得到一致,使两个规范组合成一个汉字输入规范,不再增加新的规则,达到减轻输入者记忆负担,学起来省时又省力的目的。
对于独体字,同样不将它肢解成两个部首(字元字根),第一码输入与合体字相同,第二码按规范笔顺取最后两笔指位置击键,第三码为声母首符(下文简称音码)。例如,气=BQQ,四=AHS,专=TLZ,垂=BTC等。但若该独体字不到四笔,或所述的独体字首尾有游离一笔,则该独体字为两码字,第二码取音码。例如,二=TE,三=TS,飞=KF,旦=SD,乱=BL等字。
还有一些部首,例如水和″氵″,我们按首续笔点点的指位″O″击键;其余,例如,耳和″卩″,″阝″=J;言和″讠″=P;″饣″和食=X;心和″忄″,″必″和″慕″字的第二部份=U;匚和弋(包括戈=Q)都按其指位击键。
本发明的原理是充份利用中国汉字的各种属性信息集中与分散同存的自然规律现象,将使用集中的部元和使用分散的指位键元兼容,将使用集中的音码和使用较少的形码兼容就能达到减少码元,码长和重码的多重目的。
首先,中国的汉字,常用字使用频率40%集中在一百个汉字上,常用部首字40%集中在二十个部件上,常用笔顺,因有规律,集中与分散同存的现象更是显著。既是部份高频常用的部件,必然属于编码重码字集中的区域,本发明选取拾来个机动码作为部元分布在重码低的指位键元上,极大地提高了编码的离散率,降低了重码率,使本发明的编码的规范化的重码率能达到实用要求。
其次,方块汉字的块状特点,明显具有编码属性若干笔形(五笔或八笔)构成六百余个部件,六百个部件,构成六万个汉字。在七千余个汉字统计中,独体字三百多个,双体字二千六百多个,三体字三千一百多个,占近80%。在二千一百多万言汉字文稿的统计中,独体字占近30%,双体字占47%,三体字占21.4%,占94%以上。所以,若要使汉字编码与方块汉字的块状编码属性保持一致,不拆部件,部首和部件的码长,绝大多数只能是二或三,等长码三,双体字可以声母补码。音码的码元声母首符不足26个,常用的声母集中在拾来个码元上,在第三码上兼容形音码,在检索双体字时用声母补足三码,这不但充份地利用了码元码长开销,而且达到取码容易,减少码长和重码率的多重目的。
与现有的编码方案比较,本发明的优点是十分突出的1,彻底解决了输入代码数量的瓶颈问题。14个微代码码元与14个字母键一一对应,微代码的补集按汉字笔形笔画笔顺击键后自然出现,不再另行记码取码,极大地方便了用户掌握,减轻了学生负担。
2,彻底解决了汉字电脑编码的统一与汉字传统规范统一的接轨问题。电脑要从娃娃抓起,汉字文字输入处理系统迟早要进入中小学教学,迟早要统一规范。目前要统一汉码的困难是一不能结束目前的百家汉码各显神通的″战国″局面,二不能解决汉码与汉的传统规范要求统一问题,要求娃娃另学一套文字输入规范,实难实施。由于本发明的基本内容都与当今中小学语文教学中对汉字的字形,笔画,笔顺,汉字字型的划分和声母的规范内容兼容一致,这不但有利于汉字电脑早日在中小学统一实施教学规范,而且有利于进一步纯洁中华民族的汉字,消除社会上使用汉字中的不规范现象。
图一是拾来个部元在键盘上的分布图。
权利要求
1,本发明涉及一种汉字编码的方法及其键盘布局,尤其是一种全面精简部首和规范汉字编码及其键盘的方法,其由汉字字形的笔画,笔顺,部件,字型和声母等内容组合而成,将笔画(信息元)构成坐标系统,按键元行列位置对应坐标取出使用。其特征是(A),尊重汉字部件的完整,取码面向全部部件。(B),将少数机动码的部件作为部元,用西文字母作为代码。(C),尊重汉字每个部件的独体性,不将一个部件肢解成两三个部首。(D),尊重汉字字型的完整性,按字型规范将一个合体字分成两个或三个部份,一个部份一个码,一个汉字最多三码,不将一个汉字形体人为肢解成四个部份,按规范字型取两个或三个形码,形码不足三码,就以音码补足。(E),遵循汉字字形的笔画,笔顺规范和国际电脑通用键盘的指法规范,将两个规范统一组合成一个具有规范特性的汉字输入方法。
2,按权利要求1所述的编码,其特征是所述部元和字母的具体对应是1,日=″S″(包括″甲″,″申″,″电″,″禺″,″曳″和″果″字的第一部份)2,月=″U″(包括″用″,″甩″)3,口=″N″(包括″足″,″可″和″福″字的第二部份)4,金=″H″(包括″钅″)5,刀=″V″(包括″刃″,″刂″和″急″,″危″,″多″字的第一部份)6,手=″K″(包括″扌″和″看″字的第一部)7,土=″C″(包括″士″,″去″,″走″和″者″,″卖″,″戴″字的第一部份)8,木=″W"(包括″本″)9,山=″J″(包括″幽″字的第一部份)10,寸=″O″11,艹=″F″(包括″廿″,″世″,″革″,″其″和″带″字的第一部份)12,又=″I″(包括叉)13,示即礻=″L″(包括衤和″衣″及″衷″字的第一部份)14,宀=″G″(包括穴)15,白=″M″(包括臼,贝)
3,按权利要求1所述的编码,其特征是所述合体字,先取其合体的两个部份的形码为第一码和第二码。第三码一般取音码,但若左右型合体字的右部本身是一个其它合体字,或者其它合体字的续部是左右型或内外型合体字,则第三码取形码。
4,按权利要求1所述的编码,其特征是所述的独体字,第一码输入汉字形码,第二码按最后两笔的手指位置击键,第三码为声母首符(下文简称音码)。
5,按权利要求4所述的编码,其特征是若独体字不到四笔,或首尾有游离一笔,则该独体字为两码字,第二码取音码。
6,按权利要求1所述的编码,其特征是所述规范笔画笔顺,仅以部件的第一笔就明确左手三排右手两排的击键分工,第二笔进一步明确五指的分工,直接按两笔指位击键。
7,按权利要求7所述的编码,其特征是所述第一笔的安排是横竖撇是左手字母键上中下三排,点折是右手字母键上中两排。
8,按权利要求7所述的编码,其特征是所述第二笔的安排是横竖食指撇中指,点无名指折小指。大拇指击空格键。
9,按权利要求1所述的编码,其特征是将词组作纯形码处理,将第三或第二三两码取该词的第二个字或第二三个字的第一码。
全文摘要
本发明涉及一种汉字编码的方法及其键盘布局。其由汉字字形的笔画,笔顺,部件,字型和声母等内容组合而成,其特征是尊重部件和字型的完整,按字型规范分成两个或三个部分,一个汉字最多取三码,双体字取声母首符为第三码。遵循汉字字型中笔画、笔顺规范和国际电脑键盘的指法规范,将两个规范统一组合成一个规范。彻底解决了输入代码数量的瓶颈问题和汉字电脑编码的统一与汉字传统规范统一的接轨问题。
文档编号G06F3/023GK1125335SQ9411924
公开日1996年6月26日 申请日期1994年12月20日 优先权日1994年12月20日
发明者沈世铭 申请人:沈世铭
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1