一种电脑汉字输入法及其键盘的制作方法

文档序号:6654295阅读:416来源:国知局
专利名称:一种电脑汉字输入法及其键盘的制作方法
技术领域
本发明属于电脑汉字输入法及其键盘。
电脑汉字输入法有两大性能指标易学性和高效性。目前已有近两千种编码方案,但尚未有任何一种能同时达到理想的易学、高效。
易学性主要取决于码元的选取和编码规则是否简明。
高效性即指输入速度,应分两种情况,一种情况指非专业打字员的输入速度,这类使用者往往是一边打字一边编码,其输入速度不仅取决于输入法的动态码长、动态重码率,还取决于码元的选取是否直观。码元的选取不直观势必降低编码速度,从而降低输入速度。另一种情况指熟练专业打字员的输入速度,这类使用者已形成条件反射,打字时基本不用编码,其输入速度主要取决于输入法的动态码长和动态重码率。
目前使用的输入法大致可分为形码、音码和形音码。形码中有一种以组合笔画为码元的类型,与一般形码区别较大,本发明将其称为组合笔画码,分开论述。其余形码则称为传统形码。
传统形码,其基本特征是把汉字看作由字根组成。汉字有常用字根几百个,传统形码选择其中的100~300个字根分配到键位上,称为基本字根。余下的那些字根则必须拆成基本字根。学习传统形码,首先需要记忆大量基本字根,其次要掌握拆字方法,还要记住一些特例。学习难度很大,不具有易学性。
音码对那些拼音学得好的学员来说很容易学,但对拼音学不好的人来说,音码比形码还要难。事实上,发音不准的人所占人口比例很大。而且,拼音学得好的人也不是每个字都知道读音,偶尔遇到不认识的字也会严重影响输入速度。从总体上说音码也不具有易学性。
形音码,由于使用了拼音要素作为码元,对很多人来说同样不易学。
有一类以汉字五种笔画为码元的输入法,确实很好学,但重码过多。因此又有人提出以组合笔画为基本码元的输入法,其主要特征是把书写顺序相邻的两个笔画看作一个码元,共有5×5=25种,再加上5种单笔画,共30个,恰好可以配置到电脑键盘上最好用的30个键位上。其易学性也强于传统形码,但由于使用了组合笔画,很不直观,因为编码时要一眼看清一个字或一个部件的第一、第二笔画也许还可以,但要一眼看清第三、第四个笔画相当困难。初学者编码时往往需要在心里把字写一遍才能确定编码,脑力负担重,编码速度慢。当然,学习时间长后可以形成条件反射。但形成条件反射的所需要的时间实在太长,很多人甚至始终无法形成,因此打字一直速度很慢。相比之下,传统形码在记住字根后取码较容易,也容易形成条件反射。因此很多学员宁可花很多时间学传统形码,也不愿意学组合笔画码。因此,组合笔画码问世多年仍然无法取代传统形码。
目前公开的输入法中也有极少数采用了图形或几何的概念,但有的仅以字字根的几何特征作为字根分类的依据,本质上属于传统形码。没有摆脱传统形码的难学、难记特点。有的定义了一些几何结构为码元,把汉字看作由这些几何结构组成,进了一大步,但所定义的码元不够完善,编码规则不够简明,不仅没有能够把图形编码法的易学性特点充分地表现出来,也没有很好地解决高效性,还没有任何一种在市场上推广开。
目前,具有易学性的只有极少数的图形码和以横、竖、撇、捺、折为码元的笔画码。但尚未有一种能同时实现高效性。
本发明的目的是为了确实解决计算机汉字输入法的易学性和高效性的统一问题。
为研究一般人学习汉字输入的困难,本发明人亲自担任了三年的电脑教师,教授多种市场上能买到的汉字输入法,不断研究学员的所遇的困难,并把成果运用到本发明中。经过无数次的编码实验和教学实验,不断检验的其易学性和高效性,历时六年,完成本发明。
本发明基本内容包括由几何学概念定义的结构组成的码元体系。为同时满足易学性,高效性而设计的编码体系。
码元体系几何学认为,线段由点组成,点无限小。线段有长度,没有宽度。两条线段之间可以有交点,也可以没有交点。点和线段不可能有交点,点要么在线上,要么在线外。
本发明把汉字结构分为五种基本类型。具体定义如下1、散所有的点和离散的线段统称为“散”。其中的一点或一条线段称为一个“散件”。如“一”、“二”、“川”等。
2、交两条线段有公共点,并且公共点都不是两线的端点。这两条线段的关系称为“交”。这个公共点称为“交点”。如“十”、“艹”等。
3、顶两条线段有公共点,并且公共点是其中一根线的端点,但不是另一根线的端点。这两条线段的关系称为“顶”。这个公共点称为“顶点”。如“上”、“非”等。
公共点不在端点上的线段称为“梁”,公共点在端点上的线段称为“柱”。
4、连两条线段有公共点,并且公共点在两条线段各自的一个端点上。这两条线段的关系称为“连”。这个公共点称为“连点”。如“厂”、“了”等。
5、口至少有三个角为连的矩形。如“口”、“回”、“尸”等。
上述所说的公共点指一个字块里两条线段之间的公共点,不包括汉字部件与部件之间的公共点。也不包括矩形四个角上的公共点。
如三条以上线段汇聚于一点。公共点的结构类型由最先书写的两条线段决定。其余线段看成“散件”。
如“才”第一个公共点看作“十”不看作“ ”。
在汉字中,根据线段的走向,线段可分为横、竖、撇、捺四种类型,其中横和竖统称为“正线”,撇和捺统称为“斜线”。笔画中的“折”可看作几条线段相连。有一种弧线没有明显的转折点(如“儿”的左边、“戈”的第二个笔画的转折点之前的部分),本发明将往左拐的孤线看作“撇”,往右拐的孤线看作“捺”。
“散”、“交”、“顶”、“连”、“口”五种基本结构可以根据需要进一步细分成更多个具体结构作为编码的码元。
表1显示本发明一个实施方案的码元名称、定义及代表符等。表1一种实施方案的码元名称、定义及代表符
以上定义其外延包含了所有的“口”、“交”、“散”。有极少数“顶点”、“连点”不属于上述定义范围,编码时可当其不存在。如“公”字右下角的顶点当作不存在,把横和捺的关系看作离散关系。
如上所述的码元集中,一个键位只定义一个码元,一个码元只有一种几何定义,为便于初学者使用,有些码元用两个符号作为代表符,这两个符号都符合所给出的定义,只是其具体形状有点差异。


图1是本实施方案的码元在键盘上的分布图。
可以将“码元代表符”、“码元名称”中的任一种或两种标到键盘上,形成韦码键盘,有利于使用者记忆。
所述的码元,允许少量调整、变更,其变化可以在10%左右。
编码体系汉字分为左右型、上下型、包围型、独体型四种。前三种统称合体型。
本发明编码码长可取三码或四码。
三码方案规则如下独体字按从上到下,从左到右顺序取三码。不足三码加空格键。
合体字偏旁打一码,非偏旁打两码。非偏旁部分如仍为合体结构则将其分为两部分,各取一码,如为独体结构直接取两码。非偏旁部分不足两码则从偏旁取一码,如偏旁也只有一码,则不再取码,加空格键。取码顺序按从上到下,从左到右取。
四码方案规则如下独体字按从上到下,从左到右顺序取四码。不足四码加空格键。
合体字偏旁取一码,非偏旁取三码。非偏旁部分仍为合体结构则将其分为两部分,前者取一码后者取两码,如为独体结构直接取三码。非偏旁部分不足三码则从偏旁取足四码。如从偏旁取码后码长仍然不足四码,则不再取码,加空格键。取码顺序按从上到下,从左到右取。
初学者可以按如下程序编码1.判断字型,区分独体字和合体字。如是合体字,区分偏旁和非偏旁部分。2.寻找并标记“口”。3.寻找并标记线段间的“公共点”。4.寻找并标记单独的“散件”。5.按顺序编码。编码流程图如下 按此流程编码,可以大大提高初学者的编码正确率。熟练之后形成条件反射,无需重复此编码程序。
表2显示了用上述方法对一些汉字的编码(单字码长为三码)。
表2一些汉字的编码实例
为减少常用字重码,本发明可以规定少数常用汉字(30多个)只打两码。
为减少常用字重码,本发明可以采取独创的字频码技术。字频指汉字的使用频度。本发明把一些非常用汉字的最后一码统一定义为某个码元,从而避免与常用汉字的编码产生重码。使用字频码会在盲打时产生极少量的错误,但只要控制好数量,使得错误率低于千分之一,就不影响盲打。字频码不参与词组的编码。无需记忆使用字频码的字。
由于以上措施的使用,使得本发明可以仅用三码,便可达到一般四码输入法差不多的动态重码率。
单字码长为三码的方案,词组码长可为三码或四码。
单字码长为三码、词组码长为三码的方案,为保持低重码率,词库收录词条数为30000左右。一般普通的文章中有70%左右的词组可以打出来。但使用者须记忆一些词组才能盲打。
与一般输入法相比,其重码率、词库量相近,而码长少了一码。
单字码长为三码、词组码长为四码的方案,词库收录词条数为60000左右。一般普通的文章中有98%左右的词组可以打出来。使用者无须记忆词库中有哪些词组,可以做到见词就打。极大地减轻了盲打者的脑力负担,提高输入速度。
与一般输入法相比,本方案码长相同,词库容量大。能实现真正意义上的词组输入。
本发明的特点与现有的输入法相比,本发明取得了实质性的进步。具体表现在如下几个方面一、使用几何方法定义的码元规范、直观,一般人能很快理解、记忆。不认识汉字的外国人也能学会。避免了传统形码的令人望而生畏的字根记忆。避免了音码对发音不准者造成的困难。也避免了组合笔画码在编码上的不直观。
二、编码规则简单,不违背人们对汉字的习惯认识,初学者可以很快掌握。
三、使用字频码技术,在保证低动态重码率的前提下,把单字的码长缩为三码,不仅提高了输入速度,也大大降低了编码难度,因为编码码长越长,编码时产生错误的概率就越大。
本发明实现了汉字输入法易学性和高效性的统一。
本发明最佳实施方案是单字码长为3码、词组码长为4码的方案。
权利要求
1.一种电脑汉字输入法及其键盘。其特征在于把汉字看作由一些简单的几何结构组成的图形,为满足汉字输入法易学性和高效性统一的要求,定义汉字图形的几种基本结构,并由此构造码元。并利用汉字的字型、偏旁等概念制定简明的编码规则。
2.如权利要求1所述的输入法及其键盘,其特征在于还可以把汉字的基本结构定义为“口”、“交”、“顶”、“连”、“散”五种基本结构。
3.如权利要求2所述的输入法及其键盘,其特征在于还可以以五种基本结构(口、交、顶、连、散)构造三十种码元。所述的码元,允许少量调整、变更,其变化可以在10%左右。上述的码元名称、代表符、定义及其在键盘上的分布是
4.如权利要求3所述的输入法及其键盘,其特征在于还可以按如下规则编码独体字按从上到下,从左到右顺序取三码。不足三码加空格键。合体字偏旁打一码,非偏旁打两码。非偏旁部分如仍为合体结构则将其分为两部分,各取一码,如为独体结构直接取两码。非偏旁部分不足两码则从偏旁取一码,如偏旁也只有一码,则不再取码,加空格键。取码顺序按从上到下,从左到右取。词组码长可取三码或四码。
5.如权利要求3所述的输入法及其键盘,其特征在于还可以按如下规则编码独体字按从上到下,从左到右顺序取四码。不足四码加空格键。合体字偏旁取一码,非偏旁取三码。非偏旁部分如仍为合体结构则将其分为两部分,前者取一码后者取两码,如为独体结构直接取三码。非偏旁部分不足三码则从偏旁取足四码。从偏旁取码后码长仍然不足四码,则不再取码,加空格键。取码顺序按从上到下,从左到右取。词组码长为四码。
6.如权利要求1或2或3或4或5所述的输入法及其键盘,其特征在于还可以使用字频码。
7.如权利要求1或2或3或4或5所述的输入法及其键盘,其特征在于还可以把码元分类排放到键盘上。
8.如权利要求1或2或3或4或5所述的输入法及其键盘,其特征在于还可以把“码元代表符”、“码元名称”中的任一种或两种标到键盘上,形成韦码键盘。
全文摘要
本发明是一种计算机汉字输入法。其主要特征是把汉字看作图形处理,用几何学的概念定义几种基本结构,并以此为基础构造码元。兼顾人们对汉字的习惯认识,使用汉字的字型、偏旁等概念制定编码规则。还使用字频码技术把常用字和非常用字的编码分开。使得单字码长只有三码,词库容量大,动态重码率低,能进行盲打。本发明同时解决了高效性和易学性问题。本输入法不仅适合中国人使用,也适合不认识汉字的外国人使用。
文档编号G06F3/023GK1324015SQ0110760
公开日2001年11月28日 申请日期2001年2月28日 优先权日2001年2月28日
发明者韦永骁 申请人:韦永骁
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1