笔数笔划6区5位码的制作方法

文档序号:6600501阅读:242来源:国知局
专利名称:笔数笔划6区5位码的制作方法
这是以一种汉字编码为主的发明,其全称是笔数笔划6区5位码,简称笔数笔划65码或BB65码。它涉及一种汉字的计算机输入方法及键盘。
汉字编码是现阶段计算机汉字输入的主要手段;然而有一个瓶颈问题至今尚未妥善解决。这就是,容易学和打得快很难兼顾。拿五笔字型来说,它已流行于全国的专业打字人员中。打字速度足以满足商业上的需要,但容易学这一点并未做到。五笔字型规定了200多个字根,其中有不少是自定义的;把这些字根按分区分位的规则分布在25个键上,规则虽好,但例外情况太多;把一个字切分为字根时,规则不够明确等等;凡此种种,使字根难记字难拆成为学习过程中的常事。
发明本码的目的是要创造一种易学易记易拆而又能打得快的计算机的汉字输入方法。
1、一种由简要明确的汉字部件定义、具有二维键位的部件编码法、对当前通用的键盘进行改革,以及作为定长码却有自由长度的编码方法而成的笔数笔划65码及键盘。其要点在于1)宣布下列三类字形为部件角交形(各种成交笔或成角的字形。如吏、事、聿、戊、尹、臼字外壳和官字的下部);五笔划以下的部首或字(含五笔划);其他12种指定部件耳雨豕(含涿字右部)甫、非虫足、竹鱼兆、米,还有小字形。小字形的特点是,不含横笔,由三或三以上笔划左右排列而不相交不成角。包括亦字下部,州字,倒小字形(尚字首、业字首、学字首)。
2)键盘区位表定义;将三排29个键分成6个区,第一排是1、2区,第二排是3、4区,第3排是5、0区;每个区5个位,但4区只有4个位。位码5处于行的两端,依次向中心分布。见BB65及QWERTACE键盘表中各键的数字。
3)部件的区位码定义取两个要素作为它的分类依据部件笔划数与部件首笔形。将笔划数分成六类,对应五个区码;部件笔划数为1-5时,就是它的区码;笔划数超过5时,区码是1。首笔划分成横竖撇点折五类,对应12345五个位码。
本码根据部件的笔划数与首笔形这两个要素使部件获得区位码,实际上是部件最合理的分类法。因为1、它是已经沿用千年的汉字字形检索法的当然继承。我们不必害怕继承笔划数检索法会带来难记的困难,因为本码只要求记五笔划以下的小笔划数。2、部件的字符化也在其中了。这就是所说的“对号入座”的办法,根据一个部件的笔划数和首笔形,就能得到这个部件的区码位码是几,再根据键盘的区位表,从而就知道了它所对应的键是什么。例如王字是一个部件,其笔划数是4,区码也是4,首笔是横,首笔码(位码)是1,所以王字的区位码是41,对应的键符是h。
更值得提出的是,这里部件的键符安排不是直接的,键位安排才是直接的。实际这是优点而非缺点。只有这样,部件与手指击键时的分工定位才能建立直接的联系,而不必记住部件的键符是什么。例如,凡首笔划是撇的部件必由食指击键。这能大大提高击键时的反应速度。
4)具有自由长度的定长码一个汉字的码数称为码长。通常分为定长码与不定长码两类。由于汉字及其部件的频度分布的集中性,与频度无关的编码效率很低,不定长码的效率更低。也就是每字码长期望值不小。所以不得不依靠二次检索或空格等键截尾的帮助,以减少高频字的击键数,实际是高效的不定长的霍夫曼方法的应用;或者不得不在编码上大做文章以降低重码率。这两种方法势必都会增加记忆的难度。这是易学与打得快不能兼顾的症结所在。
本发明是具有自由长度的定长码。每字定长为六码。前三码是位于1至5区的基本码,后三码是位于0区的识别码,它并非是每字必击的,因而有自由键之称。再配以记忆难度小的一、二级字可以分流击打等方法,基本上做到了三键成字四键成词。
2、根据1所述的一种由简要明确的汉字部件定义等所形成的键盘,其要点在于1)上下挡键共存字母区三排33个键切分成33对66个键。每对由上下挡键组成。贴身一侧的是下挡键。下挡键键面尺寸为12×9mm,上挡键键面尺寸为12×5mm,它比下挡键面低2cm。这两者之间的空缝长2mm。两对键键面之间的空缝长仍为6mm。
随着信息的增长,西文用大写字母的情况也在增长。本码则充分利用大写字母来提高输入速度(详见实施的例)。所以这样的改革不仅对本码也是对西文有着提高打字速度的意义。
2)在空棒的外侧增设Ctrl键及Alt键各两个。原来空棒两边的Alt键改成Esc键。并定名为QWERTACE键盘。
Ctrl键、Esc键及Alt键是常用键,这种设计,是为了可利用大拇指就近打这些键,比原来的用小拇指、无名指击键的设计方便得多,特别Esc键更是大大缩短了操作距离。再者,这些键都是易损建,它比通常的字符键坏得早。所以本键盘还有延长键盘使用期的作用。
3、根据1、2所述的由一种简要明确的汉字部件定义等所形成的建盘,其要点在于对0区五个键作为二级简码的截尾键的使用。
综上所述的结果,可得下面的BB65及QWERTACE键盘表
注意一四个部件的区码是例外情况,并称之为不规则区位码。指注意二首笔或位码与手指的对应关系是直接的。
本码的实际效果本码是在设计-小规模试用-再设计的很多次反复的过程产生的。在近期所作的试点推广中,达到了既易学易拆也能打得快的预期目的。为使本码达到一定速度所需的训练时间及遇到的难度都很低。做到了“字根毋须背,角交不用拆常用字三键,词组打四键。”本码的训练为时十天,每天三小时。除了每天要适当练习英文键盘盲打以外,可分为一天四天五天三个阶段,第一阶段规则学习。第二阶段试打,到阶段末就能打出6783个汉字中的绝大部分。最后阶段速度熟练。学习曲线是指数型的。经过十天的训练后,一个对计算机键盘很生疏的学员,一般每分种可打10个至20个汉字;具有英文键盘盲打基础的人,一般每分钟可打字30个。实际每分钟20个字,就可以进行计算机写作了。再加5天的训练,能做到速度翻番。
本发明实施的例本码在计算机实现时,分音形码和纯形码两种。这里只对音形码作介绍。
第一节BB65码形码部分的设计安排传统的汉字字形排序广泛用于各种场合的汉字检索问题。其核心是按部首分类;以笔划数排序;按札字的五笔划的次序排序。本码正是顺着这个思路来设计安排的。
一、汉字部件1、部件概念任何一种汉字形态编码,必须将某些常见字形用键盘上的一个字符与之对应。这些字形就是汉字部件。目前不少编码以传统的部首作为部件是很正确的方向。但若不筛选掉若干不常用的部首,势必会增加记忆的难度,不利于码的学习及使用。本码对部件基本上不作具体规定,而只是规定了三类字形作为部件。这样,便于理解后记住而不靠背诵,大大减少记忆负担。这些规则都是明确的,与传统的部首在常用字形范围内大体上是一致的,因而容易使人接受。
2、BB65码的三类部件(a)五笔划以下的部首或字(含五笔划),如艹氵宀王皮等都是部件。但五笔划以下的字是左右型的情况时(如仁字),不能作为部件。
有的本源字本身的笔划数虽然超过5,作为部首时的笔划数却小于6,如金和钅,言和讠、艮和即的左旁、食和左旁食、衣和衤等。这样的字也作为部件。
(b)角交形各种成交笔或成角的字形。如史、吏、事、聿、戊、尹、臼字外壳和官字的下部。既然凡交形角形均成部件,所以将字拆分为部件时非常自然,无刀砍抽剥之难。例如束字,还有耕字、刺字左部,均可分为角交形和八字两个部件。大大减少了拆分的二义性。这一点是本码的易拆性主要依靠。
(c)指定部件共12种。可分为两类.五笔划以上的字或部首共11个指耳雨豕(含涿字右部)甫、非虫足、竹鱼兆、米。
.小字形,它们不完全是字或部首。小字形包括亦字下部,州字,倒小字形(尚字首、业字首。学字首)。这些字形的特点是,不含横笔,由三或三以上笔划左右排列而不相交不成角。
二、部件的字符化在明确了哪些字形是部件后,就要说明,在打字的过程中,遇到了一个部件,怎样在键盘上找到一个键符和它相配。本码用“对号入座”的办法来为部件安排一个键符。
1、键盘区位表本码将29个键分成0-5共6个区,每个区有5或4个位。如下表
注意位码与手指的对应关系是有意义的。
注一4区只4个位,1键是4位兼5位。
注二用于音形码时,0区2位码的m键被分号键代替。
2、部件的区位分类法与部件字符化的直接联系。
BB65码的部件取其笔划数与部件首笔形作为它的区位分类标准。分别简称笔数与首笔。将笔划数分成六类,对应五个区码;部件笔划数为1-5时,就是它的区码;笔划数超过5时区码是1。首笔形分成五类,对应五个位码。见下表
例如王字是一个部件,其笔数是4,区码也是4;首笔是横,首笔码(位码)是1。所以王字属4区5位,也可以说它的区位码是41。从键盘的区位图可知,处于4区1位的键符是h。这样,部件王对应的字符就是h。我们说的“对号入座”的办法,其含义就是,根据一个部件的笔划数和首笔形,就能得到这个部件的区码位码是几,再根据键盘的区位图,从而就知道了它所对应的键是什么。显然,用这种办法使部件获得区位码,实质上是部件的一种合理的分类法。
用笔划数给部件分类,虽然自古有之,但因为笔划数不是易记的,没有一个编码界同仁敢使用它。故引入编码中来绝对是本码的首创。为什么敢使用它?因为本码基本上是在小笔划数范围内使用,五笔划以上的情况不需要识别笔划差异。心理实验的结果显示,单独识别字形的笔划差异的反应时耗随笔划数的增加而增加。超过四笔后,反应时耗急速增加。而本码的部件笔划数平均值为3.8,所以反应时耗不大。
如上所述,根据部件的笔划数和首笔形,很容易得到该部件所对应的键。这就可以得到BB65形码部件键盘图。由于用三种字形规定的部件达三百个以上,所以这里连常用部件也不可能一一列出。由于已最大限度地减少了部件字符化的记忆里,容易做到举一反三。
第二节BB65码的取码规则使用Alt-F3键,就可以用本码打中文了。此时,提示行首出现“开大”或“关大”字样。这是两种可选状态的标志。
开大状态是开放英文大写字母之意。英文大写字母可照常使用。此时,首键小写字母可打中文的字和词组。这是中文字词混用状态。
关大状态是关闭英文大写字母之意,英文大写字母就不能使用了。此时,首键大写字母可打中文词组。这是中文字词分用状态,是本码的两个特色之一。在这种状态下,三字成字四字成词才具备了实现的条件。
一、第一键音码,音码是汉字取码的第一键。一般取该字的第一拼音字母为其音码。但有两点变通1、第一拼音字母为r,a,o及无拼音部首,均以e为码。
2、u代替q,以提高食指的使用率。为满足0区作为自由键的需要,以a代替n。
下面讲第二第三键形码的取法。
二、形码部分的取法一个字若由一个、两个与多于两个部件组成时,分别称为部件字,双部件字与多部件字。后两者又可称为非部件字。
形码主体只取两键。是字的第二第三键。取法分部件字和非部件字两种情况。
部件字的第二键取部件码。第三键无正常码可取,用第二笔划码补足,它的区码是0。部件字例表
非部件字又可分左右型及非左右型两种情况。
左右型取左右取字的左部、右部的首部件码为码。
非左右型取先后取字的最先部件及最后部件为码。含首笔划的部件是最先部件,但最后部件却不一定含末笔划,像圆字的部件依次为口口贝,所以贝字是最后部件。又菌字的最后部件是禾,臣字臧字藏字的最后部件是竖笔。都不含尾笔划。本码是按照各部件首笔划序的先后来规定部件码次序的先后的。
多部件字在取过两部件为码后还有剩余的字形,称为字的剩余部分。如圆字中的口、鹃字中的月非部件字例。
非左右型死s4123 近j4334 亦y2443 衷z1442驾j2535 寒h3424 桌z2245 眉m3552 辰c2114 菌j3153 我w1314藏c3112 圆y3242 是s5242 南a2131 具j5223 登d1511 鬼g1325离12414 彖c1511 叟s5325 身s1331 承c5514左右型仁e2321 磁c5124 以y1523 静j3123 将j2433注一、左右型字左部和右部一定要分别取码,所以仁字虽是四笔划,不是部件字。但比字却可以作为一个部件,因为它还是一个部首。
注二、“将”的首部件是二笔划,新华字典没有这样的三笔划部首。
三、字的拆分原则。把字拆分成部件时,会有多种分法。例如耒字,可拆分为丰和人、但也可拆为三和小字等。又如雀字,可拆分为小和隹,但首部件也可取少字。为了做到拆分明确,制定拆字的原则如下。这五个原则是按优先次序排列的。
原则一角交不拆。所以耒字应拆分为丰和八,来字应拆分为未和倒八字,臼字应拆分为臼的外壳(四笔)、一和一共三个部件。
原则二取码要少。含义是整字拆分成尽可能少的部件,这样,彖字应拆分为折、折和豕字三个部件。这个字的首三笔划是一个部首,因而是一个部件,然而却不应取。又是字应拆分为旦和止字形两个部件,原则三取件完整。有两个含义1、取件成字。首先应力求把目标字分成几个字或部首后再取码。如雀字应拆分为小和隹后再取码。
2、取件整齐。如果一个字形既可与前面的字形结合为部件,也可与后面的字形结合为部件(如交字中的八,朱字中的插形),则拆分成两个部件时,力争做到使一部件不锲入另一部件。这样,交字应拆分为点横和父字,而不是六和叉;朱字应拆分为搬未,而不是牛八。
原则四取大在前。一个字形既可与笔划序在前的字形结合为部件,也可与笔划序在后的字形结合为部件时,则与在前的结合。这样,克字应拆分为古儿,而不是十兄;舍字拆成人干口三个部件,而不是人一古,具字,应拆分为且一八。
当然这种情况应该是在优先考虑前三原则的基础上进行。否则交字不应拆分为点横和父字,而是六和叉了。
四、三键成字与两类识别码前面说过使用本码有两种状态可供选择。即字词混用(开大)和分用(关大)状态。在分用状态下,基本上做到了三键成字四键成词。就是说绝大多数频率高的字三键完成,具体来说,就一级字库来说,总频度为95%的约3200个字可以三键完成。还有总频度为5%的约1500个字用四键或五键甚至六键完成。由于并不是靠屏幕提示而是靠打识别码完成汉字的输入,使重码率减少到2%左右,因此盲打依旧可以做到,对输入速度的影响很小。
两类识别码取法。
两类识别码是指末笔划及交笔数识别码。是本码精心设计的又一特色。它们所对应的键是0区的五个上下挡键及五个数字键。它并非是每字必击的,因而有自由键之称。这就使本码成为具有自由长度的定长码每字定长为六码。再配以记忆难度小的一、二级字可以分流击打等方法基本上做到了三键成字四键成词。就是说,绝大多数频率高的字三键完成,词四键完成。就一级字库来说,总颇度为95%的约3200个字可以三键完成,还有总频度为5%的约1500个字用四键或五键甚至六键完成。由于并不是靠屏幕提示而是靠打识别码完成汉字的输入,使重码率减少到3%左右,其中一级字库的重码率减少到1.7%左右,因此盲打依旧可以做到,对输入速度的影响很小。所以说它是不依靠二次检索或空格等键截尾的每字击键期望值≤2的盲打方法的保证,因而是易记而又打得快的保证。
末笔划识别码又可分为两种即首部件末笔划及后手末笔划。首部件末笔划的含义是取首部件的末笔划。后手末笔划的含义是力求在后取或未取部件中取末笔;即部件字取末二笔;双部件字取末笔;多部件字,是字的剩余部分的末笔划,以南字为例,其末部件干字已被取过,所以其后手末笔划就不是字的末笔划,而是剩余部分的末笔划撇。两类三种识别码可在第四、五、六键中取键。特别是均可作为第四键等。所以,同一码在不同次序下,取的键是不同的。
两类三种识别码取键表
<p>字的识别码例表
五、一级简码(一键)字是]的[为\了|一i个I中q国Q有}人r和R不o在{大‘小~六、二级简码(二键)字1、首键打v,共26个。每个汉字后的字母是第二键十q二w三e四r五t六y七u八i九o零p日a所s动d反f关g合h加j科k量l种z性x此c也v变b你n命m2、利用0区的简码截尾键,共100个。首键为字的音码,第二键是0区的简码截尾键,它对应字的首笔划。例如成(cn),此(c;),从(c,),产(c.),出(c/)。
权利要求
1.一种由简要明确的汉字部件定义、具有二维键位的部件分类编码法、对当前通用的键盘进行改革,以及作为定长码却有自由长度的编码方法而成的笔数笔划65码及键盘。其特征在于1)宣布下列三类字形为部件角交形(各种成交笔或成角的字形,如吏、事、聿、戊、尹、臼字外壳和官字的下部);五笔划以下的部首或字(含五笔划);其他12种指定部件。2)键盘区位图定义;将三排29个键分成6个区,第一排是1、2区,第二排是3、4区,第3排是5、0区;每个区5个位,但4区4个位。位码5处于行的两端,依次向中心分布。当用于音形码时,将“;”键替代m键作为0区2位。见下面键盘图中各键的数字。3)部件的区位码定义取部件两个要素作为它的分类依据部件笔划数与部件首笔形。将笔划数分成六类,对应五个区码;部件笔划数为1至5时,就是它的区码;笔划数超过5时,区码是1。首笔划分成横竖撇点折五类,对应12345五个位码。但有四个部件的区码是例外情况,并称之为不规则区位码。即氵(14)、纟(15)扌(21)口(22)。4)不依靠二次检索或空棒的具有自由长度的定长码本码是每字六码的定长码。前三码是位于1至5区的基本码,后三码是位于0区的识别码。后三码并非每字必击的,因而有自由键之称。
2.根据权利要求1所述的笔数笔划65码,由一种简要明确的汉字部件定义等所形成的键盘,其特征在于1)上下挡键共存2)在空棒的外侧增设Ctr1键及Alt键各两个。原来空棒两边的Alt键改成Esc键。并定名为QWERTACE键盘。
3.根据权利要求1、2所述的由一种简要明确的汉字部件定义等所形成的键盘,其特征在于对0区五个键作为二级简码的截尾键等的使用。
4.根据权利要求1、2、3所述的笔数笔划65码是由一种简要明确的汉字部件定义等所形成的BB65及QWERTACE键盘,如下表BB65及QWERTACE键盘表
>注Alt键、Ctrl键的键面成45度角,以便大拇指的使用。每键键面的尺寸为10×12mm。
全文摘要
本发明涉及一种汉字的计算机的输入方法及键盘。首先宣布所有角交形、五笔划以下(含五笔划)的部首或字以及12种字形为部件。取部件的笔划数与首笔划码作为它的区码与位码。再将键盘上三排29个键符分成六个区;每区五或四个位。这就是由一个部件很容易地获得一个键符的“对号入座”方法。本码作为定长码却有自由长度的编码方法是概念上的突破,是不依靠二次检索或空棒的每字击键期望值≤2的盲打方法的保证。还对键盘增设了上下挡共存、Ctrl等键。
文档编号G06F3/023GK1126333SQ94119970
公开日1996年7月10日 申请日期1994年12月31日 优先权日1994年12月31日
发明者胡锡全 申请人:胡锡全
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1