计算机汉字符底码键盘输入方法

文档序号:6602660阅读:1207来源:国知局
专利名称:计算机汉字符底码键盘输入方法
技术领域
本发明属于计算机汉字输入方法,特别是依形编码的汉字计算机输入方法。
任何一种形码(组字构件码),一开始编码就会遇到组字构件的分类问题。因为汉字组字构件有600多个,经过归并,也还剩有300个左右。国际通用键盘上可利用的字母键只有29个,加上字母键也只有36个。不经过分类就无法把这几百个组字构件分配到仅有的二三十个键位上去。有人认为汉字编码的基本问题就是组字构件的分类问题,这个问题解决了,汉字编码的问题就解决了。这个说法是很有道理的。
让我们现在来看看目前影响较大的几种组字构件码是怎样解决这一问题地。
五笔字型输入法把笔画分为横、竖、撇、点(捺)、折五种笔型,按首笔、次笔的顺序对200来个字根(被认定为取码单元的组字构件)逐级进行分类。但是,五笔字型的编码人却无法把这一思想完全贯彻到编码过程中去。据本发明人对《五笔字型基本字根表》的统计,真正按上述思想编码的仅占40%左右,其它60%左右为无理编码或随意编码。——从方法论上讲,这叫做其分类标准不能穷尽对象。
表形码是根据汉字组字构件和英文字母的形象对应关系来编码的。在实际编码中,其根据除形似外,还有谐音、有笔画数,大部分还是汉字结构特征。——从方法论上讲,这叫做分类标准多重化。
认知码是较后推出的一种形码,其基本思想是根据组字构件的名称发音来进行分类,“以音托形”,并补充以笔画数。它回避了汉字组字构件分类这个难题。自称“形码”,却根据发音来分类。其实,许多组字构件是没有名称的,无从发音。——从方法论上讲,这叫做分类根据不在自身而在它物。
现在流行的各种形码,由于找不到对组字构件进行分类的客观特征,无法实现对组字构件的科学分类,却也实现了汉字键盘输入。这是因为现代科技已使计算机技术发展到这样的高度,只要把组字构件分成20-30堆,给字编一个号就可以用键盘把它敲出来。这正是形码编码层出不穷的原因。条件是操作者必须“背字根”(即背诵字根键位的口诀和助记歌)。
本发明的目的是提出一种可以不“背字根”的、规范的形码编码方案及采用该方案的计算机汉字输入方法。
本发明的内容包括
一种计算机汉字符底码键盘输入方法,其特征在于
A.将汉字全部组字构件(偏旁部首)依形归并为若干组字字符,并依字符落底部位的笔画结构将字符分为25种,对应西文键盘A-Y25个字母键,字母Z键为查询键,其分类方法及对应键名如下 类别 代码键名(结构名称)落底笔画特征 点底类A 一点底字符丶
B 二点底字符
C 三点四点底字符
横底类 D 横一底字符 一
E 横二底字符 二
F 横三底字符 三
G 横端附点底字符
冖竖底类 H 出头竖底字符 丨
I 不出头竖底字符亻
J 侧竖弧竖底字符卜了
K 二竖底字符 冂

L 三竖四竖底字符 川而双分底类M 简单双分底字符 人
N 复合双分底字符 儿ス
O 交叉双分底字符 乂夊女
P 竖斜双分底字符 才
三分底类Q 简单三分底字符 小个
R复合三分底字符

爪本折框底类 S折底三角框底字符
コ 凵ム
T空方框底字符口
U实方框底字符囗
V特位特形框底字符
斜底类W撇底捺底字符丿
夕之
X左斜钩底字符


Y右斜钩底字符

B.汉字的拆分原则是依书写顺序将字拆分为字符、按照与字符落底部位的笔画结构对应的西文A-Y25个字母键取字符代码,起笔在先的先取
C.汉字的计算机输入方法是
四符以下的字一符一码,不足四码的击空键表示结束;
四符以上的字取一(首符)码、二(次符)码、三码及末码;
重码字按频序排列,其中高频字击空格直接上屏,其它字屏底显示选择
将汉字全部组字构件归并为390个字符,依其符底特征分类秩序列表如下汉字符底秩表
将全部组字构件中,不属于390个字符的多符组字构件32O个按其末符取码列表如下
《多符组字构件和多符单体字取码一览表》A一点底末符为AXA
DRA
DSAA
DYA
EA 玉FA 书HA
寸JA
斥KA 乓KDA戕KYA(臧KYsA)甫LA声太犬MA 令MAA 月丸尤龙NA叉
oA 氐
我戊
PA 戍PAA 成PxA术QA 求RA
SA
WA
发WOA 刃勺习匀XA 羽XAXA兔XNA 匆XWA飞YA (戎YWA)B二点底末符
EB黄EVB
(釜)FB 穴GB肃HKB 平乎IB 夹
MB 兆NB
OB 来柬QB
办XBC三点四点底末符黑熏FC鸟XAC马鸟XCD 横一底末符BD
CD亚DRD 互DVD
HD 垂ID 卫JD 韭JJD丘
KD
MD
MLD 业丞RD
WD 重WHD 与刁XDE 横二底末符
(冒)KE 至SE
壬血WEF 横三底末符
BF 隹IF
HF
JF
MF生
(寡)WFG 横端附点底末符
CG
DBG
HG
KG
QG 瓜RG
WGH 出头竖底末符丫半BH币DH 辛EH
HUH
IH
JJH 伞MBH
午年MH竹MHMH革VH 千
牛币牜
WH
YHI 不出头竖底末符予AI
羊BI 亍DI (南HKBI)臣
SI 彳WI争XIJ 侧竖弧竖底末符斗AJ 下卞DJ 非JJ 乍MJ
XJK 二竖底末符
DBK
丌开丙两再DK 齐DOK亓EK青FK骨GK (胤NSK) 鼻VUK
升舟WK 面WUKL 三竖四竖底末符州CL鬲DTL龠MDTL
RDL鼎UL
WL 角XLM 简单双分底末符头AM 关
BDM
BM天灭DM亥DWM 买GAM 欠GM 疌JM贝KM 矢MM 以SAM尺SM页WKM 夭失WM奂XMN 复合双分底末符羌BN 兀无DN元走EN 见KN光QDN (是UN)久WN 虎WYN(凫XAN) 免XNO 交叉双分底末符义AO 父BO 必CO文更DO麦FO 支HO
攴JO 卤JUO攵MO 风殳NO 妻SO皮
WOP 竖斜双分底末符矛AP 良
ASP
DP 丧EBP民艮
SPQ简单三分底末符米BQ 不
DQ 示EQ糸SQ
UQ 采WBQ 禾朱WQ 麻WQQ系WSQR 复合三分底未符兼BDR 衣亦豕DR
DSR 赤ER辰FR 彖VDR 黍WQMR 象XWRS 折底三角框底末符
BQS
DKS 亡
玄DS 齿EMS云去ES甚FBS 镸FS 出
HS
JUS缶MHS 鬼NS
巨SS丢WES 臿WHS
么WS
WXS
XMS
XST 空方框底末符谷BMT 高DTKT (可IT) 舌WHT司XDT
XTU实方框底末符首BWU 音EU 旧HU香WQU百
(夏)WUV 特位特形底末符
WVW 撇底捺底末符户AW
BDW
BW严DRDW歹
DW 产
步EW髟FSWW 麥HMMW
JW乒KDW
QMOW 少QW乡
SW彡
乏WW

XWX左斜钩底末符丐DJX万方
DX 亏EX
FX
ISX 今MAX
WXY右斜钩底末符甩KY 巳已
巴比SY黾TY 鹿WSSY乇毛老WY 色XSY
龟XY
词输入一律取四码,其中
二字词取首字首符+首字次符+次字首符+次字末符(一符字重复本码一次);
三字词取首字首符+次字首符+第三字首符+第三字末符(第三字为一符字者重复本码一次);
四字及四字以上词取前三字首符+末字末符。
符底码对组字构件的分类采取的是局部特征分类法。即撇开对象的其它部分,仅仅根据对象的某一部分的特征来对对象进行分类。一方面,它抓住了一部分;另一方面,它又放弃了一部分,放弃的甚至可能是大部分。这里的主要问题是抓住的必须是具有决定意义的部分,放弃的只能是不具有决定意义的部分。汉字组字构件实在太复杂了。它是一种多层次、多交点的平面结构,只有放弃其不具有决定意义的部分,才能抓住其底部具有决定意义的部分,使之简化为单层次、单交点的线性结构,从而解决其分类问题。
可以从三个方面来考察符底分类法对组字构件分类的效果
①符底分类法所划分的组字构件25种符底特征之间,有着明确的界限。各个符底的命名、定义和所含字符的界定都是客观的,不容互换的,都有着它直观的、易于识别的形象特征。
②符底分类法在对汉字组字构件进行分类时,使用的标准是客观对象自身的特征,不在它物。在编码的全过程中,自始至终坚持了一个标准,没有改变、偷换标准,没有增加新的标准。分类的结果是穷尽了对象,无论是用它对认定的390个字符、或者是对全部传统的组字构件进行分类,无一例外。
③符底分类法所确定的各类、各种符底之间有着明显的隶属关系和阶梯式的关系,形成一个有序的符号系列,故称《汉字符底秩表》。只要根据这个符号系列,就可以把全部汉字排成一个统一的字形系统。
从此可以得出结论,符底分类法对组字构件的分类是成功的。据本发明人了解的情况,在汉字组字构件的分类上,符底码也许是唯一的成功者。这样,符底码不只制定出了一个易学难忘的键盘输入方案,而且也制定出了一个更简便、更直接的查字方法。在没有计算机的条件下,可以先学习符底码查字法,作为学习符底码键盘输入法的准备。
符底码的发明人认为汉字构成是有规律的,无论笔画组成组字构件,还是组字构件组成字都是有规律的。这里,符底概念的提出有着十分关键的意义。符底是符底码一切观点的出发点,也许称得上是符底码打开汉字构成规律之门的钥匙。符底码关于汉字构成总规律的观点就是“八底笔自我扩张,加、乘、减三法说”。现在,先从发明人对笔画的看法讲起
1.单一笔画点、横、竖、撇、捺。
汉字笔画是具有特定方向(包括走向和朝向两个方面)和特定形态的书写线条,是汉字构成的简单要素和最低层次。一次起笔,一次行笔,一次收笔为一次完整的运笔过程。由一次运笔过程写成的笔画叫单一笔画。单一笔画有五种点、横、竖、撇、捺。点是一切笔画的起点。横、竖、撇、捺是点朝不同方向的延续。点是点形笔画,有确定的朝向。落笔一侧为背,出锋一侧为向。横、竖是直线,直行,有确定的走向。横由左而右平行,竖由上而下纵行。撇、捺是弧线(曲率很小),斜行,有走向也有朝向。撇由右上而左下,背右而朝左。捺由左上而右下,背左而朝右。
2.复合笔画重复笔画、混合笔画和组合笔画
复合笔画是由两个以上的单一笔画组成的、也就是由两次以上运笔过程所写成的笔画。由于组成的成分和方式不同,复合笔画有三种重复笔画、混合笔画和组合笔画。
重复笔画是同一种笔画在同一字符中多次出现所组成的复合笔画,是一种简单的重复。有横向的重复,如多竖;有纵向的重复,如多横。点可以纵向重复,也可以横向重复。
混合笔画是由不同的单一笔画尾首相连而组成的复合笔画。混合笔画在画数上被看成是一笔写成的,实际上在这一笔之中包含有几个单一笔画,是由两次以上的运笔过程相连而成的复合笔画。钩是以线形笔画为主体,点画依附其尾端,出锋而形成的混合笔画。钩的作用在于使笔画具有朝向,或加强其朝向,使之更富于表现力。由不同的线形笔画尾首相连而成的混合笔画是折,折是有朝向的。如果再以点依附于折尾,出锋,就形成折连钩,折的朝向得到进一步地加强。
组合笔画是由两个以上的单一笔画(或混合笔画)按照固定的数量、种类和排列顺序,以交、接、连、应等各种方式相组合而成的复合笔画。组合笔画种类繁多,不胜枚举。从严格的意义上讲,各种各类字符的起始字符,除了单一笔画、重复笔画和混合笔画以外,大约一半是组合笔画。它们是笔画和组字构件的双重物。
由此,发明人提出,不只要有单一笔画的概念,而且要有复合笔画及其三种形态重复笔画、混合笔画和组合笔画的概念。它们不只是组字构件的起点,而且是组字构件自我扩张的基本方式。发明人认为对笔画的研究必须着眼于它同组字构件的联系和它在组字构件自我扩张中的作用。
3.从笔画到组字构件的转化、组字构件的自我扩张
组字构件是汉字的结构单元,是笔画和字之间的中间环节。组字构件的起点是八个笔画丶(点)、一(横)、丨(竖)、人(撇配捺)、个(中竖配左撇右捺)、
(竖折横)、丿(撇)、(捺)。包括五个单一笔画和三个复合笔画。八个笔画直接转化为七类字符的八个起始字符(或称七类组字构件的八个起始构件)点底类起始字符、横底类起始字符、竖底类起始字符、双分底类起始字符、三分底类起始字符、折框底类起始字符和斜底类起始字符(斜底类起始字符有撇底和捺底两个起始字符。在《汉字符底秩表》中符下有横线者)。——这标志着笔画转化为组字构件的开始,这是第一步。
第二步,上述七类起始字符经过扩张而形成25种起始字符(含60亚种。60亚种起始字符是25种起始字符改变底部细节形态的结果。在《汉字符底秩表》中符下有虚线者。)其扩张的主要方式是单一笔画的重复、组合笔画的完善和弧线笔画的朝向加强,从而奠定了各种汉字符底的基本模式。——这是各类起始字符的自我扩张,它标志着笔画转化为组字构件的完成。
4.从组字构件发展为字的三条途径
①加法 在汉字中,单体字和组字构件是在同一过程中形成的(单体字就是成字组字构件)。这个过程是,以25种(含60亚种)起始构件为起点,底部结构特征不变,在构件的上中部不断增添次要笔画,使之从无笔画到有笔画,从少笔画到多笔画,从简单笔画到复杂笔画,同时也个别地改变其底部结构特征的某些细节,如交、接、连、应等方式,形成数百个组字构件和单体字。由于这种方式,每增加一次次要笔画就产生一个字或一个组字构件,故称加法。——这一变化是同一种符底内的变化,从《汉字符底秩表》中看,是自左而右的、多线的变化,这是组字构件和单体字的构成过程。在汉字构成的金过程中,这是第三步。
②乘法 由两个以上的组字构件(或单体字)相组合而成合体字。合体字通常是由一个通用性组字构件(部首)和另一个或几个非通用性组字构件(偏旁),以一定的方式组合而成的。这是一种平面的多项组合,结构成分之间有上下、左右、内外等多种组合方式。每一个组字构件同其它各种组字构件相组合就会产生一批合体字。每增加一个通用性组字构件就会把字数增加一倍,故称乘法。从抽象的可能性上讲,合体字数等于通用性组字构件(部首)数乘以非通用性组字构件(偏旁)数,再乘以组合方式数。这简直是个天文数字,它说明汉字有极大的组字能力。实际上,人们只是有选择地用特定的通用性组字构件同特定的非通用性组字构件、以特定的组合方式组合成字。即便如此,汉字还是太多了。这是合体字的构成过程,这是第四步,也是汉字构成的主要方式。把由不同符底的组字构件已经组合成的字,按其符底结构的构成顺序排列起来,就是汉字字形系统。《汉字符底码码本》是这个系统的记录。
③减法 由于加法和乘法的连续使用,字越造越多,笔画越来越繁。结果是难认难记难写。物极必反。为了控制字数和笔画数,人们在造字的同时,又不断地减字减画淘汰废字;用较简单或较少的笔画和组字构件来替代较复杂或较多的笔画和组字构件。减画产生简化字,故称减法。这是简化字的形成过程,这个过程融合在造字的全部历史中,不成为一个明显的步骤。
如果把上述汉字构成全过程的一、二步看成是准备阶段,以后的步骤看成成字阶段,我们就可以发现在前一阶段,笔画之转化为组字构件是转化为组字构件底部的笔画结构而非其它;组字构件底部的笔画结构一旦形成,在成字阶段是至终不变的。变化的只是在组字构件的上中部增添次要笔画,因此,每一种符底都包含着从笔画最少到笔画最多的一连串组字构件。符底码正是抓住了汉字在构成过程中的这个特点,才成功地对组字构件进行了分类、并发现了汉字构成的总规律。
总而言之,现代汉字分为三个层次笔画组成组字构件(包括单体字)、组字构件组成字(合体字)。由五种单一笔画(点、横、竖、撇、捺)组成三种复合笔画(重复笔画、混合笔画和组合笔画)。从中分离出八个笔画(“丶”点、“一”横、“丨”竖、“人”撇配捺、“个”中竖配左撇右捺、“
”折、“丿”撇、“”捺),直接转化为七类起始构件。七类起始构件经过单一笔画的重复、组合笔画的完善、弧线笔画朝向的加强等三种方式扩张为25种(含60亚种)起始构件。以这25种(含60亚种)起始构件为起点,用加法,即构件的底部特征不变,在构件的上中部增添次要笔画的办法形成数百个组字构件和单体字;再用乘法把两个以上的组字构件有选择的组合成数千、数万个合体字。与此同时,用减法来控制字数和笔画数,从而建筑起庞大的现代汉字字形系统。——这就是发明人所理解的以符底特征为出发点的汉字构成总规律。用通俗的话说,就是“八底笔自我扩张,加、乘、减三法说”。当然,这绝不是对古人造字历史的叙述,只是对汉字结构的分析。如果说以符底特征为出发点的汉字构成总规律是符底码编码的指导思想和理论基础,符底码则是前者的证实和应用。人们常说汉字是实用性和艺术性的统一。也许今后应该再加一“性”汉字是系统性、实用性和艺术性的统一。暂且把这些想法的真假对错搁置一旁,发明人的这些想法能从最简单的笔画说到最复杂的字,自圆其说,贯彻始终,在人们还不了解、甚至不承认汉字构成规律的情况下,也可算是在这个问题上给了一个“说法”。如果主张汉字构成无规律的人能够看到本发明人的这个说法,不知会不会重新考虑他们的主张。历史上曾经有过许多特定领域的无规律论者,这种主张实际上是人们尚未掌握那个特定领域的规律的表现。依发明人看来,汉字构成无规律说产生的原因就在于人们没有找到汉字构成规律。一旦有人在汉字构成规律上有所发现,汉字构成无规律说就会消声匿迹。
同其它汉字键盘输入法相比,符底码有着显著的特点和优点
1.符底码是完全的形码,不含丝毫拼音的因素,无论是会与不会普通话拼音的人,只要认得一些汉字就可以操作使用。从全国、全世界范围来看,不会普通话拼音或拼音不准的汉字使用者是大多数,因此,符底码有着极其广大的适用对象。
2.现在流行的各种形码不为广大汉字使用者所接受的主要.原因是操作者要“背字根”(即死记硬背那些关于字根位置的口诀或助记歌),难学易忘。符底码的主要优点是不要求“背字根”。符底码没有口诀和助记歌,只规定了25个键名。任何一个认得一些汉字的人,只要记住了这25个键名及其代码,就可以去识别各个字符,取码操作。这25个键名既表现了每个汉字字符结构的形象特征,又有秩序地形成一个符号系列,因而所需的记忆量是很小的,是易学难忘的,是不须特别培训的。
3.现在流行的各种形码不为广大汉字使用者所接受的另一原因是拆分不规范。在一般汉字输入中,汉字传统的组字构件有600-700个,要减轻操作者的记忆负担就必须减少字符数量,字符数量太少就会造成拆分困难。有的形码由于顾虑增加操作者记忆负担,而确定字根太少或数量不足,致使拆分不确定或不规范。符底码为了拆分规范化,认定390个组字构件为字符,而勿需顾虑字符太多。因为符底码找到了汉字构成规律,根本不要求“背字根”。据悉,国家语委将在一两年内公布汉字部件规范和拆分规范,这就是说,汉字还在变化。但是,汉字的根本特征在组字构件的底部不会变,汉字组字构件的底部特征分为25种不会变,汉字构成规律不会变,变化的不过是组字构件的数量。符底码完全可能根据即将公布的规定做到组字构件规范化,拆分规范化(如果国家语委规定的组字构件在390个左右,符底码还可能做到组字构件不拆不分)。
4.符底码字输入的重码率33.3%,字词输入的重码率15%,低于全拼码,高于其它形码。了解汉字编码的人都知道,一个合理的汉字编码不可避免的包含一定的重码。其它形码的重码率低是在不顾汉字构成规律的条件下,用增加规则,牺牲易学性换来的。符底码也可以用增加规则的办法把重码率降低一些,但不可能达到那样低的水平。因为符底的笔画结构是客观的,符底码不可能把不同的字符在各个代码之间随意调来调去。为了把记忆量控制在最低限度内,符底码除了25种符底的代码、名称及其界定以外,也不规定任何特殊的规则。
符底码的重码率高,却很分散,每一个同码的字数并不多。同码11-16字者6码,同码5-10字者27码,其它重码均在2-4字之间。这就是说,如果不要求输入高速度,采取目前一般的软件技术(高频先见、显示选择、词输入、联想),非专业人员操作起来不会有不方便的感觉。只要有完善的软件技术,符底码一定可以实现高速度输入。
符底码除用于汉字键盘输入外,还可用于汉字检索、电讯传递、排版检字等方面。
本发明的特点是,依字符落底部位的笔画结构,将组字构件分类,可形象地称之为“符底码”。
汉字编码分形码、音码、音形码三大类。形码又有笔画码和组字构件码之分。符底码属组字构件码,按组字构件取码。
事实上,没有那一种组字构件码是完全按传统的组字构件取码的。一般是认定一部分比较简单的组字构件为取码单元,称之为字符(或字根、字元)、取一码;其它比较复杂的组字构件则被当成合体字(或多符字),予以拆分,由两个以上的字符去组成。符底码也采用了这个办法。符底码所谓字符,就是符底码认定为取码单元的组字构件。传统的组字构件有600多个,符底码认定其中390个为字符,取一码;其它组字构件则被当成合体字,取两码以上。
符底(组字构件底)是符底码第一次提出来的、用以表征字符特征的新概念。所谓符底是指支撑全符(整个组字构件)、位于字符落底部位的笔画结构。符底是同类同种字符中有决定意义的部分,把握了符底就把握了同类同种字符的根本特征。把注意力集中于符底是掌握字符特征的关键,是符底码取码的诀窍。在对组字构件进行分类时,其它各种形码并非不了解各种结构的特征,符底码不过是在各种结构特征的后面加了一个“底”字。这是因为只有抓住字符底部的结构特征才能对组字构件进行分类,才能掌握汉字的构成规律。
本发明的实施例见《汉字符底秩表》和《多符组字构件和多符单体字取码一览表》,结合上述两表对本发明加以具体说明
(一)点底类
代码A 一点底字符
一点底字符是一点居于落底部位的字符。冫(冰两点)、氵(三点水)都属于一点底字符。一点底字符有8个
丶(例字户)、冫(冰)、
(冬、斗)、
(飞)、マ(勇令)、氵(江)、
(监)、专。
代码B 二点底字符
二点底字符是横二点居于落底部位的字符。在汉字辞书中,八字和
(横二点)是不分的,我们也把它归在一起。二点底字符有7个
(六)、丷(关)、八、
(粼)、(竺)、
(脊)、
(
)。
代码C 三点四点底字符
三点四点底字符是横三点或横四点居于落底部位的字符。在简化字中,多数
、灬(横三点、横四点)已经简化为一(一横)。为了保持汉字符底系列的完整性和繁简体共用,纟、鱼等字符和马、乌、鸟等字中的一(横),仍按三点四点底取码(与、丝字中的下横按横取码。)。其字符有(2亚种)8个
①三点底字符
(州)、
(必)、
(兴)、巛、纟(红)。
②四点底字符 灬(杰、黑)、一(马、鸟)、鱼。
(二)横底类
代码D 横一底字符
横一底字符的特征是以单一笔画一(一横)为底,其底横两端不连不接其它笔画。底横之上,其它笔画可有可无,但不得再有横画。横一底字符有3个
一、亠(文)、
(刁。
挑是横的特殊形态)。
代码E 横二底字符
横二底字符也是以单一笔画一(一横)为底,底横两端不连不接其它笔画。底横之上其它笔画可有可无,但只能有一横画。其字符有10个
二、工、
(侯)、土、士、上、
(共)、止、立、皿。
代码F 横三底字符
横三底字符也是以单一笔画一(一横)为底,底横两端不连不接其它笔画。底横之上其它笔画可有可无,但不得少于二横画。其字符有23个
三、
(录)、王、丑、(表)、五、正、且、
(寒)、主、
(隹)、
(髟)、
(具)、
(其)、
(典)、里、豆、
(黑)、
(卸)、
(堇)、金、钅、
(熏)。
代码G 横端附点底字符
横端附点底字符是以底横的一端或两端与点相连或相接而形成的字符。其字符有(3亚种)7个
①横尾接点底字符
(惠)、虫。
②横尾连点底字符乛
(买)、(尔)。
③平宝盖底字符冖(军)、宀(安)、
(骨)。
(三)竖底类
代码H 出头竖底字符
出头竖底字符是一竖底字符的主要形态,其特征是一竖落底,主竖上端高于同符的其它笔画。其字符有25个
丨(引)、十(孛、博)、丰(奉、半)、扌(打)、忄(
忧)、
(舛)、屮(出、蚩)、
(年)、巾(币、师
)、丰、巿(肺)、肀(唐、肃)、中、
(革)、
(
囊)、申、
(书)、串、韦、聿、
(制)、
(惠)、
(
、重)、
(叟)、事。
代码I 不出头竖底字符
不出头竖底字符是一竖底字符的另一形态,其特征是一竖落底,主竖上端不高于(可以平于,也可以低于)同符的其它笔画。其字符有16个
亻(仁、彳)、丁、予(予)、干、于、
(乎)、车、
(羊)、
(拜)、甲、
(单)、
(臣)、
(颐)、手、
(垂)。
代码J 竖弧底字符
①侧竖底字符
侧竖底字符是因上中部次要笔画偏于一侧,使主竖偏于另一侧而形成的一竖底字符。其字符有19个
卜、(占)、
、刂(别)、卩(即、报、卫)、
ㄐ(收)、阝(队、邮)、丬(将)、
(北)、
(
斗)、
(寸)、
(乍)、
(非)、
(非)、
(
鹤)、
(段)、
(假)、耳、
(捷)。
②弧竖底字符
弧竖底字符是以弧形竖(其竖为弧线笔画,但首尾垂直而不斜行)为底的一竖底字符。其字符有6个
了、子、孑、孓、犭(狂)、豸。
代码K 竖底字符
二竖底字符的特征是二竖居于字符的落底部位。其字符共(3亚种)24个
①内二竖底字符
(介)、
(临)、
(面)、卄(
艺)、廾(开)、井、月、
(青)、丹、
(舟)、冉、
弗。
②外二竖底字符冂(同、向)、
(周)、门、内、
(
离)、
(舆)、
(两)、禹、禺。
③内外竖底字符斤、片、爿。
代码L 三竖四竖底字符
三竖四竖字符的特征是三竖、四竖居于字符的落底部位,三竖底和四竖底两种字符共用一个代码,计(2亚种)14个字符
①三竖底字符川、卅、
(敝)、雨、
(雪)、用、
(甫)、
(鬲)、
(庸)。
②四竖底字符而、
(扁)、册、
(舞)、
(鼎)。
(四)双分底类
代码M 简单双分底字符
简单双分底字符是以撇捺两种斜行的单一笔画为主笔而形成的字符,其构形模式是撇、捺两首相接,从字符中部较高部位出发,两尾呈半放射状向底部左、右两个方向分张。字符计13个
人、(乞)、入、大、火、夫、
(缺)、
(春)、
(奂)、央、
(庚)、臾、夷。
代码N 复合双分底字符
复合双分底字符是因双分的主笔中有复合笔画参与而形成的双分底字符。其字符计(3亚种)21个
①撇配浮鹅钩(竖弯横钩)底字符儿(光、辉)、几、
(风)、九、尢(尤)、
(龙)、
(既)、
(沈)、
(羌)、
(鬼)、
(免)。
②横折撇配捺底字符ス(劲)、
(久)、癶(登)、
(祭)。
③以撇捺在分张途中加上其它笔画为底的字符
(走)、
(定)、疋、
(疏)、足、(路)。
代码O 交叉双分底字符
交叉双分底字符的特征是主笔撇、捺(或由撇、捺参与组合的复合笔画)先在字符中间的较高部位相交,然后两尾分别向底部左、右两个方向分张。其字符共(4亚种)11个
①立撇配侧捺交叉底字符乂、又、丈、史、吏、廴(建)、
(更)。
②双撇配斜捺交叉底字符夊(冬)、及。
③撇折点配斜撇交叉底字符女。
④斜撇配心钩交叉底字符
(必)。
代码P 竖斜双分底字符竖斜双分底字符是由一支直行笔画——竖、另一支斜行笔画——或撇或捺组合而形成的双分底字符。其字符有(3亚种)18个
①右竖左钩配撇底字符才、
(矛)、牙、身、
(姊)、
(弟)。
②左竖右钩配捺(或撇接捺)底字符
(畏)、
(派)、
长、食、饣(饭)。
③左竖及其 变化形态配戈钩底字符
(越)、
(民)、
氏、
(戊)、
(我)、
(羲)、
(戢)。
(五)三分底类
代码Q 简单三分底字符
简单三分底字符是由中竖和撇、捺等单一笔画组成的三分底字符,其构形模式是三支主笔画首在字符的较高部位集聚,三画画尾呈半放射状分别向底部左、中、右三个方向分张。“个”是简单三分底字符的主要形态,其字符有(2亚种)13个
①中竖左钩配左右点底字符小、(当)、东、乐。
②中竖配左撇右捺底字符个、木、未、末、耒、
(刺)、
束、果、秉。
代码R 复合三分底字符
复合三分底字符是因三分的主笔中有复合笔画参与而形成的三分底字符。该字符有(6亚种)24个
①中二竖配左右点(或左撇右捺)底字符
(亦)、
(
兼)。
②中竖左钩配左横折撇、右撇接捺底字符水、氺(黍)、
(鳏)、承(丞)、永、
(求)、隶、承。
③中竖右钩配左撇、右撇接捺(或左横折撇、右点)底字

(衣)、衤、礻、农。
④弧竖左钩配左多撇、右撇接捺底字符
(象)、
(
豕)、
(聚)。
⑤三主笔画首相近,上卧平撇,中竖配左撇、右捺底字符
爪、爫(采)。
⑥以竖、撇、捺在分张途中加上其它笔画(或其它复合笔画
参与主笔之中)为底的字符本、
(练)、(恭)、
(荒)、
(鼠)。
(六)折框底类
代码S 折底三角框底字符
折底字符是由两个或三个线形笔画尾首相连、相接而形成的、具有半封闭性质的不完全框底字符。折底三角框底字符共(4亚种)23个
①左折底字符
(以、改)、
(亡)、匚(区)、
(切)、
(比)、
(迎)、
(印)、
(留)、
(丝)、(疟)、世、
(延)。
②右折底字符コ(已、兜)、彐(寻)、
(巴、
)、
(鹿)、
(妻)。
③双折底字符凵(凶)、山、臼。
④三角框底字符ム(台)、
(至)、幺(玄)。
代码T 空方框底字符
空方框底字符是一种完全的方框底字符,由竖、横折竖、横三个笔画尾首相连相接而成,全部为直行笔画,形成一个在书法上完备的正方形封闭体。其字符仅1个
口。
代码U 实方框底字符
这里所谓实方框就是框内含有其它笔画的方框。以实方框为底的字符有8个
口(囚)、日、曰、
(临)、目、四、田、
(罪)。
代码V 特位特形框底字符
所谓特位框,是指在特定位置上的、即处于字符底部的方框,它同上部的其它笔画共同组成一个不可分割的字符。
特形框的特征有三有斜行笔画参加,其框形不正,如母、瓦等;即使全部由直行笔画组成,其形不方,如凸、凹;框边笔画伸出框外,其框边不齐,如廿、
等。其字符有(2亚种)24个
①特位框底字符
(囟)、白、自、
(睾)、由、石、
曲、西、
(要)、
(曹)、
(寅)、酉、言、讠
(计)。
②特形框底字符
(互、彖)、廿、甘、母、
(贯)、
毋、瓦、凹、凸、
(官)。
(七)斜底类
代码W 撇底捺底字符
撇是弧线笔画,自右上而左下,斜行。撇底字符是以撇为底的字符。捺也是弧线笔画,自左上而右下,斜行。捺底字符是以捺为底的字符。两种字符共(5亚种)30个
①侧撇底字符丿(产、少)、
(反)、厂、广、
(皮)、
(虎)、疒(病)、尸。
②立撇底字符
(班)、
(归)、丆(页)、
(友)、
(发)、
(朔)、
(爰)、
(那)、尹、(拜、
看)、
(着)、
(邦)、
(象)、
(卑)。
③斜撇底字符
(形、勿)、
(步)、
(亥)、
(卯)、耂(老)。
④横折撇底字符夕。
⑤捺底字符之、辶(过)。
代码X 左斜钩底字符
左斜钩是撇的变化形态,是撇尾与右点相连,出锋而形成的混合笔画。以左斜钩为底的字符共(5亚种)16个
①刀钩底字符
(刁)、
(今)、刀、(刍)、
(万、殷)、力。
②习钩底字符
(习、司)。
③勹钩底字符勹(勺)、
(黎)。
④弓钩底字符
(亏、丐)、
(与、考)、
(马)、
(乌、鸟)、弓。
⑤乃钩底字符ㄋ(扬)、乃。
代码Y 右斜钩底字符
右斜钩是捺的变化形态,是捺尾与左点相连,出锋而形成的混合笔画。以右斜钩为底的字符计(4亚种)18个
①戈钩底字符
(弋)、
(戈、尧)、
(戋)、曳、
(哉)。
②心钩底字符心。
③浮鹅钩底字符
(孔)、乙、匕、七、
(毛)、
也、屯(顿)、
(龟)、电(鹌)。
④飞钩底字符
(飞)、气。
以上七大类25种(含60亚种)字符共390个,另多符组字构件和多符单体字320个。这样我们就把与国标字基本集(6763字)有关的传统的组字构件列出了一个完整的清单。国标字中任何一个字的取码都可以在《汉字符底秩表》中找到根据,《多符组字构件和多符单体字取码一览表》则为取码提供更详细的示范。
各种符底间的联系
各种符底间的联系首先表现为七类符底的起始字符(符下有横线者)扩张为25种(含60亚种)符底起始字符(符下有虚线者)的过程。这个扩张过程是通过三种方式实现的
1.单一笔画的重复
点底类起始字符的扩张是横向的扩张从丶(一点)到
(横二点)、
、灬(横三点、横四点)。点得到充分扩张后转化为一(一横)。横是点的横向延续。一(一横)的扩张方式主要是纵向的扩张,横向扩张居次要地位。从一(一横)到二(二横)、到三(三横)。横得到充分扩张后转化为竖。竖是点的纵向延续。丨(一竖)的扩张方式主要是横向扩张,纵向扩张居次要地位。从丨(一竖)到
(二竖),到川、
(三竖、四竖)。[※汉字中单一笔画的重复几乎没有五画的。心理学认为,人的视觉对五以上的数难以瞬间识别,不便阅读。]以上点底类、横底类、竖底类三类字符的扩张,都是以一种单一笔画为起点,主要是通过横向的重复(横底类字符实际上是通过纵向的重复)形成各种符底的起始字符。
2.由组合笔画构成的一定模式的丰富和完善
双分底类、三分底类、折框底类三类字符的扩张则复杂得多。它们是从构成一定的模式的组合笔画和混合笔画(人——撇接捺、个——中竖配撇捺、
——竖折横)出发,扩张的主要方式是追求模式自身的完善、丰富、复杂化。从简单的放射模式到复杂的放射模式,从不完全的封闭模式到完全的封闭模式,一直走向自己的反面。在发展过程中,各种模式得到充分地展开。一旦得到了充分地展开就转化为自身的对立物。
3.弧线笔画尾端连点成钩,以加强朝向
前述六类字符由于底部左右两侧均衡而保持着稳定——静态的平衡。斜底类字符则由于底部左右两侧不均衡而带来偏斜。但是偏斜并非不平衡,而是要求重心落在中线上所维系的平衡——动态的平衡。斜底类字符的动态平衡,在造型上有一种特殊的、运动的美,使汉字的多样性得到进一步地丰富和完善,却大大限制了自身扩张的空间。由于撇、捺斜跨对角,首尾异处,要保持符底偏斜的性质,只能在尾端连点,出锋而形成左、右斜钩。由撇、捺扩张为左、右斜钩的意义何在?发明人百思不得其解。只是猜想在汉字笔画中,点有朝向,横、竖有走向,撇、捺有朝向又有走向。撇、捺尾端连点成钩,使原有的朝向得到进一步加强,使之更富于表现力。
从七类符底的起始字符扩张为25种符底(含60亚种)的起始字符的联系和变化,是从笔画转化为字符(组字构件)的过程,是符底的自我扩张,从《汉字符底秩表》上看,是自上而下的、单线的变化。
由此可见,无论是一种符底向另一种符底的转化,还是同一种符底内的变化,或者是一类符底向另一类符底的过渡都是有规律的。有时是纵向的变化,有时是横向的变化;有时是质变,有时是量变;有时是变形,有时是变位;有时是简单的重复,有时是模式的完善;有时是自身的肯定,有时走向自身的反面;……直到汉字的符底特征得到充分而完全的展开为止。
从点底类的一点底字符(代码A)开始,到斜底类的右斜钩底字符(代码Y)为止,这是一个阶梯式的、有秩序的、无一遗漏的符号系列,故称《汉字符底秩表》。在这个系列面前,每一种符底(组字构件底)都有它确定的位置,它同前后的符底都处于一种本质的关联之中,它同所属的符底类别和自身包含的每一个字符都有着无可质疑的隶属关系。任何一种符底,只能属于这个系列之内,不可能超越这个系列之外。
权利要求
1.一种计算机汉字符底码键盘输入方法,其特征在于
A.将汉字全部组字构件(偏旁部首)依形归并为若干组字字符,并依字符落底部位的笔画结构将字符分为25种,对应西文键盘A-Y25个字母键,字母Z键为查询键,其分类方法及对应键名如下 类别代码键名(结构名称) 落底笔画特征 点底类 A 一点底字符 丶
B 二点底字符
C 三点四点底字符
灬横底类 D 横一底字符 一
E 横二底字符 二
F 横三底字符 三
G 横端附点底字符
冖竖底类 H 出头竖底字符丨
I 不出头竖底字符 亻
J 侧竖弧竖底字符 卜了
K 二竖底字符 冂

L 三竖四竖底字符 川而双分底类 M 简单双分底字符 人
N 复合双分底字符 儿ス
O 交叉双分底字符 乂夊女
P 竖斜双分底字符 才
三分底类 Q 简单三分底字符 小个
R 复合三分底字符

爪本折框底类 S折底三角框底字符
凵厶
T空方框底字符 口
U实方框底字符 囗
V特位特形框底字符
斜底类W撇底捺底字符 丿
夕之
X左斜钩底字符


Y右斜钩底字符

B.汉字的拆分原则是依书写顺序将字拆分为字符、按照与字符落底部位的笔画结构对应的西文A-Y25个字母键取代码,起笔在先的先取
C.汉字的计算机输入方法是
四符以下的字一符一码,不足四码的击空格键表示结束;
四符以上的字取一(首符)码、二(次符)码、三码及末码;
重码字按频序排列,其中高频字击空格直接上屏,其它字屏底显示选择
2.如权利要求1所述的计算机汉字符底码键盘输入方法,其特征在于
将汉字全部组字构件归并为390个字符,依其符底特征分类列表如下
3.如权利要求1所述的计算机汉字符底码键盘输入方法,其特征在于
将全部组字构件中,不属于390个字符的多符组字构件320个按其末符取码列表如下A 一点底末符为AXA
DRA
DSAA
DYA
EA玉FA 书HA
寸JA
斥KA 乓KDA 戕KYA(臧KYSA)甫LA 太犬MA 令MAA 凡丸尤龙NA叉
OA 氐
我戊
PA 戍PAA 成PXA术QA 求RA
SA
WA
发WOA 刃勺习匀XA 羽XAXA兔XNA匆XWA 飞YA (戎YWA)B 二点底末符
EB 黄EVB
(釜)FB 穴GB肃HKB平乎IB夹
MB兆NB
OB来柬QB办
XBC 三点四点底末符黑熏FC 鸟XAC 马乌XCD 横一底末符BD
CD亚DRD 互DVD
HD 垂ID 卫JD 韭JJD丘
KD
MD
MLD 业丞RD
WD重WHD 与刁XDE 横二底末符
(冒)KE 至SE
壬血WEF 横三底末符
BF隹IF
HF
JF
MF生
(寡)WFG 横端附点底末符
CG
DBG
HG
KG
QG 瓜RG
WGH 出头竖底末符丫半BH
DH 辛EH
HUH
IH
JJH 伞MBH
午年MH竹MHMH 革VH千
牛币牛
WH
YHI 不出头竖底末符予Al
羊BI亍DI (南HKBI)臣
SI 彳WI 争XIJ 侧竖弧竖底末符斗AJ下卞DJ 非JJ 乍MJ
XJK 二竖底末符
DBK
开丙两再DK 齐DOK
EK青FK 骨GK (胤NSK)鼻VUK
升舟WK 面WUKL 三竖四竖底末符州CL鬲DTL 龠MDTL
RDL鼎UL
WL 角XLM 简单双分底末符头AM关
BDM
BM天灭DM亥DWM 买GAM 欠GM 疌JM贝KM矢MM 以SAM尺SM页WKM 夭失WM 奂XMN 复合双分底末符羌BN兀无DN 元走EN 见KN光QDN (是UN) 久WN 虎WYN(凫XAN) 免XNO 交叉双分底末符义AO父BO 必CO 文更DO麦FO支HO
攴JO 卤JUO攵MO风殳NO 妻SO 皮
WOP 竖斜双分底末符矛AP良(
)ASP
DP丧EBP民艮(
)SPQ 简单三分底末符米BQ不
DQ 示EQ
SQ
UQ 采WBQ 禾朱WQ麻WQQ系WSQR 复合三分底末符兼BDR 衣亦豕DR
DSR 赤ER辰FR 彖VDR 黍WQMR象XWRS 折底三角框底末符
BQS
DKS 亡
玄DS 齿EMS云去ES 甚FBS镸FS 出
HS
JUS 缶MHS鬼NS
巨SS丢WES臿WHS
么WS
WXS
XMS
XST 空方框底末符谷BMT高DTKT (可IT) 舌WHT司XDT
XTU 实方框底末符首BWU音EU旧HU 香WQU百
(夏)WUV 特位特形底末符
WVW 撇底捺底末符户AW
BDW
BW 严DRDW歹
DW产
步EW 髟FSWW麥HMMW
JW乒KDW
QMOW 少QW乡
SW彡
乏WW

XWX 左斜钩底末符丐DJX 万方
DX 亏EX
FX
ISX 今MAX
WXY右斜钩底末符甩KY 巳已
巴比SY黾TY 鹿WSSY乇毛老WY色XSY
龟XY
4.如权利要求1、2、3所述的计算机汉字符底码输入方法,其特征在于
词输入一律取四码,其中
二字词取首字首符+首字次符+次字首符+次字末符(一符字重复本码一次);
三字词取首字首符+次字首符+第三字首符+第三字末符(第三字为一符字者重复本码一次);
四字及四字以上词取前三字首符+末字末符。
全文摘要
一种计算机汉字符底码键盘输入方法,将汉字全部组字构件(偏旁部首)依形归并为若干组字字符,并依字符落底部位的笔画结构将字符分为25种,对应西文键盘A-Y25个字母键,字母Z键为查询键;汉字的拆分原则是依书写顺序将字拆分为字符,按照对应的西文字母键取代码,起笔在先的先取;输入方法是四符以下的字一符一码,不足四码的击空格键表示结束,四码以上的取一、二、三及末码,重码字按顺序排列,其中高频字击空格键直接上屏,其它选择上屏。
文档编号G06F3/023GK1164694SQ9610633
公开日1997年11月12日 申请日期1996年6月19日 优先权日1996年6月19日
发明者喻宜 申请人:喻宜
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1