边角特征顺序汉字输入键盘的制作方法

文档序号:6086851阅读:256来源:国知局
专利名称:边角特征顺序汉字输入键盘的制作方法
技术领域
本发明涉及一种用于中文信息处理的汉字编码计算机键盘输入方法及适用于该方法的输入键盘。
现有的中文处理方法在国内应用较广的约有五-六种,如“拼音码”、“表型码”、“五笔定型码”……,(其中首推“五笔字型码”),虽各自对中文信息的处理作出了不容忽视的贡献,然而无庸讳言,这种种方法依然未克完善不是因为重码率太高或每个汉字所需输入的码元太长而影响了输入效率,便是由于难于识记而妨碍了普遍的推广与采用-“五笔字型码”就属于这种类型。“五笔字型码”使用了字根拆分法加笔划分类法,此方法从汉字的图形入手,无疑是正确的方法,-因为汉字从根本上来说乃是图形文字。
本发明旨在提供一种易于识记与操作,重码率低,输入效率高的中文汉字编码计算机键盘输入的方法及键盘。
本发明是以下述的方式完成的-本发明先假定每个汉字都是由形态不同的四条边或四个角构成的方块,而每个单字都是异于其它任何一个单字的特殊方块。边个特殊方块可以用直观扫描法来提取其信息,使之与其它方块区别开来。
本发明对所有汉字的边角特征进行分析比较,找出一定数目的汉字边角特征作为组成汉字的基本单元,并对所述的边角特征归纳分类,给出二十六类边角特征作为信息码元。这些信息码元的排列组合须既能概括汉字的特征,又极少重复和混淆。每个汉字由至多四个码元来表示。
本发明把包涵“角”的“边”,与显露“边”的“角”,统称为“边角”。在此基础上依其特征归纳为-五类“角”钝角、锐角、单直角、上双直角与双直角(三向)。
七类“叉”单叉、斜叉、“大”字叉、“人”字叉、横上叉、垂双叉和横双叉。
五类“点”横上点、平行双点、平行三点、点上点和角边点。
三类“框”单框、双框和三框。
两类“垂”单垂与垂折。
两类“横”单横与垂上横。
两类“撇”叉上撇与点上撇。
上述廿六类边角特征成为本发明的信息码元。不仅如此,这些码元的概念还具有双重含义,譬如“叉上撇”又含有“撇下叉”同等价值的信息。再如“横上点”,可以逆向地表达“点下横”这个同等价值的信息。这二十六类边角特征构成的汉字信息码元,再加上以下将谈及的三条输入法则,就形成了本发明的主要输入方法。与同类的发明相比较,本发明有着明显的两大优点1、易于识记与操作。不管文化程度如何,凡识字的人一般只要学习-十天即可上机操作。
2、重码率低于3%本发明不使用字根拆分法,也不必背诵为数众多的边旁与部首。本发明使用二十六个英文字母键-在字母键上标有码元代表符号,每单字由最多不超过四个码元组成。倘将本方法加以归类,则“直观扫瞄法”庶几近之。
以下将结合附图对汉字边角特征与码元代表符号间的关系作进一步描述。


图1为本发明所归纳的二十六类汉字边角特征的名称及其所代表的汉字边角特征与英文字母的对照表。
图2为根据图1中的对照表所设计的适用于本发明输入方法的“码元代表符号键盘图”先从“角”说起-钝角 钝角以两个笔划相触其夹角>90度为明显特征,如“风”、“厂”、“尸”、“卯”、“氏”……钝角的码元代表符号为
,标于英文字母键“F”上方。要点“风”为双钝角,所以必须先输入“FF”。必须注意识别“九”与执“,前者的右边是竖弯钩”,后者的右边是“斜钩”。横与斜钩相触才构成钝角。
锐角 锐角以两个笔划相触或相连其夹角<90度为明显特征。如“刀”、“勿”、“汤”、“又”、“幼”、“方”、“乃”、“力”……诸字中的角。
锐角的码元代表符号为“
”,标于英文字母键盘“D”上方。
单直角(类单直角)。所谓类直角即不是严格定义上的直角,而是看起来像是直角。如“马”、“句”、“旬”、“卩”、“与”诸字中的角。
类单直角的码元代表符号为
,标于英文字母键“P”的上方。区别锐角与类直角的关键在于前者的夹角中通常没有独立的笔划结构如“刀”、“勿”。而后者则有,如“句”、“匀”、“勾”。类直角在码元长度许可范围应输入其夹角内容。
上双直角 上双直角顾名思义就是位于上边的两个直角。如“月”、“冈”、“用”、“贝”、“同”、“殳”诸字中的角。
上双直角的码元代表符号为
,标于英文字母键“N”上方。要点“巾”、“内”、“周”“同”结构都应先输入“N”。
双直角(三向) 双直角即除了上双直角外的左右下三向双直角。如“甘”、“山”、“凶”、角;“区”、“叵”、“匝”;“刍”、“己”、“录”、“聿”。
双直角的码元代表符号为
,标于英文字母键“U”的上方。要点双直角倘与其它笔划连接或穿插,只要其角仍显露于边,则应被读码。如“聿”、“世”。双直角与其夹角内容的关系往往是先输入双直角,再输入其内容。如“区”,应先读“U”,再读“X”,但如果夹角的内容明显触及上边,则应先读内容,如“山”、“凶”“幽”。“山”在上下结构中,双直角与内容几乎平行,如“岿”、“岗”,故只输入“U”。
现在谈汉字的七种“叉”-单叉 单叉由横竖或一横一竖勾交叉而成。本发明只扫瞄其特征而不介意这个竖横还从属于别的笔划结构。
如“求”、“木”、“巾”、“于”。“巾”与“子”的中间都是“单叉”,“钅”的次码也属单叉。入口单出头的叉被视为单叉,如“由”、“甲”。
单叉的码元代表符号为
,标于英文字母键“I”的上方。要点一竖通过双横即成“垂双叉“”。单叉的底边不显露,被一横止住,即成“横上叉”,如“土”、“主”。
斜叉 斜叉由横与斜钩,横与撇,撇与捺交叉而成。
如“弋”、“友”“女”,“又”“文”、“父”诸字中的叉。
斜叉的码元代表符号为
,标于英文字母键“X”上方。要点弧形“女”字由双斜叉构成。码元为XX,处于复形的左边时仍为XX,如“好”,“妈”除此外,字根“女”一般只读一个“X”。“戋”、“史”、“丈”,由一个垂双叉加一个斜叉组成。
“大”字叉大字叉码元符号
,在英文键“A”上方表示“奉”.“天”.“矢”诸字中的大字叉。要点在“奉”、“奏”,以及“”形结构中,一般先读“垂双叉”,次读“大字叉”,然而在码元不足的情况下,应舍前者取后者-(详见下述取舍法则)。“塞”、“寨”中的撇捺属于“人字叉”,不属“大字叉”。
“人字叉” 人字叉由撇捺相触或相对峙组成。如“人”、“八”“入”,“是”、“塞”,诸字中的“人”字叉。本发明将单人旁“亻”也归入此键。
“人字叉的码元代表符号为
,标于英文字母键“R”的上方。要点撇点“丿丶”,一般不属”人字叉。本发明将它归入“点”类。在并列的双人时,如“从”应被识别为两个“人”字叉。
垂双叉(三叉)垂双叉由一竖或一撇或一斜钩穿过双横或一横一提或一横一撇以上的笔划构成。如“找”、“丰”、“戋”、“年”“吏”、“看”诸字中的叉。本发明将“中”“申”字中的叉视为垂双叉。
“垂双叉”的码元代表符号为
,标于英文字母键“H”上方。要点“井”字,依先上后下的顺序应被视为两个“横双叉”,而不是两个“垂双叉”。入口的叉,凡双出头的一律视为垂双叉,如“中”、“申”。
横双叉(三叉)横双叉由一横穿过双垂以上的笔划构成。
如“共”、“也”、“苏”、“世”。一横穿过一个“口”或一个双直角,应被视为横双叉。如“母”“舟”“丹”“冉”。
横双叉的码元代表符号为
,标于英文字母键“Y”的上方。“其”与“共”的差别在于前者多了一个“三框”。“典”字其显示上边的是典型双竖,中间是特殊的六个“框”。
横上叉(叉下横)“横上叉”由一个“单叉”或一个“垂双叉”和一个“横”构成,上述的两种“叉”被这一“横”止住使不通透。如“土”、“士”“土”属“横上叉”,而“主”、“隹”、“王”的底边一横属“叉下横”,所指不同,码元相同。
“横上叉”的码元代表符号为
,标于英文字母键“T”的上方。要点“圭”字根应依其笔划及形态读为TT,而非HT。“王”读作ZT,“青”读作TN。
次及汉字的五种“点”-横上点(点下横) “横上点”顾名思义即一横上边加一点。如“文”、“方”、“广”、“言”……横上“点”,指的是点。而“横上点”这个概念同时又被赋于“点下横”的逆向含义,此时它指的是“横”不是点。如“佥”、“豆”的末码便是“点下横”横上点的码元代表符号为
,标于英文字母键“E”的上方。要点“兰”、“前”、“曾”首码属“平行双点”。在“广”字结构中,其首码为E,次码为F。
平行双点(四点)“平行双点”由双点平行构成。如“关”、“兰”、“前”的首码,“共”、“其”、“兴”的末码便是。由“双”“点”的概念延伸,它又被赋于平行四点的含义,故“焦”、“煎”的末码也是”平行双点“。撇点“丿丶”也被视为此类点,如“贝”、“灯”。笔划结构“”与“
”也归属以键,如“年”、“欠”、“危”、“攵”中的首码。
“平行双点”的码元代表符号为
,标于英文字母键“C”的上方。要点弧形“火”读MR,而作为边旁的“
”则读MC。前者末笔是捺,后者末笔是点。“办”、“亦”“”的末码皆是C。“亚”的的中间属“平行双点”。
平行三点 “平行三点”可以是三点平行,也可以是单垂加边上两点构成。如“小”、“心”、“州”、“米”、“平”、“火”、“金”诸字中的点皆属“平行三点”。
“平行三点”的码元代表符号为
,标于英文字母键“M”的上方。要点“雨”、“黍”,恭“的底边都是“平行三点”。
点上点(点下提、捺) “点上点”由垂直双点或一点一提构成。如“江”,“准”、“病”。撇点,撇捺如“兆”、“飞”、“辰”,长捺如“之”,“过”也归入此键。同时,依书写习惯与形态特征,本发明将短勒也视为点,双短勒和三短勒等于点上点。如“非”、“乍”。
点上点的码元代表符号为
,标于英文字母键“K”的上方。“藏”,“鼐”中的“爿”结构一律视为“点上点”=“丬”。
角边点(边角点) “角边点”指的是位于各类角夹角中的点。如“勺”、“付”,这类点为数不多。然而“角边点”又被赋于“边角点”的第二种含义。这“边角点”指的是位于单字边角之点,如“令”、“弋”、“辶”、“虫”、“家”、“冗”、“犬”、“社”、“矣”诸字中的点,这类点为数众多,对于区分汉字特征有价值。
“角边点”的码元的代表符号为
,标于英文字母键“G”的上方。要点弧形“台”、“矣”上边的“厶”读作DG,即一个锐角加一个“角边点”。但作为边旁,如“抬”,“挨”、“唉”中,这个“厶”只读G。“卜”与“
”被为同形结构,即竖边短勒,归入“V”键,不属于“角边点”。如“处”、“外”、“咎”等。
本发明将“框”分为三种-单框(类单框)单框指是的“口”,大框“囗”也属单框。此外,封闭状态的双直角只要类似“口”,就被视为单框。如“己”、“尸”。
“单框”的码元代表符号为
,标于英文字母键“O”的上方。要点“尸”的码元为FO,“已”字为OL。“口”与“囗”的码元识别在于后者须在末码加打“S”,指明前面码元的“O”是个大“囗”。详见“特殊功能键S”节。
双框(类双框四六框) “双框”由两个单框连接或对峙构成,如“日”,“吅”,“罒”,”封闭状态的双直角,只要类似双框,就被视为“双框”,如“巴”、“艮”、“
”。此外,由“双”框的概念延伸,四框“田”,六框“典”,也归入此类。
“双框”的码元代表符号为
,标于英文字母键“B”的上方。要点“
”形须先读“U”,再读B。弧形“田”,读作OIS,即一个“单框”中含一“单叉”。复形“田”,如“备”、“苗”,若码元长度允许,须在B后加读“S”与“日”区别,若码元用尽,可免读“S”。“田”在复形中,首码应打BB,如“畦”BBTT。
三框(类三框)“三框”由三个“单框”连接而成,如“目”。与上述两类框一样,凡类似“三框”,就被视为“三框”如“且”、“四”、“皿”、“西”、“酉”、“其”。
“三框”的码元代表符号为
,标于英文字母键“Q”的上方。弧形的“四”。读作OCS,即一个大“单框”中含“平行双点”。“目”字只读作Q。在码元有余的情况下,“且”、“皿”可加读一个“Z”。“Z”的码元定义是“单横”。
垂有两种-单垂(带钩、勒点) “单垂”指单竖,单撇或竖钩,如“牛”,“刂”、”少,“齐”。单竖的情况极少,而单竖带勒,带点的居多,本发明将此归入单垂,如“卜”、“占”、“上”,“叔”、“处”诸字中的“
”与“卜”。
单垂的码元代表符号为
,标于英文字母键“V”的上方。要点双竖读“VV”,如“止”读“VVZ”,”齐“读EXVV。但在左右结构中,双竖不可能都显露在边上。
垂折 垂折包括笔划竖弯、竖弯钩、竖提和卧钩,如”比、“以”、“己”、“心”、“仓”、“仑”、“旨”、“几”……“垂”折的码元代表符号为
,标于英文字母键“L”的上方。要点注意辨别竖弯钩与斜钩,如“九”与“执”,“几”与“飞”,前者右达读“L”,后者左边读“F”-钝角。
“横”分两类单横 单横就是一横,如“亘”、“上”、“平”、“三”以及“马”字左边的一横。
“单横”的码元代表符号为
,标于英文字母键“Z”的上方。要点“一”是“Z”,“二”读作“E”,即一勒(点)一横。“三”读ZZ。
垂上横(横下垂),“垂上横”由一横下添一“撇”或一“竖”或一“钩”构成,如“而”“丁”、“石”、“子”、“工”、“万”、“不”、“兀”诸字中的“横”。横钩与横撇也归入这个键,如“买”,“劲”。“垂上横”指的是“横”,它还被赋于“横下垂”的逆向含义,此时指的是“垂”如元、“衣”中的左边撇便是。“J”与“Z”的区别在于后者或是单纯一横,或是横下是叉或双竖。
垂上横的码元代表符号为
,标于英文字母键“J”的上方。要点平行双撇也归入此键,如“彳”、“彡”、“犭”、“豸”、。“彡”读JJ。
叉上撇(撇下叉)“叉上撇”指位于各类叉顶上的撇,如“禾”、“夭”“各”、“毛”、“千”。“叉上撇”还被赋于“撇下叉”的逆向含义,前者指撇,后者指叉,其意义在于在码元不足于表达单字的全部边角特征时,“撇下叉”就已经表达了二个信息。如“各”可读SO,“”可读SH,“”可读SM,因为S已表达了“撇”下是一个叉的信息。
“叉上撇”的码元代表符号为
,标于英文字母键“S”的上方。要点注意识别“夂”与“攵”,前者读SX,后者读CX,(作为特殊功能键S,其用法详见下述。)点上撇(鸡爪、凤尾)“点上撇”指位于各类点之上的“撇”,如“寽”、“乏”、“乎”、“采”、“”。本发明将“川”、“
”称为“凤尾”“个”、“
”称为“鸡爪”,一并归入此键。“”头部首为双“鸡爪”,只须输入一个“W”。
最后,必须论及输入法则。
本发明的输入(读码)法则有三-1、边角优先法则;
2、比较取舍法则;
3、省略识别法则。
(1)边角优先法则。本法则首先指明读码顺序。“边角特征”读码顺序基本上与笔画顺序相同,但若边角顺序与笔画顺序相抵触,则必须遵从本法则。兹举例说明
上述遵从了边角优先法则。边角特征读码顺序在整体上依然是先上后下,先左后右。更具体而言是左右结构左上左下,右上右下;上下结构;左上右上,左下右下,而这正是笔划顺序。
边角优先法则与笔划顺序保持一致的同时又保持优先地位,兹再举数例-
本法则还规定边角特征保持独立,不因笔画的关连而改变或被并吞。兹举数例说明-
(2)比较取舍法则。
本法则指明提取复杂单字信息码元的简单方法。尤其在四码元不足以表达某单字所有的边角特征时,更必须遵从本法则进行取舍。比较取舍法则概而言之就是取其边角中幅度较大因而显露面较广的特征-即信息较大的码元,具体而言是-1)边角比较边>角。如
2)W>S>X “乎”、“采”这类单字,既是“撇下叉”又是“撇下点”,由于W>S所以取“W”舍“S”,“夆”、“各”这类字,如果作为边旁只能取两码时,取“S”舍“X”,因为S>X。夆=SH,各=SO3)S>A>H “乔”、“忝”这类单字,如果作为边旁只能取两码时,取“S”舍“A”,“乔”=SV “忝”=SM。“奉”、“泰”这类字,如果作为复形只能取两码时,取“A”舍“H”。“奉”=AH,“泰”=AM4)T>H>X “戋”、丈“史”这类字中,须先读H,次读X,码元不足时,取“H”舍“X”。在“青”、“贵”这类单字中,如果作为边旁只能取两码时,取“T”舍“H”。青=TN 贵=TNC。在“孝”、“考”这类字作为边旁只能取两码时,取“T”舍“X”,孝=TI 考=TD。
5)X>C>D 在“攵”作为边旁的单字中,如果只能取一码时,取“X”舍“C”如“橄”=IWJX。在“又”作为边旁的单字中,如果只能取一码时,取“X”舍“D”,如“铎”=CIXH,“椒”=IWVX6)I>L>V“旨”、“皆”这类字作为边旁只能取两码时,取“L”舍“V”。旨=LB 皆=LB,在“钅”作为边旁取两码时,取“I”舍“L”,钅=CI。
7)G>D 在“矣”、“台”等字作为部首只能取两码时,取“G”舍“D”,台=GO,矣=GA8)M>L 在“心”作为部首或边旁,只能取一码时,取“M”舍“L”,思=BM,悉=WM。
9)同等价值取上不取下,取左不取右。下述的例中,“椒”与“橄”是取上舍下的典型。在三复形中,由于中间须被读码这种取舍在所难免。
在“几”字中,由于F>P,故读作FL。“阝”与“卩”,由于P>D故读P。
10)F>P>O/D/L 在“尸”字作为部首只能取一码时,取“F”舍“O”,在“民”作为部首只能取两码时,取“P”舍“O”,“民”=PX。“民”、“氏”“
”等字,作为边旁或部首时“L”或“D”不被读码。氏=FX,民=POX,虏=VFXD例子不胜枚举,在理解的基础上,通过操作短期内便会进入机械识记。此时,诸多法则也经被消化了。
(3)省略识别法则。
本法则指明在复杂单字中须加以省略处理的结构,以及在某个码元信息不确定的情况下,如何加以识别。本法则中还指明如何具体应用两个特殊功能键以达到上述目的。这两个特殊功能键分别为“表示键”C与“指示键”S。
本法则先将单字中某种复杂的结构部分统称为“附件”。“附件”的特征通常为同形对称或对峙,如“赞”“替”、“潛”、“卒”、“噩”、“
”、“飆”、“幽”、“變”、“巽”、“桑”、“勰”……这些“附件”必取加以省略处理,其方法是代入“表示键”C。
但“喿”形不在此例,因为“三柜”Q,足以表达这个码元信息。“指示键”-S只能居于码元之末,它把前面的码元中不确定因素识别出来-1)指示前面码元为间隔同形
衡、衙、街、……在本法则中被视为间隔同形。
2)指示前面的码元为三同形
“田”作为边旁部首读BB,作为末码可加打“S”
3)指示前面的码元是个重码,而本单字使用频率较低治=KGO 冶=KGOS 淮=KETS 准=KET 土=T 士=TS
由于本发明重码率低,上述情况不易与其它用法相混。
4)识别码 识别大“囗”与小“口”,识别末码“田”与“日”。
吕=OO 回=OOS 田=OIS 四=OCS 日=B 目=Q 佃=RBS 锶=CIBM惫-SBML 畜=EGBS-以上比较中可以明白应用“S”的具体情况。

但在码元不足时,也可免读S,尤其是夹在字间的“囗”与“田”,如上述的“惫”,“摁”。
本发明无法解决的唯一单字为孤形“可”,而“可”字却是高频字。直捷的解决方法是“可”=S。
最后,如遇到重码,则屏幕上将按单字使用频率的高低,显现供选择,本发明的首版为简体基础版,依GB5007-85标准字库收入单字6750字。本发明的第三版为繁体版,技术特征与“基础片”完全相同。本发明的条二版为“词组版”,收入高频词组六千条。词组的输入法如下三字词以上的词组,一律提取其首码,如-
而两字词则各提取其首码与末码。其它技术特征与“基础版”完全相同。
两字词组中若有一个是单码,则必须在此字单码后加打S,补足四码,
根据专利法第三章第三十一条,以上所述“词组版”属于“一个总的发明构思两项以上的发明”,故只提交一份申请,其余从略。
权利要求
1.一种边角特征汉字输入方法及键盘,其特征在于将一定数目的汉字边角特征作为组成汉字的基本单元,并将所述的汉字边角特征归纳为二十六类,分别为五类“角”、七类“叉”、五类“点”、三类“框”、两类“垂”,两类“横”、两类组合“撇”,每一类边角特征被赋于一个输入键,键上标有边角特征码元代表符号,每个汉字或词组由至多四个代表其特征的码元组成。
2.根据权项1所述的汉字输入方法及键盘,其特征在于,单字的输入按1)边角优先法则,2)比较取舍法则,3)省略识别法则输入。
3.根据权项2所述的汉字输入方法及键盘,其特征在于,三字以上的词组,依次输入各单字的首码;两字词组则依次输入各单字的首、末码,如其中一个单字为单码则须在其单码后加打一个功能键,补足四码。
4.根据权项要求1或2或3所述的汉字输入方法及键盘,其特征在于键盘的设计使所述的二十六类汉字边角特征代表符号尽可能与英文字母形态相似,如“双框”与字母“B”相似,“垂折”与字母“L”相似,“大”字叉与字母“A”相似,“人”字叉与字母“R”相似,“单框”与字母“O”相似,“横下垂”与字母“J”相似,“双直角”与字母“U”相似,“单直角”(类直角)与字母“P”相似,“角边点”与字母“G”相似,“斜叉”与字母“X”相似,“单横”与字母“Z”相似。
全文摘要
本发明是一种汉字编码输入方法以及与此方法相应的专用输入键盘。本发明可应用于中文信息处理,通讯、办公、印刷与书写诸领域。其主要技术特征在于对汉字的边与角进行分析与归类后,给出二十六种边角特征作为汉字输入的信息码元,在此基础上设计出与二十六个英文字母相对应的码元代表符号键盘。在此键盘上依本发明的读码法则输入汉字,每单字或词组由至多四个码元组成。本发明较之现有其它汉码更易于识记与掌握,且重码率低。易于得到推广和采用。
文档编号G01S7/02GK1061860SQ9111050
公开日1992年6月10日 申请日期1991年10月30日 优先权日1991年10月30日
发明者陈震 申请人:陈震
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1