三五字码及其键盘的制作方法

文档序号:6656713阅读:499来源:国知局
专利名称:三五字码及其键盘的制作方法
技术领域
本发明属于电脑汉字编码方法,且属于纯字形输入法,还涉及了实现这一方法的键盘。纯字形输入法在听打、想打、修改时不方便,不能由码得字,但它有个优点那就是即便不认识的字也能够迅速输入,特别适合海外华人和外国人使用,由鉴于此,本人发明了三五字码。因其主要特点是将汉字的组字单元、拼形结构集约优化在五三笔码上,所以称之为三五字码。如果认为有商业性宣传之嫌,可改称五三字码。
目前输入速度高的纯字形输入法编码都以拆分汉字组字单元为基础,其缺点是组字单元数大大多于某种西文字母数,记不胜记,又容易忘记,让一般人望而生畏,并且拆分过程中又容易产生歧义,学习难度较大,无法全民普及。五三笔码则完全舍弃了组字单元,无拆分,任何人只要懂得最基本的书写顺序即可在短短几分钟内学会,重码率大大低于全拼音码,其适应面比全拼音码更广,可因为有时会拆散汉字组字单元和拼形结构,影响头脑反应,还会有点重码,输入速度不高。
本发明的目的是提供一种将汉字组字单元、拼形结构集约优化在五三笔码上的汉字编码方法三五字码。它具有易学好用、重码率低、输入速度迅速的优点,一般人20分钟左右可以学会,并且与五三音码具有良好的兼容性。
为达到三五字码的目的,将汉字分为两类一类是单体字,一类是合体字。单体字又分为两类一类是笔画交连或离散对称的汉字,即人们常说的独体字如大、小、三、八等字;另一类是包围部分要分开书写的汉字,如可、区等字。合体字占汉字的绝大多数,可分为左右、上下、包围这三类结构。合体字通常具有或可以有明显的间隙,根据汉字的整体结构,在最初产生间隙处,将其一分为二,先写部分为第1部,后写部分为第2部。
接着编码,对单体字主要以每三笔编码,编码规则与五三笔码雷同。对合体字分别对第1部和第2部主要以每三笔编码,也与五三笔码雷同。第1部编码一般最多取2码,在实施例中就是如此,但“心”等常出现在字尾的部首可以约定例外,第2部最多不超过3码,、第1部和第2部至少各有1码。
为降低重码,最好将某些组字单元排列在键上,组字单元由笔画结合产生,组合后可形成汉字。排列组字单元的技巧是避免组字频率高的组字单元和已排列在键上的横竖斜某种排列组合形式排在同一键上,组字频率高的惯常出现在字首或字尾的组字单元尽可能取一码,以扩大编码空间,降低重码。排列组字单元时还要从降低重码出发,将优选出的组字单元主要按笔画或拼音或表形等方式排列在键上,组字单元以不超出五十个左右为宜,这样利于记忆又能有效降低重码。所有的组字单元一律繁简互含,同源互含,还可包含音或义或形、主要是形体直观相似的同类组字单元,这些同类组字单元可视为“小兄弟”,就像英文字母由大小手写体一样。在以每三笔编码时,若首三笔或末三笔与排列键上的组字单元相同时要优先按最大的组字单元编码。
不足4码的汉字由于其信息含量不足容易造成重码,为此提供了一种易记的识别码,该识别码由该汉字的字型和首笔笔形结合而成,字型在先,笔形在后。将合体字的左右、上下、包围三种字型分别用中文数字一、二、三作代号,将首笔笔形分为横、竖、撇、捺、折五类笔画,分别用中文数字一、二、三、四、五作代号,并优化排列在5个数字和10个字母键上,当然也可排列在别的字母或符号键上。对不足4码的汉字只需补上该汉字字型和首笔笔形所对应的识别码即可。
下面结合优选的实施例作详细说明。
本发明在编码时对汉字笔画的认识完全科学,根据公认的观点,楷书汉字由笔画构成,笔画为书写汉字时不间断一次连续写成的一个线条,汉字的笔画有多种,在只考虑笔画的运笔方向而不计较其轻重长短时,可分为横竖撇捺折五种基本笔画,其中点作捺,提作横、但点提相连时提作点。本人通过潜心研究发现,撇捺都由上向下倾斜,故可称为斜笔画,而折根据其没折弯钩前的运笔方向可并入横竖斜三类笔画中。这三类笔画进发明人称之为根本笔画。它与汉字各种笔画的对应关系见图1所示。接着编码。
单体字编码规则是一、对1至4笔的单体字,按书写顺序根据基本笔画的相交情况编码,横、竖、撇、捺、折当没与上一笔相交时,编码分别为5个互不相同的数字1、2、3、4、5;当只与上一笔相交时,分别为5个互不相同的字母Q、W、E、R、T;当不只与上一笔相交时,分别为另外5个互不相同的字母Y、U、I、O、P。如“大”的编码为1E4,“丰”的编码为111U。
二、对5笔及以上的单体字,按书写顺序根据根本笔画横竖斜的排列次序以每三笔编码。在三个依次出现的笔画中,横竖斜的排列组合的不外乎27种。可一一对应或大致一一对应地排列27个或不足27个互不相同的字母或特定符号键上,因此,对每三笔只需以对应的字母或符号编码。为便于记忆,利用26个字母和分号键一一排列,见图2所示。当取至最后不足四码且不足三笔时,最未笔为横或竖或撇或捺或折,编码分别为5个互不相同的数字1或2或3或4或5。当然,编码也可为别的5个互不相同的数字或符号,当要超过4码时,改取未3笔,如“更”的编码为AE4,“武”的编码为WA4,由于武的编码不足4码,也可规定对最末2笔逐笔编码为WA54。
对合体字编码前最好要掌握优化三五字码键盘排列图,见图3。该图的特点是以图2为基础,将组字单元按前述方法有机排列键上,下面作具体解说(1)目含且,亻含人,日含 ,土含士,心含,讠含言, 含 尸、已、己,氵含水、 ,扌含手、 ,纟含幺,艹含廿、 ,火含灬,钅含金,饣含食。
(2)虫、酉、鱼、火、石、竹按首三笔排列。目、禾按末三笔排列。饣为食的简体、根据食的末三笔排列。、土、氵、古按拼音首字母排列。亻变形后形似W,日之左部,足之中部形似E,讠形似丨,口形似O, 形似P,扌形似F,王形似Z,艹形似H,钅字头形似V,大之下半部形似倒立的V,阝形似B,心开口向上,形似U,纟起笔形似L,所以排列在相应的字母键上,巾将其横倒看为横竖横,所以排在A键上,车将其横倒看为首三笔为竖斜竖,所以排在B键上,女、 逆书写顺序排列,小起笔为竖、末笔为斜兼容在H键上,疒的首二笔为斜横,兼容在U上,D形似半个月的形状,Y形似树木枝叉,所以排在相应的键上,贝旋转后与山形似,而山的三个笔画应排在G键上,所以也排在G键上。
合体字编码规则是分别对第1部和第2部主要以每三笔编码。第1部一般最多不超过二码,第2部最多不超过三码,第1部和第2部至少各有一码,总共不超过四码。当取至最后不足三笔时,将最末笔或剩下的第一笔归类为几种笔画,用若干键表示,一般将最末笔归类为横、竖、撇、捺、折,分别用五个数字键1、2、3、4、5编码。当超过三笔时,改取末三笔。在对每三笔编码时,若首三笔或末三笔与组字单元相同时,则要优先按最大的组字单元编码,再对该组字单元后面部分编码。若首二笔与只有二笔的组字单元相同,也要按该组字单元编码。如青的编码为QD,森的编码为YYY,意的编码为MIEU。
实施例一种电脑汉字编码方法三五字码1 NO2 E5 DMO S4 KZ LUIH XA 4135 ST4 111 15W1 KZ XA有的汉字编码时不足四码,不加识别码将造成重码,如只与叭、径与经等,为此本发明人提供了字型首笔笔形识别码,见图4所示,该识别码用中文数字作代号,有了识别码就能很好的区分,如只的编码为O4W,叭的编码为O42,径的编码为LZ13,经的编码为LZ15。
为提高输入速度,还提供了词组输入法,词组编码码长一律为4码,规则是双字词,每字取其前二码,如实际的编码为KVBW;三字词,第一、二个汉字取其前一码,最后一个汉字取其前二码;四字及多字词,第一、二、三、最末个汉字各取其前一码。不足二码的可补上一个特定的符号,如“,”键。
本发明字词兼容,无须换档等附加操作。重码处理方法和其它输入法相同,或字频或智能。“?”为万能查询键,当某一码难以确定时,用“?”键代替,再利用提示项选择。达到四码的且无重码的自动上屏,不足四码的均以空格键结尾。
本发明可以用于一切大、中、小、微型计算机中文信息处理系统和通讯系统,可广泛应用于中文终端、中文电传、电脑打字、计算机排版印刷及特殊设备等各个方面。可以在互联网环境下运行。
本发明可以适用于使用繁体字的港澳台地区,也可用以日文韩文输入。
不难看出,三五字码编码规则简单、客观,一般人20分钟左右可学成,且不易忘记,码长最多不过4码,重码少,拆分方便,一般不会产生歧意,易学好用,容量大,不认识的汉字也能迅速输入,使得汉字输入速度可以与西文相比。


图1、横竖斜三类根本笔画与汉字各种笔画对应关系表。
图2、三个笔画中横竖斜27种排列组合形式在键盘上的一种优选排列图。
图3、优化三五字码键盘排列图。
图4、字型首笔笔形识别码。
图2、图3中1、2、3分别为横竖斜的代号。
权利要求
1.一种三五字码,其特征是将汉字的组字单元和拼形结构集约优化在五三笔码上。
2.一种优化三五字码键盘排列图,其特征是在任意三笔中,横竖斜的排列组合不外乎27种,可一一对应或大致一一对应地排列在27个或不足27个互不相同的字母或特定符号键上,一般一一对应排列,并将某些组字单元集约优化在键上。
3.根据权利要求2所述的优化三五字码键盘排列图,其特征是排列组字单元时要避免组字频率高的组字单元与已排列在键上的横竖斜某种组合形式排在同一键上。
4.根据权利要求2所述的优化三五字码键盘排列图,其特征是将优选出的组字单元主要按笔画或拼音或表形等方式排在键上,有的组字单元还可以包含互为繁简,互相同源,音或形或义基本相近、主要是形体直观相似的组字单元。
5.根据权利要求2所属的优化三五字码键盘排列图,其特征是排列组字单元时,组字频率高的惯常出现在字首或字尾的组字单元尽量抽出排在一个键上。
6.根据权利要求1所述的三五字码,其特征是将汉字分为单体字、合体字,合体字又一分为二,先写部分为第1部,后写部分为第2部。
7.根据权利要求6所述的三五字码,其特征是对单体字主要以每三笔编码。
8.根据权利要求6所述的三五字码,其特征是合体字编码时,对第1部、第2部主要分别以每三笔编码,第1部一般最多不超过二码,第2部最多不超过三码,第1、2部至少各有一码,总共不超过四码。
9.根据权利要求3或4或5或7或8所述三五字码,其特征是以每三笔编码时,若首三笔或末三笔与组字单元相同时,要优先按最大的组字单元编码,并接着对组字单元后的部分编码,若首二笔与只有二笔的组字单元相同,也要按该组字单元编码。
10.根据权利要求1所述的三五字码,其特征是识别码由汉字的字型和首笔笔形结合产生。
全文摘要
本发明属于电脑汉字编码方法,且属于纯字形输入法。是对本发明人前一项发明五三笔码的一种改进。
文档编号G06F3/023GK1375760SQ0111101
公开日2002年10月23日 申请日期2001年3月18日 优先权日2001年3月18日
发明者王治阳 申请人:王治阳
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1