汉字拼音笔划编码的制作方法

文档序号:6597220阅读:2208来源:国知局
专利名称:汉字拼音笔划编码的制作方法
技术领域
本发明属于计算机使用的汉字编码这一领域。
目前,汉字编码方案,已有数百种,但在全国使用最为广泛的是王永民的《五笔字型》编码,而最简单易学。使用方便的是陈尚农最近申请发明的《汉字表型符号编码》,但《五笔字型》须背熟130个基本字根和掌握末笔字型交叉识别法则,《汉字表型符号编码》的表型实质上是一种象形,故它们均非十分直观。简便。
本发明则完全按照日常使用汉字的习惯和汉字的三个特点1.每个字均按拼音发音,拼音的第一个字母(首母)为英文23个字母之一。例如“儿”的首母为“e”,“好”的首母为“h”。2.每个字均由笔划或其它字或笔划结合其它字组成,例如“土.口.万.力”均由笔划组成,分别为“3划.3划.3划和2划”;而“叭.庆.功”均由其它字组成。“叭”为“口.八”,“庆”为“广.大”,“功”为“工.力”,但“左.日.由”等则是由笔划和字两者组合而成,“左”为“工”,“日”为“口.一”,“由”为“日.丨”3.汉字字典的最佳查字法为笔划法,如“手.业.臣.雨”分别为“4划.5划.6划.8划”,来编出一种以拼音的首母和笔划的数码组合而成的新型的《汉字拼音笔划编码》。例“办”可分为“丿.力.丶”这三部分,它的编码为1l1”.“罢”为“四.土.厶”,它的编码为“sts”。“启”为“丶.尸.口”。它的编码为“1sk”同时,除一些特殊规定和法则外,基本上不须记忆。这样,则使编码更为简单,使用更为方便。
编码法则如下一.码元35个,为英文26个字母(加上特殊规定五.1中的三个)和数字1-9。
二.码长2-4位,取每个字各部分的首母或笔划数码按书写顺序排列而成。
三.码长不足三位者,则取其拼音首母放在末位,如“儿”不再含有其它字,它的笔划为2,仅一位,故再将“儿”的拼音首母放在“2”的后面,构成“儿”的编码为“2e”。同理“土”的编码为“3t”。再如“叭”由“口”和“八”组成,不足3位,故再将“叭”的拼音首母放在“口.八”之后,组成“叭”的编码是“kbp”。同理,“只”的编码为“kbz”。
四.三位及四位码长者,则直接取各部的拼音首母或笔划数码按顺序排列。如“吧”的组合为“口.巳.丨”(“丨”规入笔划类)三部分,它的编码为“ks1”,同理“品”的编码为“kkk”。再如“翱”的组合为“白.本.习.习”,它的编码为“bbxx”。同理“嘛”的编码为“kgmm”。
五.特殊规定1.为减少重码,下列偏旁分别用字母取代。即氵.冫-i;忄-a;扌-p;
纟.幺.
-u; 月-v;
2.为编码方便,下列偏旁或字头算字,其对应的字和此字拼音首母如下人.亻.彳-人.r;讠-言.y;攵-文.w;
冖.宀-盖.g;钅-金.j;丌-兀.w;
廴.辶.
-之.z; 令-令.L;
-丰.f;
卩.阝-耳.e;饣-食.s;士-土.t;
艹.廾-草.c; 犭.
-犬,q; 干- g;
礻.衤-衣.y;-竹.z;玉-玉.y;
3.为简化字的拆分,将数字“1.一.二.三和十”规入笔划类,而“四.五.六.七.八.九”仍作为字处理。但是,单独输入它们时,则为一(11).二(22).三(33).-九(99).十(00)六.拆分和排列准则凡含有其它字的字或笔划均可拆分,否则不能拆。如“有”含有“月”,可拆成“大.月”它的编码为“2vy”。同样“分”可拆为“八.刀”它的编码为“bdf”,再如“拜”字的右半部“
”,它不是字,但它是含字的笔划,故可分为“干.二”,但象“口.月”等字和笔划“干.
”等均不含其它字,故不能拆分。同时,字的拆分时还应注意如下几点1.成字为要。如臂-尸.口.辛.月(skxv)全是字,而不应拆成“启.立.十.月”,再如碍-石.日.于.丶(sryl)而不是“石.口.一.于”,即应当尽量多成字。
2.后位拆分。如猖-犭.日.口.一而不是“犭.口.一.日”。再如蜡-虫..口.一而不是“口.
..日”,即拆字时尽量拆后位部分。
3.笔划不断。凡属于一笔下来的笔划,不能分为两段或更多段,如“丰”不能拆为“士.十”;“出”不能拆成“山.山”,只能拆为“凵.山”。
4.数码不连。如“戟”为“十.早.弋.丿”而不应成为“古.一.十.戈”,因为这样造成笔划“一.十”的编码“1和2”是相连的。
5.大字先成。如埃-土.厶.丿天;而不应为土.厶.大,因为“天”比“大”的笔划多。即在同样字母数字排列情况下,应尽量拆成笔划较多的字。
6.笔划为顺。如碍-石.日.于.丶;而不是“石.日.一.寸”。因为按汉字书写方法,是先写出“于”再加上的一点“丶”。
7.尽力拆分。如安-丶.冖.女,这里尽管“宀”和“冖”的编码都是g,但是,在不足以拆成四位的情况下,需要时应尽力拆分。再如“幼”为“幺丶.力”(r1l).“辽”为“了.丶.
”(L1z)。
8.不足则添。如己-3j.计-y2j.兀-lew(一.儿)七.拆分与编码示例日-口.一,k1r;白-丿.口.一,1k1;
禾-千.八,qbh;木-十.八,2bm;
百-丆口.一,2k1; 虫-口.
.k3c;
火-丷.人.2rh;巴-巳.丨,s1b;
甫-
.月,3vf; 父-八.乂,byf;
田-日.丨,rlt;本-十.八.一,2b1;
兵-丘.八,qbb;革-,廿.中.一,nz1;
惰-忄.左.工.月,a2gv;卑-丿.口.一.千,1k1g按-扌.丶.冖.女,plgn;板-十.八.又,2b2y斌-文.一.弋.止,wlyz;柏-木.丿.口.一.m1k1腭-月.口.口.亏,vkkk;饿-饣.丿.扌.
,s1p3八.重码字的处理方式。
本发明的总编码容量为35*34*35*34+35*34*35+9*26=145.8万按国标基本集6763个汉字来算,重码率为6763/145.8万*100%=0.464%由此可知重码字极少。
当两个或两个以上字的编码重复时,取最常用的字放在标准字库的代码中,其它字则另加末位识别码。当打入重码字时,可让计算机报警,同时将所有的重码字(此类)全显示出来,如果你打入的那个字是最常用的字(它可列在屏幕的第一位)你可直接续打下面的文件,如果不是最常用的那个字,你须再打入屏幕上显示的相应识别码,然后续打下面的文件。
九.查寻键0(零)当你对某个字的其中部分的编码弄不准时,你可打入代用键码“0”,这样,其它各部分均相同的字将全部显示出来,并同时显示出它们的标准码来。同理,当你对某个字的其中两个部分编码不清楚时,你可打入代用键“0.0”(在相应的弄不准的位上打)以此类推。
十.容错码,某些容易编错的字,可同时将它的容错码编入编码库,这样,即使你打入的不是标准码,也能调出你所须的字来。如柏-木.丿.口.一(m1k1),它的容错码为“十.八.丿.日”即“2b1r”。另外,对于双音字,如“车”,它有两种发音,即“che”和“ju”则取“4c”为它的标准码,取“4j”为它的容错码。
十一.词的输入法(四位码)一.双字词-取每个字的拼音首母和第一位(尽量直观化)组合而成。如你们-你.亻.们.亻.即nrmr.计算-计.讠.算..即jysz.山东-山.3.东.
即s3d2.土.地-土.3.地.土.即t3dt.简单-简..单.丷即jzd2。
二.三字词-取每个字的拼音首母和第三个字的第一位组合而成。如计算器-计.算.器.口.即jsqk.大众化-大.众.化.亻.即dzhr.飞机场-飞.机.场.土.即fjct。
三.四字词-取每个字的拼音首母组合而成。如合理规化-hlgh.宏伟建筑-hwjz.热气腾腾-rqtt.爱莫能助-amnz。
四.四字以上的词-取第一.二.三和末位字的拼音首母组合而成。如电子计算机-电.子.计.机.即dzjj四个现代化-四.个.现.化.即sgxh.中国人民解放军-中.国.人.军.即zgrj。
由于采用4位码,其编码总容量为145.8万,而标准汉字才占有其中的6763个编码,其剩余容量极大,故输入词时不须再打识别码,即可以采用与字的相同方式打入,即可显示出各种词来。
权利要求
1.一种计算机使用的汉字编码,其特征在于码元为英文26个字母和数字1--9,码长为2--4位。字的编码方式是按拆分规则将汉字分成四个部分,再将那些是字部分的拼音首母和不是字部分的笔划数码以排列顺序组合而成。词的输入方式为全四位码,其键入方式和字的键入方式相同,编码方式是取词中字的拼音首母或结合字的第一位按排列顺序组合而成。
2.按权利要求1所述的汉字编码,其特征在于当某个字的拆分不足于三位时,则取那个字的拼音首母放在后位作扩展码。
3.按权利要求1所述的汉字编码,其特征在于特殊规定了“氵-i.忄-a.扌-p.纟.幺.
-u.月-v”.“1.一.二.三.十”划入笔划类,而“四.五.六.七.八.九”则规入字类,以及将偏旁和字头规入字类。
4.按权利要求1所述的汉字编码,其特征在于具有容错码和查寻键“0”(零)。
全文摘要
《汉字拼音笔划编码》完全按照汉字发音,书写顺序。笔划和组字的特点,按拆分总则凡含有其它字的字和笔划均可拆分,尽量将一个字拆成四个部分,再分别取个各部分的拼音首母或笔划的数码按顺序组成起来。如“璧”可分成“尸、口、辛、玉”四个部分,对于拆分不足三位的字,则在后位补上那个字的首母,如“儿”不能再拆,仅一位,其编码为“2e”,“子”可分为“了、一”两位,它的编码为“11z”。同时,为了简化编码和提高键入速度还规定了词的输入方式为全四码,其键入方式与字同。如四字词……取每个字的拼音首母组合而成。如“建设四化”的编码为“jssh”。
文档编号G06F3/00GK1034280SQ88109679
公开日1989年7月26日 申请日期1988年10月27日 优先权日1988年10月27日
发明者吕乃冲 申请人:吕乃冲
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1