223汉字编码法的制作方法

文档序号:6598318阅读:380来源:国知局
专利名称:223汉字编码法的制作方法
技术领域
本发明是关于一种汉字编码方法的设计,本发明提出了一种全新的汉字编码思想和编码方法。
一、本发明的出发点目前,用键盘将汉字输入电脑运用得最广泛的编码法是王永民发明的五笔字型编码法,223编码法的发明就是以超越五笔字型编码法作为出发点的。
五笔字型以字根拼形的原理为汉字编码,“223”同样依据字根拼形的原理,五笔字型选取的一百多个字根只有少部分被标印在输入键的键面上,大部分字根需要辨笔形分区位进行背记,“223”选设数目不多的代码符号安排到键面上,以一个码符代表一个或几个字根,码符与所代表的字根或形同、或形似、或意义关联,也就是说,“223”选取的字根都能在键面上直观地看到或找到其形意特征。
五笔字型适用于26个输入键的键盘,“223”不仅适用于26键键盘,还适用于多于26键但键数又不过份地大的任意键数的键盘。
五笔字型安排有二键字(即击键两次输入一字)25个,三键字625个,其余皆为四键字,“223”用于26键键盘时,最多可安排二键字194个,可安排三键字二千个以上。此外,“223”还可安排四键字、五键字、六键字……假如需要,“223”可安排电脑能够处理的任意键字。
五笔字型设计有字根拼形、部首加笔划、纯笔划三种编码和输入方法,“223”同样设计有这三种编码和输入方法,而且三种输入方法兼容,即在输入操作时可随意变换输入方法却无须附加操作换档。再则,五笔字型只有5种基本笔划,“223”却有9种基本笔划,毫无疑问,编码分辨力后者优于前者(部首加笔划或纯笔划编码时)。
五笔字型能用于繁体字的编码,“223”不仅也能用于繁体字的编码,还可将简体字与繁体字合在一起进行编码且不会增加重码字。
五笔字型重码少、码长短,字词兼容,这些优点“223”也都具备。
二、本发明的编码方法1、码符和字根“223”将选设的码符按取码次序分为前码符和续码符两类,又按笔划多少将全部码符分为特征码符和笔划码符两类,这样,综合两种分类方法,全部码符就分为特征前码符、特征续码符和笔划续码符三类,这也正是本发明取名“223”的含意所在。
图一为前码符表,表中列出了48个特征前码符及其所代表的字根。图二是续码符表,表中列出了18个特征续码符和9个笔划续码符及其所代表的字根。
特征前码符代表的字根就是前字根,特征续码符代表的字根即为续字根。
码符中,日与曰的根本区别在于日为无其它笔划与之相交的“日”形字根,“早”“查”等字就取“日”符,曰为有其它笔划与之相交的“日”形字根,“田”“鬼”等字就取“曰”符。“囗”符表示全包围结构及有其它笔划与之相交的“口”形字根。“虫”“围”“央”等字取“囗”符。续码符“二”表示连续写下的“二”形字根,“亏”字取“二”符,“工”字则不取“二”符。
表中有一些由实线部分和虚线两部分构成的码符,称为或然码符,实线部分称为基符,虚线部分称为或符,基符代表着字根的基本特征,或符表示其本身可以有也可以没有,代表字根的附加特征。设置或符是为了使一个码符可以代表更多的字根并更贴近字根。
图一表中第二行右边的或然码符,它上端的虚线圆圈并不代表一个圆,而是代表着这个码符所代表的几个字根上被基符省略掉的笔划。
除了用虚线来区别或符外,也可用其它直观明显的区别标志来区分或符与基符。
码符表中,同一行的3个码符将连同一个英文字母被安排到一个输入键的键面上,这样,在编取一个字的码符代码的同时,又可编取一个字母代码。
将码符安排到输入键上,其实质是将码符所代表的字根安排到了输入键上。
图一图二所示码符表适用于26键键盘,全部码符将占用25个输入键,余下一键为功能键。假定功能键也有一个虚拟的码符“O”,O就称为虚符。对于没有前字根的字,可以以虚符O作为代码的起始码符。
代码中的“O”符表示输入时击功能键一次。
O也可排在前码符后边组成代码。
空格键也给予一个虚符“K”,K也将可以与码符组成代码代码中的K表示输入时击空格键一次。
如对图一图二表中的码符作调整增设,或安排两码符一键,就可使“223”适用于键数多于26个的键盘了。
2、取码规则(1)、为便于掌握运用,先为全部需要编码的字编取一个四符码(即由四个码符组面的代码),再为常用字按使用频率高低各编取二符码和三符码,为属重码字的非常用字编取五符码。以编取五符码的办法来解决重码问题,无疑比用数字键从显示屏幕上的提示行中选字简便得多。
(2)、给字编码,取码顺序为先取前码符,后取特征续码符,若还取不足,再补取笔划续码符。
(3)、“223”若用于键数较多的键盘,编取四符码和五符码时,前码符限取2个,按书写顺序选取。“223”若用于26键键盘,前码符限取3个,按书写顺序取第一、第二和最后一个前码符。若一个字取不够前码符,则按序取完为止。
(4)、特征续码符按书写顺序选取,不限数量,按序取足或取完为止。
(5)、笔划续码符按离笔→余笔的顺序选取,属同类笔划的,则按书写顺序选取,取足或取完为止。
离笔是指与已取特征码符的字根不相交连的笔划。余笔是指与已取特征码符的字根相交连的笔划。未被取用的字根视同离笔或余笔。
也可不分离笔与余笔,笔划续码符一律按笔划的书写顺序选取,这样虽会增加一些重码字,但便于掌握运用。
一个字若取完余笔后还不够,就再对末笔(最后一笔写下的笔划)取一个笔划续码符。如若取末笔后仍不够,就再添上一个虚符。
(6)、前字根不能拆为续字根,也不可从前字根上拆下笔划来与别的笔划组成续字根。若一个笔划结构可按不同的拆分法拆成不同的字根,应按两优先原则拆分,即优先拆出前字根,优先拆出先写成的字根。但“广”字例外,规定拆分为“厂”和一点。
图3是一部分例字依据图一图二所示码符表编制的四符码编码表。
3、键位安排及其电脑编程要求“223”的输入键盘,其安排前码符的键称为前键,安排续码符的键称为续键。在键盘上,前、续键应分区设置,一般以前键在上续键在下为宜。前、续键之间应有明显的区分标志,如可以用不同的颜色来标印前码符与续码符。
根据“223”的编码原理及键位安排,为“223”编制的电脑程序应满足下述要求(1)、击前键后接击续键,是对同一个字的代码的连续输入,击续键后接击前键,则击前键就意味着前一个字已输入完毕,后一个字已输入了其代码的第一个前码符。设击前键为q,击续键为x,那么,连续击键必须是这样的间隔qx·qqx·qqxxx·qxx……每个间隔输入一字。
(2)、在前码符限取2个的情况下,纯前码符代码的标准码长为两码符,连续击前键,每两键输入一字。
(3)、在前码符限取3个的情况下,纯前码符代码的标准码长可定为三码符,也可定为四码符,但四码符的纯前码符代码只适宜用于词语的编码。
(4)、对连续击续键不设间隔,或将间隔定为足够长。
(5)、功能键和空格键应赋于间隔和虚符输入双重功能,这样,击功能键和击空格键都起到间隔的作用,同时,代码“水O”和“水K”就代表着两个不同的字,代码“O二”和“K二”也代表着不同的字。
(6)、如操作员弄不清一个字的某个笔划结构该取什么码符,可先将这个字其余的码符输入,再连击功能键两次,这时输入系统的显示屏幕上的提示行就将那些含有已输入码符并符合其输入顺序的字全部分批予以显现提示,操作员即能用数字键将所需之字选出输入。
4、部首加笔划编码和纯笔划编码部首加笔法编码,即先根据字的部首选取一个前码符,然后对余笔按书写顺序选取笔划续码符。
纯笔划编码,即是按书写顺序以笔划续码符给字编码。
为防止这两种编码法所编代码与特征码符代码产生重码,可充分利用拆笔将有可能重码的字的代码编为五符码或六符码。
拆笔是指一个字已取完全部所含码符后,再将这个字全部拆为笔划,这拆开来的笔划就为拆笔。
5、词语的编码“223”将码符分为前码符(q)续码符(X),又给功能键和空格键设了虚符(O、K),因此所编代码有qO、qK、OX、KX、qX、qqO、qqK……等多种类型,可将一部分类型的代码专用于词语的编码,这样既便于掌握运用又不会产生词字重码的问题。词语的编码方法很简单,按字的取码顺序从词语的字中取码,每字取1-2个码符。
运用于26键键盘的“223”,qO、qK、OX、KX型代码共50个,qX型代码共144个,这些代码都是二键输入,说明书开头所称“223”最多可安排194个二键字就据此计算而得。如是键数更多的键盘,则二键字还要多得多。
6、繁体字的编码目前,既使在中国大陆,繁体字还没有完全弃置不用,所以为繁体字编码仍有价值。
若单独为繁体字编码,只需以繁体字字根替换码符表中相应的字根并改动几个码符即可。
若将简体字繁体字合并编码,只要将繁体字字根补入码符表中,按同样规则对简、繁体字进行混合编码,并将可能产生重码的繁体字的代码编为五符码、大符码。
三、本发明的适用推广
“223”将码符分为前码符和续码符的编码方法,适用于非字词代码的其它代码的编制。
“223”将输入键分为前键续键的键位安排,适用于非字词代码的其它代码的输入运用。
最后说明一点,223汉字编码法属非专业人员的业余发明,本发明人从着手编码研究到提出专利申请,其间不满两个月的时间,也就是说,本发明还只是一项初步研究成果,还有着很大的进一步完善提高的余地。
权利要求
1.一种223汉字编码法,其特征在于将代表字根的代码符号分为前码符和续码符两类,并以先取前码符后取续码符的方法给字编码。
2.如权利要求项1所述的编码法,前码符是特征码符,续码符包括特征码符和笔划码符,这样,全部码符可进一步分为特征前码符、特征续码符和笔划续码符三类,按特征前码符→特征续码符→笔划续码符的取码顺序给字编码。
3.如权利要求项1、2所述的编码法,以一个码符代表一个或几个字根(包括笔划),码符与所代表的字根(包括笔划)之间有着形意特征相同或相似的联系。
4.如权利要求项1、2、3所述的编码法,将码符分为前码符和续码符,其实质是所选用的字根有了前续之分。
5.如权利要求项1、2、3、4所述的编码法,依据字所含字根(包括笔划)以码符给字编码。
6.如权利要求项1、2所述的编码法,将汉字的笔划分为9类(如图2笔划续码符栏)。
7.如权利要求项1-6所述的编码法,为每一个需要编码的字编取一个四符码,为非常用又与别的字重码的字编取一个五符码。
8.如权利要求项1、3、4所述的编码法,每个字的代码限取前码符2个,取足或取完为止。
9.如权利要求项1、3、4所述的编码法,每个字的代码限取前码符3个,按书写顺序取第一、第二和最后一个前码符,取足或取完为止。
10.如权利要求项1、7所述的编码法,可将简体字与繁体字合并编码,将可能与别的字重码的繁体字的代码编为五符码或大符码。
11.如权利要求项1所述的编码法,对汉字(简体字和/或繁体字)进行编码所得到的汉字码本。
12.如权利要求项1所述的编码法,将前码符与续码符(实质是前字根与续字根)分类安排在键盘的输入键上,从而使输入键也有了前键与续键之分,击打前键后接击续键,是对同一字的代码的连续输入,而击打续键后接击前键,则击前键便意味着前一个字已输入完毕,后一字的代码已输入了第一个码符。
13.如权利要求项1所述的编码法,其将码符分为前码符与续码符的原理,也可用于非字词代码的其它代码的编制。
14.如权利要求项12所述的对输入键予对前键续键的区分,也可用于非字词代码的其它代码的输入运用。
15.如权利要求项1所述的编码法,设计有一种或然码符,或然码符由基符和或符两部分构成,基符和或符之间应有直观明显的区分标志。
全文摘要
本发明的223汉字编码法的特征在于用数量不多的代码符号代表字根,直观易记,码符分为前码符和续码符,相应地输入键也分为前键和续键,可安排二键输入的字194个,三键输入的字二千个以上,适用于键数不等的多种键盘,字词兼容,简、繁体字兼容,还可用于非字词代码的其它代码的编制和输入运用。
文档编号G06F3/023GK1083232SQ9210880
公开日1994年3月2日 申请日期1992年7月22日 优先权日1992年7月22日
发明者李向宇 申请人:李向宇
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1