三五数码的制作方法

文档序号:6601610阅读:343来源:国知局
专利名称:三五数码的制作方法
技术领域
本发明属于电脑汉字编码方法。且属于纯字形输入法。因将汉字分为三块简单汉字、复杂汉字第一部分、复杂汉字第二部分,按五种基本笔画相交与否编码。所以称为三五数码。
目前,利用10或不足10个键输入汉字的输入法,按是否离不开书写顺序编码可分为二类一是象四角号码那样按顺时针或逆时针对四角取码,可这不符合人们习惯的书写顺序,不利于输入,通常只能用于检索汉字。二是将汉字的各种笔画归类为几种笔画,基本按书写顺序编码,为降低重码,往往还将合体字一分为二,或优选组字部件参与编码。可这些输入法要么组字部件过多,欠简单;要么笔画的归类选取欠合理;要么不考虑笔画间的空间位置关系;要么对合体字切分过细,甚至象切豆腐干一样,一分为三,一分为四。要么未用足十键,白白浪费键位。流行的逐笔取码的输入法则码长过长,重码又高。这样目前的输入法都不尽人意。
本发明的目的是提供一种简单易记、输入速度快的汉字输入法三五数码。它具有笔画归类、组字部件选取、切分合体字合理,考虑了笔画间的位置关系,用足十键,码长最多六码,输入速度快的优点。
为达到三五数码的目的,本发明先将汉字分为三块简单汉字、复杂汉字第一部分、复杂汉字第二部分。再将汉字的各种笔画归类为横竖撇捺折五种基本笔画,根据其与其它笔画相交与否,对不交的横或竖或撇或捺或折,用五个互不相同的字母或数字或其它符号编码。对相交的横或竖或撇或捺或折,用其它五个互不相同的字母或数字或其它符号编码。接着编码,规则是简单汉字按书写顺序最多取五码。复杂汉字先写的部分为第一部分,最多取首尾二码。复杂汉字后写的部分为第二部分,按书写顺序最多取四码,最好取前三笔和最末笔,但末二笔为撇捺时且去掉还能取足四码时应去掉撇捺。口、日、目、田这四个组字部件组字频率高,规定复杂汉字第一部分最多只取首尾码时,编码就会相同,这会造成大量重码。由于口、日、目、田可认为分别由一个或二个或三个或四个“口”组成,因此可优选其首笔和“口”数编码。将“口”数与四种基本笔画一一对应,为简单易记,一般用横或竖或撇或捺相对应。再将“口”数转化为对应的基本笔画,为降低重码,最好将首笔或“口”数皆视为相交,再编码。
下面结合优选的实施例作详细说明。
本发明在编码时对汉字笔画、部件的认识完全科学。笔画为书写汉字时,按规定走向一次连续不断写成的一个线条。汉字的具体笔画有多种,国家标准为28种。在只考虑其运笔方向,而不计其轻重长短时,可归类为横、竖、撇、捺、折五种基本笔画,其中提归入横,竖钩归入竖,点作捺,其余一切带拐弯、转折的笔画都归入折。可以组成汉字的笔画结构,叫部件。也有的输入法称字根,码元等等,还是按国家标准叫部件为好。
本发明基于汉字结构对汉字作划分也很科学。将汉字分为简单汉字和复杂汉字二类。简单汉字一般指独体字,是指具有笔画粘连相交浑然一体或离散对称的汉字,如“了”,“木”,“八”等字。复杂汉字一般指合体字,是指具有左右或上下或包围结构的汉字。它可以一分为二,分为二部分,按书写顺序先后,含汉字首笔的部分为第一部分,余下的部分为第二部分。为降低重码,还可规定包围部分写在最后的汉字也划入简单汉字,在本实施例中这么规定。当然也可不作这一规定,或规定辶或阝或心写在最后时前置。接着编码。规则是(1)约定不与其它笔画相交的基本笔画横或竖或撇或捺或折的代码分别为1或2或3或4或5;之所以如此约定一是考虑了横竖撇捺折的组字频率和实用频率,二是为了记忆方便。当然也可规定不与其它笔画相交的基本笔画横或竖或撇或捺或折的代码分别为其它五个互不相同字母或数字或其它符号。类似地,与其它笔画相交的基本笔画横或竖或撇或捺或折的代码分别为6或7或8或9或0。当然也可规定与其它笔画相交的基本笔画横或竖或撇或捺或折的代码分别为别的五个互不相同字母或数字或其它符号。
(2)为区分简单汉字和复杂汉字,规定简单汉字最多取5码,复杂汉字最多取6码。简单汉字规定按书写顺序取前5个笔画编码,或取前4个笔画和最末笔编码。不足5码时,取完所有的笔画为止。本实施例约定取前4个笔画和最末笔编码。复杂汉字的第一部分编码时按书写顺序取第一部分的首笔画和末笔画,不足2码时取首笔画;复杂汉字的第二部分编码时按书写顺序取第二部分的前3个笔画和最末笔。不足4码时取完所有的笔画为止。但末二笔为撇捺且去掉后,第二部分仍可取足4码的应去掉撇捺再编码。
对复杂汉字一分为二的方法有二一是按结构划分,即在左半部分和右半部分,上半部分和下半部分,包围部分和被包围部分的交界处,将复杂汉字一分为二。另一种是据理划分,即按造字方法划分,以“意”字为例,据理划分的话,第一部分为音,第二部分为心,这样两边都成字,且符合形声字原理,不过据理划分需要对汉字有较深的认识,因此还是按结构划分为好,即“意”字的第一部分为“立”,余下部分为第二部分,在实施例中按结构划分。无论那种方法,先写的部分都为第一部分,后写的部分都为第二部分。
汉字有个特点,那就是撇捺特别是捺(包括点)在字尾的组字出现的频率非常之高,而折撇在字尾的频率很低,硬性规定必须取汉字的最末笔的话不利于区分重码。若将惯常出现在字尾的含撇捺的组字部件如“大”、“八”等抽出排在区区十个数字键上,则一来不能较为有效地降低重码,二来不利记忆。本人阐精竭虑后想到了一个解决之道那就是去掉撇捺后第二部分还能取足四码时应该去掉撇捺再编码。这一规则是深思熟虑后的产物,因为若一律规定去掉末二笔撇捺则在第二部分笔画较少时,会丢失信息,造成重码。
(3)“口”、“日”、“目”、“田”这四个成字的部件组字频率较高,惯常出现在字首,由于规定复杂汉字的第一部分只取首尾二笔,会造成部首编码相同,进而产生大量的重码,因此有必要另行规定。考虑到“口”、“日”组字频率很高,可将“口”、“日”抽出排在组字频率低的相交的或不交的基本笔画键上,我认为排在交折键上比较好。“口”的代码相当于一个交折笔画,即为0;“日”的代码相当于二个交折笔画,即为00。这个办法便于记忆,只是别人很容易想到。本人还想到了另一个别人不易想到的办法“口”、“日”、“目”、“田”这四个成字的部件可认为1个或2个或3个或4个“口”合并组成,可将“口”的个数分别转化成相应的四个基本笔画,为便于记忆,分别转化成横或竖或撇或捺。编码时取首笔和“口”的个数即可。为降低重码,最好将首笔和“口”的个数都视为与其它笔画相交的基本笔画。这样,“口”的代码或者说编码为76,“日”的代码为77,“目”的代码为78,“田”的代码为79。在本实施例中就这么编码。
当然,所有规则中最大最巧妙的发明之处还在于按基本笔画的相交与否编码。这一技术非常简单却能把大部分部首的编码轻易区分。通过这一规则,就可把土、王、扌等部首的编码轻易区分。本人一年前就想到这一规则,只是其它规则还有待完善,因此没申请专利。有的输入法宣称取合体字第一部分的首末二个笔画是其重大创新。可本人在北京理工大学图书馆的一本旧书上看到早在多年前已有这么一条规则。其规则是合体字的第一部分和第二部分都取首末二笔。这一规则同样由于对汉字认识不够,也没想到去掉末二笔撇捺。
以上规则可编成几句口诀横1竖2撇3捺4折5交加5;单字前四补末笔;一部首末取二笔;二部前三添末笔,末笔撇捺足四去;方框首笔“口”数交。其中,单字指简单汉字,一部是指复杂汉字的第一部分,二部是指第二部分。足四指的是第二部分去掉撇捺后仍能取足四码。
有的汉字笔顺、组字部件完全相同,但部件的位置不同,就成了不同汉字。因此有必要考虑其位置关系。汉字在漫长的发展过程中形成了微妙的比数制,共有3000多种结构,总的看来,左右型的汉字远远多于上下、包围型的汉字,有的汉字输入法无视这一规律,将三种字型同样对待,徒增记忆负担。本发明根据排除法,不考虑左右结构的字型,并且仅对不足6码且为上下或包围型的复杂汉字补识别码。考虑到交撇、交折在字尾的组字频率低,就补上一个交撇或交折分别作上下或包围型的复杂汉字的识别码。当然也可不用识别码。
编码实例“了”的二笔都为不与其它笔画相交的折,简称折,其余类推,编码就为55。
“事”按书写顺序,第一笔为与其它笔画相交的横,简称交横,其余类推,编码为6,接着遇到“口”,视为由交竖、交横二个笔画构成。编码为76,下一笔为交折,编码为0,末笔为交竖,编码为7,“事”的编码就为67607。
“搞”的第一部分“扌”的首末笔都为交横,编码为66,第二部分为前二笔为点横,编码为41,第三笔遇到“口”,“口”的第一笔视为交竖,编码为7,最末笔也遇到“口”,“口”的第二笔视为交横,编码为6。“搞”的编码就为664176。
“苜”的第一部分“艹”的首笔为交横,末笔为交竖,编码为67,第二部分遇到“目”,编码为78,上下结构补上识别码为交撇,编码为8,“苜”编码就为67788。
“圆”的第一部分为“口”,编码为76,第二部分为“口”,编码为76,下一笔为竖,编码为2,由于去掉末二笔撇捺后仍能取足四码,就去掉撇捺,末笔变为折,编码为5,“圆”的编码就为767625。
为减少击键次数,提高输入速度,还设置了一、二、三、四、五级简码和词组输入法。一些常用的字,除了可以按全码输入,还可以只取前一、二、三、四、五码,再加空格键输入,这就是一、二、三、四、五级简码。对词组编码时,不管多长的词语,一律不超过六码,且字词兼容,不用进行换档等附加操作,当然也可规定词组前要加个前导符键。词组取码方法为二字词第一个字取前二码,第二个字取前四码;三字及以上词,分别取第一个字、第二个字和最末个字的前二码。某个字不足规定码长时,取完该字的全码即可。例如“国家”的编码为764513。“三五数码”的编码为111716。“一切”的编码为16053。
为选择重码方便,在电脑上输入汉字时最好用字母Q、W、E、R、T、Y、U、I、O、P分别代替1、2、3、4、5、6、7、8、9、0这十个阿拉伯数字编码。
本发明三五数码输入法可适用于一切巨、大、中、小、微型计算机中文信息处理系统中,可以在手机、机顶盒、掌上电脑、信息家电等能用中文输入法和检索汉字的一切纳米、光电子产品中获得广泛应用。可以在互联网环境下使用。
本发明可以对繁体字编码,也可以对日文汉字、韩文汉字编码。还可设置万能查询键,当某一码难以确定时,可用万能查询键代替查询,达到规定码长无重码的自动上屏。在电脑上使用时,不足规定码长时补上空格键结尾,有重码的用数字键选择。在手机或其它光电信息产品上使用,则遵照手机或其它光电信息产品规定方法。
不难看出,三五数码简单客观,一般人只要懂得最基本的书写顺序10多分钟左右即可学会,用足十键,重码少,输入速度快,使汉字输入可望在全世界得到普及。
权利要求
1.一种三五数码,将汉字的各种笔画归类为横竖撇捺折五种基本笔画,再将汉字分为简单汉字和复杂汉字二类,简单汉字一般指独体字,复杂汉字一般指合体字,但允许将少部分合体字划入简单汉字,对复杂汉字又根据其整体结构,在其交界处将其一分为二,含汉字首笔的部分为第一部分,余下部分为第二部分,接着编码,其特征是对基本笔画根据其与其它笔画相交与否,分为二类一类是不与其它笔画相交的基本笔画横或竖或撇或捺或折,分别用五个互不相同的字母或数字或其它符号编码,另一类是与其它笔画相交的基本笔画横或竖或撇或捺或折,分别用别的五个互不相同的字母或数字或其它符号编码,对简单汉字一般按笔顺根据基本笔画的相交与否最多取五个笔画编码,复杂汉字对其第一部分和第二部分分别编码,对第一部分一般按笔顺根据基本笔画的相交与否最多取首尾二个笔画编码,对第二部分一般按笔顺根据基本笔画的相交与否最多取前三个笔画和最末笔编码,但末二笔为撇捺时可去掉末二笔编码,另外还可精选组字部件及字型参与编码。
2.根据权利要求1所述的三五数码,其特征是不与其它笔画相交的基本笔画横或竖或撇或捺或折,分别用五个互不相同的数字比如1或2或3或4或5编码,或者分别用五个互不相同的字母比如Q或W或E或R或T编码;与其它笔画相交的基本笔画横或竖或撇或捺或折,分别用别的五个互不相同的数字比如6或7或8或9或0编码,或者分别用别的五个互不相同的字母比如Y或U或I或O或P编码。
3.根据权利要求1所述的三五数码,其特征是可精选“口”、“日”等用二个笔画难以区分的组字频率高的组字部件参与编码,将“口”视为一个组字频率低的与其它笔画相交或不交的笔画,比如为一个与其它笔画相交的折,将“日”视为由二个组字频率低的与其它笔画相交或不交的笔画构成,比如为二个与其它笔画相交的折。
4.根据权利要求1所述的三五数码,其特征是可精选“口”、“日”、“目”、“田”等用二个笔画难以区分的组字频率高的成字的部件参与编码,由于这四个部件可视为由1个或2个或3或4个“口”合并组成,只要将“口”的个数转换为四个基本笔画,比如转换为横或竖或撇或捺,对这几个组字部件就用首笔竖和“口”的个数编码。
5.根据权利要求4所述的三五数码,其特征是对“口”、“日”、“目”、“田”等部件编码时,先将“口”的个数转换为相应的基本笔画,最好将其首笔竖和“口”的个数视为与其它笔画相交的基本笔画编码。
6.根据权利要求1所述的三五数码,其特征是对不足六码的复杂汉字可补上一个识别码,补识别码时只要对上下或包围型的汉字分别补上在字尾出现频率低的与其它笔画相交或不交的二个基本笔画,比如分别补上与其它笔画相交的撇或折。
7.根据权利要求1或2或3或5所述的三五数码,其特征是对简单汉字编码时一般按笔顺根据基本笔画的相交与否用对应的数字或字母对第1、第2、第3、第4及最末笔编码,码长最多五码,不足五码的取完所有的笔画为止。
8.根据权利要求1或2或3或5所述的三五数码,其特征是对复杂汉字的第一部分编码时,一般按笔顺根据基本笔画的相交与否用对应的数字或字母对第一部分的首笔和末笔编码,只有一笔时就取一笔。
9.根据权利要求1或2或3或5所述的三五数码,其特征是对复杂汉字的第二部分编码时,一般按笔顺根据基本笔画的相交与否用对应的数字或字母对第二部分的第1、第2、第3笔及最末笔编码,但当去掉末二笔撇捺仍能取足四码时应去掉末二笔再编码,不足四码时取完所有的笔画为止。
10.根据权利要求1或2或3或4或6所述的三五数码,其特征是单字和词组最长码长都为6码,并可对简体汉字、繁体汉字、日文汉字、韩文汉字编码。
全文摘要
本发明三五数码属于电脑汉字编码方法,因将汉字分为三块即简单汉字、复杂汉字第一部分、复杂汉字第二部分,根据横竖撇捺折五种基本笔画的相交与否编码,特别适用只有十个阿拉伯数字的光电子产品如手机、掌上电脑等,所以称为三五数码。
文档编号G06F3/023GK1523477SQ0310624
公开日2004年8月25日 申请日期2003年2月18日 优先权日2003年2月18日
发明者王治阳 申请人:王治阳
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1