汉字简明码的制作方法

文档序号:6598285阅读:168来源:国知局
专利名称:汉字简明码的制作方法
技术领域
本发明涉及汉字编码。
目前,公布于众的汉字编码方法已达400多种,在这当中,专家们认为最先进的编码方法是上海市杜冰蟾发明的汉字全息码。其特征是以部首、笔顺、用拼音或笔画分类集约化定汉字区位的编码。其优点在于只要知道100个部首的拼音的第一个字母,不需专门培训,就能编码上机。但是该发明有以下不足之处1、虽然千百年来,人们书写汉字都遵守笔顺的七条规则,但是由于汉字形体的复杂性,有时实难统一笔顺。例如“区”全息码认为笔顺是“一、丿、 、 ”,而《儿童图解字典》(江苏少年儿童出版社,1988年2月第2版)认为笔顺是“一、 、丿、 ”(见第157页“医”字)。
2、该发明以笔顺分解部首,每一步分解以最多笔画的部首为原则。这种分解部首的方法比较复杂,缺乏直观性,要达到见字得码的熟练程度,需要长时间的训练。例如“饩”的接尾部首是“一”还是“二”呢?需要考虑续笔部首,而在编码时又用不上续笔部首。
3、编码方案复杂。编码分部首字、两个部首的复合字、三个部首的复合字、四个以上部首的复合字四种情况,还要考虑是否是键名部首,连发明人也没有真正掌握,例如“民”应该是“GHHG”而发明人编成“GGHG”,“族”应该是“THRQ”而发明人编成“TBRQ”。
4、部首不尽合理。变体、繁体太多,最多一个部首有七个变形码;该分的不分,例如把“犬”作为“大、豸”的本体,不符合汉字的形、音、义;该合的不合,例如把“日”和“曰”分开,在编码过程中,实难区分这两个部首。
5、重码多。由于部首少,造成了许多重码,例如《新华字典》(87年12月第四版)中,起笔部首是“虫”部的字有167个,其中有32个码有两个以上的字,最多一码有6个字,并不象发明人所说的小于千分之一。
有鉴于此,本发明的目的在于提供一种更简单易学,能见字得码,重码少的汉字简明码。
本发明的汉字简明码是依照先上后下、先左后右、先外后内的规则,将汉字分解成部首,用拼音或笔画分类高度集约化定汉字区位的编码。同时规定夹在中间的部首不取,部首与部首的笔画不相交,尽量不取单笔部首。本发明的部首字可以按其汉语拼音声母的第一个字母或韵母的第一个字母排列,也可以按二位数字码排列。本发明优先采用组字能力最强的、最容易识别的178个部首并编排成部首表1和部首表2,由此编出“简明1码”和“简明Ⅱ码”,针对不同的用户,在通用机上操作。
与全息码相比,本发明的优点和效果是显著的本发明按照一定的规则分解部首,不破坏汉字的整体结构,见字得码,想字得码。
本发明按照一条规则对复合字进行编码,简化了编码方案。
本发明采用178个部首,变体、繁体少,容易掌握和识别。
本发明充分发挥26个字母的作用,部首安排得非常合理,重码比全息码少得多。
采用本发明,大约只要化一、两个小时就能编码上机。
以上将结合实施例对本发明作更详细的叙述实施例1简明Ⅰ码1、部首表(Ⅰ)(附于后-表1)按照178部首字汉语拼音的声母的第一个字母或韵母的第一个字母顺序排列,u作u和ü使用,V没有相应的部首字,留作功能键使用。编码方案中要使用部首的部首,为了便于使用者掌握,表中各部首下面列出了部首的部首代码(这里笔画允许相交),没有部首代码的部首称整体部首,不能再分解部首,用部首的部首,大大增加了区分重码的离散度。
2、分解部首规则本发明采用从汉字的整体结构出发,按先上后下、先左后右、先外后内,夹在中间的部首不取,部首与部首的笔画不相交(戈除外),尽量不取单笔部首的原则将汉字分解成部首。即先取上面的多笔部首,再取下面的多笔部首,先取左边的多笔部首,再取右边的多笔部首,先取外面包着的多笔部首,再取里面的多笔部首;上面不是多笔部首,则取下面的,左边的不是多笔部首,则取右边的,外面的没有多笔部首,则取里面的;上、下都不是多笔部首,则先取上边部分的多笔部首,再取下边部分的多笔部首,其余类推。若均不是多笔部首字,则依笔顺分解成“横、竖、撇、点、折”五种单笔部首。每一步分解以笔画最多为原则。例第一部首 第二部首 第三部首 第四部首率 亠 十 冫 幺鬲
丷冂 口通辶  冂
到 刂 土 厶 一夹 夫 丷韶 立 刀 日 口决 冫  大豪亠 豕口
这样分解部首,显然比全息码直观得多。
3、编码实例(1)单字编码①部首字,用拼音代码、各部首代码、第二、三部首代码,不足四码击V键。例
风FIPD 弓GNHN 口KVVV②复合字用第一部首、第一部首的部首、第二部首、第三部首的代码进行编码。若第一部首没有部首,则补用第四部首代码;若不足四码,则补用最后一个部首的部首代码;仍不足四码击V键。例鞋GCTT 赏XBEB 物NRWA如NKVV 棕MBXH 棋MQCV抬PSKV 呢KIIP 新JALM存ZNHR 怒XNYN2、词语文献快速码①四个以上字的词语取一、二、三及末字的第一部首的代码。例如中华人民共和国ZIRQ;有目共睹YMCM;五花八门HCBM;八一建军节BHFC。
②不足四个字的词语,取第一字的第一部首、第二部首(部首字改为部首的部首),第二字的第一部首、第三字的第一部首(如果是三字词)的代码进行编码。不足四码补用最后一个字的第二部首(或部首的部首)的代码;仍不足四码击V键。例国庆节QWGC 自来水MPWS 人民币RMJP金刚石JDSV 国家QWBI 人民RMNV火山HAVV 敌人EWRV实施例2,简明Ⅱ码1、部首表(Ⅱ)(附于后-表Ⅱ)简明Ⅱ码是用“部首表(Ⅱ)”代“部首表(Ⅰ)”,用二位数码代拼音字母,其他编码顺序则都似简明Ⅰ码。
“部首表(Ⅱ)”按组字能力最强的22个部首和另156个部首,按笔画、笔画数排列,容易记忆,重码少。
2、编码实例
“简明Ⅱ码”规则基本上同“简明Ⅰ码”,只是Ⅱ码不用部首的部首,用起笔笔画的编号补充不足之码,重码字用*号并移动它来区分。
(一)单字编码(1)单部首字在6位数中,第一、第二位击其编号,第三-第六位击起、续笔画的编号。
例风982527 弓682723 口072427(2)多部首复合字,在6位数中,第一到第六位击其第一、第二、第三部首的编号,不足六位数击起笔笔画的编号。
例鞋940404 赏738940 物912325 口120727(二)词语文献快速码(1)双字词取第一字的第一、第二部首、第二字的第一部首的编号进行编码。若第一字为部首字,则改用第二字的第一、第二部首的编号;不足六位数,补用第二字的起笔笔画的编号。
例国家571465 人民015727 火山180824(2)三字以上词取第一、二、末字第一部首。例中华人民共和国872857 有目共睹174040五花八门230564 国庆节576305人民币015758 金刚石203419本发明可作如下调整(1)调整部首部首可以调整,“Ⅰ码”和“Ⅱ码”均可增减部首,可用数百个常用偏旁字;可用数十个部首;可用100个部首;可用56个部首;也可去掉乍、齿、风、斤、方、欠、殳、穴、页、赤、亦等用167个部首。“Ⅰ码”和“Ⅱ码)的部首也可不同,但用178部首为好,易识别。
(2)部首代码,编号调整部首表Ⅰ中各部首的字母代码和各部首的部首代码均可调整;部首表Ⅱ中各部首的数字编号也可调整,部首可编成三位数,也可用一个数码表示几个部首,也可部分用两位数码,部分用三位数码。
(3)分解部首调整可以去掉“部首和部首的笔画不相交,夹在中间的部首不取,尽量不取单笔部首”的规定。可增加先中间后两边的规定。
(4)编码调整“Ⅰ码”中,复合字编码的第二码可不用部首的部首,而改用部首的起笔笔画或收笔笔画;部首字的第二、三、四码不用部首而用笔画。为了减少重码,三部首复合字的编码,若第一、第三部首均没有部首时,可用第一部首、第二部首、第二部首的部首、第三部首的代码进行编码,或用第一、第二、第三部首和第二部首的部首代码进行编码。如“抬”PSNK或PSKN,三字词亦如此,如“金刚石”JDGS或JDSG。“Ⅱ码”中,若部首用三位数表示,可取二个部首编成6位数码,也可取三个部首编成9位数码。若部首用二位数表示,可取四个部首编成8位数码,其余类推。若一个数表示几个部首,则编码时,可用起笔笔画(或收笔笔画)的编号的个位数,编成七位数码或九位数码。
去重码“Ⅰ码”可用击V键并移动其位置或击1、2、……、9、0数字键去重码。“Ⅱ码”可用*键去重码,去重码的让码以词频为序。
功能键提示、改错、分简繁体、正字、异体、讹体、中西文夹排等,都可使用多余的键。
本发明的用途除了全息码所列十条可供开发应用外,它分解部首的规则,可用来编字典的检字表,这对人们方便查字,培养中小学生的系统观念,提高民族素质都有重大的意义。
部首表(Ⅱ)
权利要求
1.一种汉字简明码,其特征在于所说的简明码是依照先上后下、先左后右、先外后内的规则将汉字分解部首,用拼音或笔画分类高度集约化定汉字区位的编码。
2.根据权利要求1所述的汉字简明码,其特征在于部首与部首的笔画不相交。
3.根据权利要求1所述的汉字简明码,其特征在于尽量不取单笔部首。
4.根据权利要求1所述的汉字简明码,其特征在于每一步分解取最多笔画的部首。
5.根据权利要求1所述的汉字简明码,其特征在于夹在中间的部首不取。
6.根据权利要求1、2、3、4或5所述的汉字简明码,其特征在于所说的部首字的代码是用其汉语拼音的声母的第一个字母或韵母的第一个字母表示的。
7.根据权利要求1、2、3、4或5所述的汉字简明码,其特征在于所说的部首字的编号是用二位数码表示的。
8.根据权利要求1、2、3、4、5、6或7所述的汉字简明码,其特征在于所说的部首最好采用178部首或167部首。
9.根据权利要求1、2、3、4、5、6或8所述的汉字简明码,其特征在于对部首字,用拼音代码、部首代码、第二、三部首代码进行编码,不足四码用Ⅴ码。
10.根据权利要求1、2、3、4、5、6或8所述的汉字简明码,其特征在于对复合字,用第一部首、第一部首的部首、第二部首、第三部首代码进行编码。若第一部首没有部首代码,则补用第四部首代码;若不足四码,补用最后一个部首的部首代码;仍不足四码用Ⅴ码。
11.根据权利要求1、2、3、4、5、6或8所述的汉字简明码,其特征在于对四个以上字的词语,用第一、第二、第三及末字的第一部首的代码进行编码。
12.根据权利要求1、2、3、4、5、6或8所述的汉字简明码,其特征在于对不足四个字的词语,用第一字的第一、第二部首(部首字改为部首的部首)、第二字的第一部首、第三字的第一部首(如果是三字词)的代码进行编码。不足四码,补用最后一字的第二部首(或部首的部首)的代码;仍不足四码用Ⅴ码。
13.根据权利要求1、2、3、4、5、7或8所述的汉字简明码,其特征是对单部首字,在6位数码中,第一、二位用其编号,第三、四、五、六用起、续笔画的编号进行编码。
14.根据权利要求1、2、3、4、5、7或8所述的汉字简明码,其特征在于对复合字在6位数中用其第一、第二、第三部首的编号,不足6位数用起笔笔画的编码。
15.根据权利要求1、2、3、4、5、7或8所述的汉字简明码,其特征在于对双字词,用第一字的第一、第二部首、第二字的第一部首。若首字为部首字,则改为第二字的第一、第二部首的编号进行编码。不足六位数,补用第二字的起笔笔画的编号。
16.根据权利要求1、2、3、4、5、7或8所述的汉字简明码,其特征在于对三字以上词语,用第一、二及末字的第一部首的编号进行编码。
17.根据权利要求1、2、3、4或5所述的汉字简明码,其特征在于部首是用三位数码排列的。
全文摘要
汉字简明码涉及汉字编码,其主要特征是依照先上后下、先左后右、先外后内、夹在上、下之间的部首不取,部首与部首的笔画不相交,尽量不取单笔部首的规则,将汉字分解成部首,用拼音或笔画分类高度集约化定汉字区位的编码。本发明遵循人们分解汉字部首的习惯,不破坏汉字的整体结构,直观性极强,见字得码,想字得码,本发明的178个部首安排合理,重码极少,采用本发明,大约只要花一、两个小时就能编码,在通用机上操作。
文档编号G06F3/023GK1060163SQ9110703
公开日1992年4月8日 申请日期1991年5月8日 优先权日1991年5月8日
发明者陈光耀 申请人:陈光耀
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1