专利名称:常用字不拆分的编码方法
技术领域:
本发明涉及一种中文信息处理技术三码以上的常用字不拆分的编码方法。
背景技术:
目前汉字的输入方法是“汉语拼音”和“五笔字型”输入方法。汉语拼音输入汉字的优点易学习,只要会拼音就会打字。缺点是重码多,容易产生别字。大量的同音字翻页时一不留神翻过去,倒回重来,影响打字速度,浪费人们的宝贵时间。尽管有了狂拼输入汉字的新方法,提高了打字速度,却依然存在着修改、翻页、检字的麻烦和别字的缺陷;特别是签订协议打印出的合同文书的别字,在经济全球化的今天,将会造成不可估量的损失。更为严重的是,容易造成“提笔忘字”。五笔字型输入汉字的优点打字速度快,重码率低,适合大批量处理文字。不足之处是,有些汉字的拆分,违背了汉字常规的书写习惯,不利于汉字教学,并且增加了沉重的学习、记忆负担,长时间不用,极容易忘记。
发明内容
目前的汉字编码一般是用“五笔字型”和“汉语拼音”输入汉字。“五笔字型”学习难,“汉语拼音”打字慢,使汉字输入不尽完美。《信息处理用GB13000.1字符集汉字部件规范》将二万多个汉字拆分为560个部件。在280个基础部件汉字中,可拆分的汉字104个(略),二画、交重、部分交重和不拆分的汉字111个(二十丁厂七卜八人入乂匕几儿九刁了力刀乃又厶乜丈巾丸子孑孓也女丰井韦车屯中甘丹尹口曰曰日世凸凹目申甲电由册弗母史吏曲串事五弋及牙戈内专长氏为夬丑书本戋戊戉央必民西夷舟艮甫且皿更两耳里我身垂重大万夕久门丫之不止月心业丘臣臼州非),交重的非常用字63个(廿市丐丏卅旡禸冘卐卍爿毋冉冎束曳缶聿帇镸酉豕豖疌采臾禺禹<繁体、专用字35个>)。非汉字基础部件280个(丨亅丿丶乛乚ナ匚丂
冂勹亠冫丷冖マ巜丩卩凵丌廾尢囗彡夊丬彐屮彑巛耂爫灬肀歺曱甴乑癶襾戼丳刂 阝彳亻讠辶艹扌饣犭忄氵宀辶纟攵夂衤礻钅疒虍豸糹飠覀罒
……)。
[丨丂凵勹丩屮巛彐口癶肀氺
曱攵戼丳……都是有音可读的汉字,因不常用,与现代汉语无意义,或者说是被现代汉语淘汰的汉字,本发明视作“非汉字基础部件”,并无严格上意义上的“非汉字”] 用汉字的“声母”,交重的非常用字的“代码”或者非汉字基础部件的“代码”和一画、二画、交重、部分交重和不拆分的汉字的“汉语拼音字母”综合编码,使汉字重码少,别字率低,容易学习,不易忘记。本发明之目的就是提供一种三码以上的常用字不拆分的编码方法,其编码方法解决的技术方案是 1.用汉字的“声母(b c d f g h j k l m n p q r s t w x y z和零声母a e o——下同)”分别作第一码,再用该字拆分后常用字(变形汉字、《汉字偏旁名称表》部首读音——下同)的“声母”或者交重的非常用字的“代码(u——下同)”或者非汉字基础部件的“代码(a o e u——下同)”作二、三、四码编码。最后一码是非常用字用最后一个常用字的“声母”(非汉字基础部件的“代码”——下同)编码。
2.能拆分的非常用字,用该字的“声母”作首码,该字拆分后常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三、四码编码第一组。第二组用该字首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码(a、o、e、u、v——下同)”作首码,二、三、四码与第一组“二、三、四码”的编码方法相同。交重的非常用字独立作字时,先用该字全拼的汉语拼音字母编码第一组,不够四码最后一码是啥补啥,超过四码舍弃,“zh、ch、sh”用“z、c、s”编码,韵母“ü”用“u”编码。第二组用该字首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码”作首码,二、三、四码用“u”编码。
3.二画、交重、部分交重和不拆分的常用字,独立作字时用该字全拼的汉语拼音字母编码,不够四码最后一码是啥补啥,超过四码舍弃,韵母“ü”用“u”编码;与其它汉字、部件组合时用其“声母”编码,“zh、ch、sh”用“z、c、s”编码。
4.交重的异音字用其全拼的汉语拼音字母编码;能拆分的异音字双重编码。
5.左边是上下、上中下结构的汉字——左边不拆分。
6.二字词用二字的“声母”作第一、二码,再用前一个字拆分后第一码和后一个字拆分后第二码的“声母”作第三、四码编码;三字词、四字词用每个字的“声母”编码;五字以上词用前三个字和最后一个字的“声母”编码;词中的非常用字用“u”编码。二画、交重、部分交重和不拆分的常用字用其“声母”编码,“zh、ch、sh”用“z、c、s”编码。
7.用“i”作一-五画非汉字基础部件的首码,一、二、三、四、五画的非汉字基础部件分别用“a、b、c、d、e”作第二码,一、二、三、四、五画的非汉字基础部件的首笔“—横(a),丨竖(o)、丿撇(e),丶点(u),乛折(v)”的“代码”,分别作第三码,不够四码最后一码是啥补啥。用“ii”作六-十画非汉字基础部件的第一、二码,六、七、八、九、十画的非汉字基础部件分别用“a、b、c、d、e”作第三码,六、七、八、九、十画的非汉字基础部件的首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码”分别作六、七、八、九、十画的第四码 编码与键盘上的字母键相对应,手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字直接按键盘上相应的字母键。
其编码方法是 一、常用字编码方法。
1.先用常用字的“声母”作首码,再用该字拆分后刚好三码的常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三、四码编码。
2.先用常用字的“声母”作首码,再用该字拆分后超过三码的第一、二个和最后一个常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三、四码编码。最后一码是非常用字用最后一个常用字的“声母”编码。
3.先用常用字的“声母”作首码,再用该字拆分后只有二码的常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三码编码,不够四码最后一码是啥补啥, 二、非常用字编码方法。
1.能拆分的非常用字,用该字的“声母”作首码,该字拆分后常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三、四码编码第一组。第二组用非常用字的首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码”作首码,二、三、四码与第一组“二、三、四码”编码方法相同。
2.交重的非常用字独立作字时,用该字全拼的汉语拼音字母编码第一组,不够四码最后一码是啥补啥,超过四码舍弃,“zh、ch、sh”用“z、c、s”编码,韵母“ü”用“u”编码。第二组用该字首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码”作首码,二、三、四码用“u”编码。
三、二画、交重、部分交重和不拆分的常用字编码方法。
二画、交重、部分交重和不拆分的常用字,独立作字时用该字全拼的汉语拼音字母编码,不够四码最后一码是啥补啥,超过四码舍弃,韵母“ü”用“u”编码,与其它汉字、部件组合时用其“声母”编码,“zh、ch、sh”用“z、c、s”编码。
四、异音字编码方法。
1.交重的异音字与“二画、交重、部分交重和不拆分的常用字”编码方法相同。
2.能拆分的异音字与“常用字、能拆分的非常用字”的编码方法相同。区别是用该字不同读音的“声母”双重编码。
五、“左不拆”的汉字编码方法。
左边是上下、上中下结构的汉字左边不拆分。
六、词编码方法。
1.二字词用二字的“声母”作第一、二码,再用前一个字拆分后第一码常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”和后一个字拆分后最后一码常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作三、四码编码;第三码是“左不拆”的,仍然适用单字“左不拆”的规定;第四码是非常用字用最后一个常用字的“声母”(部件的“代码”)编码;词中的非常用字用“u”编码。词中二画、交重、部分交重和不拆分的常用字用其“声母”编码,“zh、ch、sh”用“z、c、s”编码。
2.三字词用每个字的“声母”编码,不足四码最后一码是啥补啥。
3.四字词用每个字的“声母”编码。
4.五字以上词用前三个字和最后一个字的“声母”编码。
5.词中的非常用字用“u”编码。
七、非汉字基础部件编码方法。
1.用“i”作一-五画非汉字基础部件的首码,一、二、三、四、五画的非汉字基础“部件”分别用“a、b、c、d、e”作第二码,一、二、三、四、五画的非汉字基础部件的首笔“—横(a),丨竖(o)、丿撇(e),丶点(u),乛折(v)”的“代码”,分别作第三码,不够四码最后一码是啥补啥。
2.用“ii”作六-十画非汉字基础部件的第一、二码,六、七、八、九、十画的非汉字基础“部件”分别用“a、b、c、d、e”作第三码,六、七、八、九、十画的非汉字基础部件的首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码”分别作六、七、八、九、十画的第四码。
按照上述编码方法,手机输入汉字按数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。不需死记硬背口诀、规则,编码短,重码少,打字快,容易学,不易忘记,不会造成“提笔忘字”,是一种高效、好学、好用的汉字编码方法。
有益效果快捷实用、科学规范、重码率低、学习记忆负担小、不提笔忘字;不管是老年中年人,还是青年少年人,甚至是学龄前儿童,只要会汉语拼音,会操作手机、电子字词典和计算机,一学就会,一劳永逸;对巩固汉字的记忆、运用能力,提高识字水平和中华民族整体文化素质;对简繁体汉字统一编码,统一注音会起到促进作用;告别昔日“别字满天飞”、“无错不成书”的时代。
具体实施例方式 以下结合具体情况对本发明的具体实施方式
作详细说明。
根据技术方案要求 1.先用常用字的“声母”作首码,再用该字拆分后刚好三码的常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三、四码编码。手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
2.用常用字的“声母”作首码,再用该字拆分后三码以上的第一、二个和最后一个常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三、四码编码。最后一码是非常用字用最后一个常用字的“声母”编码。手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
3.先用常用字的“声母”作首码,再用该字拆分后不够三码的常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三码编码,不够四码最后一码是啥补啥。手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
4.能拆分的非常用字,用该字的“声母”作首码,再用该字拆分后常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三、四码编码第一组。第二组用非常用字的首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码”作首码,二、三、四码与第一组编码方法相同。手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
5.交重的非常用字独立作字时,先用该字全拼的汉语拼音字母编码第一组,不够四码最后一码是啥补啥,超过四码舍弃,“zh、ch、sh”用“z、c、s”编码,韵母“ü”用“u”编码。第二组用非常用字的首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码”作首码,二、三、四码用“u”编码。手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
6.二画、交重、部分交重和不拆分的常用字,独立作字时用该字全拼的汉语拼音字母编码,不够四码最后一码是啥补啥,超过四码舍弃,韵母“ü”用“u”编码;与其它汉字、部件组合时用其“声母”编码,“zh、ch、sh”用“z、c、s”编码。手机输入汉字按相应的数字键,电子字词、典和计算机输入汉字按键盘上相应的字母键。
7.交重的异音字与“二画、交重、部分交重和不拆分的常用字”的编码方法相同。输入时,手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
8.能拆分的异音字与“常用字、非常用字”的编码方法相同。区别是用该字不同读音的“声母”双重编码。输入时,手机输入汉字按相应的数字键,电子字词典和计算机输入汉字按键盘上相应的字母键。
9.左边是上下、上中下结构的汉字——左边不拆分。输入时,手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
10.二字词用二字的“声母”作第一、二码,再用前一个字拆分后第一码和后一个字拆分后第二码的“声母”作第三、四码编码。输入时,手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
11.三字词用每个字的声母编码,不足四码最后一码是啥补啥。输入时,手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
12.四字词用每个字的声母编码。输入时,手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
13.五字以上词用前三个字和最后一个字的声母编码。输入时,手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
14.词中的非常用字用“u”编码。输入时,手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
15.用“i”作一-五画非汉字基础部件的首码,一、二、三、四、五画的非汉字基础“部件”分别用“a、b、c、d、e”作第二码,一、二、三、四、五画的非汉字基础部件的首笔“—横(a),丨竖(o)、丿撇(e),丶点(u),乛折(v)”的“代码”,分别作第三码,不够四码最后一码是啥补啥。用“ii”作六-十画非汉字基础部件的第一、二码,六、七、八、九、十画的非汉字基础“部件”分别用“a、b、c、d、e”作第三码,六、七、八、九、十画的非汉字基础部件的首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码”分别作六、七、八、九、十画的第四码。输入时,手机输入汉字按相应的数字键,电子字、词典和计算机输入汉字按键盘上相应的字母键。
具体实施方式
分述如下 一、常用字编码 1.常用字拆分后刚好三码的汉字编码方法。
先用常用字的“声母”作首码,再用该字拆分后刚好三码的常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三、四码编码 如“碧”字,拆分为“王,白,石”,用“碧”字的“声母b”作首码,再用“碧”字拆分后“王,白,石”三个字的“声母w,b,s”作二、三、四码编码。碧编码bwbs. 如“帮”字,拆分为“(216)阝巾”。用“帮”字“声母b”作首码,再用“帮”字拆分后变形汉字“丰(216)”的“声母f”,《汉字偏旁名称表》中的部首“阝”旁读音的“声母e”和常用字“巾”字的“声母j”作二、三、四码编码。帮,编码bfej. [括号中的阿拉伯数字(216)为“汉字基础部件表”中部件的序号,取代该非汉字基础部件。因计算机字库中没有这一类部件,即使利用刮、贴手法复印出来,也为日后公布时打不出该部件而留下缺憾。故用“汉字基础部件表”中该部件的序号取代该基础部件。以下括号内的数字均为“汉字基础部件表”中该部件的序号] 棒-木(152),编码bmue.用“棒”字的“声母b”作第一码,再用“棒”字拆分后“木”字旁读音的“声母m”,四画以上的非汉字基础部件“”的“代码u”和三画的非汉字基础部件(152)的“代码e”作二、三、四码编码。
离-文凵禸/亠凶禸,编码lwou.loxu.用“离”字的“声母l”作第一码,再用“离”字拆分后“文”字的“声母w”和二画的非汉字基础部件“凵”的“代码o”和交重的非常用字“禸”的“代码u”作二、三、四码编码。“离”字上部“亠ㄨ凵”三个部件即可组成“文凵”还可组成“亠凶”双重编码,使不同拆分编码的人都能正确打出该字。
2.常用字拆分后三码以上的汉字编码方法。
先用常用字的“声母”作首码,再用该字拆分后超过三码的第一、二个和最后一个常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三、四码编码 用“赢”字的“声母y”作第一码,再用“赢”字拆分后第一、二码“亡,口”声母wk”和最后一码“凡”字的“声母f”作二、三、四码编码。赢,编码ywkf. 最后一码是非常用字用最后一个常用字的“声母”编码 用“寇”字的“声母k”作第一码,再用“寇”字拆分后部首“宀”头读音的“声母b”,“元”字的“声母y”,最后一码“支”字是非常用字用常用字“又”字的“声母y”作二、三、四码编码。寇,编码kbyy. 3.常用字拆分后只有二码的汉字编码方法。
先用常用字的“声母”作首码,再用该字拆分后的常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三码编码,不够四码最后一码是啥补啥。
阳-阝 日,编码yerr. 汉-氵 又,编码hsyy. 枕-木 冘,编码zmuu. 字-宀 子,编码zbzz. 编码明确后按相应的数字键、字母键,所需汉字自动给出。以下各部分的编码输入方法均同上。
二、非常用字编码 1.能拆分的非常用字编码方法。
能拆分的非常用字,用该字的“声母”作首码,再用该字拆分后常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三、四码编码第一组 非常用字“檄”字,按照常用字的编码方法先编码第一组xmbw.供认识“檄”字的人打字。如果不认识“檄”字,用“檄”字的首笔“—(横)”的“代码a”作第一码,再用“檄”字拆分后的“木,白,攵”的“声母m,b,w”编码第二组ambw. 第二组用非常用字的首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码”作首码,二、三、四码编码与第一组编码方法相同 “靥”拆分为厂犬面,编码ycqm.acqm. “羁”拆分为罒革马,编码jsgm.osgm. “簟”拆分为西早,编码dzxz.ezxz. “旄”拆分为方毛,编码mfom.ufom. “媛”拆分为女(134)友,编码ynuy.vnuy. 2.交重的非常用字编码方法。
交重的非常用字独立作字时,用该字全拼的汉语拼音字母编码第一组,不够四码最后一码是啥补啥,超过四码舍弃,“zh、ch、sh”用“z、c、s”编码,韵母“ü”用“u”编码 廿-编码nian.auuu. 冉-编码rann.ouuu. 禹-编码yuuu.euuu. 冘-编码yinn.uuuu. 第二组用该字首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码”作首码,第二、三、四码用“u”编码 “度”拆分为广廿又,编码dguy. “苒”拆分为艹冉,编码rcuu.acuu. “律”拆分为彳 聿,编码lruu. “拽”拆分为扌曳,编码zsuu.asuu. “暨”拆分为(211)旡旦,编码juud.vuud. 三、二画、交重、部分交重和不拆分的汉字编码 二画、交重、部分交重和不拆分的常用字,独立作字时用该字全拼的汉语拼音字母编码,不够四码最后一码是啥补啥,超过四码舍弃,韵母“ü”用“u”编码 几-编码jiii. 女-编码nuuu. 屯-编码tunn. 心-编码xinn. 丘-编码qiuu. 臣-编码chen. 州-编码zhou. 长-编码chan. 与其它汉字、部件组合时用其“声母”编码,“zh、ch、sh”用“z、c、s”编码 “机”拆分为木几,编码jmjj. “纯”拆分为纟屯,编码cstt. 四、异音字编码 1.交重的异音字与“二画、交重、部分交重和不拆分的汉字”编码方法相同。
重chong.zhong,编码chon.zhon. 车che.ju,编码chee.juuu. 长chang.zhang,编码chan.zhan. 万wan.mo,编码wann.mooo. 2.能拆分的异音字与“常用字、非常用字的”编码方法相同。区别是用该字不同读音的“声母”双重编码。
“会”拆分为人二厶,编码hres.kres. “弹”拆分为弓丷(298),编码dgou.tgou. “行”拆分为彳一丁,编码xryd.hryd. “调”拆分为讠 冂 口,编码dyok.tyok. 五、“左不拆”的汉字编码 左边是上下、上中下结构的汉字左边部分不拆分。
1.左边是常用字的,用其“声母”编码 “励”拆分为厉力,编码llll. “期”拆分为其月,编码qqyy. “割”拆分为害刂,编码ghdd. “郗”拆分为希阝,编码xxee.exee.2.左边是非常用字的,用“u”编码。
“彭”拆分为壴彡,编码cuey.vuey. “歃”拆分为臿人,编码suor.euor. 3.是“非汉字”的分别用该部件的“代码”编码。
“改”拆分为(129)攵,编码goww. “毁”拆分为*几又,编码hujy. 六、词编码 1.二字词编码方法。
二字词用二字的“声母”作第一、二码,再用前一个字拆分后第一码常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”和后一个字拆分后最后一码常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作三、四码编码;第三码是“左不拆”的,仍然适用单字“左不拆”的规定;第四码是非常用字用最后一个常用字的“声母”(部件的“代码”)编码;词中的非常用字用“u”编码;词中二画、交重、部分交重和不拆分的常用字用其“声母”编码,是“zh、ch、sh”用“z、c、s”编码。
①第一、二、三、四码是常用字的,用其“声母”编码。
如和谐-禾皆编码hxhj. 贪恋-今心编码tljx. 对话-又舌编码dhys. 道德-首心编码ddsx. ②第一、二码是非常用字除用该词的“声母”编码外,再用“u”作第二组编码。
如奢侈scdd.sudd.ucdd.uudd. 斟酌zzss.zzus.uzss.uuss. 亵渎xdom.xuom.udom.uuom. 淫秽yhss.yuss.uyss.uuss. ③第三、四码是非常用字用“u”编码。
如函授-氶 受编码hsus. 雏形-刍 彡编码cxue.uxue. 叫嚷-口(86)编码jrku. 浇灌-氵(88)编码jgsu. 最后一码是“亍兀卉夲吾圭尃吕昷曷孚殳奂皃番舛亢咅妾糸隹襄衮”非常用字的,用最后一个常用字的“声母(非汉字基础部件的‘代码’)”编码。
④二画、交重、部分交重和不拆分的常用字用其“声母”编码,“zh、ch、sh”用“z、c、s”编码。
如母女-母女,编码mnmn. 耳目-耳目,编码emem. 长城-长成,编码cccc. 历史-厂史,编码lscs. ⑤第三、四码是“部首、变形汉字”的,用其读音的“声母”编码。
如街道-彳辶,编码jdrz. 零散-
攵,编码lsyw. 着重-羊重,编码zzyz. 比武-(43)止,编码bwoz. ⑥第三码左边是“上下”、上中下”、“半包围”结构的汉字,仍然适用单字“左不拆”的规定编码。
如朝霞-又,编码zxuy. 敬爱-苟友,编码jauy. 殿堂-*土,编码dtut. 毁灭-*火,编码hmuh. ⑦第四码是非汉字(也不是部件)的,用最后一码常用字的“声母”或者部件的“代码”编码。
如升降-丿(228),编码sjae. 维修-纟 彡,编码wxse. 衣服-亠 又,编码yfoy. 选择-先(152),编码xzxe. ⑧异音字编码。
如重庆-重 大,编码cqcd. 重量-重 里,编码zlzl. 沉降-氵(228),编码cjge. 投降-扌(228),编码txse. 2.三字词编码方法。
三字词取每个字的声母编码,不足四码最后一码是啥补啥。
计算机-编码jsjj. 托儿所-编码tess. 闭门羹-编码bmgg.bmuu. 微生物-编码wsww. 赡养费-编码syff.uyff. 肇事人-编码zsrr.usrr. 3.四字词编码方法 四字词取每个字的声母编码。
两袖清风-编码lxqf. 天长地久-编码tcdj. 和谐社会-编码hxsh. 瞠目结舌-编码cmjs.umjs. 刚愎自用-编码gbzy.guzy. 4.五字以上词编码方法 五字以上词取前三个字和最后一个字的声母编码。
新华通讯社-编码xhts. 上海合作组织-编码shhz, 中华人民共和国一编码zhrg. 新疆维吾尔自治区-编码xjwq. 中国共产主义青年团中央委员会-编码zggh. 5.词中非常用字编码方法 词中的非常用字用“u”编码。
奇葩-编码qpdb.qudb. 奢侈-编码scdd.ucdd.sudd.uudd. 虔诚-编码qchc.uchc. 亵渎-编码xdom.udom.xuom.uuom. 同仇敌忾-编码tcdk.tcdu. 面面相觑-编码mmxq.mmxu. 七、基础部件汉字编码 1.一-五画非汉字基础部件编码方法。
用“i”作一-五画非汉字基础部件的首码,一、二、三、四、五画的非汉字基础部件分别用“a、b、c、d、e”作第二码,一、二、三、四、五画的非汉字基础部件的首笔“一横(a),丨竖(o)、丿撇(e),丶点(u),乛折(v)”的“代码”,分别作第三码,不够四码最后一码是啥补啥。
一画的基础部件编码 一编码iaaa(一) 亅编码iaoo(丨亅) 丿编码iaee(丿) 丶编码iauu(丶……) 乛编码iavv(乛乚……) 二画的基础部件编码 一编码ibaa(丆ナ匚……) 亅编码iboo(
刂冂……) 丿编码ibee(亻勹……) 丶编码ibuu(亠丷冫冖讠……) 乛编码ibvv(丩卩阝廴凵巜……) 三画的基础部件编码 一编码icaa(丌艹廾尢扌丂……) 亅编码icoo(……) 丿编码icee(彡犭彳夂饣亇……) 丶编码icuu(忄丬氵宀辶……) 乛编码icvv(卪彑彐屮纟巛……) 四画的基础部件编码 一编码idaa(耂
……) 亅编码idoo(冃……) 爫编码idee(攵牜爫……) 丶编码iduu(灬礻……) 乛编码idvv(肀……) 五画的基础部件编码 一编码ieaa(……) 亅编码ieoo(罒覀歺氺……) 丿编码ieee(钅……) 丶编码ieuu(疒衤……) 乛编码ievv(癶疋……) 第一码“i”代表一-五画的非汉字基础部件。
第二码“a、b、c、d、e”分别代表一、二、三、四、五画的非汉字基础部件。
第三码“a、o、e、u、v”分别为首笔“横、竖、撇、点、折”的“代码”。
第四码与第三码同。即不足四码最后一码是啥补啥。
2.六-十画非汉字基础部件编码方法。
用“ii”作六-十画非汉字基础部件的第一、二码,六、七、八、九、十画的非汉字基础部件分别用“a、b、c、d、e”作第三码,六、七、八、九、十画的非汉字基础部件的首笔“—横(a),丨竖(o),丿撇(e),丶点(u),乛折(v)”的“代码”分别作六、七、八、九、十画的第四码。
六画的基础部件编码 一iiaa(*……) 丨iiao(虍……) 丿iiae(乑……) 丶iiau(……) 乛iiav(*……) 七画的基础部件编码 一iiba(*……) 丨iibo(囬……) 丿iibe(豸……) 丶iibu(*……) 乛iibv(*……) 八画的基础部件编码 一iica(……) 丨iico(*……) 丿iice(*) 丶iicu(*……) 乛iicv(*) 九画的基础部件编码 一iida(*) 丨iido(*……) 丿iide(*……) 丶iidu(*) 十画的基础部件编码 一iiea(*) 丨iieo(*……) 丿iiee(*……) 乛iiev(*) [因字库中没有该“非汉字基础部件”,故用“*”号代表] 第一、二码“ii”代表六-十画的非汉字基础部件。
第三码“a、b、c、d、e”分别代表六、七、八、九、十画的非汉字基础部件。
第四码“a、o、e、u、v”分别为首笔“横、竖、撇、点、折”的“代码”。
以上汉字编码方法,依照《汉字基础部件表》、《现代汉语通用字笔顺规范》、《普通话异词审音表》等标准、规范规定,对GB18030《信息技术信息交换用汉字编码字符集的扩充》21003个汉字进行编码。一个汉字拆分出三码以上——常用字不拆分,构成了汉字拆分编码常用字的完整性,使汉字编码减少别字、不“提笔忘字”同时得到解决。
权利要求
1.一种中文信息处理技术三码以上的常用字不拆分的编码方法,用汉字的声母、代码,汉语拼音字母编码;其特征在于,用常用字的“声母”作首码,再用该字拆分后常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作二、三、四码编码,编码与键盘上的字母键相对应,输入时直接按相应的字母键;
能拆分的非常用字,用该字的“声母”作首码,再用该字拆分后常用字的“声母”或者非汉字基础部件的“代码”或者交重的非常用字的“代码”作二、三、四码编码第一组,第二组用非常用字的首笔“一横(a),丨竖(o),丿撇(e),丶点(u),折(v)”的“代码”作首码,二、三、四码与第一组编码方法相同,输入时直接按相应的字母键;
交重的非常用字独立作字时,先用该字全拼的汉语拼音字母编码第一组,不够四码最后一码是啥补啥,超过四码舍弃,“zh、ch、sh”用“z、c、s”编码,韵母“ü”用“u”编码;第二组用该字首笔“一横(a),丨竖(o),丿撇(e),丶点(u),折(v)”的“代码”作首码,二、三、四码用“u”编码,输入时直接按相应的字母键;
二画、交重、部分交重和不拆分的常用字,独立作字时用该字全拼的汉语拼音字母编码,不够四码最后一码是啥补啥,超过四码舍弃,韵母“ü”用“u”编码;与其它汉字、部件组合时用其“声母”编码,“zh、ch、sh”用“z、c、s”编码,输入时直接按相应的字母键;
左边是上下、上中下结构的汉字——左边不拆分,输入时直接按相应的字母键;
二字词用二字的“声母”作第一、二码,再用前一个字拆分后第一码常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”和后一个字拆分后最后一码常用字的“声母”或者交重的非常用字的“代码”或者非汉字基础部件的“代码”作三、四码编码;第三码是“左不拆”的,仍然适用单字“左不拆”的规定;第四码是非常用字用最后一个常用字的“声母”(部件的“代码”)编码;三字词用每个字的“声母”编码,不够四码最后一码是啥补啥;四字词用每个字的“声母”编码;五字以上词用前三个字和最后一个字的“声母”编码;词中的非常用字用“u”编码;词中二画、交重、部分交重和不拆分的常用字用其“声母”编码,是“zh、ch、sh”用“z、c、s”编码,输入时直接按相应的字母键;
用“i”作一-五画非汉字基础部件的首码,一、二、三、四、五画的非汉字基础部件分别用“a、b、c、d、e”作第二码,一、二、三、四、五画的非汉字基础部件的首笔“一横(a),丨竖(o)、丿撇(e),丶点(u),折(v)”的“代码”,分别作第三码,不够四码最后一码是啥补啥。用“ii”作六一十画的非汉字基础部件的第一、二码,六、七、八、九、十画的非汉字基础部件分别用“a、b、c、d、e”作第三码,六、七、八、九、十画的非汉字基础部件的首笔“一横(a),丨竖(o),丿撇(e),丶点(u),折(v)”的“代码”分别作六、七、八、九、十画的第四码,输入时直接按相应的字母键。
全文摘要
本发明是一种信息处理技术三码以上常用字不拆分的编码方法,目前汉字的输入方法是“汉语拼音”和“五笔字型”。其编码方法是用汉字的声母分别作首码,再用该字拆分后常用字的声母或者交重的非常用字的代码或者非汉字基础部件的代码作二、三、四码编码。能拆分的非常用字,用该字的声母作首码,再用该字拆分后常用字的声母或者交重的非常用字的代码或者非汉字基础部件的代码作二、三、四码编码第一组。第二组用该字首笔一丨丿丶乛的代码作首码,二、三、四码与第一组编码方法相同。交重的非常用字用该字全拼的汉语拼音字母编码第一组,第二组用该字首笔一丨丿丶乛的代码作首码,二、三、四码用u编码。输入汉字按键盘上相应的字母键。
文档编号G06F3/023GK101114199SQ200710055089
公开日2008年1月30日 申请日期2007年9月3日 优先权日2007年9月3日
发明者袁长宝, 王惠芳 申请人:袁长宝, 王惠芳