汉字形定数输入法_2

文档序号:9349612阅读:来源:国知局
插,而四个插的字形汉字编码是9, 一个插的字形汉字编码是3,而一个 倒"匚"的字形汉字编码为4,因此聿字的字形汉字编码为934。
[0038]凹,按其笔画顺序,该字具有八个折,此时,将八个折拆分为两个四折,而四折的字 形汉字编码是8,因此凹字的字形汉字编码为88。
[0039] 当汉字的折、插在一笔里面时,两者相加。
[0040] 例如,也,按其笔画顺序,该字具有两个一插(十),两个二折(〈〈),然而因为这两个 一插和两个二折都是由同一笔的一竖弯钩和同一笔的一竖形成的,因此每个一插均可以和 每一个二折相加,即3+4=7,因此也字的字形汉字编码为77。
[0041] 当汉字具有弯折钩时,用"弯"所对应的字形数字编码补注,且补注在该汉字的字 形数字编码的最后一位。
[0042] 例如,乙,按其笔画顺序,该字分为三折(〈〈〈),且具有弯折钩,则补注0. 2,因此乙 字的字形数字编码为6. 2。
[0043]此处额外需要说明的是:由于单体字的字形复杂,可能会拆解成五个或五个以上 的部分,但由于五个数字足矣代表一个单体字,因此一般取五位数字即可,剩余的部分省 去。例如,兼字还具有一撇一捺的点位对称取〇,其字形数字编码应为017740,但01774已 经构成五位,因此点位对称所对应的0略去。
[0044] 当汉字的字形数字编码出现重码时,通过补位的方法可进行有效处理。一般而言, 出现重码的汉字大都是以成对的形式出现,例如"土"和"士"、"未"和"末"、"凹"和"凸"、 "日"和"曰"等。为了区分以成对的形式出现的两个重码汉字,在编码时,可采用"正、负" 的概念,约定其中一个汉字为其原本的字形数字编码,而另一个汉字,在其原本的字形数字 编码后补注0. 1,从而区分重码的两个汉字。
[0045] 以"土"和"士"为例,就笔画顺序以及字形编码规则而言,两者的字形数字编码均 为31,无法区分。因此在编码时,可以约定"土"为正,即保留其原本的字形数字编码31,同 时约定"士"为负,而后在"士"原本的字形数字编码31后补注0. 1,使"士"的字形数字编码 改变为31. 1 ;这样一来"土"与"士"的重码问题便得到解决。此处额外需要说明的是,在编 码时,同样可以约定"士"为正,其字形数字编码为31,"土"为负,其字形数字编码为31. 1 ; 也就是说,所谓正负是两个重码的汉字之间的相对关系,约定重码的两个汉字中的任意一 个为正,那么就保留该汉字原本的字形数字编码,而另一个即为负,则在该汉字原本的字形 数字编码后补注0. 1,就可有效处理重码的情况。
[0046]以上述的方法进行类推,下表为若干单体字的举例说明:

按汉字的笔画顺序,其第一笔为撇时,汉字的字形数字编码第一个数取6。
[0047] 例如,人,按其笔画顺序,该字分为一撇、一捺,且一撇为人字的第一笔,则一撇为 第一笔时取6, 一捺取0. 3,因此人的字形数字编码为6. 3。
[0048] 么,按其笔画顺序,该字分为一撇、一个"厶",一撇为么字的第一笔取6,一个"厶" 取2. 1,因此么字的字形数字编码为62. 1。
[0049] 以撇字为第一笔的若干汉字的字形数字编码以及首位字形数字编码为6的汉字, 如下表举例所示:

(3)当汉字为包含两个单体部分的多体字时,先取其部首的字形数字编码中的第一个 数,然后在该数之后进位加入一个空格,接着按笔画顺序再取该汉字的另一单体部分的字 形汉字编码进行收尾。
[0050] 当汉字为上、下结构的多体字且其上、下两部分均为部首时,取其上部为部首;若 汉字为左、右结构的多字体且其左、右部分均为部首时,取其左部为部首。
[0051] 例如,郯,按其字形结构,其右半部分为部首卩,部首卩的字形数字编码为41,之 后郯字的左半部分"炎"为剩余部分,而炎由于具有四组点位对称,因此其字形数字编码为 0000,此时郯字的字形编码即为4 (空格)0000。
[0052]阿,按其字形结构,其左半部分为部首卩,部首卩的字形数字编码为41,之后阿字 的右半部分"可"为剩余部分,而可为一横、一竖弯钩和一 "口"字结构,三者分别取1、2、8, 因此阿字的字形数字编码为4 (空格)128。
[0053] 以上述的方法进行类推,下表为若干多体字的举例说明: 表10

此处额外需要说明的是:由于多体字的字形复杂,可能会拆解成六个或六个以上的单 体部分,但由于六个数字足矣代表一个多体的汉字,因此一般取六位数字即可,剩余的部分 省去。例如,鄗字还具有位于"高"字顶部的一点,其字形数字编码应该为4 1868. 1,但4 (空格)1868已经有六位,因此0. 1的小数部分略去。
[0054] (4)当汉字包括两个单体部分以上的多体字时,先取其部首的字形数字编码中的 第一个数,然后在该数之后进位加入一个空格,接着按笔画顺序再 取该汉字其余单体部分的第一个数,之后再以最后一个单体部分的剩余字形数字编码 进行收尾。
[0055] 其中,"再以最后一个单体部分的剩余字形数字编码进行收尾"指的是,当某一多 体字的部首加空格以及先前各单体部分的首位所组成的字形数字编码不足六位时,采用该 多体字最后一个单体部分的剩余字形数字编码进行收尾,以使该多体字的字形数字编码构 成六位,从而降低重码率。
[0056] 例如,鄭,按笔画顺序分为部首"卩"和"先"、"先"、"贝"这四个部分,以字形数字 编码规则,部首"卩"取首位4, "先"取首位6, "先"取首位6, "贝"先取首位4,此时"鄭"字 的部首加空格以及各单体部分的首位所组成的字形数字编码为4 (空格)664,共有五位,不 足六位,因此按"鄭"字的笔画顺序,取其最后一个单体部分,即"贝"的剩余字形数字编码进 行收尾,以使"鄭"字的字形数字编码构成六位,"贝"字剩余部分为点位对称的"人"取〇, 那么"鄭"字的字形数字编码为4 (空格)6640。
[0057] 但,包含两个部分以上的多体字也遵循于字形数字编码超过六位时,超过六位的 部分省去这一规则。
[0058] 例如,"瀛",按笔画顺序分为部首"、? "、"亡"、" 口"、"月"、"女"、"凡",这六个部分, 以字形数字编码规则"取首位〇, "亡"取首位1," 口"取首位8, "月"取首位6, "凡"取 首位6,那么"瀛"字的字形数字编码为0 (空格)18656,为七位编码,超过六位,此时最后 "凡"这一单体部分所取的6就应省去,所以这样一来,"瀛"字的字形数字编码为0 (空格) 1865〇
[0059] 也就是说,当某一多体字的部首加空格以及各单体部分的首位所组成的字形数字 编码正好为六位时,就不再以该多体字最后一个单体部分的剩余字形数字编码进行收尾。 而当某一多体字的部首加空格以及各单体部分的首位所组成的字形数字编码超过六位时, 省去其超过六位的部分的字形数字编码。
【主权项】
1. 一种汉字形定数输入法,其特征在于:所述汉字形定数输入法将汉字的字形与数字 建立如下对应关系:2. 根据权利要求1所述的一种汉字形定数输入法,其特征在于:若所述汉字为单体字, 根据所述汉字的字形结合其笔画数顺序并按所述对应关系进行数字编码。3. 根据权利要求2所述的一种汉字形定数输入法,其特征在于:若按所述汉字的笔画 顺序,其第一笔为撇时,所述汉字的字形数字编码第一个数取6。4. 根据权利要求1所述的一种汉字形定数输入法,其特征在于:若所述汉字为包含两 个单体部分或两个以上单体部分的多体字时,先取其部首的字形数字编码中的第一个数, 然后在该数之后进位加入一个空格,接着按笔画顺序再取其余单体部分字形汉字编码的首 位,之后再以最后一个单体部分的剩余字形汉字编码进行收尾。5. 根据权利要求4所述的一种汉字形定数输入法,其特征在于:若所述汉字为上、下结 构的多体字且其上、下两部分均为部首时,取其上部为部首;若所述汉字为左、右结构的多 字体且其左、右部分均为部首时,取其左部为部首。6. 根据权利要求1所述的一种汉字形定数输入法,其特征在于:若所述汉字具有若干 点、若干弯、若干撇或若干捺时,相同类型的笔画所对应的小数相加;然后按所述汉字的笔 画顺序摆放各小数在字形汉字编码中的次序,即笔画在先,小数靠前,笔画在后,小数靠后。7. 根据权利要求1所述的一种汉字形定数输入法,其特征在于:若所述折或所述插的 数量超过四时,将大于四的部分拆分并构成两位字形汉字编码,其中前一位是所述折或所 述插的数量为四时所对应的字形汉字编码,后一位是所述折或所述插超过四的部分所对应 的字形汉字编码。8. 根据权利要求1所述的一种汉字形定数输入法,其特征在于:若所述折、插在一笔里 面时,两者相加。9. 根据权利要求1所述的一种汉字形定数输入法,其特征在于:当所述汉字具有弯折 钩时,用所述弯所对应的字形数字编码补注,且补注在该汉字的字形数字编码的最后一位。
【专利摘要】本发明涉及输入法领域,尤其是汉字形定数输入法,其特征在于:该编码输入法将汉字字形与数字建立对应关系,若汉字为单体字,则由汉字字形直接进行数字编码;若汉字为多体字,先取部首字形数字编码中的第一个数,再取字的字形进行数字编码。本发明的优点是:动用空格、空心、省去多余信息,明确关系,简单操作。如参与文字改革可打造无重码精确形定数码。使可直接应用到汉字、词、语、文、典库;还能运用于一切软件包括密码。用于检索、写作、编纂、组织网络、组织社会活动、构建社会防护,为在大数据领域起中流砥柱作用作出贡献。
【IPC分类】G06F3/023
【公开号】CN105068674
【申请号】CN201510469392
【发明人】桂有恒, 桂佳
【申请人】桂有恒, 桂佳
【公开日】2015年11月18日
【申请日】2015年8月4日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1