一种汉字直查三码检字法的制作方法

文档序号:2623251阅读:293来源:国知局
专利名称:一种汉字直查三码检字法的制作方法
技术领域
本发明属于一种汉字检字方法,是涉及一种主要用于中文字词典的汉字检索的汉字检字法。
背景技术
目前广泛使用的检字法有部首检字法、拼音音序检字法、四角号码检字法、笔画检字法 等,这些检字法各有其优缺点。
部首检字法历史悠久,用的最广,几乎所有的中文字词典都有部首检字表。其缺点是检 字步骤繁多,耗费时间,査一个字需要经过判断部首+査该部首笔画数》査部首目录+找到 该部首在检字表中的页码+查该字除部首以外的笔画数》查检字表+根据在检字表中所示的 页码数翻到字典的正文页码等7个步骤,查一个字最快需要一分钟左右,有的字则数分钟也 査不到。
拚音音序检字法的优点是,认识并能够准确读音的字一翻就能査到。其缺点 一是对不 认识的字一筹莫展,而我们査字还往往是査不认识的字;二是同音字太多,增加了査找难度, 有时查一个字也需要数分钟。
四角号码检字法的优点是号码多,同码字较少,其缺点是规则多,难记忆,准确度低, 因而现在已很少有人使用。
笔画检字法查字速度更慢,更困难,经常是在使用多种方法不灵时才被迫使用。
综上所述,目前广泛使用的部首、拼音音序、四角号码、笔画等常用检字法存在着检字 步骤繁杂、速度慢、规则难记忆、准确度低、或同码字过多造成检字难等缺点。
本发明就是为了克服上述几种常用检字法的缺点而设计的,提出了一种新的快速、简明、 易记、易学的汉字检字法。

发明内容
本发明依据汉字的笔画和汉字的书写顺序自然取码,提出一种新的汉字编码方法,其要 点是
(一)利用"1、 2、 3、 4、 5"五个数字,分别代表"一 (横)I (竖)〗(撇)、(点) 乙(折)"五种基本笔形,即"横1、竖2、撇3、点4、折5",这五个数字称作"笔形码";利用"6、 7、 8、 9、 0"等五个数字,分别代表"矛廿木> 口"这五个在汉字结构中出现频 率相对较高的部首,即"手6、草7、木8、水9、 口 0",这五个数字称为"部首码"。笔 形码和部首码统称为"笔码"。"1、 2、 3、 4、 5、 6、 7、 8、 9、 0"这10个数字就是其所对
应的汉字笔码。
其中,z (提)归一 (横),J (竖钩)归I (竖),、(捺)归、(点),各种折笔笔 画归为乙(折)。
笔码与笔形、部首的对应关系见下列表一。
表一 汉字笔码表
笔形码部首码笔形和部首— 1、乙净卄木
笔码1234567890
为了便于记忆,编以下口诀-
横1竖2撇是3, 点捺为4折作5, 6手割7草8木, 好酒(9)水配好口令(0)。
(二) 编码规则
直査三码的编码规则非常简单,其编码规则如下
直査三码-笔画数.首笔码+第二笔码+末笔码 艮P:直査三码是由笔画数、圆点和三笔码共同组成的一组编码。
圆点"."左边是该字的笔画数,圆点右边是由首笔码、第二.笔码、末笔码等3个笔码组 成的"三码"。圆点的功能是区分和连接笔画数和三笔码。
具体方法是
先数汉字的笔画数,加一圆点,然后按汉字的书写顺序依次取该字的首笔码、第二笔码、 末笔码等3个笔码组成"三码",放在圆点后,由笔画数、圆点和三笔码共同组成一组编码。
"三笔码"不足三码时补加"0", 因为检字时首先直接先査汉字的笔画数,然后再把汉字的首笔码、第二笔码和末笔码组 成三笔码,由笔画数和三笔码共同组成一组编码,因此本检字法称为为"直查三码检字法", 所编的码称为"直查三码"
(三) 编码例举例l.对"码"字编码
先数"码"的笔画数为8,加一圆点,然后依次取"码"字的首笔码"横1"、第二笔码 "撇3"和末笔码"横1"组成该字的"三笔码"。 即:"码"的直查三码是8.131 园点前的8是笔画数,园点后面的131是"三笔码" 绝大多数汉字可以本例进行编码。 例2.对"核"字编码
先数"核"的笔画数为10,加一圆点,然后取"核"字的首笔码"木8"、第二笔码"点 4"和末笔码"点4"组成该字的"三笔码"。 艮P:"核"的直査三码是10.844 园点前的10是笔画数,园点后面的844是"三笔码"
字体结构中含有"净^木? 口"这五个部首之一的汉字(此类汉字约占全部汉字数的五 分之一)可以本例进行编码,其特点是,将部首码作为第一码,此部首后面的笔码为第二码, 末笔码是第三码。如在本例中,"核"字由"木"和"亥"两个部件组成的合体字,"木"是 以部首码作为"核"字的首笔码"木8",第二码笔依次是"木"这个部首之后"亥"部件的 第一笔"点4"。同理,如果这五类部首码虽然没有在出现在字的首笔位置,如需要编码时也 要按部首码进行编码。
把"净^木? 口"这5个部首设为部首码的依据是在汉字的结构中,"净*木'? 口" 这5个部首的造字能力特别强,例如在《新华字典》中收录的1万个汉字中,"#*木? 口" 这5个部首下的汉字数分别是401、 500、 460、 552、 470个,即这5个部首下的汉字数达2383 个,约占《新华字典》收录个汉字数的五分只一。这也是许多汉字检字法重码率高的主要原 因之一。把"净^木? 口"这5个部首设置为部首码,有效的解决了汉字编码中出现的重码 率高的难题。
例3.对"人"字编码
先数"人"的笔画数2,将"2"作为该字的笔数码,然后取"人"字的首笔码"撇3"、 第二笔码"捺4",因不够三笔,末笔码补以"0"组成该字的"三笔码"。 艮P:"人"的直三码=2.340
只有一、二笔画的汉字(常用的一、二笔画汉字不足20个)可以用此方法。 (四)"直查三码检字法"的优点
1. 编码规则少而简单,容易掌握,读者只需花几分钟时间就能看懂并熟练运用。
2. 十种笔码简单明了,不需要特殊记忆,极大的简化人们在检索汉字的心理过程。3. 把复杂的汉字简单化,不考虑汉字是独体字还是合体字,也不考虑汉字的结构有多么
复杂,只数笔画数,取字的第一、二笔码和末笔码进行编码,极大的减少了影响编码的因素。
4. 査字方便、迅速,用该检字法编篡的字词典,根据编码可直接翻到该字所在的页码, 使检字步骤最少化,省略了大多数字典常用的"检字表",节省了检字时间,提高了检字效率。
5. 重码率低,绝大多数的"直査三码"的编码所包含的汉字数在IO个以内,提高了检 字的速度。
具体实施例方式
1. 根据本发明可以进行中文字词典等汉字工具书的编篡。
例如,用"直査三码"编篡汉语字典、汉语词典、汉语学习字典等工具书,字词典正文 中所收录汉字按照"直査三码"进行升序排列。
2. 根据本发明可以编写现有中文字词典的辅助检索工具书。
3. 根据本发明可以编写中文图书、文献、档案、资料等部门的索引工具书
4. 根据本发明可用于移动电话、电子字典的中文编排输入,以及与汉字输入、检索有关 的其它领域。
权利要求
1.一种汉字直查三码检字法,其特征在于用“1、2、3、4、5”五个数字,分别代表“一(横)丨(竖)丿(撇)丶(点)乙(折)”五种基本笔形,这5个数字称为“笔形码”;用“6、7、8、9、0”等五个数字,分别代表“扌艹 木 氵口”这五个在汉字结构中出现频率相对较高的部首,这5个数字称为“部首码”;笔形码和部首码统称为“笔码”;“1、2、3、4、5、6、7、8、9、0”这10个数字就是其所对应的汉字笔码;汉字直查三码是由笔画数、圆点、三笔码组成;汉字直查三码可用于中文字词典等工具书的编篡以及与汉字输入、检索等相关领域。
2. 根据权利要求1所述的"汉字直査三码是由笔画数、圆点、三笔码组成",其特征在 于编码时,先数汉字的笔画数,加一圆点,然后按汉字的书写顺序依次取该字的首笔码、 第二笔码、末笔码等3个笔码组成"三笔码",放在圆点后,由笔画数、圆点和三笔码共同组 成一组编码。
3. 根据权利要求1所述的"汉字直查三码可用于中文字词典等工具书的编篡",其特征在于汉字直査三码可用于编篡各种各类汉语字典、汉语词典、汉语学习字典等工具书。
4. 根据权利要求1所述的"汉字直査三码可用于中文字词典等工具书的编篡以及与汉字输入、检索等相关领域"中的"以及与汉字输入、检索等相关领域",其特征在于汉字直査三码可用于移动电话、电子字典等事项的中文编排输入,汉字直査三码可用于编写中文图书、 文献、档案、资料等部门的索引工具书,汉字直査三码可用于与汉字输入、检索有关的其它 领域。
全文摘要
一种汉字直查三码检字法,它属于一种汉字检字方法。它克服了部首、拼音音序、四角号码、笔画等检字法所存在的检字步骤繁杂、速度慢、规则难记忆、准确度低、同码字过多等缺点。其要点是用“12345”五个数字,分别代表“一丨丿丶乙”五种基本笔形,这五个数字称作“笔形码”;用“67890”五个数字,分别代表在汉字结构中出现频率较高的五个部首“扌艹木 氵口”,这五个数字称为“部首码”。笔形码和部首码统称为“笔码”。编码规则直查三码=笔画数,首笔码+第二笔码+末笔码圆点“.”左边是该字的笔画数,圆点右边是由首笔码、第二笔码、末笔码等3个笔码组成的“三码”。本发明可用于中文字词典等汉字工具书的编篡。
文档编号G09B19/00GK101493999SQ200910014169
公开日2009年7月29日 申请日期2009年2月18日 优先权日2009年2月18日
发明者贾守治 申请人:贾守治
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1