基于字型及笔划的汉字检索方法与流程

文档序号:11654468阅读:711来源:国知局
基于字型及笔划的汉字检索方法与流程

本发明涉及一种基于字型及笔划的汉字检索方法,具体地说是一种用于纸质字典、计算机或移动终端上电子字典的汉字检索方法。



背景技术:

人们从小学开始,在整个接受教育的过程中,就要使用字典。参加工作后遇到文字方面的疑难问题,经常要查字典、词典等工具书,这些工具书的使用都必须借助于一定的检字法。检字法是否方便快捷,直接关系到人们的学习工作效率,而且其影响面很广。目前社会上通用的各种汉语工具书尽管内容形式各异,但是其检字法不外乎“音序检字法”和“部首检字法”等。对于不知读音的汉字,还必须使用汉字部首检索,汉字部首检索汉字繁琐、耗时,因此部首检字法还专门附带《难检字笔画索引》。所以,部首检索方法存在其固有的缺陷和明显不足之处。



技术实现要素:

本发明的目的是要提供一种简单易学的、根据汉字结构就能操作的汉字检索方法,以解决现有汉字部首检索难度高、效率低的问题。

本发明的目的是这样实现的:一种基于字型及笔划的汉字检索方法,用于纸质字典、计算机或移动终端上电子字典的汉字检索,

采用两级索引检索汉字,

一级索引为排列成一行的10种汉字的字型标记和6种外围部首的字型标志:

按从左到右的顺序,字型标志所对应的汉字或外围部首分别为:1左右三等分汉字、2上下三等分汉字、3方块四等分汉字、4独体汉字、5左右二等分汉字、6上下二等分汉字、7左右二等分后右部仍可等分的汉字、8左右二等分后左部仍可等分的汉字、9上下二等分后下部仍可等分的汉字、10上下二等分后上部仍可等分的汉字、11右上角部首、12上面部首、13左上角部首、14左面部首、15左下角部首、16下面部首。

设立5种汉字的笔划标志:

按从左到右的顺序,笔划标志所对应的汉字笔划为:1横笔划、2竖笔划、3撇笔划、4点笔划、5折笔划。

二级索引为三个笔划标志。

取汉字笔划的方法为:

左右三等分汉字、上下三等分汉字、方块四等分汉字、左右二等分后右部仍可等分的汉字、左右二等分后左部仍可等分的汉字、上下二等分后下部仍可等分的汉字、上下二等分后上部仍可等分的汉字按书写汉字顺序取三个等分部的首笔笔划;

独体汉字书按书写汉字顺序取前三笔笔划;

左右二等分汉字、上下二等分汉字在一个等分部中取首笔及第二笔笔划,另外一个等分部中取首笔笔划;

有外围部首的汉字,第一笔取外围部首的首笔笔划,第二笔及第三笔取去掉外围部首后汉字的笔划;

将一级索引布置于字典的检字页面,检索汉字时先在一级索引中确定汉字所对应的字型标志,再提取该汉字的三个笔划确定二级索引。

等分部至少的笔划是折笔划,或者是横、竖、撇、点、折笔划中的两个笔划的组合:横横、横竖、横撇、横点、横折、竖横、竖竖、竖点、竖折、撇横、撇竖、撇点、撇折、点横、点竖、点撇、点点;并且不与相邻的等分部笔划交叉。

二级索引的排列顺序,三个笔划标志均按照横、竖、撇、点、折的顺序排列。

用于纸质字典的汉字检索时,将一级索引布置在检字表页面的上部,二级索引为三个排列成行的笔划标志,布置在对应的汉字上面,该页面的汉字所对应的字型标志下侧有标记;或者是字型标志下侧是其对应的汉字首次出现在检字表的页码,该页面的汉字所对应的字型标志下侧则没有页码;或者是该页面的汉字所对应的字型标志在一行中凸出,在下侧是该页面的二级索引的首位笔划标志。用于电子字典的汉字检索时,在计算机或移动终端的的触摸屏上,布置一级索引及5种汉字的笔划标志,手指点击一级索引中一种字型标志,再点击三次笔划标志确认二级索引后检索所需的汉字;如果在计算机的显示屏上,则用鼠标点击。

本发明具有如下优点:要检索某一汉字,可以直接确定字型标志和提取笔划,直接在检字表二级索引对应的汉字里面找到该汉字。本人对《3500个常用汉字》进行了编码,不同字型的二级索引有790个左右,归属二级索引的汉字至多不超出30个,平均为4.4个,显著超越了汉字部首检字法。

附图说明

图1是本发明的字型标志对应的汉字举例。

图2是本发明的笔划至少的等分部举例。

图3是本发明的二级索引排列表。

图4是本发明为纸质字典时在检字表的布置。

图5是本发明为纸质字典时在检字表的布置。

图6是本发明为纸质字典时在检字表的布置。

图7是本发明为电子字典时在屏幕上的布置。

图中:1二级索引、2标记、3页码、4二级索引首位笔划标志。

具体实施方式

下面结合附图详细描述本发明的实施方式:

参照图1、图2和图4:图1所举例的汉字的等分部界线是比较清晰的,如“浙”、“蓄”、“韶”、“明”、“畜”、“招”、“部”、“茹”、“竖”等字。本发明所述的等分部的定义与部首有所不同,它可以出现在汉字的不同部位,原则是不能与相邻的等分部的笔划交叉,图2所示是至少笔划的等分部,它可以是一个折(包括撇折、横折、竖折、竖勾)笔划,或者是横(提笔划相同于横笔划)、竖、撇、点(捺笔划相同于点笔划)、折五种笔划中两个或两个以上的笔划组合,设定最少笔划数使判定等分部更准确,超过二笔划的等分部有很多,其中包括部首和汉字,也有一部份等分部是多个笔划的组合。判定等分部有时要根据至少笔划,如“玄”字,是“点横”、“折”、“折点”三个等分部组合,可以归属上下三等分汉字;有时也要也要根据等分部之间比例和间隔“畜”字是“玄”和“田”组合成上下二等分汉字,“蓄”字则又是上下三等分汉字。如“示”字就是“二”和“小”两个等分部组成的上下二等分汉字(两个等分部的笔划可以接触),如“未”字书写顺序及笔划和“示”相同,但“未”的竖笔划已插入“二”的横笔划中间,已和上等分部笔划发生交叉,因此“未”字不能归属上下二等分汉字,属独体汉字。

左右三等分汉字如等分部超出了三个,如“摊”字,则取左面三个等分部的首笔笔划:横、折、撇笔划。上下三等分汉字如等分部超出了三个,如“惹”字,则取上面三个等分部的首笔笔划:横、横、竖笔划。

左右二等分汉字在左等分部中取首笔及第二笔笔划、在右等分部中取首笔笔划,上下二等分汉字在上等分部中取首笔及第二笔笔划、在下等分部中取首笔笔划;或者是左右二等分汉字在左等分部中取首笔笔划、在右等分部中取首笔及第二笔笔划,上下二等分汉字在上等分部中取首笔笔划、在下等分部中取首笔及第二笔笔划;前一种方法取笔划相对容易,后一种方法二级索引稍多。

左右二等分后,左部或右部是上下三等分汉字,但只需要二个等分部笔划,优先取隔离的等分部:如“慎”字的右部“真”取横、撇笔划;如无前述条件,则根据比例将其二等分后取,如“漂”字右部“票”分成“西”和“示”,取横、横笔划;如果三个等分部面积相等则可以按顺序取,如“绰”字的右部“卓”字中取竖、竖笔划。

有外围部首的汉字,外围部首本身就是一个等分部,第一笔取外围部首的首笔笔划,第二笔及第三笔取去掉外围部首后汉字(归纳为三种字型:独体汉字、左右二等分汉字、上下二等分汉字)的笔划,如“武”字,取横、竖、竖笔划;如“掌”字,取竖、竖、撇笔划;如“痛”字,取点、折、竖笔划;如“趣”字,取横、横、折笔划。左面部首、下面部首对应的汉字不多,之所以采用,则是能够让外围部首具有连惯性。当有外围部首的汉字成为左右二等分汉字、上下二等分汉字的等分部时,取等分部的笔划应根据书写顺序:如“挖”字,取横、点、折笔划;如“莲”字,取横、横、点笔划。

参照图3、图4、图5、图6和图7:用于纸质字典的汉字检索时,将一级索引布置在检字表的上面,二级索引1为三个排列成行的笔划标志,布置在对应的汉字上面,二级索引1的排列顺序,三个笔划标志均按照横、竖、撇、点、折的顺序排列(图3所示的是一个字型标志所对应的按顺序排列的二级索引),该页面的汉字所对应的字型标志下侧有标记2,图示的记号2是一个箭头符号,记号2还可以是一个圆点或者是一条直线,也可以是该字型标志的线条粗于其它字型标志的线条,能使该字型标志与其它字型标志明显区分;或者是字型标志下侧是其对应的汉字首次出现在检字表的页码3,该页面的汉字所对应的字型标志下侧则没有页码3,以示区别;或者是该页面的汉字所对应的字型标志在一行中凸出,在下侧是二级索引1的首位笔划标志4,如果对应的二级索引1的首位笔划标志4有两种,则在字型标志下侧就放两个笔划标志,一个页面同时具有二个字型标志所对应的汉字时也按照上述方法。在计算机或移动终端的的触摸屏上,布置一级索引及5种汉字的笔划标志,手指点击一级索引中一种字型标志,再点击三次笔划标志确认二级索引后触摸屏会显示所需的汉字;如果是在计算机的显示屏上,则用鼠标点击。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1