利用汉语拼音声母查询中文姓名的方法

文档序号:6374985阅读:3429来源:国知局
专利名称:利用汉语拼音声母查询中文姓名的方法
技术领域
本发明涉及一种利用汉语拼音声母查询中文姓名的方法,特别是指一种利用汉语拼音的声母组合,在记载有中文姓名的数据文件中迅速准确查找定位目标姓名的方法。
一般中文平台的用户通讯簿或数据库中联系人的姓名为中文姓名,中文姓名常用的汉字有几千个,如果利用拼音或部首等传统方法检索中文姓名,其速度很慢。姓名的输入通常需要输入2-3个汉字,再加上PDA手写识别所花费的时间、挑选重码汉字所花费的时间,检索中文姓名的效率一般较低;在操作中,用户需要输入的信息量大,操作点击的次数多,所以操作不方便。如果按照姓氏进行查询,其速度比传统的查询方法有了一定提高,但由于要在屏幕中挑选合适的“姓”和“姓名”,也增加了查询的时间;并且仍然存在由用户进行搜索的缺点。
通过对大量的随机姓名样本进行统计可以发现一般姓氏的姓名,只需要利用三个汉语拼音声母进行查询就能准确定位到需要找到的姓名;对于具有特别常用的姓氏(如张、王、李等)的姓名的重复率稍高,但三个汉语拼音声母的查询结果一般也只有3-5个,前两个汉语拼音声母的查询结果一般也不会超过10个。
因此,如果利用汉语拼音声母查询汉字姓名,用户通过三笔输入即可得出查询结果,并且在PDA显示屏上仅需一屏也足以显示全部的查询结果,不用翻屏;由此,可以极大地提高查询的速度,使汉字姓名的查询操作变得简便。
本发明的主要目的在于提供一种利用汉语拼音声母查询中文姓名的方法,通过降低汉字姓名查询结果的重复率,迅速定位查询目标,提高查询效率,克服传统查询方法的不足,实现对中文姓名的快速检索。
本发明的目的是通过如下的技术方案实现的。
所述的支持声母查询的数据结构中至少包括按照拼音排序的汉字和/或与声母相对应的汉字。
所述的支持声母查询的数据结构通过如下的步骤建立1、对于按照拼音进行排序的汉字库,查找其汉字内码的区段;2、然后,将该汉字内码区段的边界值记入数组。
支持声母查询的数据结构的建立还包括为汉字库中的汉字建立声母索引列表,并将汉字和声母一一对应。
所述的排序的顺序为依次从字母A到字母Z。
所述的汉字库为国家标准汉字库。
所述的姓名索引文件在保存姓名的同时还保存有该姓名所对应的声母信息。
所述的通过姓名索引文件从数据中获取中文姓名的方法为将用户输入的声母,在姓名索引文件中进行匹配,然后获得其所对应记录的标识信息和数据偏移量,最后根据该偏移量从数据中读取姓名记录。
将用户输入的声母在姓名索引文件中进行匹配的是通过汉字库内码二分定位的方法进行的。
所述的数据为存储有姓名信息的数据文件或数据库。
本发明利用汉语拼音声母查询中文姓名的方法,通过降低汉字姓名查询结果的重复率,迅速定位查询目标,提高了查询的效率,克服了传统查询方法的不足,实现了对中文姓名的快速检索。
以下结合实施例对本发明作进一步的详细说明。
在查找汉字内码的区段时,可采用从字母A到字母Z的顺序进行查找。
在向数据文件中存储中文姓名时,要同时建立的一与之相应的姓名索引文件,该姓名索引文件在保存姓名的同时,还保存该姓名所对应的声母信息。
当从数据文件中检索或者获取中文姓名时,首先将用户输入的声母在姓名索引文件中进行匹配;然后,进一步获取该记录的标识信息和数据偏移量,最后,再根据该偏移量的值从数据中读取输入的声母所对应的姓名记录。
在从数据中读取姓名记录时,可以采用内码二分定位的方法定位一个汉字的声母。
由于中文姓名的声母的重复率并不高,所以利用声母的查询方法能够大大提高查询的效率,同时减少了查询所需的操作复杂度。
权利要求
1.一种利用汉语拼音声母查询中文姓名的方法,其特征在于利用支持声母查询的数据结构,通过姓名索引文件从数据中获取中文姓名。
2.根据权利要求1所述的利用汉语拼音声母查询中文姓名的方法,其特征在于所述的支持声母查询的数据结构中至少包括按照拼音排序的汉字和/或与声母相对应的汉字。
3.根据权利要求2所述的利用汉语拼音声母查询中文姓名的方法,其特征在于所述的支持声母查询的数据结构通过如下的步骤建立a、对于按照拼音进行排序的汉字库,查找其汉字内码的区段;b、然后,将该汉字内码区段的边界值记入数组。4、根据权利要求2所述的利用汉语拼音声母查询中文姓名的方法,其特征在于所述的支持声母查询的数据结构的建立还包括为汉字库中的汉字建立声母索引列表,并将汉字和声母一一对应。
5.根据权利要求3所述的利用汉语拼音声母查询中文姓名的方法,其特征在于所述的排序顺序为依次从字母A到字母Z。
6.根据权利要求3或4所述的利用汉语拼音声母查询中文姓名的方法,其特征在于所述的汉字库为国家标准汉字库。
7.根据权利要求1所述的利用汉语拼音声母查询中文姓名的方法,其特征在于所述的姓名索引文件在保存姓名的同时还保存有该姓名所对应的声母信息。
8.根据权利要求1所述的利用汉语拼音声母查询中文姓名的方法,其特征在于所述的通过姓名索引文件从数据中获取中文姓名的方法为将用户输入的声母,在姓名索引文件中进行匹配,然后获得其所对应记录的标识信息和数据偏移量,最后根据该偏移量从数据中读取姓名记录。
9.根据权利要求8所述的利用汉语拼音声母查询中文姓名的方法,其特征在于将用户输入的声母在姓名索引文件中进行匹配的是通过汉字库内码二分定位的方法进行的。
10.根据权利要求1或8所述的利用汉语拼音声母查询中文姓名的方法,其特征在于所述的数据为存储有姓名信息的数据文件或数据库。
全文摘要
一种利用汉语拼音声母查询中文姓名的方法,利用支持声母查询的数据结构,通过姓名索引文件从数据中获取中文姓名,该支持声母查询的数据结构中至少包括按照拼音排序的汉字和/或与声母相对应的汉字;本发明利用汉语拼音声母查询中文姓名的方法,通过降低汉字姓名查询结果的重复率,迅速定位查询目标,提高了查询的效率,克服了传统查询方法的不足,实现了对中文姓名的快速检索。
文档编号G06F17/30GK1403962SQ0113117
公开日2003年3月19日 申请日期2001年9月5日 优先权日2001年9月5日
发明者刘慧峰, 史敬威, 何君舰, 梁小霞, 刘晓炜 申请人:联想(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1