一种针对电子卡片数据的数据查找方法及装置与流程

文档序号:15517971发布日期:2018-09-25 18:47阅读:389来源:国知局

本申请涉及计算机技术领域,尤其涉及一种针对电子卡片数据的数据查找方法及装置。



背景技术:

随着互联网社交平台的发展,通过移动设备管理电子卡片(如电子名片、电子化的银行卡或者电子会员卡等)数据的方式越来越普遍。电子卡片数据,是指作为电子卡片中所承载的卡片信息数据。比如,电子名片承载的各种卡片信息(这里也可称为名片信息),包括姓名、公司名称和职位等信息。电子卡片数据,可以保存在移动设备本地,以便根据用户需求进行查找。

现有技术中,当本地保存的电子卡片数据对应的电子卡片数量较大时,从大量的电子卡片数据中查找某电子卡片对应的电子卡片数据比较困难。如何准确且便捷地查找电子卡片数据是亟待解决的问题。

现有技术提供的一种电子卡片数据的查找方法,主要是在用户界面上,根据电子卡片数据的索引(这里所说的电子卡片数据的索引,一般是指电子卡片包含的指定信息,如电子名片包含的姓名,电子会员卡包含的商户名称,等)的拼音首字母,对电子卡片数据的索引进行排序显示,以便用户按照排序后的索引,准确且便捷地查找到索引,进而触发移动设备查找索引对应的电子卡片数据。或者,也有现有技术提出在界面上提供用于输入查询关键词的输入框,以便根据输入的关键词对相应的电子卡片数据进行查找。

上述第一种方法,存在的问题在于若用户不能完整记忆期望查找的电子卡片数据对应的信息,则难以快捷地进行数据查找。比如,假设期望查找的电子卡片对应的信息为“北京xx科技有限公司”,则如果用户忘记这个公司是北京的了,只能记起“xx科技有限公司”,那么即便以公司名称作为索引进行排序显示,用户也不能很快在“b”这个字母对应的索引中找到“北京xx科技有限公司”。

上述第二种方法虽然不要求用户完整记忆期望查找的电子卡片数据对应的信息,但也存在一定的问题:若用户不小心将“xx科技有限公司”输入成“xx科技有线公司”,这样以“xx科技有线公司”作为关键词,会查找不到相匹配的索引,从而得不到任何查找结果。



技术实现要素:

本申请实施例提供一种针对电子卡片数据的数据查找方法,用以解决在用户输入的关键词不准确的情况下,按照现有技术提供的数据查找方法无法得到查找结果的问题。

本申请实施例还提供一种针对电子卡片数据的数据查找装置,用以解决在用户输入的关键词不准确的情况下,按照现有技术提供的数据查找方法无法得到查找结果的问题。

本申请实施例采用下述技术方案:

一种针对电子卡片数据的数据查找方法,所述方法包括:

获取用于查找电子卡片数据的关键词;根据所述关键词,查找电子卡片数据索引库;若在所述电子卡片数据索引库中没有查找到与所述关键词精确匹配的索引,则查找数据库中是否存在与所述关键词的相似度处于预定范围的数据库记录;所述数据库中保存的数据库记录,包括根据保存的电子卡片数据确定的拼音;若在所述数据库中查找到与所述关键词的相似度处于预定范围的数据库记录,则将所述保存的电子卡片数据中与查找到的数据库记录所映射的电子卡片数据,作为查找结果。

一种针对电子卡片数据的信息查找装置,所述装置包括:

获取模块,用于获取用于查找电子卡片数据的关键词;索引库查找模块,用于根据所述关键词,查找电子卡片数据索引库;数据库查找模块,用于若索引库查找模块在所述电子卡片数据索引库中没有查找到与所述关键词精确匹配的索引,则查找数据库中是否存在与所述关键词的相似度处于预定范围的数据库记录;所述数据库中保存的数据库记录,包括根据保存的电子卡片数据确定的拼音;结果获得模块,用于若数据库查找模块在所述数据库中查找到与所述关键词的相似度处于预定范围的数据库记录,则将所述保存的电子卡片数据中与查找到的数据库记录所映射的电子卡片数据,作为查找结果。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:

由于在电子卡片数据索引库中没有查找到与关键词精确匹配的索引时,可以继续查找与关键词的相似度处于预定范围的数据库记录,并将查找到的数据库记录所映射的电子卡片数据作为查找结果,因此,即便用户在查找的过程中输入了不太准确的关键词,采用本方案也能够得到与所述关键词的相似度处于预定范围的查找结果。本方案提升了对于关键词不准确性的容忍程度,解决了现有技术中存在的在用户输入的关键词不准确的情况下,按照现有技术提供的数据查找方法无法得到查找结果的问题。

此外,本申请实施例采用索引查询效率较高的lucene开源框架来建立电子卡片数据索引库,并采用适用于对中文进行分词处理的ik分词方式进行分词处理,可以使方案能适用于用户习惯输入中文关键词的场景,保证高效、准确地得到查找结果。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本申请实施例提供的一种针对电子卡片数据的信息查找方法的流程示意图;

图2为本申请实施例提供的一种针对电子卡片数据的信息查找方法在实际应用中移动设备查找结果显示图;

图3为本申请实施例提供的一种针对电子卡片数据的信息查找方法在实际中的应用流程示意图;

图4为本申请实施例提供的一种针对电子卡片数据的信息查找装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

以下结合附图,详细说明本申请各实施例提供的技术方案。

实施例1

本申请实施例1中提供一种针对电子卡片数据的数据查找方法,该方法的执行主体可以是任意的可用于存储及搜索电子卡片数据的电子设备。其中,所述电子设备可以是手持式电子设备(如手机、平板电脑等),也可以是可穿戴式电子设备等。为了便于清楚的描述本申请实施例1提供的该方法,下文以方法的执行主体为移动设备为例,详细介绍本申请实施例提供的方法。

本领域技术人员可以理解,该方法的执行主体为移动设备只是一种示例性说明,并不是对本方法的执行主体的具体限定。

具体的,实施例1提供的一种针对电子卡片数据的数据查找方法的实现流程示意图如图1所示。所述方法包括如下主要步骤:

步骤101、移动设备获取用于查找电子卡片数据的关键词。

电子卡片数据,是指作为电子卡片包含的卡片信息的载体的数据。比如,电子名片包含的各种卡片信息,包括姓名、公司名称和职位等信息,就可以以电子名片数据作为载体来承载。

移动设备的显示界面可以包含用于输入关键词的输入框,以便用户根据输入的关键词对电子卡片数据进行查找。所述关键词,具体可以为字、词、词组或拼音等。

为了实现查找,移动设备中的电子卡片数据索引库中,会预先存储映射于不同电子卡片的各条索引。所述电子卡片数据库索引中的索引,根据电子卡片数据建立。

其中,一条索引往往对应一条电子卡片信息,进而,对应于一种电子卡片的所有电子卡片数据。

本申请实施例中,电子卡片数据索引库中的各条索引,均可以根据相应的电子卡片数据来生成。具体而言,根据电子卡片数据生成索引的实现方式可以如下:

基于lucene开源框架,建立电子卡片数据索引库。本申请实施例之所以选择利用lucene开源框架,建立电子卡片数据索引库,一方面,是由于lucene开源框架具备检索索引效率比较高的特点;另一方面,是由于利用lucene开源框架是一个比较成熟的开源框架,利用它能够比较方便地使应用程序具备建立索引和检索索引的能力。

其中,lucene开源框架是apache软件基金会4jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,它可以为应用程序提供索引器和检索器,从而实现为应用程序添加建立索引和检索索引的能力。

本申请实施例中,利用lucene开源框架提供的索引器,建立电子卡片数据索引库的具体过程可以包括:

lucene开源框架的索引器调用分词方式,对移动设备中保存的电子卡片数据进行分词处理,以得到分词处理结果(后称分词处理第一结果)。进一步地,索引器确定分词处理第一结果对应的拼音。

一条电子卡片信息所对应的电子卡片分词处理第一结果以及相应的拼音,构成一条索引,也即一条索引项。

需要说明的是,本申请中所述分词方式具体包括ik分词方式,之所以采用ik分词方式,是由于使用ik分词处理方式更适用于对中文进行分词处理,可以使得分词处理第一结果可以包含字和词组,使得分词处理第一结果多样化。

以下举例说明如何建立索引:

假设移动设备中保存有“李晓明”的电子名片的各电子名片数据(这里所说的各电子名片数据一般姓名、公司名称和职位等信息分别对应的电子名片数据,进一步地,还可以包括该电子名片的背景图片等等),那么,可以根据该电子名片的指定类型(本申请实施例中主要是文本类型)的电子名片数据,实现在电子卡片数据索引库中建立映射于“李晓明”的电子名片的各电子名片数据的索引。

具体来说,姓名“李晓明”、公司名称“橙鑫数据科技有限公司”和职位“软件工程师”分别对应的电子名片数据,由于都是文本类型的电子名片数据,因此均可以直接作为索引保存于电子卡片数据索引库中。此外,移动设备还建立起该些索引与相应的各电子名片数据的映射关系。这里所说的“相应的各电子名片数据”,是指用于承载“李晓明”的电子名片信息的各电子名片数据。

需要说明的是,考虑到用户在记忆电子名片信息时,很可能只记得电子名片的某一完整的电子名片信息的部分内容,如,只记得“橙鑫数据科技有限公司”中的“橙鑫数据”,因此可以预测,用户所输入的关键词,可能会出现只能与完整的电子名片数据的部分内容完全匹配的情况。如“橙鑫数据科技有限公司”就是一个完整的电子名片数据,而“橙鑫数据”则是该完整的电子名片数据的部分内容。为了保证在该情况下通过关键词搜索得到正确的查找结果的成功率,本申请实施例中,可以对完整的电子名片数据进行拆分,并以拆分结果作为索引进行保存。

具体而言,针对文本类型的电子名片数据,可以采用分词的方式(如ik分词方式),对电子名片数据进行分词,并将分词处理后得到的词作为索引保存至电子卡片数据索引库。

此外,考虑到用户后续在查询电子名片数据时输入的关键词有可能是拼音;或者,用户输入的关键词有可能出现不准确的情况——如本意是想输入“有限公司”但错误地输入了“有线公司”,本申请实施例中,还提出确定分词处理后得到的词对应的全拼,并将所述全拼作为索引,保存至电子卡片数据索引库。

以下列举一些实例,来说明可以怎样对电子卡片数据进行分词处理从而得到分词处理第一结果,进而确定得到的分词处理第一结果所对应的拼音:

针对对应于名字“李晓明”、公司名称“橙鑫数据科技有限公司”及职称“软件工程师”的电子卡片数据,移动设备可以对该电子卡片数据进行ik分词处理后得到的分词处理第一结果,以及确定分词处理第一结果所对应的拼音,如表1所示。

表1

因此,移动设备的电子卡片数据索引库中保存的索引可以包括以下内容:

一、针对对应于名字“李晓明”的电子卡片数据,电子卡片数据索引库中保存的一条索引可以包括:1)“李晓明”;2)“李”、“晓”、“明”;3)“lixiaoming”;4)“li”、“xiao”、“ming”;5)“晓明”;6)“xiaoming”。

二、针对对应于公司名称“橙鑫数据科技有限公司”的电子卡片数据,电子卡片数据索引库中保存的一条索引可以包括:1)“橙鑫数据科技有限公司”;2)“橙”、“鑫”、“数”、“据”、“科”、“技”、“有”、“限”、“公”、“司”;3)“ashujukejiyouxiangongsi”;4)“cheng”、“xin”、“shu”、“ju”、“ke”、“ji”、“you”、“xian”、“gong”、“si”;5)“橙鑫”、“数据”、“科技”、“有限公司”;6)“chengxin”、“shuju”、“keji”、“youxiangongsi”。

三、针对对应于职位名称“软件工程师”的电子卡片数据,移动设备的电子卡片数据索引库中保存的一条索引可以包括:1)“软件工程师”;2)“软”、“件”、“工”、“程”、“师”;3)“ruanjiangongchengshi”;4)“ruan”、“jian”、“gong”、“cheng”、“shi”;5)“软件”、“工程师”;6)“ruanjian”、“gongchengshi”。

通过对移动设备中保存的各电子卡片的电子卡片数据执行上述类似操作,即可实现在移动设备中建立起电子卡片数据索引库,以便后续查找。

步骤102、根据所述关键词,查找电子卡片数据索引库。

沿用上述的“李晓明”的电子名片的例子,当用户需要查询“李晓明”的电子名片的电子卡片数据时,移动设备根据用户在输入框中输入的关键词,在电子卡片数据索引库中进行查找。

其中,若关键词为词组;则根据所述关键词,查找电子卡片数据索引库,具体包括:

步骤s1、基于根据词组确定的查找词,查找所述电子卡片数据索引库。

本步骤中,如图2所示,以用户在移动设备1的输入框11中输入关键词“软键公陈师李小明的电子名片”为例:

根据词组确定查找词,具体实现为:

利用预定的分词方式(如前所述的ik分词方式),对词组进行分词处理,得到各个分词处理结果(称分词处理第二结果),作为所述查找词。

例如,文本信息为“软键公陈师李小明的电子名片”,则对“软键公陈师李小明的电子名片”进行分词处理后得到:“软”、“键”、“公程师”、“李”、“小”、“明”、“小明”、“的”、“电子”、“名片”。若进行分词处理得到的分词处理结果(后称分词处理第二结果)中存在助词,则去除助词“的”后,得到的:“软键公陈师李小明”、“软”、“键”、“公陈师”、“李”、“小”、“明”、“小明”,就作为查找词。

步骤s2、若在电子卡片数据索引库中,查找不到与查找词精确匹配的索引,则确定所述查找词的拼音。

其中,查找词与索引精确匹配,是指查找词与索引完全一致时。如,查找词为“李晓明”,则查找词为“李晓明”与索引“李晓明”完全一致,即精确匹配。如查找词为“软键公陈师李小明”、“软”、“键”、“公陈师”、“李”、“小”、“明”和“小明”,则存在分别与该些词和字完全一致的索引时,视为精确匹配。

以下举例说明,在查找不到与所述查找词精确匹配的索引,如何确定所述查找词的拼音:

以查找词为“软键公陈师李小明”为例,由于电子卡片数据索引库中,并不会存在“软键公陈师李小明”这一索引,因此在电子卡片数据索引库中进行查找,会查找不到与“软键公陈师李小明”完全匹配一致的电子名片数据。

那么,移动设备确定“软键公陈师”、“李小明”、“软”、“键”、“公”、“陈”、“师”、“李”、“小”、“明”分别对应的拼音:“ruanjiangongchengshi”、“lixiaoming”、“ruan”、“jian”、“gong”、“chen”、“shi”、“li”、“xiao”、“ming”。

步骤s3、根据所述查找词的拼音,查找所述电子卡片数据索引库中保存的索引。

本步骤中,移动设备根据通过执行上述步骤s2中确定出的拼音,查找电子卡片数据索引库,即查找上述表1。若电子卡片数据索引库中存储有与通过执行上述步骤s2中确定出的拼音完全相同的拼音,则将查找到的拼音确定为与查找词精确匹配的查找结果;若在所述电子卡片数据索引库中没有查找到与通过执行上述步骤s2中确定出的拼音完全相同的拼音,则执行步骤103。

需要说明的是,在电子卡片数据索引库中查找索引时,查找结果需要满足“精确匹配”原则,是由于lucene开源框架提供的检索器的特性决定的。

步骤103、若在所述电子卡片数据索引库中没有查找到与所述关键词精确匹配的索引,则查找数据库中是否存在与所述关键词的相似度处于预定范围的数据库记录。

其中,所述数据库中保存的数据库记录,包括根据保存的电子卡片数据确定的拼音(如表1中所示的拼音)。

前文已经提到,lucene开源框架提供的检索器的特性决定了在电子卡片数据索引库中查找索引时,查找结果需要满足“精确匹配”原则。在本申请实施例中,为了解决在用户输入的关键词不准确的情况下,按照现有技术提供的数据查找方法无法得到查找结果的问题,提出利用该数据库进行纠错。

所谓“纠错”,是指在数据库中找到与关键词对应的拼音具备一定相似度的数据库记录,然后,根据该数据库记录,对电子卡片数据索引库进行查询。由于该数据库记录中保存的是电子卡片数据对应的拼音,电子卡片数据索引库中存在与该些拼音精确匹配的索引,因此,利用数据库记录,对电子卡片数据索引库进行查询能够得到查询结果,从而避免上述问题。

在本申请中,所述相似度的大小,可以通过关键词对应的拼音与电子卡片数据索引库中作为索引的单个拼音的相似程度来衡量。具体而言,可以通过下述公式计算该相似度的大小:

关键词对应的拼音与电子卡片数据索引库中单个拼音中相同字母的数量/关键词对应的拼音包含的字母数量

其中,所述相同字母的数量,可以是通过依次比较字母确定出的。如,拼音lixiaoming,与拼音lixiaomin的相似度为9/10=90%。当然,也可以通过其他方式来确定所述相同字母的数量,本申请实施例对此不作限定。

视实际情况的不同,所述预定范围可以灵活确定,比如可以为大于80%,也可以为大于90%,等等。假设将“在电子卡片数据索引库中查找是否存在相似度处于预定范围的数据库记录”称为“模糊匹配”,那么,若对该“模糊匹配”的匹配精度要求得比较高,则比如可以将该预定范围设置为大于95%,而若对匹配精度要求得比较低,则比如可以将该预定范围设置为大于75%,等等。具体哪个预定范围更适合于实际需求,可通过多次实验得出。

沿用上述关键词“软键公陈师李小明”的例子,由于在电子卡片数据索引库中没有查找到与“软键公陈师李小明”精确匹配的索引,那么,移动设备可以执行步骤103,即依据“软键公陈师李小明”进行ik分词处理后得到的查找词对应的拼音,在电子卡片数据索引库中查找是否存在相似度处于预定范围的数据库记录。

步骤104、若在所述数据库中查找到与所述关键词的相似度处于预定范围的数据库记录,则将所述保存的电子卡片数据中与查找到的数据库记录所映射的电子卡片数据,作为查找结果。

步骤104中,“将所述保存的电子卡片数据中与查找到的数据库记录所映射的电子卡片数据,作为查找结果”的一种具体实现方式包括:

将查找到的数据库记录作为查询关键词,对电子卡片数据索引库进行查找,以确定电子卡片数据索引库是否存在与该查询关键词精确匹配的索引。

如查找到,则将保存的电子卡片数据中与查找到的索引所映射的电子卡片数据,作为查找结果;若查找不到,则可以输出错误提示,以使得用户根据该提示调整自己输入的关键词。

例如,若假设在所述数据库中查找到的与关键词“软键公陈师李小明”的拼音“lixiaomin”相似度处于预定范围的数据库记录为“lixiaoming”,那么,移动设备根据数据库记录“lixiaoming”,在电子卡片数据索引库中进行查找,并将查找到的与“lixiaoming”精确匹配的索引所映射的“李晓明”的电子名片数据,作为查找结果显示在移动设备的显示区域上。如图2中所示,最终显示在移动设备1的显示区域12内的“李晓明的名片”。

进一步的,为了使得移动设备中存储的电子卡片数据索引库内的索引、数据库内的数据,与电子卡片数据同步更新,以避免根据关键词在电子卡片数据索引库中查找不到与关键词匹配的索引的情况发生。本申请方案通过根据电子卡片数据发生的变化,更新所述电子卡片数据索引库和所述数据库。例如,沿用上述的“李晓明”的电子名片的例子:

若“李晓明”的公司由“a数据科技有限公司”换成“b信息有限责任公司”,则针对对应于公司名称“a数据科技有限公司”的电子卡片数据,电子卡片数据索引库中保存的索引相应的变成:1)“b信息有限责任公司”;2)“b”、“信”、“息”、“有”、“限”、“责”、“任”、“公”、“司”;3)“bxinxiyouxianzerengongsi”;4)“b”、“xin”、“xi”、“you”、“xian”、“ze”、“ren”、“gong”、“si”;5)“b”、“信息”、“有限责任公司”;6)“b”、“youxian”、“zerengongsi”。

需要说明的是,实施例1所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤101和步骤102的执行主体可以为设备1,步骤103和步骤104的执行主体可以为设备2;又比如,步骤101的执行主体可以为设备1,步骤102、步骤103和步骤104的执行主体可以为设备2;等等。

本申请实施例1中,主要以电子名片数据为例,对本申请实施例提供的一种针对电子卡片数据的数据查找方法进行了介绍。在实际应用中,针对其他电子卡片的数据,如电子化的银行卡的数据(一般包括承载“银行名称”的数据)、电子会员卡数据(一般包括承载“商户名称”的数据)以及其他类型的电子卡片的某些数据(一般包括承载“电子卡片类型名称(如门禁卡或者公交卡等)”的数据)等,均可以采用该方法进行数据查找。采用本申请实施例提供的该方法对任意类型的电子卡片数据进行数据查找的方案,均包含在本申请的权利要求范围之内。

由于在电子卡片数据索引库中没有查找到与关键词精确匹配的索引时,可以继续查找与关键词的相似度处于预定范围的数据库记录,并将查找到的数据库记录所映射的电子卡片数据作为查找结果,因此,即便用户在查找的过程中输入了不太准确的关键词,采用本方案也能够得到与所述关键词的相似度处于预定范围的查找结果。本方案提升了对于关键词不准确性的容忍程度,解决了现有技术中存在的在用户输入的关键词不准确的情况下,按照现有技术提供的数据查找方法无法得到查找结果的问题。

实施例2

本实施例2基于一种针对电子卡片数据的信息查找方法的实现流程,如图3所示,以查找“李晓明的名片”为场景,所述方法包括如下步骤:

步骤301、用户在移动设备的显示界面上的用于输入关键词的输入框内输入关键词;如,关键词为“李晓明的名片”。

步骤302、精简关键词,如将“李小明的名片”精简为“李小明”。

步骤303、根据精简后的关键词,查找电子卡片数据索引库。

如,沿用上述的在电子卡片数据索引库中保存有“李晓明”的电子名片的例子,当用户需要查询“李晓明”的电子名片的电子卡片数据时,移动设备根据用户在输入框中输入的关键词“软键公陈师李小明的电子名片”,根据ik(ikanalyzer)分词方式对关键词进行分词处理后,“软键公陈师李小明”、“软”、“键”、“公陈师”、“李”、“晓”、“明”、“晓明”中的至少一个确定为查找词,以查找电子卡片数据索引库。

其中,移动设备的电子卡片数据索引库中保存的索引可以包括以下内容:

一、针对对应于名字“李晓明”的电子卡片数据,电子卡片数据索引库中保存的一条索引可以包括:1)“李晓明”;2)“李”、“晓”、“明”;3)“lixiaoming”;4)“li”、“xiao”、“ming”;5)“晓明”;6)“xiaoming”。

二、针对对应于公司名称“橙鑫数据科技有限公司”的电子卡片数据,电子卡片数据索引库中保存的一条索引可以包括:1)“橙鑫数据科技有限公司”;2)“橙”、“鑫”、“数”、“据”、“科”、“技”、“有”、“限”、“公”、“司”;3)“ashujukejiyouxiangongsi”;4)“cheng”、“xin”、“shu”、“ju”、“ke”、“ji”、“you”、“xian”、“gong”、“si”;5)“橙鑫”、“数据”、“科技”、“有限公司”;6)“chengxin”、“shuju”、“keji”、“youxiangongsi”。

三、针对对应于职位名称“软件工程师”的电子卡片数据,移动设备的电子卡片数据索引库中保存的一条索引可以包括:1)“软件工程师”;2)“软”、“件”、“工”、“程”、“师”;3)“ruanjiangongchengshi”;4)“ruan”、“jian”、“gong”、“cheng”、“shi”;5)“软件”、“工程师”;6)“ruanjian”、“gongchengshi”。

步骤304、若找到相同字的内容,执行结束动作。

步骤305、若未找到相同字的内容,则将关键词转换成拼音,查找电子卡片数据索引库。

步骤306、若找到相同音的内容,执行结束动作。

步骤307、若未找到相同音的内容,则根据与所述关键词相近的拼音,查找电子卡片数据索引库。

步骤308、若未找到相近音的内容,执行结束动作。

步骤309、若找到相近音的内容,则执行步骤305。

由于在电子卡片数据索引库中没有查找到与关键词精确匹配的索引时,可以继续查找与关键词的相似度处于预定范围的数据库记录,并将查找到的数据库记录所映射的电子卡片数据作为查找结果,因此,即便用户在查找的过程中输入了不太准确的关键词,采用本方案也能够得到与所述关键词的相似度处于预定范围的查找结果。本方案提升了对于关键词不准确性的容忍程度,解决了现有技术中存在的在用户输入的关键词不准确的情况下,按照现有技术提供的数据查找方法无法得到查找结果的问题。

实施例3

基于与本申请实施例1提供的一种针对电子卡片数据的信息查找方法同样的发明构思,本申请实施例还提供了一种针对电子卡片数据的信息查找装置,如图4所示。

图4为本申请实施例提供的一种针对电子卡片数据的信息查找装置结构示意图,所述装置包括:

获取模块41,用于获取用于查找电子卡片数据的关键词;

索引库查找模块42,用于根据所述关键词,查找电子卡片数据索引库;

数据库查找模块43,用于若索引库查找模块在所述电子卡片数据索引库中没有查找到与所述关键词精确匹配的索引,则查找数据库中是否存在与所述关键词的相似度处于预定范围的数据库记录;所述数据库中保存的数据库记录,包括根据保存的电子卡片数据确定的拼音;

结果获得模块44,用于若数据库查找模块在所述数据库中查找到与所述关键词的相似度处于预定范围的数据库记录,则将所述保存的电子卡片数据中与查找到的数据库记录所映射的电子卡片数据,作为查找结果。

其中,所述电子卡片数据索引库中保存的索引,包括按照预定的分词方式,对电子卡片数据进行分词处理后得到的分词处理第一结果和所述分词处理第一结果对应的拼音;

所述数据库记录所包括的拼音,为所述分词处理第一结果对应的拼音。

其中,所述分词方式,具体包括:ik分词方式;所述电子卡片数据索引库,利用lucene开源框架建立。

其中,所述关键词包括词组;则

所述索引库查找模块42包括:

词查找单元,用于基于词组确定的查找词,查找所述电子卡片数据索引库中保存的所述分词处理后得到的分词处理第一结果;

确定单元,用于在所述分词处理后得到的分词处理第一结果中,查找不到与所述查找词精确匹配的词,确定所述查找词的拼音;

拼音查找单元,用于根据所述查找词的拼音,查找所述电子卡片数据索引库中保存的所述分词处理第一结果对应的拼音。

其中,所述查找词,采用下述方式确定:利用所述分词方式,对所述词组进行分词处理,得到的分词处理第二结果作为所述查找词。

所述结果获得模块44包括:

索引查找单元,用于从电子卡片数据索引库中,查找与所述查找到数据库记录精确匹配的索引;

结果获取单元,用于将与所述查找到数据库记录精确匹配的索引所映射的电子卡片数据,作为查找结果。

所述装置还包括:

更新模块,用于根据电子卡片数据发生的变化,更新所述电子卡片数据索引库和所述数据库。

其中,所述电子卡片包括电子名片;所述电子卡片数据,包括用于承载姓名、公司名称、公司地址和职位中的至少一种的电子卡片数据。

由于在电子卡片数据索引库中没有查找到与关键词精确匹配的索引时,可以继续查找与关键词的相似度处于预定范围的数据库记录,并将查找到的数据库记录所映射的电子卡片数据作为查找结果,因此,即便用户在查找的过程中输入了不太准确的关键词,采用本方案也能够得到与所述关键词的相似度处于预定范围的查找结果。本方案提升了对于关键词不准确性的容忍程度,解决了现有技术中存在的在用户输入的关键词不准确的情况下,按照现有技术提供的数据查找方法无法得到查找结果的问题。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1