电子证照检索方法、装置和计算机可读介质与流程

文档序号:22813438发布日期:2020-11-04 10:50阅读:318来源:国知局
电子证照检索方法、装置和计算机可读介质与流程

本发明涉及信息管理领域,特别涉及电子证照检索方法、装置和计算机可读介质。



背景技术:

随着《gb/t36901-2018电子证照总体技术架构》等6项电子证照国家标准,以及《c0126-2018国家政务服务平台数据交换与共享接口标准》等电子证照跨区域共享标准的发布,为实现电子证照的跨层级、跨部门、跨区域互认共享以及推动证照类政务信息资源整合共享等提供了标准支持。因此使得电子证照数据量持续上升,用户的检索需求也随之增多,需要电子证照库可以针对不同类型的证照支持多种检索需求,从而导致对电子证照库的数据检索能力提出更高的要求。

不同类型的电子证照数据均由基础信息项和业务信息项组成,各类电子证件照的基础信息项的数据特点与检索需求相似,而业务信息项的数据取值和分布等特点却与检索需求存在极大差异,因此增加了推广电子证照实际应用的难度,很难实现针对电子证照的多种组合检索需求的快速检索。



技术实现要素:

本发明提供了电子证照检索方法、装置和计算机可读介质,能够实现对电子证照的快速检索。

第一方面,本发明实施例提供了电子证照检索方法,包括:

获取至少一个第一电子证照中每一个第一电子证照的基础信息和业务信息;

针对每一个业务信息,根据该业务信息所对应的数据类型、数据分布特征和存储方式,确定用于对该业务信息进行标识的标识信息;

分别为每一个所述第一电子证照创建相对应的id,其中,不同的所述第一电子证照对应有不同的id;

生成电子证照数据模型,其中,所述电子证照数据模型表征每一个所述第一电子证照的基础信息、业务信息、标识信息和id之间的对应关系;

从所述至少一个第一电子证照中随机抽取至少一个第二电子证照,并从所述电子证照数据模型中获取每一个所述第二电子证照的业务信息和标识信息;

针对每一个所述第二电子证照,根据该第二电子证照的业务信息的存储方式确定相对应的第一索引模型,其中,不同的存储方式对应有不同的索引模型;

按照决策树算法在每一个所述第一索引模型中分别对每一个所述第二电子证照的业务信息和标识信息进行处理,获得决策树;

确定待检索电子证照数据的检索场景,其中,所述检索场景中包括有至少两个业务信息;

将所述检索场景输入所述决策树,以从各所述第一索引模型中确定出与所述待检索电子证照数据最匹配的第二索引模型;

利用所述第二索引模型确定与所述检索场景相对应的目标id;

根据目标id从所述电子证照数据模型中获取所述待检索电子证照数据。

可选地,所述分别为每一个所述第一电子证照创建相对应的id,包括:

从至少一个预设电子证照类型中,确定所述第一电子证照对应的目标电子证照类型;

确定所述目标电子证照类型对应的目标号段;

确定最新电子证照对应的所述id,其中,所述最新电子证照为所述目标电子证照类型对应的电子证照中在所述电子证照数据模型上存储的时间最短的电子证照;

根据所述最新电子证照对应的所述id,生成所述第一电子证照对应的所述id。

可选地,所述按照决策树算法在每一个所述第一索引模型中分别对每一个所述第二电子证照的业务信息和标识信息进行处理,获得决策树,包括:

确定电子证照数据模型所对应的检索场景,其中,所述电子证照数据模型与所述待检索电子证照数据对应相同的检索场景;

根据所述检索场景确定检索类型,其中,所述检索类型为精确检索或模糊检索;

根据检索类型按照决策树算法在每一个所述第一索引模型中分别对每一个所述第二电子证照的业务信息和标识信息进行处理,获得业务信息所对应字段的评分;

根据所述业务信息所对应的所述评分,按照预先设置的决策树规则建立决策树。

可选地,所述将所述检索场景输入所述决策树,以从各所述第一索引模型中确定出与所述待检索电子证照数据最匹配的第二索引模型,包括:

根据所述检索场景确定检索类型,其中,所述检索类型为精确检索或模糊检索;

确定所述检索场景中每一个业务信息所对应的标识信息;

将所述检索场景中各业务信息所对应的标识信息输入所述决策树,获得在所述检索场景的检索类型下每一个所述第一索引模型的得分;

将所述检索场景的检索类型下对应得分最高的一个所述第一索引模型确定为所述第二索引模型。

可选地,所述利用所述第二索引模型确定与所述检索场景相对应的目标id,包括:

确定所述检索场景所包括的每一个所述业务信息所属的目标字段;

建立查询模型,其中,所述查询模型中包括有从所述电子证照数据模型中位于所述目标字段下的所有业务信息和每一个所述业务信息所属的所述第一电子证照的id;

利用所述第二索引模型从所述查询模型中确定与所述检索场景相对应的目标id。

第二方面,本发明实施例还提供了电子证照检索装置,包括:获取模块、生成模块、创建模块、确定模块和检索模块;

所述获取模块,用于获取至少一个第一电子证照中每一个第一电子证照的基础信息和业务信息,并针对每一个业务信息,根据该业务信息所对应的数据类型、数据分布特征和存储方式,确定用于对该业务信息进行标识的标识信息,以及分别为每一个所述第一电子证照创建相对应的id,其中,不同的所述第一电子证照对应有不同的id;

所述生成模块,用于生成电子证照数据模型,其中,所述电子证照数据模型表征由所述获取模块获取到的每一个所述第一电子证照的基础信息、业务信息、标识信息和id之间的对应关系;

所述创建模块,用于从所述至少一个第一电子证照中随机抽取至少一个第二电子证照,并从所述生成模块生成的所述电子证照数据模型中获取每一个所述第二电子证照的业务信息和标识信息,以及针对每一个所述第二电子证照,根据该第二电子证照的业务信息的存储方式确定相对应的第一索引模型,并按照决策树算法在每一个所述第一索引模型中分别对每一个所述第二电子证照的业务信息和标识信息进行处理,获得决策树,其中,不同的存储方式对应有不同的索引模型;

所述确定模块,用于确定待检索电子证照数据的检索场景,将所述检索场景输入由所述创建模块获得的所述决策树,以从各所述第一索引模型中确定出与所述待检索电子证照数据最匹配的第二索引模型,其中,所述检索场景中包括有至少两个业务信息;

所述检索模块,用于利用由所述确定模块确定的所述第二索引模型确定与所述检索场景相对应的目标id,根据目标id从由所述生成模块生成的所述电子证照数据模型中获取所述待检索电子证照数据。

可选地,

所述获取模块,在执行所述分别为每一个所述第一电子证照创建相对应的id时,用于执行下述操作:

从至少一个预设电子证照类型中,确定所述第一电子证照对应的目标电子证照类型,确定所述目标电子证照类型对应的目标号段;

确定最新电子证照对应的所述id,其中,所述最新电子证照为所述目标电子证照类型对应的电子证照中在所述电子证照数据模型上存储的时间最短的电子证照;

根据所述最新电子证照对应的所述id,生成所述第一电子证照对应的所述id。

可选地,

所述创建模块,在执行所述按照决策树算法在每一个所述第一索引模型中分别对每一个所述第二电子证照的业务信息和标识信息进行处理,获得决策树时,用于执行下述操作:

确定电子证照数据模型所对应的检索场景,其中,所述电子证照数据模型与所述待检索电子证照数据对应相同的检索场景;

根据所述检索场景确定检索类型,其中,所述检索类型为精确检索或模糊检索;

根据检索类型按照决策树算法在每一个所述第一索引模型中分别对每一个所述第二电子证照的业务信息和标识信息进行处理,获得业务信息所对应字段的评分;

根据所述业务信息所对应的所述评分,按照预先设置的决策树规则建立决策树。

可选地,

所述确定模块,在执行所述将所述检索场景输入所述决策树,以从各所述第一索引模型中确定出与所述待检索电子证照数据最匹配的第二索引模型时,用于执行下述操作:

根据所述检索场景确定检索类型,确定所述检索场景中每一个业务信息所对应的标识信息,其中,所述检索类型为精确检索或模糊检索;

将所述检索场景中各业务信息所对应的标识信息输入所述决策树,获得在所述检索场景的检索类型下每一个所述第一索引模型的得分;

将所述检索场景的检索类型下对应得分最高的一个所述第一索引模型确定为所述第二索引模型。

可选地,

所述检索模块,在执行所述利用由所述确定模块确定的所述第二索引模型确定与所述检索场景相对应的目标id时,用于执行下述操作:

确定所述检索场景所包括的每一个所述业务信息所属的目标字段;

建立查询模型,其中,所述查询模型包括有所述电子证照数据模型中位于所述目标字段下的所有业务信息和每一个所述业务信息所属的所述第一电子证照的id;

利用所述第二索引模型从所述查询模型中确定与所述检索场景相对应的目标id。

第三方面,本发明实施例还提供了电子证照检索装置,包括:至少一个存储器和至少一个处理器;

所述至少一个存储器,用于存储机器可读程序;

所述至少一个处理器,用于调用所述机器可读程序,执行上述第一方面或第一方面的任一可能的实现方式所提供的电子证照检索方法。

第四方面,本发明还提供了计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行上述第一方面或第一方面的任一可能的实现方式所提供的电子证照检索方法。

本发明实施例提供的电子证照检索方法、装置和计算机可读介质,通过生成表征每一个电子证照的基本信息、业务信息、标识信息和id之间对应关系的电子证照数据模型,从该电子证照数据模型中获取由至少一个第二电子证照组成的样本数据,并获取每一个第二电子证照的业务信息和标识信息,再确定第一索引模型,按照决策树算法在每一个第一索引模型中对每个第二电子证照的业务信息和标识信息进行处理,建立决策树,将待检索电子证照数据的检索场景输入决策树中,以确定与待检索电子证照数据最匹配的第二索引模型,利用该索引模型获取与待检索场景相对应的目标id,以根据该目标id从电子证照数据模型中获取待检索电子证照数据。由此可见,首先生成包括所有电子证照信息的电子证照数据模型,针对待检索电子证照数据的多条件组合检索场景,利用该电子证照数据模型的样本数据创建决策树,如此以利用决策树选择最匹配的索引模型,实现针对多条件组合检索的快速检索,提高了在复杂检索条件下的检索效率,能够实现对电子证照的快速检索。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一个实施例提供的一种电子证照检索方法的流程图;

图2是本发明一个实施例提供的一种电子证照检索装置所在设备的示意图;

图3是本发明一个实施例提供的一种电子证照检索装置的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明一个实施例提供了一种电子证照检索方法,该方法可以包括如下步骤:

步骤101:获取至少一个第一电子证照中每一个第一电子证照的基础信息和业务信息;

步骤102:针对每一个业务信息,根据该业务信息所对应的数据类型、数据分布特征和存储方式,确定用于对该业务信息进行标识的标识信息;

步骤103:分别为每一个第一电子证照创建相对应的id,其中,不同的第一电子证照对应有不同的id;

步骤104:生成电子证照数据模型,其中,电子证照数据模型表征每一个第一电子证照的基础信息、业务信息、标识信息和id之间的对应关系;

步骤105:从至少一个第一电子证照中随机抽取至少一个第二电子证照,并从电子证照数据模型中获取每一个第二电子证照的业务信息和标识信息;

步骤106:针对每一个第二电子证照,根据该第二电子证照的业务信息的存储方式确定相对应的第一索引模型,其中,不同的存储方式对应有不同的索引模型;

步骤107:按照决策树算法在每一个第一索引模型中分别对每一个第二电子证照的业务信息和标识信息进行处理,获得决策树;

步骤108:确定待检索电子证照数据的检索场景,其中,检索场景中包括有至少两个业务信息;

步骤109:将检索场景输入决策树,以从各第一索引模型中确定出与待检索电子证照数据最匹配的第二索引模型;

步骤110:利用第二索引模型确定与检索场景相对应的目标id,根据目标id从电子证照数据模型中获取待检索电子证照数据。

本发明实施例提供的电子证照检索方法,该方法通过生成表征每一个电子证照的基本信息、业务信息、标识信息和id之间对应关系的电子证照数据模型,从该电子证照数据模型中获取由至少一个第二电子证照组成的样本数据,并获取每一个第二电子证照的业务信息和标识信息,再确定第一索引模型,按照决策树算法在每一个第一索引模型中对所有第二电子证照的业务信息和标识信息进行处理,建立决策树,将待检索电子证照数据的检索场景输入决策树中,以确定与待检索电子证照数据最匹配的第二索引模型,利用该索引模型获取与待检索场景相对应的目标id,以根据该目标id从电子证照数据模型中获取待检索电子证照数据。由此可见,通过生成包括所有电子证照信息和标识信息的电子证照数据模型,针对待检索电子证照数据的多条件组合检索场景,利用该电子证照数据模型的样本数据创建决策树,如此以利用决策树选择最匹配的索引模型,实现针对多条件组合检索的快速检索,提高了在复杂检索条件下的检索效率,能够实现对电子证照的快速检索。

在本发明实施例中,根据业务信息所对应的数据类型、数据分布特征和存储方式,确定用于对该业务信息进行标识的标识信息,如此根据预先设置的规则可以将与检索需求存在极大差异的业务信息项的数据类型、数据分布特征、存储方式等特点归一化,从而根据标识信息进行检索,降低了检索难度,同时降低了电子证照实际应用的推广难度。

例如,获取营业执照数据中所有电子证照的基础信息和业务信息,基础信息可以包括法人和注册编号,业务信息可以包括法定代表人、住所等,根据预先设置的规则,数据类型包括:文本型、数字型、日期型和其他,与之相对应的标识信息分别记为1、2、3、4;数据分布特征包括:无重复、重复率低于十万分之一、重复率低于万分之一、重复率低于万分之一和其他,与之相对应的标识信息分别记为1、2、3、4、5;存储方式包括:单表存储、分表存储、哈希分表存储,与之相对应的标识信息分别记为1、2、3等。其中法定代表人的数据类型为文本型,其标识信息记为1,法人代表的数据分布特征为重复率低于十万分之一,其标识信息记为2,法定代表人的存储方式为分表存储,其标识信息记为2。

在本发明实施例中,按照决策树算法在每一个第一索引模型中分别对每一个第二电子证照的业务信息和标识信息进行处理,获得决策树,通过决策树可以判断每一个第一索引模型进行检索的可行性,能够直观运用概率分析,应用于电子证照检索方法中,使得确定检索模型的方法更加科学和可靠,从而利用可靠的检索模型,实现对电子证照的快速且精确的检索。

在本发明实施例中,利用第二索引模型确定与检索场景相对应的目标id,以根据目标id从电子证照数据模型中获取待检索电子证照数据,由于id具有唯一性,如此在确定目标id后,可以更准确快速地实现对待检索电子证照数据的获取。

可选地,在图1所示电子证照检索方法中,步骤103分别为每一个所述第一电子证照创建相对应的id,首先从至少一个预设电子证照类型中,确定第一电子证照对应的目标电子证照类型,并确定该目标电子证照类型对应的目标号段,再确定最新电子证照对应的id,其中,最新电子证照为目标电子证照类型对应的电子证照中在电子证照数据模型上存储的时间最短的电子证照,然后根据最新电子证照对应的id,生成第一电子证照对应的id。具体方式如下:

根据预设的电子证照类型,确定第一电子证照所属的目标电子证照类型,从而进一步确定该目标电子证照的目标号段,即同一类电子证照中各个第一电子证照的各个id的相同号段,然后确定当前最新存储的一个第一电子证照的id,以根据该id生成该第一电子证照对应的id。

为了便于查找同一业务类型的电子证照,不同的电子证照类型对应的号段不同。例如,学生证的号段为a12020,驾驶证的号段为b12020,营业执照对应的号段为c12020。具体地,若当前最新存储的营业执照对应的id号段为c12020028,再储存一个新的营业执照,则其id为c12020029,且该id唯一对应一个电子证照。

在本发明实施例中,针对每一个第二电子证照,根据该第二电子证照的业务信息的存储方式确定相对应的第一索引模型,其中,不同的存储方式对应有不同的索引模型,比如,接前例所述,营业执照中法定代表人信息项的存储方式为分表存储,则该存储方式的标识信息记为2,与其相对应的索引模型是索引表二级索引,且对于不同存储方式对应有不同的索引模型,其中,索引模型包括有es索引、索引表二级索引、哈希索引等。

可选地,在图1所示电子证照检索方法中,步骤107按照决策树算法在每一个第一索引模型中分别对每一个第二电子证照的业务信息和标识信息进行处理,获得决策树,首先确定电子证照数据模型所对应的检索场景,再根据检索场景确定检索类型,然后根据检索类型按照决策树算法在每一个第一索引模型中分别对每一个第二电子证照的业务信息和标识信息进行处理,获得业务信息所对应字段的评分,最后根据业务信息所对应的评分,按照预先设置的决策树规则建立决策树,其中,电子证照数据模型与待检索电子证照数据对应相同的检索场景,检索类型为精确检索或模糊检索。具体方式如下:

确定电子证照数据模型所对应的检索场景,再根据该检索场景确定检索类型,根据检索类型按照决策树算法在每一个第一索引模型中分别对每一个第二电子证照的业务信息和标识信息进行处理,获取每一个业务信息所对应字段的评分,根据不同业务信息对应的评分按照预先设置的决策树规则建立决策树。

例如,接前例所述,电子证照数据模型中包括有1000个营业执照,确定该电子证照数据模型的检索场景为检索张三在a地的营业执照数据,确定检索类型为精确检索,然后抽取100个营业执照(即第二电子证照),获取其的标识信息,即这100个营业执照中每一个营业执照的法定代表人、住所以及其他业务信息的标识信息,按照决策树算法测试100个营业执照的标识信息在每一个索引模型中以精确检索的效率,从而获取法定代表人、住所及其他业务信息项评分,将最高评分的业务信息项作为根节点,再根据评分高低依次选择各级叶子节点,从而建立决策树。

在本发明实施例中,确定待检索电子证照数据的检索场景,其中,检索场景中包括有至少两个业务信息,即待检索场景为多条件检索,而非单一条件检索,例如,接前例所述,检索场景为检索张三在a地的营业执照数据或检索张三于2010-2020年间在a地的营业执照数据。

可选地,在图1所示电子证照检索方法中,步骤109将检索场景输入决策树,以从各第一索引模型中确定出与待检索电子证照数据最匹配的第二索引模型,首先根据检索场景确定检索类型,确定检索场景中每一个业务信息所对应的标识信息,将检索场景中各业务信息所对应的标识信息输入决策树,以获得在该检索类型下每一个第一索引模型的得分,然后将检索场景的检索类型下对应得分最高的一个第一索引模型确定为第二索引模型,其中,检索类型为精确检索或模糊检索。具体方式如下:

在获得决策树之后,根据检索场景确定检索类型,并确定检索场景中每一个业务信息对应标识信息,在将获取到的所述标识信息输入到决策树中,以获得在该检索类型下每一个索引模型的得分,则对应得分最高的索引模型为与待检索电子证照数据最匹配的索引模型。

例如,接前例所述,确定待检索电子证照数据的检索场景,即确定检索场景为检索张三在a地的营业执照数据,检索类型为精确检索,确定法定代表人张三和住所a地对应的标识信息,将该标识信息输入至创建的决策树中,获得各个索引模型在精确检索下的得分情况分别为:哈希索引模型的得分为0.11,索引表二级索引的得分为0.11,es索引模型的得分为0.875,则确定最高得分为0.875的es索引模型为与该检索场景最匹配的索引模型。

可选地,在图1所示电子证照检索方法中,步骤110利用第二索引模型确定与检索场景相对应的目标id,首先确定检索场景所包括的每一个业务信息的目标字段,建立查询模型,利用第二索引模型从查询模型中确定与检索场景相对应的目标id,其中,查询模型中包括有从电子证照数据模型中位于目标字段下的所有业务信息和每一个业务信息所属的第一电子证照的id。具体方式如下:

确定检索场景所包括的每一个业务信息所属的目标字段,建立查询模型,该查询模型中仅包括从电子证照数据模型中获取的位于该目标字段下的所有业务信息和每一个业务信息所属的第一电子证照的id,利用与待检索电子证照数据最匹配的索引模型从查询模型中确定与该检索场景相对应的目标id,以通过该目标id从电子证照数据模型中获取与该目标id对应的完整的电子证照数据。

在本发明实施例中,通过建立查询模型避免了从冗杂繁多的数据中查找目标id,以便更加快速的检索到目标id,从而根据唯一的目标id在电子证照数据模型中定位待检索电子证照数据,并获取符合检索场景的完整的电子证照元数据,因此进一步提高了针对多条件电子证照检索的检索效率。

为了更加清楚地说明本发明的技术方案及优点,下面对本发明实施例提供的电子证照检索方法进行详细说明,具体包括:

步骤s1:获取至少一个第一电子证照中每一个第一电子证照的基础信息和业务信息。

步骤s2:针对每一个业务信息,根据该业务信息所对应的数据类型、数据分布特征和存储方式,确定用于对该业务信息进行标识的标识信息。

步骤s3:分别为每一个第一电子证照创建相对应的id。

具体地,从至少一个预设电子证照类型中,确定第一电子证照对应的目标电子证照类型,并确定该目标电子证照类型对应的目标号段,再确定最新电子证照对应的id,然后根据最新电子证照对应的id,生成第一电子证照对应的id,其中,最新电子证照为目标电子证照类型对应的电子证照中在电子证照数据模型上存储的时间最短的电子证照,不同的第一电子证照对应有不同的id。

步骤s4:生成电子证照数据模型。

具体地,电子证照数据模型表征每一个第一电子证照的基础信息、业务信息、标识信息和id之间的对应关系。

步骤s5:从至少一个第一电子证照中随机抽取至少一个第二电子证照,并从电子证照数据模型中获取每一个第二电子证照的业务信息和标识信息。

步骤s6:针对每一个第二电子证照,根据该第二电子证照的业务信息的存储方式确定相对应的第一索引模型。

具体地,不同的存储方式对应有不同的索引模型。

步骤s7:按照决策树算法在每一个第一索引模型中分别对每一个第二电子证照的业务信息和标识信息进行处理,获得决策树。

具体地,确定电子证照数据模型所对应的检索场景,再根据检索场景确定检索类型,然后根据检索类型按照决策树算法在每一个第一索引模型中分别对每一个第二电子证照的业务信息和标识信息进行处理,获得业务信息所对应字段的评分,最后根据业务信息所对应的评分,按照预先设置的决策树规则建立决策树,其中,电子证照数据模型与待检索电子证照数据对应相同的检索场景,检索类型为精确检索或模糊检索。

步骤s8:确定待检索电子证照数据的检索场景。

具体地,检索场景中包括有至少两个业务信息。

步骤s9:将检索场景输入决策树,以从各第一索引模型中确定出与待检索电子证照数据最匹配的第二索引模型。

具体地,根据检索场景确定检索类型,确定检索场景中每一个业务信息所对应的标识信息,将检索场景中各业务信息所对应的标识信息输入决策树,以获得在该检索类型下每一个第一索引模型的得分,然后将检索场景的检索类型下对应得分最高的一个第一索引模型确定为第二索引模型,其中,检索类型为精确检索或模糊检索。

步骤s10:利用第二索引模型确定与检索场景相对应的目标id,根据目标id从电子证照数据模型中获取待检索电子证照数据。

具体地,确定检索场景所包括的每一个业务信息的目标字段,建立查询模型,利用第二索引模型从查询模型中确定与检索场景相对应的目标id,其中,查询模型中包括有从电子证照数据模型中位于目标字段下的所有业务信息和每一个业务信息所属的第一电子证照的id。

如图2、图3所示,本发明实施例提供了电子证照检索装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图2所示,为本发明实施例提供的电子证照检索装置所在设备的一种硬件结构图,除了图2所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图3所示,作为一个逻辑意义上的装置,是通过其所在设备的cpu将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。本实施例提供的电子证照检索装置,包括:获取模块301、生成模块302、创建模块303、确定模块304和检索模块305;

获取模块301,用于获取至少一个第一电子证照中每一个第一电子证照的基础信息和业务信息,并针对每一个业务信息,根据该业务信息所对应的数据类型、数据分布特征和存储方式,确定用于对该业务信息进行标识的标识信息,以及分别为每一个第一电子证照创建相对应的id,其中,不同的第一电子证照对应有不同的id;

生成模块302,用于生成电子证照数据模型,其中,电子证照数据模型表征由获取模块301获取到的每一个第一电子证照的基础信息、业务信息、标识信息和id之间的对应关系;

创建模块303,用于从至少一个第一电子证照中随机抽取至少一个第二电子证照,并从生成模块302生成的电子证照数据模型中获取每一个第二电子证照的业务信息和标识信息,以及针对每一个第二电子证照,根据该第二电子证照的业务信息的存储方式确定相对应的第一索引模型,并按照决策树算法在每一个第一索引模型中分别对每一个第二电子证照的业务信息和标识信息进行处理,获得决策树,其中,不同的存储方式对应有不同的索引模型;

确定模块304,用于确定待检索电子证照数据的检索场景,将检索场景输入由创建模块303获得的决策树,以从各第一索引模型中确定出与待检索电子证照数据最匹配的第二索引模型,其中,检索场景中包括有至少两个业务信息;

检索模块305,用于利用由确定模块304确定的第二索引模型确定与检索场景相对应的目标id,根据目标id从由生成模块302生成的电子证照数据模型中获取待检索电子证照数据。

在本发明实施例中,在图3所示电子证照检索装置的基础上,获取模块301在执行分别为每一个第一电子证照创建相对应的id时,用于执行下述操作:

从至少一个预设电子证照类型中,确定第一电子证照对应的目标电子证照类型,确定目标电子证照类型对应的目标号段;

确定最新电子证照对应的id,其中,最新电子证照为目标电子证照类型对应的电子证照中在电子证照数据模型上存储的时间最短的电子证照;

根据最新电子证照对应的id,生成第一电子证照对应的id.

在本发明实施例中,在图3所示电子证照检索装置的基础上,创建模块303在执行按照决策树算法在每一个第一索引模型中分别对每一个第二电子证照的业务信息和标识信息进行处理,获得决策树时,用于执行下述操作:

确定电子证照数据模型所对应的检索场景,其中,电子证照数据模型与待检索电子证照数据对应相同的检索场景;

根据检索场景确定检索类型,其中,检索类型为精确检索或模糊检索;

按照决策树算法在每一个第一索引模型中分别对每一个第二电子证照的业务信息和标识信息进行处理,获得业务信息所对应字段的评分;

根据业务信息所对应的评分,按照预先设置的决策树规则建立决策树。

在本发明实施例中,在图3所示电子证照检索装置的基础上,确定模块304在执行将检索场景输入决策树,以从各第一索引模型中确定出与待检索电子证照数据最匹配的第二索引模型时,用于执行下述操作:

根据检索场景确定检索类型,确定检索场景中每一个业务信息所对应的标识信息,其中,检索类型为精确检索或模糊检索;

将检索场景中各业务信息所对应的标识信息输入决策树,获得在检索场景的检索类型下每一个第一索引模型的得分;

将检索场景的检索类型下对应得分最高的一个第一索引模型确定为第二索引模型。

在本发明实施例中,在图3所示电子证照检索装置的基础上,检索模块305在执行利用由确定模块304确定的第二索引模型确定与检索场景相对应的目标id时,用于执行下述操作:

确定检索场景所包括的每一个业务信息所属的目标字段;

建立查询模型,其中,查询模型包括有电子证照数据模型中位于目标字段下的所有业务信息和每一个业务信息所属的第一电子证照的id;

利用第二索引模型从查询模型中确定与检索场景相对应的目标id。

可以理解的是,本发明实施例示意的结构并不构成对电子证照检索装置的具体限定。在本发明的另一些实施例中,电子证照检索装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。

上述装置内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

本发明实施例还提供了电子证照检索装置,包括:至少一个存储器和至少一个处理器;

所述至少一个存储器,用于存储机器可读程序;

所述至少一个处理器,用于调用所述机器可读程序,执行本发明任一实施例中的电子证照检索方法。

本发明实施例还提供了一种计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行本发明任一实施例中的电子证照检索方法。

具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或cpu或mpu)读出并执行存储在存储介质中的程序代码。

在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。

用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如cd-rom、cd-r、cd-rw、dvd-rom、dvd-ram、dvd-rw、dvd+rw)、磁带、非易失性存储卡和rom。可选择地,可以由通信网络从服务器计算机上下载程序代码。

此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。

此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展模块中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展模块上的cpu等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。

综上所述,本发明各个所述所提供的电子证照检索方法、装置和计算机可读介质,至少具有如下有益效果:

1、在本发明实施例中,通过生成表征每一个电子证照的基本信息、业务信息、标识信息和id之间对应关系的电子证照数据模型,从该电子证照数据模型中获取由至少一个第二电子证照组成的样本数据,并获取每一个第二电子证照的业务信息和标识信息,再确定第一索引模型,按照决策树算法在每一个第一索引模型中对每个第二电子证照的业务信息和标识信息进行处理,建立决策树,将待检索电子证照数据的检索场景输入决策树中,以确定与待检索电子证照数据最匹配的第二索引模型,利用该索引模型获取与待检索场景相对应的目标id,以根据该目标id从电子证照数据模型中获取待检索电子证照数据。由此可见,通过生成包括所有电子证照信息和标识信息的电子证照数据模型,针对待检索电子证照数据的多条件组合检索场景,利用该电子证照数据模型的样本数据创建决策树,如此以利用决策树选择最匹配的索引模型,实现针对多条件组合检索的快速检索,提高了在复杂检索条件下的检索效率,能够实现对电子证照的快速检索。

2、在本发明实施例中,根据业务信息所对应的数据类型、数据分布特征和存储方式,确定用于对该业务信息进行标识的标识信息,如此根据预先设置的规则可以将与检索需求存在极大差异的业务信息项的数据类型、数据分布特征、存储方式等特点归一化,从而根据标识信息进行检索,降低了检索难度,同时降低了电子证照实际应用的推广难度。

3、在本发明实施例中,按照决策树算法在每一个第一索引模型中分别对每一个第二电子证照的业务信息和标识信息进行处理,获得决策树,通过决策树可以判断每一个第一索引模型进行检索的可行性,能够直观运用概率分析,应用于电子证照检索方法中,使得确定检索模型的方法更加科学和可靠,从而利用可靠的检索模型,实现对电子证照的快速且精确的检索。

4、在本发明实施例中,通过建立查询模型避免了从冗杂繁多的数据中查找目标id,以便更加快速的检索到目标id,从而根据唯一的目标id在电子证照数据模型中定位待检索电子证照数据,并获取符合检索场景的完整的电子证照元数据,因此进一步提高了针对多条件电子证照检索的检索效率。

需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质中。

最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1