知识图谱融合方法与流程

文档序号:20010320发布日期:2020-02-22 04:02阅读:1372来源:国知局
知识图谱融合方法与流程

本发明属于人工智能技术领域,具体涉及一种知识图谱融合方法。



背景技术:

随着人工智能和知识图谱相关技术的发展,除了谷歌、百度等通用知识图谱应用方之外,越来越多的行业用户也开始考虑建设各自专业领域的知识图谱。如政府、公安、汽车、医疗等行业已经出现少量的领域知识图谱落地应用。

与通用知识图谱不同,领域知识图谱具有专业性,一般面向单个专业领域的应用,尚未实现跨领域的知识融合。另一方面,跨领域的知识融合是知识图谱未来的发展方向之一,是人工智能发展的必经之路。目前,由于技术所限,在本体概念差异较大的情况下,领域知识图谱难以像通用知识图谱一样实现跨领域的知识动态融合。

如图1,当公安部门希望应用公安知识图谱协助处理一起警察抓逃犯的案件时,可能会对汽车图谱、武器图谱、医药图谱等知识有查询需求。在知识体量日渐增长的趋势下,将所有知识都融入公安知识图谱并不现实。如何跨领域实现知识图谱的融合应用成为亟待解决的问题。

已出现的知识图谱融合方法主要面向知识图谱构建,将不同的知识图谱融合成一个较大的知识图谱。当知识图谱领域跨度较大、图谱数量较多、存储体量较大时,不同领域的知识结构难以对齐和融合。

经对现有知识图谱融合专利进行搜索查询,发现有三个典型专利涉及不同知识图谱的融合。第一个专利“一种基于约简锚点的大规模知识图谱融合方法”(申请号201810780963.6),主要包括:大规模知识图谱解析和预处理;约简集构造:计算两知识图谱实体间的语义描述文档相似度;确定正约简锚点和负约简锚点;混合匹配算法,根据约简锚点预测出后继匹配计算中大量无需计算的匹配位置;匹配结果抽取。此专利采用约简锚点方法实现知识图谱融合,且融合后将形成一个较大的知识图谱,不存在不同的知识图谱长期共存的场景。

第二个专利“一种融合多知识图谱的神经网络文本分类方法”(申请号:201810780502.9),主要包括:将训练集中文本输入至长短期记忆网络中,得到文本的上下文向量;对训练集中各文本抽取实体,在知识图谱中进行实体匹配;分别计算匹配到的各实体、知识图谱中各关系在上下文向量下的注意力权重,得到文本的总体实体向量、总体关系向量,进而得到事实三元组向量;计算不同知识图谱下的事实三元组向量,计算这些事实三元组的注意力权重,得到文本表征向量并输入到神经网络的全连接层,使用分类器计算各文本属于各类别的概率来训练网络;利用训练好的深度神经网络模型预测待预测文本所属类别。该方法提升了模型对文本语义的理解,可以更可靠、准确且鲁棒地对文本内容进行分类。此专利采用神经网络文本分类方式实现知识图谱融合,且融合后将形成一个较大的知识图谱,不存在不同的知识图谱长期共存的场景。

第三个专利“一种融合多背景知识的知识图谱嵌入方法”(申请号:201710549884.x),主要包括:1)从知识库的实体标签中选择优质的实体描述信息,从web语料中选择与实体相关的优质语料,构成多背景知识mck;2)通过嵌入多背景知识mck来学习知识库的嵌入表示;3)使用dbalstm模型从mck获得相应实体的语义嵌入向量;其中,dbalstm=深度d+双向b+关注a+基本lstm;4)将融合嵌入机制用于mck与rdf三元组的细粒度结合,完成融合多背景知识的知识图谱嵌入。本发明能提高知识图谱嵌入的准确性。此专利采用嵌入多背景知识mck方式实现知识图谱融合,且融合后将形成一个较大的知识图谱,不存在不同的知识图谱长期共存的场景。

总之,目前尚未出现通过知识路由方式实现跨领域知识图谱融合的解决方案。



技术实现要素:

(一)要解决的技术问题

本发明要解决的技术问题是:如何提供一种知识图谱融合方法。

(二)技术方案

为解决上述技术问题,本发明提供一种知识图谱融合方法,所述知识图谱融合方法基于知识图谱融合装置来实施,所述知识图谱融合装置包括:知识图谱接口服务器、知识融合协调器、业务应用模块;所述知识融合协调器包括:知识路由生成模块、知识路由更新模块、知识路由查询模块、知识路由转发模块;

所述知识图谱融合方法包括如下步骤:

步骤1:根据需求部署一定数量的知识融合协调器,多个知识融合协调器呈网状部署,形成知识融合协调器网,网内任意两个知识融合协调器路由可达;

步骤2:将所需领域的知识图谱接口服务器挂载到知识融合协调器上,每个知识融合协调器根据性能各自挂载相同/不同数量的知识图谱接口服务器;

步骤3:知识融合协调器从互联网获取知识路由表;并在知识融合协调器网内进行通告,同时根据设定更新规则,更新自身的知识路由表;

步骤4:当出现特定领域业务应用需求时,由此领域业务应用模块向该领域自有的知识图谱接口服务器发起知识查询需求,如果该领域自有的知识图谱接口服务器无法满足查询需求,则由该领域知识图谱接口服务器向其所挂载的知识融合协调器转发知识查询需求;

步骤5:知识融合协调器接到知识查询需求时,查询自身的知识路由表,并将知识查询需求转发到路由下一跳的知识融合协调器或目标知识图谱接口服务器;

步骤6:匹配的知识图谱接口服务器接收到本领域的知识查询需求时,根据知识查询需求返回特定领域知识,并最终由发起查询的业务应用模块进行知识组装和应用。

其中,所述业务应用模块为业务应用app。

其中,所述知识融合协调器从互联网获取知识路由表;

具体为:所述知识路由生成模块通过爬虫、人工设定的url地址列表及实体识别规则,从互联网爬取不同领域的相同实体,填入实体匹配列表;并以此实体匹配列表作为跨领域的知识接口,加上知识融合协调器的下一跳接口信息,形成知识路由表。

其中,所述在知识融合协调器网内进行通告,同时根据设定更新规则,更新自身的知识路由表;

具体为:知识路由更新模块用于在某个知识融合协调器的知识路由生成模块生成知识路由表后,在知识融合协调器网内通告,将该知识路由表通告至全网任一知识融合协调器;当另一知识融合协调器的知识路由更新模块收到来自别的知识融合协调器的知识路由表时,分析提取其中新的知识路由表信息,并更新至自身的知识路由表。

其中,所述知识融合协调器接到知识查询需求时,查询自身的知识路由表,并将知识查询需求转发到路由下一跳的知识融合协调器或目标知识图谱接口服务器;

具体为:若知识路由查询模块查询到匹配的知识路由,且该匹配的知识路由指向本知识融合协调器所挂载的满足查询请求的知识图谱接口服务器,则由知识路由转发模块将该条知识路由中的下一跳知识图谱接口服务器的地址信息返回给发起查询的业务应用模块;

如知识路由查询模块查询到匹配的知识路由,且该匹配的知识路由下一跳指向另一个路由可达的知识融合协调器,则由知识路由转发模块将该条知识路由中的下一跳知识融合协调器的地址信息返回给发起查询的业务应用模块,由业务应用模块向下一跳知识融合协调器地址发起知识路由查询请求,直至查询到匹配的知识图谱服务器地址为止;

业务应用模块根据查询到的匹配的知识图谱服务器地址,向该知识图谱服务器发起知识查询请求,由该知识图谱服务器向业务应用模块返回匹配的知识。

其中,所述知识融合协调器是单个装置,单个装置的情况下是单个模块、单个服务器或集群服务器。

其中,所述知识融合协调器是多个装置,多个装置的情况下直连或远程连接。

其中,所述知识融合协调器是多个装置的情况下呈网状、环形或星形布放。

其中,所述知识融合协调器是多个装置的情况下,任意两个装置之间实现路径可达。

其中,所述知识路由表为知识图谱查询的路由信息集合,用于在收到知识路由查询请求后,用于向路由查询方返回匹配查询的结果,结果即是匹配的知识路由下一跳信息;

所述知识路由表存在于知识融合协调器中,由知识融合协调器生成、更新,并在知识融合协调器网内进行通告;所述知识路由表中的知识路由呈条目排列,至少包括四列信息,每条知识路由中的信息具体定义如下:

(1)实体1:查询请求中的领域1知识图谱中的实体名称;

(2)关系:领域1知识图谱中的实体和领域2知识图谱中的实体匹配关系;

(3)实体2:领域2知识图谱中的实体名称;

(4)下一跳:领域2知识图谱接口服务器或路由可达领域2知识图谱接口服务器的知识融合协调器地址。

(三)有益效果

与现有技术相比较,本发明提出知识融合协调器、知识路由表、知识路由表生成过程、知识路由更新、知识路由通告过程、单个领域知识图谱服务器挂载知识融合协调器的过程、知识查询转发流程等。本发明提出的技术方案允许各领域知识图谱面向各自领域异步建设,无需考虑综合领域的本体概念,并通过知识融合协调器实现综合领域的动态融合应用,单一领域无需建设相关领域的综合性知识图谱,极大地提升知识图谱融合应用效率,减少重复工作,降低成本。

附图说明

图1为公安知识图谱的示例图。

图2为本发明技术方案示意图。

图3为知识路由表示意图。

具体实施方式

为使本发明的目的、内容、和优点更加清楚,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。

为解决现有技术问题,本发明提供一种知识图谱融合方法,所述知识图谱融合方法基于知识图谱融合装置来实施,所述知识图谱融合装置包括:知识图谱接口服务器、知识融合协调器、业务应用模块;所述知识融合协调器包括:知识路由生成模块、知识路由更新模块、知识路由查询模块、知识路由转发模块;

其中,知识融合协调器主要功能是实现跨领域的知识路由功能,匹配业务应用模块的知识查询需求,并向业务应用模块返回本协调器的下一跳接口,此接口指向与本知识融合协调器路由可达的其他知识融合协调器或待查询的专业领域的知识图谱;

知识路由表存在于知识融合协调器中,知识融合协调器通过人工设定的实体识别规则,获取跨领域的相同实体的匹配关系,形成实体匹配关系,并通过知识路由更新,获取全网知识融合协调器的知识路由通告,从而形成自身的知识路由表,为每次业务应用查询返回路由下一跳信息;

如图2所示,所述知识图谱融合方法包括如下步骤:

步骤1:根据需求部署一定数量的知识融合协调器,多个知识融合协调器呈网状部署,形成知识融合协调器网,网内任意两个知识融合协调器路由可达;

步骤2:将所需领域的知识图谱接口服务器通过互联网或其它网络远程挂载到知识融合协调器上,每个知识融合协调器根据性能各自挂载相同/不同数量的知识图谱接口服务器;

步骤3:知识融合协调器通过相关技术,从互联网获取知识路由表;并在知识融合协调器网内进行通告,同时根据设定更新规则,更新自身的知识路由表;

步骤4:当出现特定领域业务应用需求时,由此领域业务应用模块向该领域自有的知识图谱接口服务器发起知识查询需求,如果该领域自有的知识图谱接口服务器无法满足查询需求,则由该领域知识图谱接口服务器向其所挂载的知识融合协调器转发知识查询需求;

步骤5:知识融合协调器接到知识查询需求时,查询自身的知识路由表,并将知识查询需求转发到路由下一跳的知识融合协调器或目标知识图谱接口服务器;

步骤6:匹配的知识图谱接口服务器接收到本领域的知识查询需求时,根据知识查询需求返回特定领域知识,并最终由发起查询的业务应用模块进行知识组装和应用。

其中,所述业务应用模块为业务应用app。

其中,所述知识融合协调器通过相关技术,从互联网获取知识路由表;

具体为:所述知识路由生成模块通过爬虫、人工设定的url地址列表及实体识别规则,从互联网爬取不同领域的相同实体,填入实体匹配列表;并以此实体匹配列表作为跨领域的知识接口,加上知识融合协调器的下一跳接口信息,形成知识路由表。

其中,所述在知识融合协调器网内进行通告,同时根据设定更新规则,更新自身的知识路由表;

具体为:知识路由更新模块用于在某个知识融合协调器的知识路由生成模块生成知识路由表后,在知识融合协调器网内通告,将该知识路由表通告至全网任一知识融合协调器;当另一知识融合协调器的知识路由更新模块收到来自别的知识融合协调器的知识路由表时,分析提取其中新的知识路由表信息,并更新至自身的知识路由表。

其中,所述知识融合协调器接到知识查询需求时,查询自身的知识路由表,并将知识查询需求转发到路由下一跳的知识融合协调器或目标知识图谱接口服务器;

具体为:若知识路由查询模块查询到匹配的知识路由,且该匹配的知识路由指向本知识融合协调器所挂载的满足查询请求的知识图谱接口服务器,则由知识路由转发模块将该条知识路由中的下一跳知识图谱接口服务器的地址信息返回给发起查询的业务应用模块;

如知识路由查询模块查询到匹配的知识路由,且该匹配的知识路由下一跳指向另一个路由可达的知识融合协调器,则由知识路由转发模块将该条知识路由中的下一跳知识融合协调器的地址信息返回给发起查询的业务应用模块,由业务应用模块向下一跳知识融合协调器地址发起知识路由查询请求,直至查询到匹配的知识图谱服务器地址为止;

业务应用模块根据查询到的匹配的知识图谱服务器地址,向该知识图谱服务器发起知识查询请求,由该知识图谱服务器向业务应用模块返回匹配的知识。

其中,所述知识融合协调器是单个装置,也可以是多个装置。单个装置可以是单个模块、单个服务器或集群服务器等,形态不限。多个装置可以直连或远程连接,呈网状、环形、星形布放,任意两个装置之间实现路径可达。

其中,如图3所示,所述知识路由表为知识图谱查询的路由信息集合,用于在收到知识路由查询请求后,用于向路由查询方返回匹配查询的结果,结果即是匹配的知识路由下一跳信息;

所述知识路由表存在于知识融合协调器中,由知识融合协调器生成、更新、保存、删除,并在知识融合协调器网内进行通告、计算;所述知识路由表中的知识路由呈条目排列,至少包括四列信息,每条知识路由中的信息具体定义如下:

(1)实体1(领域1):查询请求中的领域1知识图谱中的实体名称;

(2)关系:领域1知识图谱中的实体和领域2知识图谱中的实体匹配关系;

(3)实体2(领域2):领域2知识图谱中的实体名称;

(4)下一跳:领域2知识图谱接口服务器或路由可达领域2知识图谱接口服务器的知识融合协调器地址。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1