链接和处理不同的知识图的制作方法

文档序号:26844375发布日期:2021-10-09 00:00阅读:124来源:国知局
链接和处理不同的知识图的制作方法
链接和处理不同的知识图


背景技术:

1.本发明总体上涉及一种用于组合知识图的方法,并且更具体地涉及一种用于在存在第三知识图的情况下链接第一知识图和第二知识图的计算机实现的方法。本发明进一步涉及用于链接第一知识图和第二知识图的相关系统以及相关计算机程序产品。
2.在企业计算环境中,人工智能(ai)、机器学习(ml)、以及类似技术的需求量很大。目前,大量的企业应用在其分析能力或其用户界面上由ai支持的系统增强。同样,搜索引擎和相关系统很大程度上依赖于在ai领域中使用的技术。这些技术之一是使用知识图。知识图用于存储和处理信息。知识图包括存储在经由存储节点之间的关系的边的混搭(也称为“链接”)连接的顶点(也称为“节点”)中的事实(从不同源收集)。
3.典型的知识图的范围可以从约1百万到超过1亿个顶点。存储和管理知识图可能需要通常由高性能服务器和存储系统提供的大量存储。
4.在学习阶段和正常操作期间,始终添加节点并且在这些节点之间创建边,从而使得知识图不断扩展。
5.目前,已知如何将一个或多个次要知识图结合到主要知识图中或将它们链接为等同伙伴。然而,合并的知识图的访问权限和其他元数据不总是一致地管理或完全丢失。
6.存在与知识图管理相关的若干公开内容。
7.美国专利号9,792,530公开了如何生成知识库并将其用于对图像进行分类。知识库包括指定类别的多个子类别。不是仅基于类别名称来获得图像,而是使用结构化和非结构化数据源来识别类别的子类别。
8.美国专利申请公开2018/0052855公开了用于基于一个或多个图像的元数据来学习潜在兴趣的技术。分析工具对照知识图来评估与每个数字多媒体对象相关联的元数据,其中知识图由包括每个数字多媒体对象外部的信息的数据来构建,并且其中知识图提供多个属性。


技术实现要素:

9.根据本发明的一个方面,可以提供一种用于在存在第三知识图的情况下链接第一知识图和第二知识图的计算机实现的方法。知识图可各自包括通过边连接的节点。该方法可包括将第一知识图的节点的内容与第二知识图的节点的内容进行比较,以及如果第一知识图的节点具有与第二知识图的相关节点的内容关系,所述节点具有第一节点id,所述相关节点具有第二节点id,将由包括第一节点id和第一知识图的id的元组以及包括第二节点id和第二知识图的id的元组识别的边存储在元层知识图中。
10.该方法可以进一步包括将第三知识图的节点的内容与(a)第一知识图的节点的内容和(b)第二知识图的节点的内容进行比较。在确定第一知识图中具有第三节点id的第三节点与所述第三知识图中具有第四节点id的第四节点相关,以及第二知识图中具有第五节点id的第五节点与具有第六节点id的第六节点具有内容关系,第三知识图中第四节点与第六节点之间存在内容关系,将包括所述第一节点id和所述第一知识图的id的元组和包括所
述第五节点id和所述第二知识图的id的元组可识别的边存储在所述元层知识图中。
11.最后但并非最不重要,该方法还可以包括存储元层知识图的至少所有节点和边。
12.根据本发明的另一个方面,可以提供一种用于在第三存储器单元中的第三数据结构中存在第三知识图的情况下将第一知识图与第二知识图相链接的系统。同样,这里,知识图可各自包括通过边连接的节点。该系统可以包括比较单元,其适于比较第一知识图的节点的内容与第二知识图的节点的内容。
13.此外,该系统可以包括存储单元,该存储单元被适配成如果存在第一知识图的节点具有与第二知识图的相关节点的内容关系,所述节点具有第一节点id,所述相关节点具有第二节点id,将由包括第一节点id和第一知识图的id的元组以及包括第二节点id和第二知识图的id的元组识别的边存储在元层存储单元中的元层数据中的元层知识图中。
14.由此,比较单元还可以被适配成用于将第三知识图的节点的内容与(a)第一知识图的节点的内容和(b)第二知识图的节点的内容进行比较。
15.此外,该系统可以包括确定和存储模块,其适于在通过确定和存储模块确定第一知识图中具有第三节点id的第三节点与第三知识图中具有第四节点id的第四节点相关,并且第二知识图中具有第五节点id的第五节点与具有第六节点id的第六节点具有内容关系时,第三知识图中的第四节点和第六节点之间存在内容关系,在元层知识图中存储可通过包括第一节点id和第一知识图的id的元组和包括第五节点id和第二知识图的id的元组识别的边。确定和存储模块还可以适于存储至少所有的元层知识图的节点和边。
16.所提出的用于链接第一知识图和第二知识图的计算机实现的方法可以提供多个优点和技术效果。
17.在元层知识图未变成任何第一和/或第二知识图的组成部分的情况下,第一和第二知识图保持彼此完全独立。这两个知识图中的每一个可完全自主地管理并且可由不同的组成部分(例如,法律实体)拥有。从两个知识图中的一个的角度来看,第二知识图可处于只读模式。由此,该第二知识图可以不就附加节点或对边的改变由第一知识图的所有者改变。由此,根据所提出的想法的链接知识图的用户可主要访问元层,而不是直接访问第二知识图。元层还可适于管理给定用户的访问权限。
18.此外,如果知识图的所有者想要出售通过访问其知识图而启用的洞察,则仍有可能使用互连的知识图。如果用户被启用并且具有费用的知识图的入口节点将不可见,则元层将仅允许支付费用的附加知识图的遍历。
19.然而,两个知识图的用户也可以受益于访问另一方的知识图。由此,节点中的更多关系和更多事实和内容对于更大数量的用户可见和可访问。
20.在更简单的情况下,可能仅需要将知识图的识别符添加至至元层中的节点的链接的节点id。另外,反映在第三知识图中可用的信息的复杂的间接关系可被寻址,同时使原始的第一和第二知识图独立。作为表达附加和更高级关系的信息的源,可以使用任何种类的信息源:第三知识图、词典、储存库、相关术语的简单列表等。基本上,示出内容项之间的关系的每个信息源可用作催化工具以链接第一和第二知识图。还可以注意到,此第三信息源可以不变成元层或者第一和第二知识图中的任一个的完整直接分量。由此,第三方知识源和关系源可保持完全不变。这同样适用于原始的第一和第二知识图。可以在元层中维护第一知识图与第二知识图之间的完整互连信息。
21.通过在规则或动态调度上执行互连方法的选项,可以确保那些组成部分的用户总是可以访问第一和第二知识图上的最新交叉引用信息。
22.所提出的概念也已被开发成用于最小化执行图形操作所需的计算工作量。实际上,通过将知识图分离而不是将知识图合并到一个宏实体中,减少了执行知识图遍历所需的操作的数量。例如,假设存在分别具有节点数量n1、n2、n3的三个知识图。如果这些图将被合并在一起,则所工作的节点的数量变为n=n1+n2+n3

n
interlink
。众所周知,图遍历具有顺序o(n),其中n是图中节点的数量,使得合并图中的每个遍历操作将是o(n1+n2+n3

n
interlink
)。
23.使用在此提出的使用互连边(即,互连)的方法,大多数知识合作将避免遍历至少一个知识图。由此,可以假设:(i)在遍历开始知识图1时,找到与知识图2的互连;通过互连,到达知识图2中的相应节点;通过遍历知识图2,可以到达搜索的结果。
24.因此,这些操作的顺序是o(n1+n
interlink
+n2)。由此,n3>>n
interlink
,由此可显著减少计算工作量。还可以注意到,互连的知识图越多,该方法在计算上越有利,因为与经典方法中的所有节点相反,仅相关知识图将被遍历。
25.在下文中,将描述适用于该方法和系统的本发明构思的附加实施例。
26.根据该方法的一个允许的实施例,第三知识图可以是空的。因此,它不存在。在这种情况下,将不使用经由元数据层的简单整合。第一知识图中的节点的内容与第二知识图和节点的内容的简单相同的情况将不存在,并且仅两个知识图之间的更复杂的关系

以及潜在地第三个知识图之间的更复杂的关系

将适用于这里提出的概念。
27.根据该方法的一个有利实施例,第三知识图中的第四节点与第六节点之间的内容关系可以是直接边;具体地,连接第四节点和第六节点的边—即,包括在第三知识图中的两个节点。可替代地,第三知识图中的第四节点和第六节点可被间接链接,即经由一个或多个其他中间节点。但这样会削弱第四节点和第六节点之间的内容关系。例如,当第四节点和第六节点以及一个或多个中间节点之间的权重与第三知识图中的其他周围边相比可能相对较高时,可以使用这样的实施例。
28.根据该方法的一个有利实施例,第三知识图中第四节点与第六节点之间的内容关系由第四节点与第三知识图的至少一个链接节点之间的边以及链接节点与第六节点之间的边表示。
29.根据该方法的一个实施例,具有内容关系的不同知识图的节点可以包括相同的内容。该选项可以表示关系的最简单的情况。更复杂的关系可由同义词、依赖的术语或间接描述来表示。
30.根据该方法的一些实施例,具有内容关系的不同知识图的节点可以是使用模糊等式确定内容关系的那些节点,即,内容可以是相似的。这可以通过具有小于相对阈值的边距离的词语或词语集合来表示,例如,80%的词语被包围在嵌入式空间中,例如,用可用的文本语料库训练。可以使用数字已知的相似性算法、支持存储库或文本库。
31.其结果是,并且根据该方法的另一个可选实施例,具有内容关系的不同知识图的节点是相关节点的内容是同义词的那些节点。通常,这种同义词可以由第三和第四知识图来定义,该第三和第四知识图是有帮助的并且用作连接第一和第二知识图的催化剂。
32.根据该方法的一些实施例,第一知识图可以由第一知识图管理工具来管理,并且
第二知识图可以由第二知识图管理工具来管理。这两个独立的知识图管理工具以及第一和第二知识图的内容所有权可属于不同的组成部分,例如不同的法律实体。在这种情况下,第一知识图可以仅由第一法律实体(第一公司)的用户改变,并且第二知识图可以仅由第二法律实体(第二公司)的用户改变。由此,不同知识图的责任可保持被清楚地定义。
33.根据该方法的一些实施例,可以由第一知识图管理工具以只读模式访问第二知识图。因此,可以使用仅由第一知识图管理工具所有者控制的管理工具来执行所提出的准集成(之前还被标记为“链接”)。因此,可以预期第一组成部分对第二组成部分所拥有的知识图没有负面影响。
34.根据一些实施例,可以在规则的时间间隔内或之后执行该方法。由此,第一知识图与第二知识图之间的链接可以保持为当前的。时间间隔可以具有预定义的长度,或者时间间隔的长度可以例如基于表示第一和/或第二知识图中的变化速率的参数来动态地确定。同样的原理也可以应用于第三知识图。这还可表达如下:根据另一实施例,该方法可在基于变化索引确定的时间间隔上执行,该变化索引可以是第一知识图、第二知识图和/或第三知识图中的至少一个的多个变化的函数。
35.此外,实施例可以采取相关计算机程序产品的形式,该相关计算机程序产品可从计算机可用或计算机可读介质访问,该计算机可用或计算机可读介质提供用于由计算机或任何指令执行系统使用或与其结合使用的程序代码。出于本说明的目的,计算机可用或计算机可读介质可为可包含用于存储、传达、传播或传输供指令执行系统、设备或装置使用或结合指令执行系统、设备或装置使用的程序的装置的任何设备。
36.根据本发明的进一步的方面,一种计算机实现的方法(cim),计算机程序产品(cpp)和/或计算机系统执行以下操作(不一定按以下顺序):(a)接收分别表示包括第一图形和第二图形的多个对象识别图形的多个对象识别图数据集,其中多个对象识别图中的每个对象识别图包括:(i)分别表示可在图像中识别的物理对象的类型或类别的多个对象类型节点,以及(ii)分别连接对象识别图的对象类型节点的多个边,每条边表示由边连接的对象类型节点对之间的关系;(b)确定第一图的第一对象类型节点表示与第二图的第二对象类型节点相同类型或类别的物理对象;以及(c)响应于确定第一图的所述第一对象类型节点表示与第二图的第二对象类型节点相同类型或类别的物理对象,将第一互连添加到元数据层数据集,其中所述第一互连指示第一对象类型节点表示与第二图的第二对象类型节点相同类型或类别的物理对象。
附图说明
37.应注意的是,参考不同的主题描述了本发明的实施例。特别地,一些实施例参考方法类型权利要求来描述,而其他实施例参考装置类型权利要求来描述。然而,本领域的技术人员将从以上和以下说明中得出,除非另有说明,除了属于一种类型的主题的特征的任何组合之外,还涉及不同主题的特征之间的任何组合,特别是方法类型权利要求的特征之间的任何组合,以及装置类型权利要求的特征被视为公开在本文内。
38.以上定义的方面、以及本发明的其他方面从下文将描述的实施例的实例中是明显的,并且参考实施例的示例进行解释,但是本发明并不限于这些实施例。
39.将仅通过举例的方式并且参考以下附图来描述本发明的实施例。
40.图1示出了用于链接第一知识图和第二知识图的本发明计算机实现方法的实施例的框图。
41.图2示出了实施例的框图,该实施例包括两个独立的知识图以及具有元层的链接知识图。
42.图3示出了与图2的实施例相似的实施例的框图,不同之处在于使用了常识。
43.图4示出了使用第三知识图的顶点关系合并两个知识图的实施例的框图。
44.图5示出了包括第一知识图、第二知识图和第三知识图的实施例的简化框图。
45.图6示出了用于链接第一知识图和第二知识图的系统的实施例的框图。
46.图7示出了包括根据图6的系统的计算系统的实施例。
具体实施方式
47.本发明的一些实施例可以认识到相对于现有技术的改进和/或挑战的一个或多个问题、缺点、机会:(i)在存在第三知识图的情况下克服组合两个知识图中的现有困难的附加需要

表示一种基础事实;和/或(ii)可能需要克服在维持知识图环境(即,使用知识图来执行有用任务和/或获取有用信息的计算机系统和/或人)的不同承租人对节点的访问权限方面的现有困难。
48.在本说明书的上下文中,可以使用以下惯例、术语和/或表达式。
49.术语“知识图”(可以缩写为“kg”)可以表示数据结构

也可在硬件中实现

包括具有节点识别符(节点id)的节点。节点可以包括内容或事实,并且它们可以通过表达节点之间的关系的边链接(也称为连接)。节点还可表示为顶点或角顶。边可以具有表示两个不同节点之间的关系的强度值的相关加权因子值。在本文档的上下文中,引用独立的知识图,例如,第一知识图、第二知识图和至少一个第三知识图。
50.术语“在存在”可以表示存在某物发生的主题

例如,该第一知识图和该第二知识图的链接

可以充当一种催化剂或帮助结构以便促进该第一知识图和该第二知识图的链接而不作为该最终产品的一部分,即,链接的知识图。
51.术语“第三知识图”可以表示所谓的催化剂知识图。使用该表达式是因为即使在第一和第二知识图被链接之后,第三知识图仍可保持独立于第一和第二知识图。
52.术语“元层知识图
”‑
或简称“元层
”‑
可以表示独立于第一、第二和第三知识图的知识图。元层知识图可以使能第一和第二知识图的链接。在可以链接第一和第二知识图而不需要仅在第三知识图中可用的信息的实施例中,元层仅包括将第一知识图的节点链接至第二知识图的节点的边。
53.然而,节点也可以包括在元层中。这对于第三知识图的节点可能是有用的,因为使用第三知识图中的信息(以节点和相关边的形式)可以有助于确定第一知识图和第二知识图的节点之间的间接链接。
54.在一些实施例中,元层知识图与第一知识图和第二知识图独立地存在

例如,在单独的存储单元中。由此,不同的知识图可以在不同的硬件环境上在不同的安全机制下进行管理和维护,以促进对第一、第二和第三知识图的完全分开的所有权和管理访问权限。
55.术语”直接边”可以表示直接连接两个相关节点的边。相反,间接关系可由第一节点和第二节点之间的一个或多个中间节点表示。直接边可由节点id的元组来识别,每个节
点id表示该边所链接的节点之一。
56.在下文中,将给出附图的详细描述。附图中的所有说明都是示意性的。首先,给出用于链接第一知识图和第二知识图的本发明的计算机实现的方法的实施例的框图。之后,将描述另外的实施例以及用于链接第一知识图和第二知识图的系统的实施例。
57.图1示出了用于在第三知识图的存在下(即,由第三知识图催化)链接可能潜在地由不同组成部分(即,知识图的独立拥有者)拥有的第一知识图和第二知识图的计算机实现的方法100的实施例的框图。知识图各自包括通过边连接的节点。该方法包括将来自第一知识图的节点的内容与来自第二知识图的节点的内容进行比较102。
58.另外,方法100包括如果第一知识图的节点,即具有第一节点id的节点,与第二知识图的相关节点,即具有第二节点id的相关节点(尤其是相同内容或模糊相似内容)存在内容关系,则在元层知识图中存储(104)由包括第一节点id和第一知识图的id的元组识别的边,以及包括第二节点id和第二知识图的id的元组。
59.方法100还包括将第三知识图的节点的内容与(a)第一知识图的节点的内容和(b)第二知识图的节点的内容进行比较106。在确定第一知识图中的具有第三节点id的第三节点与第三知识图中的具有第四节点id的第四节点相关时,并且第二知识图中的具有第五节点id的第五节点与具有第六节点id的第六节点具有内容关系时,在第三知识图中的第四节点和第六节点之间存在由直接边表示或经由中间节点间接表示的内容关系的情况下,方法100包括在元层知识图中存储108可由包括第一节点id和第一知识图的id的元组和包括第五节点id和第二知识图的id的元组识别的边。
60.方法100还包括存储110元层知识图的至少所有节点和边。
61.图2示出了实施例的框图200,该实施例包括两个独立的知识图202、204和具有元层218的链接的知识图202、204。
62.第一知识图a 202包括例如四个节点,“马”206链接至“鞍”208,“鞍”208链接至“皮革”212以及还链接至“镫”210。
63.第二知识图b 204包括例如链接至节点“野马”216的节点“马”214。箭头222表示链接两个知识图202、204的过程。
64.如果确定知识图a202的节点206(“马”)的内容与知识图b204的节点214完全相同,可以通过在元层218中定义链接边220来建立链接,链接边220定义两个提及的节点之间,并且因此两个知识图之间的关系,由参考数字224表示。可以注意到,原始知识图202、204保持完全独立,并且还可以由不同管理机构(组成部分)的独立知识图管理工具来管理。
65.可以通过在一侧,包括第一知识图a 202的识别符和节点206的节点id的第一元组,以及在另一侧,包括第二知识图b 204的识别符和节点214的节点id的另一元组,来定义元层218中的链接边220。
66.图3示出了实施例300的框图,该实施例包括与图2中类似的设置,区别在于使用了常识。这里代替第二知识图b204,使用包括链接到节点306“设特兰(shetland)”的节点304“小型马”的另一第二知识图c302。为了人类的想法,显然第一知识图a202和第二知识图c302中的节点“马”和“小型马”是链接的,因为小型马也是马。该关系可以在两个知识图202或302之一中可用,或者可以在与用户输入的交互步骤中使该方法可用。或者,关于马/小型马关系的信息还可从表示此类或类似关系的存储库、字典或元组列表获得。
67.链接过程222的结果与图2的结果是可比较的。在元层218中构建链接边308,其中,(定义关系310的)链接边308由包括第一知识图202的识别符和节点206的节点id的元组和包括第二知识图302的识别符和节点304的节点id的元组来定义。剩余的条件

如果与图2相比

保持不变。
68.图4示出了框图400,实施例使用第三知识图404的节点关系来合并两个知识图202、402。当与先前的示例相比较时,第一知识图202的内容是不变的。
69.第二知识图d 402现在包括链接至节点408“沙漠”的节点406“骆驼”。如图所示,在第一知识图a202和第二知识图d402的节点之间不存在直接可见和明显的关系。然而,此关系信息由第三知识图e 404递送,该第三知识图e 404包括节点410“骆驼”,节点410“骆驼”链接至节点412“鞍”。因此,鞍也可以用于骆驼。
70.在这种情况下,元层218包括更复杂的数据,即:元组414,其包括第一知识图a202的识别符、节点208“鞍”的节点id以及指向元层表达“骆驼”的索引;以及第二元组416,其包括第二知识图d402的识别符、节点410“骆驼”的节点id以及指向元层表达“鞍”的索引。这种更复杂的关系由附图标记418识别的虚线表示。如在之前的示例中,第一知识图202和第二知识图402保持独立,并且链接信息与元层218相关。
71.图5示出了具有第一知识图、第二知识图和第三知识图的实施例的简化框图500。所提出的方法的这种扩展利用如下外部数据:当创建互连边时,以及在可用数据(例如,解释图像)中找到尚未存在于任何知识图中的其他相关概念,然后在相同的元层218中添加包括关于互联边的信息的节点。在这种情况下,互联边然后将不直接而是通过元层218节点连接两个知识图。
72.此外,如果在数据中发现概念之间的关系

即,语义关系

其中,在任何知识图中都未发现任何概念,但是在元层218中发现至少一个概念,则通过元层边在元层218中连接其他概念。此方法导致以下优点:在搜索期间,不仅使用知识图之间的互联边,而且使用存储在元层218中的间接连接,所述间接连接提供额外洞察且可连接到额外知识图。
73.在图5中示出了此概念,其中,在第三源中找到节点s和r,但不包含在任何现有知识图中。因此,节点s和r被存储在元层218中,并且在本发明的各实施例中,第一知识图502和第二知识图504的已经存在的节点之间的自动关系是可能的,例如a

r

s

g。
74.在已经理解前面的附图之后,图5的内容应当是本领域技术人员可理解的。存在具有节点a、b、c和d的第一知识图502,节点a、b、c和d具有所示的边;并且存在第二知识图504,包括具有所示边的节点e、f、g和h。在节点a和f以及b和f之间存在简单的元层218边。如图所示,通过元层节点s和r促进从第一知识图502到第二知识图504的其他间接链接。确定活跃知识图502和504的节点与元层218节点(此处,s和r)之间的关系是根据在前面的图中解释的原理(例如,通过相同内容的概念或节点内容的模糊识别的概念)执行的。
75.在一些实施例中,根据图2

5,执行方法100可以将输入转换成新的链接数据集。在一些实施例中,转换的结果是元层218。在一些实施例中,转换的结果可以是链接边。在一些实施例中,链接数据可以包括互连来自不同知识图的相同节点的节点。
76.图6示出了用于链接第一知识图和第二知识图的知识图链接系统600的实施例的框图。第一知识图被维护在第一存储器单元(未示出)中的第一数据结构中,而第二知识图被维护在第二存储器单元(未示出)中的第二数据结构中。在第三存储器单元(未示出)中的
第三数据结构中存在第三知识图的情况下,促进第一和第二知识图的链接。知识图各自包括通过边连接的节点。
77.该系统包括比较单元602,该比较单元被适配成用于将第一知识图的节点的内容与第二知识图的节点的内容进行比较。
78.如果存在第一知识图(比较202,图2)的节点,具有第一节点id的节点(比较206,图2),与第二知识图(比较204,图2)的相关节点(比较214,图2)具有内容关系,存储单元604适于在元层存储器单元(未示出)中的元层数据中的元层(比较218,图2)中存储由包括第一节点id和第一知识图的id的元组以及包括第二节点id和第二知识图的id的元组识别的边(比较220,图2),其中所述相关节点具有第二节点id,所述边具有第二节点id。
79.比较单元602还适用于将第三知识图的节点的内容(比较404,图4)与(a)第一知识图的节点的内容(比较202,图4)和(b)第二知识图的节点的内容(比较402,图4)进行比较。
80.进一步地,系统600包括确定和存储模块606,其被适配成:在确定第一知识图(比较202,图4)中的具有第三节点id的第三节点(比较208,图4)与第三知识图(比较404,图4)中的具有第四节点id的第四节点(比较412,图4)相关,并且在第二知识图(比较402,图4)中的具有第五节点id的第五节点(比较406,图4)与具有第六节点id的第六节点(比较410,图4)具有内容关系时,在第三知识图(比较402,图4)中的第四节点和第六节点之间存在内容关系的情况下,确定和存储模块606适于存储可由元层知识图中的包括第一节点id和第一知识图的id的元组以及包括第五节点id和第二知识图的id的元组识别的边。这里,基于第一节点和第三节点在第一知识图中被链接,第一节点可以被链接到第五节点。在一些实施例中,边可以包括链接的元组的任何集合,即使被若干节点(例如,图5的a.r.s.g)分开。在一些实施例中,确定和存储模块606适于将可由包括第三节点id和第一知识图的id的元组和包括第五节点id和第二知识图的id的元组识别的边存储在元层知识图中。
81.此外,确定和存储模块606被适配成用于存储元层知识图的至少所有节点和边。
82.本发明的实施例可以与适用于存储和/或执行程序代码的几乎任何类型的计算机一起实现。图7作为示例示出适于执行与所提出的方法相关的程序代码的计算系统700。
83.计算系统700仅是合适的计算机系统的一个示例,并且不旨在对在此描述的本发明的实施例的用途或功能的范围提出任何限制。在计算机系统700中,存在可与许多其他通用或专用计算系统环境或配置一起操作的组件。可以适合于与计算机系统/服务器700一起使用的众所周知的计算系统、环境和/或配置的示例包括,但不限于个人计算机系统、服务器计算机系统、瘦客户机、厚客户机,手持式或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品,网络pc、小型计算机系统、大型计算机系统和包括任何上述系统或设备的分布式云计算环境,等等。计算机系统/服务器700可以在由计算机系统700执行的计算机系统可执行指令(诸如程序模块)的一般上下文中描述。一般而言,程序模块可包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、逻辑、数据结构等。计算机系统/服务器700可在分布式云计算环境中实践,其中任务由通过通信网络链接的远程处理设备执行。在分布式云计算环境中,程序模块可位于本地和远程计算机系统存储介质两者中,包括存储器存储设备。
84.如图所示,计算机系统/服务器700以通用计算设备的形式示出。计算机系统/服务器700的组件可以包括但不限于一个或多个处理器或处理单元702、系统存储器704以及将
包括系统存储器704的不同系统组件耦合到处理器702的总线706。总线706表示若干类型的总线结构中的任一种总线结构中的一种或多种,包括存储器总线或存储器控制器、外围总线、加速图形端口、以及使用各种总线架构中的任一种的处理器或局部总线。作为示例而非限制,此类架构包括工业标准架构(isa)总线、微通道架构(mca)总线、增强型isa(eisa)总线、视频电子标准协会(vesa)局部总线和外围组件互连(pci)总线。计算机系统/服务器700通常包括各种计算机系统可读介质。这样的介质可以是可由计算机系统/服务器700访问的任何可用介质,并且它包括易失性和非易失性介质、可移动和不可移动介质两者。
85.系统存储器704可以包括易失性存储器形式的计算机系统可读介质,如随机存取存储器(ram)708和/或高速缓存存储器710。计算机系统/服务器700还可以包括其他可移动/不可移动、易失性/非易失性计算机系统存储介质。仅作为示例,存储系统712可被提供用于从不可移动、非易失性磁介质(未示出,并且通常被称为”硬盘驱动器”)读取和向其写入。虽然未示出,但是可以提供用于从可移除非易失性磁盘(例如,”软盘”)读取和向可移除非易失性磁盘写入的磁盘驱动器,以及用于从可移除非易失性光盘(诸如cd

rom、dvd

rom或其他光学介质)读取或向可移除非易失性光盘写入的光盘驱动器。在这样的实例中,每一个都可以通过一个或多个数据介质接口连接到总线706。如以下将进一步描绘和描述的,存储器704可以包括具有被配置为执行本公开的实施例的功能的一组(例如,至少一个)程序模块的至少一个程序产品。
86.具有一组(至少一个)程序模块716的程序/实用程序可以通过示例而非限制的方式存储在存储器704中,以及存储在操作系统、一个或多个应用程序、其他程序模块和程序数据中。操作系统、一个或多个应用程序、其他程序模块和程序数据中的每一者或其某一组合可包含联网环境的实施例。如本文所述,程序模块716通常执行本发明的实施例的功能和/或方法。
87.计算机系统/服务器700还可以与一个或多个外部设备718(如键盘、定点设备、显示器720等)进行通信;使得用户能够与计算机系统/服务器700交互的一个或多个设备进行通信;和/或使计算机系统/服务器700能够与一个或多个其他计算设备通信的任何设备(例如,网卡、调制解调器等)进行通信。这样的通信可以经由输入/输出(i/o)接口714发生。此外,计算机系统/服务器700可以经由网络适配器722与诸如局域网(lan)、通用广域网(wan)和/或公共网络(例如,互联网)之类的一个或多个网络通信。如所描绘的,网络适配器722可以经由总线706与计算机系统/服务器700的其他部件通信。应当理解,虽然未示出,但是其他硬件和/或软件组件可以与计算机系统/服务器700结合使用。示例包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动器阵列、raid系统、磁带驱动器和数据归档存储系统等。
88.在一些实施例中,计算机系统/服务器700可以允许添加或安装硬件和/或软件组件。在这些实施例中,添加允许计算平台以某些方式被专门化并执行某些任务,从而将计算平台渲染到专门化的机器中。
89.此外,用于链接第一知识图和第二知识图的系统600可以附接至总线系统706。链接系统600和计算机系统700可以产生专用机器。
90.已经出于说明的目的呈现了本发明的不同实施例的描述,并且这些描述并不旨在是穷尽性的或局限于所披露的实施例。在不背离所描述的实施例的范围和精神的情况下,
许多修改和变化对本领域的普通技术人员而言将是显而易见的。这里使用的术语被选择以最佳地解释实施例的原理、实际应用或对市场上存在的技术的技术改进,或者使得本领域普通技术人员能够理解这里公开的实施例。
91.本发明可以具体化为系统、方法、和/或计算机程序产品。所述计算机程序产品可包含上面具有计算机可读程序指令的计算机可读存储介质(或媒质),所述计算机可读程序指令用于致使处理器执行本发明的方面。
92.该介质可以是用于传播介质的电子、磁性、光学、电磁、红外或半导体系统。计算机可读介质的示例可包括半导体或固态存储器、磁带、可移动计算机磁盘、随机存取存储器(ram)、只读存储器(rom)、刚性磁盘和光盘。光盘的当前示例包括致密盘只读存储器(cd

rom)、致密盘读/写(cd

r/w)、dvd和蓝光盘。
93.计算机可读存储介质可以是可以保留和存储指令以供指令执行设备使用的有形设备。计算机可读存储介质可以是例如但不限于电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或前述各项的任何合适的组合。计算机可读存储介质的更具体例子的非穷举列表包括以下:便携式计算机盘,硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或闪存),静态随机存取存储器(sram)、便携式致密盘只读存储器(cd

rom),数字通用盘(dvd)、记忆棒、软盘、机械编码设备(诸如穿孔卡片)或具有记录在其上的指令的凹槽中的凸起结构),以及上述的任意合适的组合。如本文中所使用的计算机可读存储媒质不应被解释为瞬态信号本身,诸如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如,通过光纤电缆的光脉冲)、或通过导线传输的电信号。
94.在此描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理设备或经由网络(例如,互联网、局域网、广域网和/或无线网络)下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配器卡或网络接口从网络接收计算机可读程序指令,并转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。
95.用于执行本发明的操作的计算机可读程序指令可以是汇编指令,指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据,或者以一种或多种编程语言的任意组合编写的源代码或目标代码,包括面向对象的smalltalk、c++等编程语言,以及常规的过程式编程语言,例如“c”编程语言或类似的编程语言。计算机可读程序指令可以完全地在用户的计算机上执行、部分地作为独立软件包在用户的计算机上执行、部分地在用户的计算机上部分在远程计算机上执行、或者完全地在远程计算机或服务器上执行。在后一种情形中,远程计算机可以通过任何类型的网络(包括局域网(lan)或广域网(wan))连接到用户的计算机,或者可以连接到外部计算机(例如,通过使用互联网服务提供商的互联网)。在一些实施例中,电子电路(包括例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla))可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以使电子电路个性化,以便执行本发明的方面。
96.在此参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图图示和/或框图描述本发明的方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框
图中各方框的组合,都可以由计算机可读程序指令来实现。
97.这些计算机可读程序指令可以被提供给通用计算机的处理器,专用计算机或其他可编程数据处理装置,以产生机器,其通过计算机或其他可编程数据处理装置的处理器执行,创建用于实现在流程图和/或方框图的一个或多个方框中指定的功能/动作的装置。这些计算机可读程序指令还可存储在可指导计算机的计算机可读存储介质中,可编程数据处理装置,和/或以特定方式起作用的其他设备,使得具有存储在其中的指令的计算机可读存储介质包括制品,该制品包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各方面的指令。
98.这些计算机可读程序指令还可以加载到计算机、其他可编程数据处理设备上,或者使得在计算机上执行一系列操作步骤的另一设备,其他可编程装置或其他设备,以产生计算机实现的过程,使得在计算机上执行的指令,其他可编程装置或另一设备实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
99.附图中的流程图和/或框图示出了根据本发明各实施例的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。对此,流程图或框图中的每个方框可以代表模块、段或指令的一部分,其包括用于实现规定的逻辑功能的一个或多个可执行指令。在一些替代实现方式中,框中所标注的功能可以不以图中所标注的顺序发生。例如,取决于所涉及的功能,连续示出的两个框实际上可以基本上同时执行,或者这些框有时可以以相反的顺序执行。还将注意的是,框图和/或流程图中的每个框、以及框图和/或流程图中的框的组合可以由基于专用硬件的系统来实现,所述基于专用硬件的系统执行指定的功能或动作或执行专用硬件与计算机指令的组合。
100.在此使用的术语仅用于描述具体实施例的目的并且不旨在限制本发明。如在此使用的,单数形式“一个”、“一种”和“该”旨在也包括复数形式,除非上下文另外清楚地指示。将进一步理解的是,当在本说明书中使用术语“包括(comprises)”和/或“包括(comprising)”时,其指定所陈述的特征、整体、步骤、操作、元件和/或组件的存在,但是不排除一个或多个其他特征、整体、步骤、操作、元件、组件和/或其组的存在或添加。
101.以下权利要求中的所有装置或步骤加上功能元件的对应结构、材料、动作和等效物旨在包括用于结合其他要求保护的元件(如具体要求保护的)来执行功能的任何结构、材料或动作。本发明的描述是出于说明和描述的目的而呈现的,但不旨在是穷尽性的或局限于所披露的形式的本发明。在不脱离本发明的范围和精神的情况下,许多修改和变化对本领域的普通技术人员将是显而易见的。选择和描述这些实施例是为了最好地解释本发明的原理和实际应用,并且使得本领域的普通技术人员能够针对适合于所考虑的具体用途的具有不同修改的不同实施例理解本发明。
102.总之,已经讨论了在以下编号的条款中再次指定的不同实施例:
103.条目1如下。一种用于在存在第三知识图的情况下链接第一知识图和第二知识图的计算机实现的方法,所述知识图各自包括通过边连接的每个节点,所述方法包括:将来自第一知识图的节点的内容与来自第二知识图的节点的内容进行比较;如果存在第一知识图的节点具有与第二知识图的相关节点的内容关系,所述节点具有第一节点id,所述相关节点具有第二节点id,将第一边存储在元层知识图中,其中所述第一边由第一元组和第二元组来识别,所述第一元组包括所述第一节点id和所述第一知识图的id,所述第二元组包括
所述第二节点id和所述第二知识图的id;将来自第三知识图的节点的内容与(a)来自第一知识图的节点的内容和(b)来自第二知识图的节点的内容进行比较;在确定第一知识图中具有第三节点id的第三节点与第三知识图中具有第四节点id的第四节点相关,以及第二知识图中具有第五节点id的第五节点与具有第六节点id的第六节点具有内容关系,在第三知识图中的第四节点和第六节点之间存在内容关系的情况下,将包括第一节点id和第一知识图的id的元组和包括第五节点id和第二知识图的id的元组可识别的边存储在元层知识图中;以及至少存储元层知识图的所有节点和边。
104.条目2如下。条目1所述的方法,其中第三知识图是空的。
105.条目3如下。条目1或2的方法,其中在第三知识图中的第四节点和第六节点之间的内容关系是直接边。
106.条目4如下。如前述条目中任一项所述的方法,其中第三知识图中的第四节点与第六节点之间的内容关系由第三知识图的第四节点、至少一个链接节点与链接节点与第六节点之间的边表示。
107.条目5如下。如前述条目中任一项所述的方法,其中具有内容关系的不同知识图的节点包括相同的内容。
108.条目6如下。如前述条目中任一项所述的方法,其中具有内容关系的不同知识图的节点是使用模糊等式确定内容关系的那些节点。
109.条目7如下。如前述条目中任一项所述的方法,其中具有内容关系的不同知识图的节点是相关节点的内容是同义词的那些节点。
110.条目8如下。如前述条目中任一项所述的方法,其中第一知识图由第一知识图管理工具管理并且第二知识图由第二知识图管理工具管理。
111.条目9如下。如条目8所述的方法,其中第二知识图可由第一知识图管理工具以只读模式访问。
112.条目10如下。如前述条目中任一项所述的方法,其中该方法是以规律的时间间隔执行的。
113.条目11如下。如前述条目中任一项所述的方法,其中该方法以基于变化索引确定的间隔来执行,变化索引是第一知识图、第二知识图和/或第三知识图中的至少一个的变化数量的函数。
114.条目12如下。一种知识图链接系统,用于将第一存储器单元中的第一数据结构中的第一知识图与第二存储器单元中的第二数据结构中的第二知识图链接,在第三存储器单元的第三数据结构中存在第三知识图的情况下,知识图各自包括通过边连接的节点,所述系统包括:比较单元,适于将来自知识图的节点的内容与来自第二知识图的节点的内容进行比较;存储单元,如果存在第一知识图的节点具有与所述第二知识图的相关节点的内容关系,所述节点具有第一节点id,所述相关节点具有第二节点id,该存储单元适于将由包括第一节点id和第一知识图的id的元组以及包括第二节点id和第二知识图的id的元组识别的边存储在元层存储单元中的元层数据中的元层知识图中;其中所述比较单元还适于将来自第三知识图的节点的内容与(a)来自第一知识图的节点的内容和(b)来自第二知识图的节点的内容进行比较;在通过确定和存储模块确定第一知识图中具有第三节点id的第三节点与第三知识图中具有第四节点id的第四节点以及第二知识图中具有第五节点id的第五
节点相关时,在第三知识图中的第四节点和第六节点之间存在内容关系的情况下,具有与具有第六节点id的第六节点的内容关系;在元层知识图中存储由包括第一节点id和第一知识图的id的元组和包括第五节点id和第二知识图的id的元组识别的边;以及存储元层知识图的至少所有节点和边。
115.条目13如下。根据条目12所述的系统,其中第三知识图是空的。
116.条目14如下。根据条目12或13所述的系统,其中第三知识图中第四节点和第六节点之间的内容关系是直接边。
117.条目15如下。根据条目12至14中的任一项所述的系统,其中第三知识图中的第四节点与第六节点之间的内容关系由第三知识图的第四节点、至少一个链接节点与链接节点与第六节点之间的边表示。
118.条目16如下。根据条目12至15中任一条目所述的系统,其中具有内容关系的不同知识图的节点包括相同的内容。
119.条目17如下。根据条目12至16中任一条目所述的系统,其中具有内容关系的不同知识图的节点是使用模糊等式确定内容关系的那些节点。
120.条目18如下。根据条目12至17中任一项所述的系统,其中具有内容关系的不同知识图的节点是所述相关节点的内容是同义词的那些节点。
121.条目19如下。根据条目12至18中任一项所述的系统,其中所述第一知识图由第一知识图管理工具管理并且所述第二知识图由第二知识图管理工具管理。
122.条目20如下。根据条目19所述的系统,其中所述第二知识图可由所述第一知识图管理工具以只读模式访问。
123.条目21如下。根据条目12至20中任一项所述的系统,其中该方法是在规则的时间间隔之后执行。
124.条目22如下。根据条目12至21中任一条目所述的系统,其中基于变化索引执行所述方法,所述变化索引是所述第一知识图、所述第二知识图和/或所述第三知识图中的至少一个中的多个变化的函数。
125.条目23如下。一种计算机程序产品,用于链接第一存储器单元中的第一数据结构中的第一知识图和第二存储器单元中的第二数据结构中的第二知识图,在第三存储器单元的第三数据结构中存在第三知识图的情况下,所述知识图包括通过边连接的每个节点,所述计算机程序产品包括计算机可读存储介质,所述计算机可读存储介质具有随其体现的程序指令,所述程序指令可由一个或多个计算系统或控制器执行以促使所述一个或多个计算系统:将来自所述第一知识图的节点的内容与来自所述第二知识图的节点的内容进行比较;如果存在第一知识图的节点具有与第二知识图的相关节点的内容关系,所述节点具有第一节点id,所述相关节点具有第二节点id,将由包括第一节点id和第一知识图的id的元组以及包括第二节点id和第二知识图的id的元组识别的边存储在元层知识图中;将来自所述第三知识图的节点的内容与(a)来自第一知识图的节点的内容和(b)来自第二知识图的节点的内容进行比较;在确定第一知识图中具有第三节点id的第三节点与第三知识图中具有第四节点id的第四节点相关,以及第二知识图中具有第五节点id的第五节点与具有第六节点id的第六节点具有内容关系,在所述第三知识图中的第四节点与第六节点之间存在内容关系的情况下,将包括第一节点id和第一知识图的id的元组和包括第五节点id和第二知
识图的id的元组可识别的边存储在元层知识图中;以及存储元层知识图的至少所有节点和边。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1