本公开涉及知识图领域,并且更具体而言,涉及与以概率实体为中心的知识图有关的方法、系统和计算机程序产品。
背景技术:
1、随着可用于分析的数据量增长,我们用于存储和评估该数据的数据结构的要求(和需求)也增长。一种类型的数据结构是知识图(有时称为语义网络)。知识图包括节点和边,其中节点是现实世界实体(例如,对象、事件、情形、概念),以及边详细说明这些节点之间的关系。知识图通常存储在图数据库中并且可视化为图结构。通过以此方式布置信息,知识图允许逻辑推断,使得利用知识图来例如回答查询的计算系统可访问知识图内的隐式信息以回答查询(例如,即使计算系统不能另外访问显式地提供该隐式信息的任何数据)。
技术实现思路
1、本公开的方面涉及与以概率实体为中心的知识图有关的方法、系统和计算机程序产品。例如,该方法包括接收关于实体的第一数据集,其中第一数据集包括实体的不同特性。该方法还包括接收关于实体的一个或多个域的第二数据集。该方法还包括使用第一数据集和第二数据集生成包括实体节点以及第一多个节点和第二多个节点的概率知识图。第一多个节点连接到实体节点并且表示所述不同特性中的每一个。第二多个节点经由具有相关联的置信度得分的概率边在概率知识图内连接。使用第二数据集确定这些置信度得分。本文还描述了被配置为执行上述方法的系统和计算机程序。
2、对于另一示例,本发明的其它方面涉及一种方法,该方法包括接收关于人的第一数据集,其中第一数据集包括人的不同特性。该方法还包括接收关于人的一个或多个域的第二数据集。该方法还包括使用第一数据集和第二数据集生成包括人节点以及第一多个节点和第二多个节点的概率知识图。第一多个节点连接到实体节点并且表示所述不同特性中的每一个。第二多个节点经由具有相关联的置信度得分的概率边在概率知识图内连接。使用第二数据集确定这些置信度得分。
3、以上概述并不旨在描述本公开的每个所示实施例或每个实现方式。
1.一种计算机实现的方法,包括:
2.根据权利要求1所述的计算机实现的方法,其中,所述第二多个节点完成所述概率知识图。
3.根据权利要求1所述的计算机实现的方法,其中,所述实体选自包括以下各项的组:材料、人或人的群组。
4.根据权利要求3所述的计算机实现的方法,其中,关于所述实体的数据作为知识图被接收。
5.根据权利要求3所述的计算机实现的方法,其中,关于所述实体的数据作为关于所述人的原始非结构化数据被接收。
6.根据权利要求3所述的计算机实现的方法,还包括使用所述概率知识图来识别对于所述实体合适的干预或动作。
7.根据权利要求1所述的计算机实现的方法,其中,每个置信度得分包括量化相应概率边的概率为真的可能性的第一得分。
8.根据权利要求1所述的计算机实现的方法,其中,每个置信度得分包括量化相应概率边的底层数据的可靠性的置信度得分的第二得分。
9.根据权利要求1所述的计算机实现的方法,其中,所述第二多个节点包括表示已知当前对于所述实体不是事实的事物的至少一个节点。
10.根据权利要求9所述的计算机实现的方法,其中,所述至少一个节点在所述概率知识图中与具有置信度得分的概率边连接,所述置信度得分与所述事物在将来对于所述实体可能是事实的概率相关。
11.根据权利要求1所述的计算机实现的方法,还包括基于预定义的因素的数量和预测的因素的数量,将集群中的每个概率的每个置信度得分归一化。
12.根据权利要求1所述的计算机实现的方法,其中,接收关于所述实体的一个或多个域的第二数据集包括爬过开放世界数据以识别所述第二数据集。
13.一种系统,包括:
14.一种计算机程序产品,所述计算机程序产品包括具有随其体现的程序指令的计算机可读存储介质,所述程序指令可由计算机执行以使所述计算机执行根据权利要求1至12中任一项所述的方法。
15.一种计算机实现的方法,包括: