知识图谱的构建方法、检测方法、装置、设备及存储介质与流程

文档序号:20216381发布日期:2020-03-31 11:56阅读:193来源:国知局

本申请涉及数据处理技术,尤其涉及数据挖掘技术领域。



背景技术:

知识图谱(knowledgegraph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

以社交关系知识图谱为例,图谱中的节点代表人,节点之间的边代表人与人之间的关系;以金融知识图谱为例,图谱中的节点代表账户,节点之间的边代表账户与账户间的转账关系。

现有的知识图谱表达的内容比较单一,难以体现节点之间、边之间深层次的关联性,导致知识图谱在应用于异常检测等业务场景中时,难以发挥有效作用。



技术实现要素:

本申请实施例提供了一种知识图谱的构建方法、检测方法、装置、设备及存储介质,以实现跨类型信息的充分融合,避免信息缺失。

第一方面,本申请实施例提供了一种知识图谱的构建方法,包括:

获取用于构建知识图谱的多种类型的多张子图,以及多张子图中节点的信息和边的属性信息;

根据所述节点的信息,将多张子图中的相同节点进行合并,得到初级知识图谱;

根据所述边的属性信息,将所述初级知识图谱中同一节点连接的、满足预设关联条件的边进行合并,得到知识图谱。

本申请实施例通过将多张类型的子图中相同的节点合并,实现了多类型子图的合并,初步融合了跨类型信息;进一步将同一节点连接的、满足预设关联条件的边进行合并,实现跨类型信息的充分融合,有效挖掘深层次信息,避免信息缺失和关键证据链断裂,使得知识图谱应用于异常检测等业务场景中时,能够发挥有效作用。

可选的,根据所述边的属性信息,将所述初级知识图谱中同一节点连接的、满足预设关联条件的边进行合并,得到知识图谱,包括:

根据所述边的时间属性信息和/或空间属性信息,将所述初级知识图谱中同一节点连接的、时间之差和/或空间之差在预设范围内的边进行合并,得到知识图谱。

上述申请中的一种可选实施方式,通过将时间属性信息和/或空间属性信息接近的边进行合并,有效融合时空接近的关系和实体,在知识图谱中构建时空接近的关系和实体之间的联系,挖掘出的信息更加全面,使得知识图谱应用于异常检测等业务场景中时,能够发挥更加有效的作用。

可选的,在所述根据所述边的属性信息,将所述初级知识图谱中同一节点连接的、满足预设关联条件的边进行合并,得到知识图谱之后,还包括:

判断知识图谱中是否存在孤立子图;

如果存在,查找各所述孤立子图之间具有关联关系的节点,并在具有关联关系的节点之间通过虚拟节点连接。

上述申请中的一种可选实施方式,通过在知识图谱中存在孤立子图时,在具有关联关系的节点之间通过虚拟节点连接,从而打通孤立子图,形成完全连通的知识图谱,保证节点之间均可达,进一步实现了信息融合。

可选的,所述查找各所述孤立子图之间具有关联关系的节点,包括:

获取各所述孤立子图中各节点的时间属性信息和/或空间属性信息;

根据所述各节点的时间属性信息和/或空间属性信息,将不同孤立子图中时间之差和/或空间之差在预设范围内的节点,作为具有关联关系的节点。

上述申请中的一种可选实施方式,通过将不同孤立子图中时间属性信息和/或空间属性信息接近的节点进行合并,从而利用时空接近的节点将不同的孤立子图连通起来,充分挖掘孤立子图之间时空接近的信息,构建新的关联关系,实现了深层次的数据挖掘。

可选的,所述查找各所述孤立子图之间具有关联关系的节点,包括:

获取各所述孤立子图之间具有共性信息的节点;

其中,所述共性信息包括相同身份信息。

上述申请中的一种可选实施方式,通过将不同孤立子图中具有共性信息的节点连接起来,例如两个孤立子图中的两个节点具有相同身份信息,则将这两个节点连接,从而利用共性信息将不同的孤立子图连通起来,实现了共性信息的充分挖掘。

可选的,所述获取用于构建知识图谱的多种类型的多张子图,包括:

获取多种类型的实体信息和实体之间的直接关系;

将每种类型的实体信息抽象为节点,将实体之间的直接关系抽象为边,构建对应类型的子图;

将所述对应类型的子图中具有关联关系的节点进行合并或连接。

上述申请中的一种可选实施方式,在构建每种类型的子图时,首先根据实体信息和直接关系构建初步的子图,在此基础上,将具有关联关系的节点进行合并或连接,实现子图内部节点和关系的融合和打通,避免信息缺失,导致关键证据链断裂,而使知识图谱无法应用于异常检测等业务场景中。

第二方面,本申请实施例还提供了一种基于知识图谱的检测方法,知识图谱根据上述任一实施例所述的方法构建,包括:

获取待检测数据;

根据所述待检测数据,查找所述知识图谱中的对应元素;

对所述待检测数据和对应元素进行一致性检测。

本申请实施例通过知识图谱对待检测数据进行一致性检测,即二者是否存在节点和/或边的冲突。由于知识图谱充分融合了各种类型的信息,证据链完整,提高了一致性检测的有效性。

第三方面,本申请实施例还提供了一种基于知识图谱的检测方法,知识图谱根据上述任一实施例所述的方法构建,包括:

获取所述知识图谱中的预设结构;

对所述预设结构进行合法性检测。

本申请实施例中,由于知识图谱充分融合了各种类型的信息,使得不具有直接关系的节点也建立了连接,从而展示出新的关系和预设结构。通过对这些预设结构进行合法性检测,能够快速、便捷地发现知识图谱中的非法行为。

可选的,所述预设结构包括:闭环结构、单入多出结构和多入单出结构中的至少一种。

上述申请中的一种可选实施方式,闭环结构、单入多出结构和多入单出结构分别表征了环状流向的信息、发散的信息和汇聚的信息,可被认定为高风险的结构。通过对这些结构进行合法性检测,从而有针对性地发现非法行为。

第四方面,本申请实施例还提供了一种知识图谱的构建装置,包括:

获取模块,用于获取用于构建知识图谱的多种类型的多张子图,以及多张子图中节点的信息和边的属性信息;

第一合并模块,用于根据所述节点的信息,将多张子图中的相同节点进行合并,得到初级知识图谱;

第二合并模块,用于根据所述边的属性信息,将所述初级知识图谱中同一节点连接的、满足预设关联条件的边进行合并,得到知识图谱。

第五方面,本申请实施例还提供了一种基于知识图谱的检测装置,所述知识图谱根据上述任一实施例所述的方法构建,包括:

获取模块,用于获取待检测数据;

查找模块,用于根据所述待检测数据,查找所述知识图谱中的对应元素;

检测模块,用于对所述待检测数据和对应元素进行一致性检测。

第六方面,本申请实施例还提供了一种基于知识图谱的检测装置,所述知识图谱根据上述任一实施例所述的方法构建,包括:

获取模块,用于获取所述知识图谱中的预设结构;

检测模块,用于对所述预设结构进行合法性检测。

第七方面,本申请实施例还提供了一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面实施例所提供的知识图谱的构建方法,或者第二方面实施例所提供的基于知识图谱的检测方法,或者第三方面实施例所提供的基于知识图谱的检测方法。

第八方面,本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面实施例所提供的知识图谱的构建方法,或者第二方面实施例所提供的基于知识图谱的检测方法,或者第三方面实施例所提供的基于知识图谱的检测方法。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案,不构成对本申请的限定。其中:

图1a是本申请实施例一中的一种知识图谱的构建方法的流程图;

图1b是本申请实施例一中的子图的示意图;

图1c是本申请实施例一中的多张子图投影到时空坐标系内的示意图;

图1d是本申请实施例一中的时空坐标系下多张子图中相同节点的示意图;

图1e是本申请实施例一中的知识图谱的示意图;

图2a是本申请实施例二中的一种知识图谱的构建方法的流程图;

图2b是本申请实施例二中的新增虚拟节点连接基站节点和相机节点的示意图;

图2c是本申请实施例二中的时空坐标系下新增虚拟节点连接孤立子图的示意图;

图3是本申请实施例三中的一知识图谱的构建方法的流程图;

图4是本申请实施例四中的一种基于知识图谱的检测方法的流程图;

图5a是本申请实施例五中的一种基于知识图谱的检测方法的流程图;

图5b是本申请实施例五中的某公司的组织架构图;

图5c是本申请实施例五中的社交关系图;

图5d是本申请实施例五中的非法闭环结构图;

图6是本申请实施例六中的一种知识图谱的构建装置的结构图;

图7是本申请实施例七中的一种基于知识图谱的检测装置的结构图;

图8是本申请实施例八中的一种基于知识图谱的检测装置的结构图;

图9是用来实现本申请实施例的知识图谱的构建方法或基于知识图谱的检测方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

实施例一

图1a是本申请实施例一中的一种知识图谱的构建方法的流程图,本申请实施例适用于基于各种类型的信息构建连通的知识图谱的情况,该方法通过知识图谱的构建装置执行,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。

如图1a所示的一种知识图谱的构建方法,包括:

s101、获取用于构建知识图谱的多种类型的多张子图,以及多张子图中节点的信息和边的属性信息。

s102、根据节点的信息,将多张子图中的相同节点进行合并,得到初级知识图谱。

同一节点会出现在不同类型的子图中。例如,由某个用户抽象成的节点出现在社会关系子图中和账户关系子图中,则将这个相同节点进行合并。但是,在不同类型的子图中,连接这个相同节点的边需要保留。

遍历多张子图中的每个节点,对任两张子图中的相同节点进行合并,得到一个知识图谱,称为初级知识图谱。可以理解的是,初级知识图谱中不存在相同的节点,而是融合了多张子图中的不同节点,并保留了全部的边。

s103、根据边的属性信息,将初级知识图谱中同一节点连接的、满足预设关联条件的边进行合并,得到知识图谱。

遍历同一节点连接的各条边,并获取该各条边的属性信息。将满足预设关联条件的边进行合并。相应地,合并的两条边所对应的另两个节点也需要合并。在实际操作中,可以将另两个节点用一个节点来表示,但保留原始两个节点的信息和属性信息。

可选地,预设关联条件包括但不限于时间属性信息和/或空间属性信息接近,转账数额属性信息接近,属性信息是否具有保密性。

以属性信息是否具有保密性为例,将均具有保密性的两条边合并,得到知识图谱。假设初级知识图谱中,节点5与节点6连接,表示用户a给用户b转账,对应边的属性信息为匿名转账。节点5与节点7连接,表示用户a给用户c通话,对应边的属性信息为电话号码不可见。可见,节点5连接的两条边的属性信息均具有保密性,则将这两条边合并。相应地,节点6和节点7也合并,合并后的节点同时表示用户b和用户c的信息。

以时间属性信息和/或空间属性信息接近为例,根据边的时间属性信息和/或空间属性信息,将初级知识图谱中同一节点连接的、时间之差和/或空间之差在预设范围内的边进行合并,得到知识图谱。其中,预设范围可以根据实际情况灵活设置,时间之差可以是10分钟或半小时,空间之差可以是10米或50米。假设节点8与节点9连接,表示相机a拍摄到人脸1,对应边的属性信息为10点整,中心大道。节点8与节点10连接,表示相机a拍摄到人脸2,对应边的属性信息为10点5分,中心大道。可见,节点8连接的两条边的时间属性信息接近,空间属性信息相同,则将这两条边合并。相应地,节点9和节点10也合并,合并后的节点同时表示人脸1和人脸2的信息。

进而,在本实施例中,每张子图对应一种类型。图1b示出了5张子图,分别是社会关系子图、账户关系子图、行为关系子图、社交关系子图和身份关系子图。每张子图中,节点由实体抽象得到,边由实体之间的关系抽象得到。例如,某个节点表示用户的身份或者该用户关联的人事地物等信息。边表示该用户与其它用户之间的关系。

其中,每张子图中的节点的信息是节点的唯一标志,可以用节点的名称来表示。边的属性信息包括但不限于边的时间属性信息、空间属性信息、隶属属性信息、等级属性信息等。在一具体示例中,手机被某一个基站记录到对应的信息,则记录为一组点边关系“节点1:手机1;节点2:基站;节点1与节点2之间的边:手机连接基站,边的属性信息:时间,频次”。在另一具体示例中,某个账号给另一个账号转账,则就记录为一组点边关系“节点3:账号a;节点4:帐号b;节点1与节点2之间的边:转账,边的属性信息:转账时间,转账金额,转账的方向等”。

在实际操作中,将多张子图投影到时空坐标系内,如图1c所示。当然,有些关系可能没有时间属性信息或者空间属性信息,可以利用该关系两端的节点的时间属性信息或者空间属性信息作为关系的时间属性信息或者空间属性信息,这样是为了更好的表征关系,进而将相近属性的关系做合并,从而构建知识图谱。

然后,利用表征到同一个时空坐标系的多张子图,可以将相同节点进行合并,如图1d中,虚线圈出了部分相同的节点。

接着,将所有子图都投影到同一个图层平面上。该图层平面上拟合了时空属性,自然地,同一节点连接的时间属性信息或者空间属性信息接近的边就自动合并了,如图1e所示,这样就可以构建一个相对完整的知识图谱。图1e中,imsi叫国际移动用户识别码(internationalmobilesubscriberidentificationnumber),是区别移动用户的标志。imei(internationalmobileequipmentidentity)是国际移动设备识别码的缩写。

本申请实施例通过将多张类型的子图中相同的节点合并,实现了多类型子图的合并,初步融合了跨类型信息;进一步将同一节点连接的、满足预设关联条件的边进行合并,实现跨类型信息的充分融合,有效挖掘深层次信息,避免信息缺失和关键证据链断裂,使得知识图谱应用于异常检测等业务场景中时,能够发挥有效作用。

实施例二

图2a是本申请实施例二中的一种知识图谱的构建方法的流程图,本申请实施例在上述各实施例的技术方案的基础上进行了优化改进。

进一步的,在执行“根据边的属性信息,将初级知识图谱中同一节点连接的、满足预设关联条件的边进行合并,得到知识图谱”之后,追加“判断知识图谱中是否存在孤立子图;如果存在,查找各孤立子图之间具有关联关系的节点,并在具有关联关系的节点之间通过虚拟节点连接”;进一步的,将“查找各孤立子图之间具有关联关系的节点”操作,细化为“获取各孤立子图中各节点的时间属性信息和/或空间属性信息;根据各节点的时间属性信息和/或空间属性信息,将不同孤立子图中时间之差和/或空间之差在预设范围内的节点,作为具有关联关系的节点”,进一步的,将“查找各孤立子图之间具有关联关系的节点”操作,还可以细化为“获取各孤立子图之间具有共性信息的节点;其中,共性信息包括相同身份信息”,以打通孤立子图,形成完全连通的知识图谱,保证节点之间均可达,进一步实现了信息融合。

如图2a所示的一种知识图谱的构建方法,包括:

s201、获取用于构建知识图谱的多种类型的多张子图,以及多张子图中节点的信息和边的属性信息。

s202、根据节点的信息,将多张子图中的相同节点进行合并,得到初级知识图谱。

s203、根据边的属性信息,将初级知识图谱中同一节点连接的、满足预设关联条件的边进行合并,得到知识图谱。

s204、判断知识图谱中是否存在孤立子图。如果存在,应查找各孤立子图之间具有关联关系的节点,具体可跳转到s205或者s206;如果不存在,跳转到s207。

孤立子图之间的节点是没有直接的连接的,需要挖掘哪些节点存在内部的关联关系,进而连接这些节点。

值得说明的是,s205和s206可以择一执行或者均执行。均执行时,s205和s206的执行顺序不作限定。择一执行时,可根据s205和s206的可执行性选择合适的步骤。例如,各孤立子图之间不具有共性信息的节点,则可以尝试执行s205。

s205、获取各孤立子图中各节点的时间属性信息和/或空间属性信息,根据各节点的时间属性信息和/或空间属性信息,将不同孤立子图中时间之差和/或空间之差在预设范围内的节点,作为具有关联关系的节点。继续执行s208。

其中,有的节点可能没有时间属性信息或空间属性信息,则将其连接边的时间属性信息或空间属性信息作为该节点的时间属性信息或空间属性信息。与上文类似,预设范围可以根据实际情况灵活设置.

s206、获取各孤立子图之间具有共性信息的节点。其中,共性信息包括相同身份信息。继续执行s208。

例如,人脸探头子图包括相连接的相机1节点和其拍摄到的人脸节点,车牌探头子图包括相连接的相机2节点和其拍摄到车牌节点。通信子图包括相连接的手机号码1节点和手机号码2节点。投影到同一个图层平面上后,这3个子图均是孤立子图。通过某些渠道获知,人脸、车牌和手机号码1均与某个身份证号关联,则将人脸节点、车牌节点和手机号码1节点指向虚拟节点,那么人脸、车牌和手机号码之间的关系就打通了,3个子图也相应连通了。

可选地,共性信息还可以包括相同隶属信息或相同法人信息,如均隶属于某个机构或团体,均具有相同的法人。本实施例对共性信息不作具体限定。

s207、结束本次操作。

s208、在具有关联关系的节点之间通过虚拟节点连接。

如图2b所示,基站探针子图包括相连接的基站节点和其探测到的手机物理地址节点。人脸探头子图包括相连接的相机节点和其拍摄到的人脸节点。投影到同一个图层平面上后,存在孤立子图。通过寻找发现,基站节点和相机节点的时间属性信息接近,空间属性信息也接近,则基站节点和相机节点为具有关联关系的节点。

如图2b所示,将基站节点和相机节点连接后,对应的手机物理地址节点和人脸节点也就连接起来了,从而挖掘出了手机物理地址和人脸之间的深层次关系。

如图2c所示,投影到同一个图层平面上后,孤立子图之间通过虚拟节点连通。虚拟节点用三角符号表示。

本实施例通过将不同孤立子图中时间属性信息和/或空间属性信息接近的节点进行合并,从而利用时空接近的节点将不同的孤立子图连通起来,充分挖掘孤立子图之间时空接近的信息,构建新的关联关系,实现了深层次的数据挖掘;以及,通过将不同孤立子图中具有共性信息的节点连接起来,从而利用共性信息将不同的孤立子图连通起来,实现了共性信息的充分挖掘。

实施例三

图3是本申请实施例三中的一种知识图谱的构建方法的流程图,本申请实施例在上述各实施例的技术方案的基础上,进行了优化改进。

进一步的,将操作“获取用于构建知识图谱的多种类型的多张子图”细化为“获取多种类型的实体信息和实体之间的直接关系;将每种类型的实体信息抽象为节点,将实体之间的直接关系抽象为边,构建对应类型的子图;将对应类型的子图中具有关联关系的节点进行合并或连接”,以实现子图内部节点和关系的融合和打通。

如图3所示的一种知识图谱的构建方法,包括:

s301、获取多种类型的实体信息和实体之间的直接关系。

可选地,从数据源获取实体信息和实体之间的直接关系,数据源例如为互联网、交通部门、商城等。实体信息可以是用户信息、手机信息、车牌信息和相机信息等。

需要注意的是,实体之间的直接关系指从数据源中直接得到的关系,不需要推理和分析。例如,相机拍摄到车牌,则相机与车牌有直接关系;又例如用户购买物品,则用户与物品有直接关系。

s302、将每种类型的实体信息抽象为节点,将实体之间的直接关系抽象为边,构建对应类型的子图。

在一示例中,根据所有手机相关的记录,构建一个子图,根据生物特征相关的实体,构建另一个子图;根据车辆相关的实体,构建另一个子图;根据帐号相关的实体,构建另一个子图;根据身份证相关的实体,构建又一个子图。

s303、将对应类型的子图中具有关联关系的节点进行合并或连接。

值得说明的是,此处具有关联关系的节点并不具有直接关系,即没有直接相连。本步骤将没有直接连接的节点进行连接或合并。比如,节点11和节点12是亲戚关系,节点12和节点13是亲戚关系,则节点11和节点13也是亲戚关系,则连接节点11和节点13,实现连个节点的打通。再比如,某人有两个手机号,每个手机号节点都有各自的通话行为,则可以将两个手机号节点合并为1个,实现节点的融合,相应的,两个手机号的通话行为也打通了,即实现了关系的打通。

这样做的好处是,将同一个子图内的所有关系做充分的融合,避免后续因为信息丢失,如丢失某个手机号,或丢失了节点11和节点12的关系,导致关键证据链断裂,而无法得到异常分析结果。

s304、获取多张子图中节点的信息和边的属性信息。

需要说明的是,如果节点是合并后的节点,则应保留原始节点的信息和属性信息;如果边是具有关联关系的节点连接得到的,则将该具有关联关系的节点的属性信息作为边的属性信息。

s305、根据节点的信息,将多张子图中的相同节点进行合并,得到初级知识图谱。

s306、根据边的属性信息,将初级知识图谱中同一节点连接的、满足预设关联条件的边进行合并,得到知识图谱。

本申请实施例在构建每种类型的子图时,首先根据实体信息和直接关系构建初步的子图,在此基础上,将具有关联关系的节点进行合并或连接,实现子图内部节点和关系的融合和打通,避免信息缺失,导致关键证据链断裂,而使知识图谱无法应用于异常检测等业务场景中。

实施例四

图4是本申请实施例四中的一种基于知识图谱的检测方法的流程图,本申请实施例适用于基于已经构建的知识图谱对外部数据进行检测的情况,该方法通过基于知识图谱的检测装置执行,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。

如图4所示的一种基于知识图谱的检测方法,包括:

s401、获取待检测数据。

可选地,获取待检测的语音或者文本,基于语音识别技术或者文本检测技术,提取出可供检测的实体及实体间的关系,即待检测数据。例如用户a声称和用户b在10点于中心大道见面,基于语音识别技术,提取出用户a、用户b、10点、中心大道和见面。

s402、根据待检测数据,查找知识图谱中的对应元素。

遍历知识图谱中的各节点和边,查找与待检测数据匹配的节点和/或边。这些匹配的节点和/或边共同构成知识图谱中的对应元素。

进一步地,为了保证元素查找的全面性,以提高数据检测的准确性,将查找到的与待检测数据匹配的节点和/或边,以及与这些匹配的节点和/或边直接连接的节点和边共同构成知识图谱中的对应元素。

s403、对待检测数据和对应元素进行一致性检测。

对比待检测数据和对应元素是否一致。如果一致,说明待检测数据是真实可靠的,如果不之一,说明待检测数据是虚假的。

在一示例中,查找到的知识图谱中的对应元素包括相连接的用户a节点和用户c节点。用户a节点和用户c节点的边代表见面,边的时空属性为10点、中心大道。待检测数据为上述例子中的数据:用户a、用户b、10点、中心大道和见面。可见,按照知识图谱,用户a于10点在中心大道与用户c见面,但待检测数据中用户a于10点在中心大道却与用户b见面。可见,对应元素中的用户c节点与待检测数据中的用户b存在冲突,为冲突节点,用户a节点与用户c节点之间的边为冲突边,待检测数据与对应元素的检测结果不一致。

本申请实施例通过知识图谱对待检测数据进行一致性检测,即二者是否存在节点和/或边的冲突。由于知识图谱充分融合了各种类型的信息,证据链完整,提高了一致性检测的有效性。本实施例提供的方法能够广泛应用于洗钱,反欺诈,不一致性检测,诈骗等应用场景。

实施例五

图5a是本申请实施例五中的一种基于知识图谱的检测方法的流程图,本申请实施例适用于对已经构建的知识图谱进行内检的情况,该方法通过基于知识图谱的检测装置执行,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。

如图5a所示的一种基于知识图谱的检测方法,包括:

s501、获取知识图谱中的预设结构。

s502、对预设结构进行合法性检测。

可选的,预设结构包括:闭环结构、单入多出结构和多入单出结构中的至少一种。

其中,闭环结构、单入多出结构和多入单出结构分别表征了环状流向的信息、发散的信息和汇聚的信息,可被认定为高风险的结构。通过对这些结构进行合法性检测,从而有针对性地发现非法行为。

图5b示出了某公司的组织架构图,图5c示出了社交关系图。利用组织架构图,社交关系图,转账记录图和银行卡相关帐号关联图(未示出)等多个子图融合在一起,构建完全连通的知识图谱。对知识图谱进行闭环检测,可以发现其中的非法闭环,如图5d所示,财务b向法人非法转账。

本申请实施例中,由于知识图谱充分融合了各种类型的信息,使得不具有直接关系的节点也建立了连接,从而展示出新的关系和预设结构。通过对这些预设结构进行合法性检测,能够快速、便捷地发现知识图谱中的非法行为。本实施例提供的方法能够广泛应用于洗钱,反欺诈,不一致性检测,诈骗等应用场景。

实施例六

图6是本申请实施例六中的一种知识图谱的构建装置的结构图,本申请实施例适用于基于各种类型的信息构建连通的知识图谱的情况,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。

如图6所示的一种知识图谱的构建装置600,包括:获取模块601,第一合并模块602和第二合并模块603;其中,

获取模块601,用于获取用于构建知识图谱的多种类型的多张子图,以及多张子图中节点的信息和边的属性信息;

第一合并模块602,用于根据节点的信息,将多张子图中的相同节点进行合并,得到初级知识图谱;

第二合并模块603,用于根据边的属性信息,将初级知识图谱中同一节点连接的、满足预设关联条件的边进行合并,得到知识图谱。

本申请实施例通过将多张类型的子图中相同的节点合并,实现了多类型子图的合并,初步融合了跨类型信息;进一步将同一节点连接的、满足预设关联条件的边进行合并,实现跨类型信息的充分融合,有效挖掘深层次信息,避免信息缺失和关键证据链断裂,使得知识图谱应用于异常检测等业务场景中时,能够发挥有效作用。

进一步地,第二合并模块603具体用于根据边的时间属性信息和/或空间属性信息,将初级知识图谱中同一节点连接的、时间之差和/或空间之差在预设范围内的边进行合并,得到知识图谱。

进一步地,装置还包括连接模块,用于:判断知识图谱中是否存在孤立子图;如果存在,查找各孤立子图之间具有关联关系的节点,并在具有关联关系的节点之间通过虚拟节点连接。

进一步地,连接模块在查找各孤立子图之间具有关联关系的节点时,具体用于:获取各孤立子图中各节点的时间属性信息和/或空间属性信息;根据各节点的时间属性信息和/或空间属性信息,将不同孤立子图中时间之差和/或空间之差在预设范围内的节点,作为具有关联关系的节点。

进一步地,连接模块在查找各孤立子图之间具有关联关系的节点时,具体用于:获取各孤立子图之间具有共性信息的节点;其中,共性信息包括相同身份信息。

进一步地,获取模块601具体用于:获取多种类型的实体信息和实体之间的直接关系;将每种类型的实体信息抽象为节点,将实体之间的直接关系抽象为边,构建对应类型的子图;将对应类型的子图中具有关联关系的节点进行合并或连接。

上述知识图谱的构建装置可执行本申请任意实施例所提供的知识图谱的构建方法,具备执行知识图谱的构建方法相应的功能模块和有益效果。

实施例七

图7是本申请实施例七中的一种基于知识图谱的检测装置的结构图,本申请实施例适用于基于已经构建的知识图谱对外部数据进行检测的情况,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。

如图7所示的一种基于知识图谱的检测装置700,包括:获取模块701,查找模块702和检测模块703;其中,

获取模块701,用于获取待检测数据;

查找模块702,用于根据待检测数据,查找知识图谱中的对应元素;

检测模块703,用于对待检测数据和对应元素进行一致性检测。

本申请实施例通过知识图谱对待检测数据进行一致性检测,即二者是否存在节点和/或边的冲突。由于知识图谱充分融合了各种类型的信息,证据链完整,提高了一致性检测的有效性。

实施例八

图8是本申请实施例八中的一种基于知识图谱的检测装置的结构图,本申请实施例适用于对已经构建的知识图谱进行内检的情况,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。

如图8所示的一种基于知识图谱的检测装置800,包括:获取模块801和检测模块802;其中,

获取模块801,用于获取知识图谱中的预设结构。

检测模块802,用于对预设结构进行合法性检测。

进一步地,预设结构包括:闭环结构、单入多出结构和多入单出结构中的至少一种。

本申请实施例中,由于知识图谱充分融合了各种类型的信息,使得不具有直接关系的节点也建立了连接,从而展示出新的关系和预设结构。通过对这些预设结构进行合法性检测,能够快速、便捷地发现知识图谱中的非法行为。本实施例提供的方法能够广泛应用于洗钱,反欺诈,不一致性检测,诈骗等应用场景。

实施例九

根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。

如图9所示,是实现本申请实施例的知识图谱的构建方法或基于知识图谱的检测方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图9所示,该电子设备包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。

存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的知识图谱的构建方法、基于知识图谱的检测方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的知识图谱的构建方法、基于知识图谱的检测方法。

存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的知识图谱的构建方法、基于知识图谱的检测方法对应的程序指令/模块(例如,附图6所示的包括获取模块601,第一合并模块602和第二合并模块603;又例如附图7所示的包括获取模块701,查找模块702和检测模块703;又例如附图8所示的包括获取模块801和检测模块802)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的知识图谱的构建方法、基于知识图谱的检测方法。

存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储实现知识图谱的构建方法、基于知识图谱的检测方法的电子设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至执行知识图谱的构建方法、基于知识图谱的检测方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

执行知识图谱的构建方法、基于知识图谱的检测方法的电子设备还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。

输入装置903可接收输入的数字或字符信息,以及产生与执行知识图谱的构建方法、基于知识图谱的检测方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案,通过将多张类型的子图中相同的节点合并,实现了多类型子图的合并,初步融合了跨类型信息;进一步将同一节点连接的、满足预设关联条件的边进行合并,实现跨类型信息的充分融合,有效挖掘深层次信息,避免信息缺失和关键证据链断裂,使得知识图谱应用于异常检测等业务场景中时,能够发挥有效作用。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

当前第1页1 2 3 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!