关系网络拓扑的风险判定方法、装置和介质与流程

文档序号:26435686发布日期:2021-08-27 13:33阅读:131来源:国知局
关系网络拓扑的风险判定方法、装置和介质与流程

本发明涉及信息处理领域,具体而言,涉及一种关系网络拓扑的风险判定方法、装置和介质。



背景技术:

大数据时代中,实体(例如单位等)之间的关系(例如开票、转账、担保)往往是很重要的一些数据,通过这些数据可以分析出实体之间的关系是否正常,实体之间是否从事着某种不恰当的行为等。实体关系大数据分析的基础是关系网络拓扑。关系网络拓扑是由节点和节点间有向边组成的连通图形,其中,用节点表示实体,用有向边表示实体间发生的关系(例如担保、转账)。关系网络拓扑是由一些可视关系网络产品,基于数据库中存储的实体间关系行为数据(例如实体a为实体b担保,实体b向实体c投资等),将实体绘制成节点,将实体间关系行为绘制成节点间有向边而形成的。这样,基于关系网络拓扑,就可以分析出实体之间的关系是否正常,实体之间是否从事着某种不法行为等。

现有技术中判定这些关系网络拓扑中是否存在风险,是通过风险模式子拓扑。事先构造出风险模式子拓扑,它也是由一些节点和节点间有向边组成的连通图形。只要关系网络拓扑中含有风险模式子拓扑,该关系网络拓扑就是风险的。例如,如果三家单位a、b、c形成了循环担保,即a为b担保,b为c担保,c为a担保,这种担保关系肯定是有风险的,就可以将a、b、c三个单位循环担保对应的拓扑(a、b、c三个节点用有向边连接组成的三角形)作为一个风险模式子拓扑。如果关系网络拓扑中含有风险模式子拓扑,则判定存在风险。

目前,构造风险模式子拓扑的方式有两种:一种通过代码转换,一种通过借助于可视化工具,在界面上管理员手动描绘风险模式子拓扑。两种方式都依赖于管理员的业务经验,效率低下,且依赖于人的主观判断,准确性差。



技术实现要素:

有鉴于此,本发明旨在使关系网络拓扑的风险判定更高效和准确。

为了达到这个目的,根据本发明的第一方面,本发明实施例提供了一种关系网络拓扑的风险判定方法,包括:

获取多个已判定为风险的关系网络拓扑,其中,关系网络拓扑是由节点和节点间有向边组成的连通图形;

提取所述多个已判定为风险的关系网络拓扑中的共有子拓扑;

对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为风险模式子拓扑;

如果待判定关系网络拓扑含有该风险模式子拓扑,则判定该待判定关系网络拓扑为风险。

可选地,所述要素为选自包括以下的要素组中的至少一个要素:节点类型、节点属性、边类型和边属性。

可选地,所述共有子拓扑包括所述多个已判定为风险的关系网络拓扑中的共有的节点和节点间有向边组成的连通图形。

可选地,所述共有子拓扑包括所述多个已判定为风险的关系网络拓扑中的共有的节点和节点间有向边组成的连通图形,且所述多个已判定为风险的关系网络拓扑中,这些共有的节点和节点间有向边的一部分要素也共有;所述对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素,包括:对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的该一部分公共要素以外的剩余要素中的公共要素。

可选地,在提取所述多个已判定为风险的关系网络拓扑中的共有子拓扑之后,所述方法包括:如果所述共有子拓扑不符合预定子拓扑规则,丢弃所述共有子拓扑。

可选地,在获取多个已判定为风险的关系网络拓扑之后,所述方法还包括:获取所述多个已判定为风险的关系网络拓扑的风险类型;所述提取所述多个已判定为风险的关系网络拓扑中的共有子拓扑,包括:提取特定风险类型中已判定为风险的关系网络拓扑中的共有子拓扑;所述对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为风险模式子拓扑,包括:对所述共有子拓扑中的节点或有向边,添加该特定风险类型中已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为该特定风险类型的风险模式子拓扑。

可选地,在提取特定风险类型中已判定为风险的关系网络拓扑中的共有子拓扑之后,所述方法还包括:如果所述共有子拓扑不符合与该特定风险类型对应的预定子拓扑规则,丢弃所述共有子拓扑。

可选地,所述如果待判定关系网络拓扑含有该风险模式子拓扑,则判定该待判定关系网络拓扑为风险,包括:将所述待判定关系网络拓扑与每一种风险类型的风险模式子拓扑对比,如果待判定关系网络拓扑含有其中一种风险类型的风险模式子拓扑,则判定该待判定关系网络拓扑为风险。

可选地,如果所述要素为节点类型,所述公共要素通过以下来判定:对于所述共有子拓扑中的节点,如果所述多个已判定为风险的关系网络拓扑中该节点的节点类型相同,或节点类型属于同一节点类型组,则该相同的节点类型或该同一节点类型组为公共要素。

可选地,如果所述要素为节点属性,所述公共要素通过以下来判定:对于所述共有子拓扑中的节点,如果所述多个已判定为风险的关系网络拓扑中该节点的特定非数值节点属性相同,或特定数值节点属性属于同一属性值范围,则该相同的非数值节点属性或该同一属性值范围为公共要素。

可选地,如果所述要素为边类型,所述公共要素通过以下来判定:对于所述共有子拓扑中的有向边,如果所述多个已判定为风险的关系网络拓扑中该有向边的边类型相同,或边类型属于同一边类型组,则该相同的边类型或该同一边类型组为公共要素。

可选地,如果所述要素为边属性,所述公共要素通过以下来判定:对于所述共有子拓扑中的有向边,如果所述多个已判定为风险的关系网络拓扑中该有向边的特定非数值边属性相同,或特定数值边属性属于同一属性值范围,则该相同的非数值边属性或该同一属性值范围为公共要素。

可选地,在对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为风险模式子拓扑之后,所述方法还包括:基于用户输入的调整指令,对该风险模式子拓扑进行调整。

根据本发明的第二方面,提供了一种关系网络拓扑的风险判定装置,包括:

处理器;

存储器,存储有计算机可执行代码,所述计算机可执行代码被所述处理器调用以执行:

获取多个已判定为风险的关系网络拓扑,其中,关系网络拓扑是由节点和节点间有向边组成的连通图形;

提取所述多个已判定为风险的关系网络拓扑中的共有子拓扑;

对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为风险模式子拓扑;

如果待判定关系网络拓扑含有该风险模式子拓扑,则判定该待判定关系网络拓扑为风险。

可选地,所述要素为选自包括以下的要素组中的至少一个要素:节点类型、节点属性、边类型和边属性。

可选地,所述共有子拓扑包括所述多个已判定为风险的关系网络拓扑中的共有的节点和节点间有向边组成的连通图形。

可选地,所述共有子拓扑包括所述多个已判定为风险的关系网络拓扑中的共有的节点和节点间有向边组成的连通图形,且所述多个已判定为风险的关系网络拓扑中,这些共有的节点和节点间有向边的一部分要素也共有;所述对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素,包括:对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的该一部分公共要素以外的剩余要素中的公共要素。

可选地,所述计算机可执行代码被所述处理器调用以执行:在提取所述多个已判定为风险的关系网络拓扑中的共有子拓扑之后,如果所述共有子拓扑不符合预定子拓扑规则,丢弃所述共有子拓扑。

可选地,所述计算机可执行代码被所述处理器调用以执行:在对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为风险模式子拓扑之后,基于用户输入的调整指令,对该风险模式子拓扑进行调整。

根据本发明的第三方面,提供了一种计算机可读介质,所述计算机可读介质存储有可由终端设备执行的计算机指令,所述计算机指令被执行时,实现:

获取多个已判定为风险的关系网络拓扑,其中,关系网络拓扑是由节点和节点间有向边组成的连通图形;

提取所述多个已判定为风险的关系网络拓扑中的共有子拓扑;

对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为风险模式子拓扑;

如果待判定关系网络拓扑含有该风险模式子拓扑,则判定该待判定关系网络拓扑为风险。

本发明实施例中,不是依赖管理员的主观判断来建立风险模式子拓扑,而是充分利用以往已经被判定为风险的关系网络拓扑,从中提取出其共有的子拓扑,在此基础上建立风险模式子拓扑,既提高了建立风险模式子拓扑的效率,也减少了人为判断对建立的风险模式子拓扑造成的影响,使关系网络拓扑的风险判定更高效和准确。

附图说明

通过参考以下附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:

图1示出了根据本发明实施例的关系网络拓扑的风险判定方法所应用的体系构架图;

图2a-c分别示出了三个已判定为风险的关系网络拓扑的例子;

图3a示出了根据本发明的仅根据共有拓扑图形来提取共有子拓扑的实施例,从图2a-c的三个关系网络拓扑中提取的共有子拓扑,图3b示出了对应的三个关系网络拓扑中各节点和有向边的公共要素列表,图3c示出了在图3a的基础上结合图3b的公共要素列表形成的风险模式子拓扑;

图4a-c分别示出了三个已判定为风险的关系网络拓扑的例子;

图5a示出了根据本发明的根据共有拓扑图形和共有节点类型来提取共有子拓扑的实施例,从图4a-c的三个关系网络拓扑中提取的共有子拓扑,图5b示出了对应的三个关系网络拓扑中各节点和有向边的公共要素列表,图5c示出了在图5a的基础上结合图5b的公共要素列表形成的风险模式子拓扑;

图6a-c分别示出了三个已判定为风险的关系网络拓扑的例子;

图7a示出了根据本发明的根据共有拓扑图形、共有节点类型、共有边类型来提取共有子拓扑的实施例,从图6a-c的三个关系网络拓扑中提取的共有子拓扑,图7b示出了对应的三个关系网络拓扑中各节点和有向边的公共要素列表,图7c示出了在图7a的基础上结合图7b的公共要素列表形成的风险模式子拓扑;

图8示出了根据本发明一个实施例的关系网络拓扑的风险判定方法的流程图;

图9示出了根据本发明一个实施例的关系网络拓扑的风险判定方法的流程图;

图10示出了根据本发明一个实施例的关系网络拓扑的风险判定装置的框图;

图11示出了根据本发明一个实施例的关系网络拓扑的风险判定装置的结构图。

具体实施方式

以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程没有详细叙述。另外附图不一定是按比例绘制的。

根据本发明实施例的关系网络拓扑的风险判定方法可以用于企业图谱分析等场景。企业图谱是为企业提供一站式的企业数据服务的产品。通过整合企业及企业关联信息,挖掘互联网海量非结构化数据,结合多维交叉分析及智能算法,为企业提供其客户画像及关联分析问题的能力。通过分析和挖掘企业在互联网的信息,实时掌握企业动态并准确预测企业行为,为企业提供智能应用和定制化解决方案。企业图谱的一个重要功能是企业与其它企业关系的关系展示。在关系展示的图谱中,将该企业作为一个节点,将与企业有各种关系(例如担保关系分析、资金转移关系、股权投资关系、发票开具关系、合同合作关系等)的其它企业或组织也分别作为节点,将企业与其它企业或组织之间的关系(如担保、资金转移、股权投资、开发票等)作为节点之间的有向边,从而绘制出企业图谱。该企业图谱不但可以为本企业分析企业动态并准确预测企业行为提供定制的解决方案,而且可以被银行等用来预测企业是否存在一些不正当的行为。

图1示出了根据本发明实施例的关系网络拓扑的风险判定方法所应用在上述场景下采用的体系构架图。该体系构架包括数据库120、服务器110、网络130和查询终端140。

查询终端140是针对一个关系网络拓扑,查询其是否有风险的终端。在上述银行用企业图谱来查验企业与其它组织是否存在不正当的行为的场景下,它可以是银行的查验终端。它可以体现为桌面电脑、笔记本电脑、移动终端(手机、pda等)、车载终端或其它专用终端。银行工作人员可以在查询终端140上借助可视关系网络产品生成待判定关系网络拓扑,或者在查询终端140提供的界面上选择待判定关系网络拓扑,通过网络130发送到服务器110。待判定关系网络拓扑可以是上述企业图谱,即根据企业和其它组织之间发生的关系,将企业或其它组织描绘成节点,将企业和其它组织之间的关系(如借贷关系、担保关系等)描绘成节点之间的有向边,而形成的表示该企业和其它组织之间的关系的连通图。银行工作人员通过查询终端140查询的目的是,在银行为银行放款前,想要判定该企业与其它组织之间的往来是否存在着风险,例如它们是否从事着洗钱行为、是否存在欺诈等,从而采取适当措施。

网络130可以是互联网、有线电信网、无线电信网等。

服务器110是本发明实施例的关系网络拓扑的风险判定方法的执行主体。在上述场景中,其可以是企业图谱服务器。它充分利用以往获得的、存储在数据库120中的关系网络拓扑中已经被判定为风险的关系网络拓扑,从中提取出其共有的子拓扑,在此基础上建立风险模式子拓扑,从而利用其判定从查询终端140接收到的待判定关系网络拓扑是否有风险。

数据库120是存放历史上获得的各种关系网络拓扑和实体关系基础数据的库。在上述场景中,它可以是企业图谱数据库。关系网络拓扑是用节点来表示实体、用节点之间的有向边表示实体之间的关系,从而形成的连通图形,它表示了实体关系网中各种实体的相互作用关系。一般来说,从一个实体出发,将其作为一个节点,考查哪些实体与其有关系,作为其相邻节点,在该节点和相邻节点之间形成有向边。再考查每个相邻节点与哪些实体有关系,这样逐层辐射下去。实体关系基础数据是绘制关系网络拓扑所依赖的数据,即每个实体数据和表示这些实体之间的关系的数据,例如,表示实体a为实体b担保的担保记录。

如图8所示,提供了根据本发明一个实施例的一种关系网络拓扑的风险判定方法。关系网络拓扑是由节点和节点间有向边组成的连通图形,其用于模拟实体(单位等)和实体之间发生的各种关系。风险判定方法是指判定关系网络拓扑是否存在风险的方法。该风险是指存在洗钱、欺诈、循环担保等不安全的隐患。该方法由服务器110实现。

在步骤310中,获取多个已判定为风险的关系网络拓扑。

如上所述,历史上的关系网络拓扑可以由服务器110上的可视关系网络产品基于数据库120存储的实体关系基础数据生成。具体地,其可以基于所述实体关系基础数据,将涉及的实体绘制成节点,将涉及的实体之间的关系绘制成节点间有向边而生成。历史上的关系网络拓扑生成后存储在数据库120中。

在一个实施例中,获取多个已判定为风险的关系网络拓扑,可以通过将数据库120存储的关系网络拓扑通过界面一一显示给管理员,然后由管理员在界面上依据人工经验标注是否有风险来实现。即,显示预先存储的历史上的关系网络拓扑,接收用户对显示的关系网络拓扑中有风险的关系网络拓扑的选择,从而获得所述多个已判定为风险的关系网络拓扑。

在步骤320中,提取所述多个已判定为风险的关系网络拓扑中的共有子拓扑。

共有子拓扑随具体应用场景的要求不同,可能存在两种不同情况,即仅考虑图形形状的共有子拓扑、和同时考虑图形形状、和节点或有向边的一部分公共要素的共有子拓扑。要素为选自包括以下的要素组中的至少一个要素:节点类型、节点属性、边类型和边属性等。公共要素是指在所述多个已判定为风险的关系网络拓扑之间都相同的要素。

节点类型就是节点代表的实体的实体性质。例如,节点代表银行实体,则银行是该节点的节点类型。节点属性是节点代表的实体的除类型之外的其它信息。例如,实体的地域、地址、电话号码、法人代表、人数等都可以作为节点属性。边类型是实体之间发生的具体关系的名称。例如,实体a给实体b担保,则担保就是对应的节点a指向节点b的有向边的类型。边属性是指实体之间发生的具体关系除名称之外的其它性质。例如,对于担保来说,担保数额可以是一个边属性,担保日期也可以是一个边属性。

先讨论仅考虑图形形状的共有子拓扑时的共有子拓扑。仅考虑图形形状的共有子拓扑时的共有子拓扑,是指所述多个已判定为风险的关系网络拓扑中的共有的节点和节点间有向边组成的连通图形。也就是说,所述多个已判定为风险的关系网络拓扑中,都含有这些节点,也含有这些节点之间的有向边,这些节点被这些有向边连接,形成连通图形,则这个连通图形就是共有子拓扑。连通是指,对于图形中的任意一个节点,都能在图形中经过若干个有向边(可以沿有向边的方向经过,也可以逆着有向边的方向经过),达到图形中的任意其它节点。

例如,对于图2a、2b、2c中的3个已判定为风险的关系网络拓扑来说,每个关系网络拓扑包括由有向边220连接的节点210。这些拓扑显然都包含d、b、c这3个节点,也包含从节点d到节点b的有向边、从节点b到节点c的有向边、从节点c到节点d的有向边,因此将它们提取出来,如图3a所示,作为图2a-c的共有子拓扑。

在上面的情形中,判定共有子拓扑时,只考虑到图形形状,即是否包括同样的节点和节点间有向边。只要多个关系网络拓扑包括共同的节点和节点间有向边,这些有向边将节点连接成一个连通图形,就可以将它们提取出来,作为共有子拓扑。但有时仅考虑图形形状是不够的。例如,图3a中,假设有向边bc、cd、db都表示担保,则构成循环担保,这种模式是有问题的,可能涉及违法,但如果有向边bc、cd、db都表示出访,则这种模式没有什么问题。因此,在一些实施例中,判定共有子拓扑时,除了考虑到图形形状,还要考虑节点或有向边的一部分公共要素。这时,共有子拓扑包括所述多个已判定为风险的关系网络拓扑中的共有的节点和节点间有向边组成的连通图形,且所述多个已判定为风险的关系网络拓扑中,这些共有的节点和节点间有向边的一部分要素也共有。也就是说,它不但要求共有子拓扑中的节点和节点间有向边是多个关系网络拓扑共有的,还要求共有的节点和节点间有向边的一部分要素也共有,例如节点类型共有,或节点类型和边类型同时共有。

以共有子拓扑不但要求节点和节点间有向边共有,还要求节点类型共有为例。图4a-c示出了三个已判定为风险的关系网络拓扑。如果按照仅要求节点和节点间有向边共有的原则,不但节点b、c、d和它们之间的有向边会被提取出来,图4a的节点h、图4b的节点i、图4c的节点j也会被提取出来,因为这些节点虽然用不同字母表示,但从节点c到该节点都有一条同样的有向边,从该节点到节点d也有一条同样的有向边。但由于图4a中节点h的节点类型是银行,在图4b中节点i的节点类型是学校,在图4c中节点j的节点类型是商店,不属于节点类型共有,因此,如图5a所示,仅提取出节点b-d和它们之间的有向边,作为共有子拓扑,其中节点b-d的节点类型都是银行。

以共有子拓扑不但要求节点和节点间有向边共有,还要求节点类型和边类型共有为例。图6a-c示出了三个已判定为风险的关系网络拓扑。如果按照要求节点和节点间有向边共有、以及节点类型共有的原则,不但节点b、c、d和它们之间的有向边会被提取出来,图6a的节点h、图6b的节点l、图6c的节点m也会被提取出来,因为这些节点虽然用不同字母表示,但从节点c到该节点都有一条同样的有向边,从该节点到节点d也有一条同样的有向边,且它们的节点类型都是银行。但由于图6b中有向边cl的边类型是借款,而图6a和c中相应的边类型是担保,且图6c中有向边nd的边类型是贷款,而图6a-b中相应的边类型是担保,因此,如图7a所示,仅提取出节点b-d和它们之间的有向边,作为共有子拓扑,其中节点b-d的节点类型都是银行,它们之间的有向边的边类型都是担保。

如图8所示,步骤320之后,进入步骤330,即如果所述共有子拓扑不符合预定子拓扑规则,丢弃所述共有子拓扑。但该步骤是可以省略的。

预定子拓扑规则是预先制定的、风险模式子拓扑应该满足的规则。步骤330是考虑到有一些常用的模式很容易出现在实体之间的关系网中,在步骤320中其相应的共有子拓扑很可能被提取出来,但它可能是没有什么危害的,并不是这些判定为风险的关系网络拓扑的风险所在。因此,预先制定一些规则,只有满足这些规则才可能认为是有风险的,不满足这些规则,就不认为是有风险的,将相应的共有子拓扑丢弃。该步骤的好处是,避免将一些常用模式识别成风险模式子拓扑,而对风险判定准确率造成影响。

然后,在步骤340中,对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为风险模式子拓扑。即风险模式子拓扑补全。

在实践中,不大可能只根据待判定关系网络拓扑中含有风险模式子拓扑中的所有节点和节点间有向边,就判定待判定关系网络拓扑为风险,一般要考虑节点类型、节点属性、边类型、边属性这些要求。即使如前述图3a所示,在判定共有子拓扑时,只考虑包括同样的节点和节点间有向边,形成最后的风险模式子拓扑时,也要将要素补全,即添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素。然后,在判定待判定关系网络拓扑是否含有该风险模式子拓扑时,不但要考虑是否含有该风险模式子拓扑中的节点和有向边,还要考虑是否包含同样的公共要素。

下面讨论公共要素的判定规则。

如果所述要素为节点类型,所述公共要素通过以下来判定:对于所述共有子拓扑中的节点,如果所述多个已判定为风险的关系网络拓扑中该节点的节点类型相同,或节点类型属于同一节点类型组,则该相同的节点类型或该同一节点类型组为公共要素。节点类型组是事先划分的、将一些类型比较类似的节点共同分入的组。例如,银行和信用社是两个不同节点类型,但实际上功能比较类似,如果两个关系网络拓扑的特定节点仅仅是类型为银行还是类型为信用社的差别,认为它们有很大差别,是不合适的。节点类型与节点类型组的映射关系表是事先设置的,可以查找该映射关系表,获得节点类型所属的节点类型组。

表1

如表1所示,如果节点1-3的类型都是银行,则以银行为公共要素;如果节点1-2的类型是银行,节点3的类型是信用社,则以金融单位为公共要素;如果节点1和3的类型是银行,节点2的类型是学校,则没有公共要素。

如果所述要素为节点属性,所述公共要素通过以下来判定:对于所述共有子拓扑中的节点,如果所述多个已判定为风险的关系网络拓扑中该节点的特定非数值节点属性相同,或特定数值节点属性属于同一属性值范围,则该相同的非数值节点属性或该同一属性值范围为公共要素。非数值节点属性是指不用数值表示的节点属性,如地域。数值节点属性是指用数值表示的节点属性,如员工人数。对于非数值节点属性,需要其完全相同,才能认为其相同,例如,地域都是北京,两个节点在地域上才认为是一样的。但对于数值节点属性来说,只要它们属于同一属性值范围,就认为它们是类似的,具体的数值没有那么大差别,可以以该同一属性值范围为公共要素。以员工人数为例,1-20人都被认为是微型单位,21-100人被认为是小型单位,101-1000人被认为是中型单位,1001人以上被认为是大型单位,因此35人和48人被认为没有太大的区别。因此,只要数值节点属性属于同一属性值范围,认为它们是类似的,以该同一属性值范围为公共要素。属性值范围是事先设置的,可以查找该预设的属性值范围,获得数值节点属性所属的属性值范围。

表2

如表2所示,如果节点1-3的员工人数这个节点属性都是35,则以21-100人为公共要素;如果节点1-3的员工人数分别是35、68、53,则以21-100人为公共要素;如果节点1-3的员工人数分别是35、138、75,则没有公共要素。

如果所述要素为边类型,所述公共要素通过以下来判定:对于所述共有子拓扑中的有向边,如果所述多个已判定为风险的关系网络拓扑中该有向边的边类型相同,或边类型属于同一边类型组,则该相同的边类型或该同一边类型组为公共要素。边类型组是事先划分的、将一些类型比较类似的边共同分入的组。例如,担保和共同出资是两个不同边类型,但实际上法律上都是承担连带责任,从法律责任意义上没有太大差别,分到共同利益组。边类型与边类型组的映射关系表是事先设置的,可以查找该映射关系表,获得边类型所属的边类型组。

表3

如表3所示,如果边1-3的类型都是担保,则以担保为公共要素;如果边1-2的类型是担保,边3的类型是共同出资,则以共同利益为公共要素;如果边1-3的类型分别是担保、贷款和共同出资,则没有公共要素。

如果所述要素为边属性,所述公共要素通过以下来判定:对于所述共有子拓扑中的有向边,如果所述多个已判定为风险的关系网络拓扑中该有向边的特定非数值边属性相同,或特定数值边属性属于同一属性值范围,则该相同的非数值边属性或该同一属性值范围为公共要素。非数值边属性是指不用数值表示的边属性,如担保地域。数值节点属性是指用数值表示的边属性,如担保金额。对于非数值边属性,需要其完全相同,才能认为其相同,但对于数值边属性来说,即只要在同一范围内,可能性质是一样的,可以认为差别不大,以该同一属性值范围为公共要素。以担保金额为例,担保金额在1万元以下可能认为是微型担保,1万-10万元可能认为是小型担保,10-100万可以认为是中型担保,100万以上可能认为是大型担保。担保35万和担保48万在性质上认为是同一种性质,可以以10-100万为公共要素。属性值范围是事先设置的,可以查找该预设的属性值范围,获得边节点属性所属的属性值范围。

表4

如表4所示,如果边1-3的担保数额这个属性都是35万元,则以21-100万元为公共要素;如果边1-3的担保数额分别是35、68、53万元,则以21-100万元为公共要素;如果边1-3的担保数额分别是35、138、75万元,则没有公共要素。

如果在步骤320提取共有子拓扑时考虑了节点和节点间有向边的一部分要素,则该部分要素的共有性在步骤320中已经考虑,在本步骤中,仅需要对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的该一部分公共要素以外的剩余要素中的公共要素。针对如图5c所示的共有子拓扑,其在生成共有子拓扑时考虑到了节点类型的共有性,则本步骤只需要考虑节点属性、边类型、边属性这些剩余要素。针对如图5a所示的共有子拓扑,其在生成共有子拓扑时考虑到了节点类型的共有性,则本步骤只需要考虑节点属性、边类型、边属性这些剩余要素。针对如图7a所示的共有子拓扑,其在生成共有子拓扑时考虑到了节点类型、边类型的共有性,则本步骤只需要考虑节点属性、边属性这些剩余要素。

对于图3a的共有子拓扑,考查其中每个节点和边的要求。图3a的节点和边的要素情况如图3b所示。节点b-c的节点类型是银行,节点d的节点类型是信用社,都属于金融单位这个组,在3a的基础上添加“金融单位”到每个节点。对于节点地域属性来说,节点b-d的地域属性分别是北京、北京、深圳,没有公共要素,不添加。对于边类型来说,三条有向边的边类型都是担保,添加“担保”到每个边。对于担保数额这个属性,边db、bc、cd的担保数额分别是20万、25万、40万,添加10-100万元到每个边。最后,生成了图3c的风险模式子拓扑。

对于图5a的共有子拓扑,其各节点和边的要素情况如图5b所示。由于生成图5a的共有子拓扑时,已经考虑了节点类型这一要素,在这里只需考虑节点属性、边类型、边属性这些剩余要素。对于节点地域属性来说,节点b-d的地域属性分别是北京、北京、深圳,没有公共要素,不添加。对于边类型来说,边db、bc的边类型都是担保,边cd的边类型是共同出资,属于“共同利益”这个组,添加“共同利益”到每个边。对于担保数额这个边属性,边db、bc、cd的担保数额分别是20万、25万、40万,都属于10-100万元这个范围,添加“10-100万元”到每个边。最后,生成了图5c的风险模式子拓扑。

对于图7a的共有子拓扑,其各节点和边的要素情况如图7b所示。由于生成图7a的共有子拓扑时,已经考虑了节点类型、边类型要素,在这里只需考虑节点属性、边属性这些剩余要素。对于节点地域属性来说,节点b-d的地域属性分别是北京、北京、深圳,没有公共要素,不添加。对于担保数额这个边属性,边db、bc、cd的担保数额分别是20万、25万、40万,都属于10-100万元这个范围,添加“10-100万元”到每个边。最后,生成了图7c的风险模式子拓扑。

然后,进入步骤350,基于用户输入的调整指令,对该风险模式子拓扑进行调整。该步骤是可以省略的。该步骤的意义在于,完全由机器得出的风险模式子拓扑可能有盲区,例如预定子拓扑规则的设置不可能穷尽所有情况,在某些情况下可能发生不准确,例如将一些并不危险的节点间关系仍然归结于风险模式子拓扑中。这时,需要人对机器生成的风险模式子拓扑手动调整。该步骤可以进一步增加风险判定的准确率。

在图1所示的体系构架中,管理员可以坐在其中一台查询终端140前,在查询终端140上显示步骤340中生成的风险模式子拓扑,由管理员在界面上输入调整指示,产生调整指令。服务器110接收到查询终端140通过网络130发送的调整指令后,对对该风险模式子拓扑进行调整。

然后,在步骤360中,如果待判定关系网络拓扑含有该风险模式子拓扑,则判定该待判定关系网络拓扑为风险。

待判定关系网络拓扑含有该风险模式子拓扑,不仅是说待判定关系网络拓扑含有该风险模式子拓扑的所有节点和边,同时还需要含有该风险模式子拓扑中的公共要素。例如,对于图3c来说,待判定关系网络拓扑需要含有b、c、d三个节点,其中,节点d给节点b担保,数额在10-100万之间;节点b给节点c担保,数额在10-100万之间;节点c给节点d担保,数额在10-100万之间。只有这些都具备时,认为待判定关系网络拓扑含有该风险模式子拓扑,判定该待判定关系网络拓扑为风险。

待判定关系网络拓扑是需要判定是否有风险的关系网络拓扑。在图1的体系构架中,它是由用户在查询终端140输入或选择的,经由网络130传送给服务器110。服务器110产生判定结果后,经由网络130传输给查询终端140显示。

在本发明另外的实施例中,不是对所有已判定为风险的关系网络拓扑提取共有子拓扑,而是针对划分为不同的风险类型(如洗钱、欺诈、薅羊毛),将每一种风险类型的关系网络拓扑放在一起提取共有子拓扑。这样做的好处就是,往往某一种风险类型的关系网络拓扑,其风险模式是类似的,在同一类关系网络拓扑中提取共有子拓扑,更能反映这一类关系网络拓扑的内在规则,相比于将所有的风险关系网络放在一起提取,提取的共有子拓扑更符合客观实际,风险判定更准确。

在该实施例中,在步骤310之后,所述方法还包括:获取所述多个已判定为风险的关系网络拓扑的风险类型。

在一个实施例中,步骤310可以通过接收用户对所述多个已判定为风险的关系网络拓扑的风险类型的输入来实现。在图1的体系构架中,管理员用户可以在其中一台查询终端140的前面。服务器100通过网络130将所述多个已判定为风险的关系网络拓扑发送给查询终端140,显示给管理员用户。管理员用户在界面上输入其判定的风险类型,经由网络130发送回服务器110.

在该实施例中,步骤320包括:提取特定风险类型中已判定为风险的关系网络拓扑中的共有子拓扑。也就是说,步骤320单独针对每种特定风险类型的已判定为风险的关系网络拓扑,提取共有子拓扑,这样,每种风险类型都会产生一个共有子拓扑。

在该实施例中,步骤330包括:如果所述共有子拓扑不符合与该特定风险类型对应的预定子拓扑规则,丢弃所述共有子拓扑。即,随着风险类型不同,其预定子拓扑规则也可能不同。针对每种风险类型,分别设置对应的子拓扑规则。这样,判定是否丢弃该共有子拓扑时,是针对该共有子拓扑是否符合这种特定风险类型对应的预定子拓扑规则进行判断,而不是用一个通用的预定子拓扑规则进行判断,使得建立的风险模式拓扑更反映这一风险类型的特点,风险判定更准确。

在该实施例中,步骤340包括:对所述共有子拓扑中的节点或有向边,添加该特定风险类型中已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为该特定风险类型的风险模式子拓扑。也就是说,在添加公共要素时,也是针对每种风险类型的共有子拓扑,添加该特定风险类型中已判定为风险的关系网络拓扑中该节点或有向边的公共要素,提高了建立的风险模式拓扑的针对性。

在该实施例中,步骤350中,基于用户输入的调整指令,对该风险模式拓扑进行调整,也是针对每种风险类型分别进行的。针对每种风险类型的风险模式拓扑,分别基于用户针对该风险类型输入的调整指令,对相应类型的风险模式拓扑进行调整。

在该实施例中,经过步骤310-350,对于每种风险类型,形成了一个风险模式子拓扑。在步骤360中,将所述待判定关系网络拓扑与每一种风险类型的风险模式子拓扑对比,如果待判定关系网络拓扑含有其中一种风险类型的风险模式子拓扑,都证明其中含有风险,判定该待判定关系网络拓扑为风险。

如图10所示,根据本发明的一个实施例,提供了一种关系网络拓扑的风险判定装置。在图1的体系构架中,它相当于服务器110。在其它体系构架中,它还有其它表现形式。例如,在单机的情况下,它可以是单机本身。

如图10所示,该关系网络拓扑的风险判定装置包括:

风险关系网络拓扑获取单元410,用于获取多个已判定为风险的关系网络拓扑,其中,关系网络拓扑是由节点和节点间有向边组成的连通图形;

共有子拓扑提取单元420,用于提取所述多个已判定为风险的关系网络拓扑中的共有子拓扑;

风险模式拓扑生成单元440,用于对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为风险模式子拓扑;

风险判定单元460,用于如果待判定关系网络拓扑含有该风险模式子拓扑,则判定该待判定关系网络拓扑为风险。

在一个实施例中,所述要素为选自包括以下的要素组中的至少一个要素:节点类型、节点属性、边类型、边属性。

在一个实施例中,所述共有子拓扑包括所述多个已判定为风险的关系网络拓扑中的共有的节点和节点间有向边组成的连通图形。

在一个实施例中,所述共有子拓扑包括所述多个已判定为风险的关系网络拓扑中的共有的节点和节点间有向边组成的连通图形,且所述多个已判定为风险的关系网络拓扑中,这些共有的节点和节点间有向边的一部分要素也共有;所述风险模式拓扑生成单元440进一步用于:对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的该一部分公共要素以外的剩余要素中的公共要素。

在一个实施例中,所述装置还包括:子拓扑规则判定单元430,用于

在提取所述多个已判定为风险的关系网络拓扑中的共有子拓扑之后,如果所述共有子拓扑不符合预定子拓扑规则,丢弃所述共有子拓扑。

在一个实施例中,所述装置还包括:风险类型获取单元(未示),用于在获取多个已判定为风险的关系网络拓扑之后,获取所述多个已判定为风险的关系网络拓扑的风险类型;所述共有子拓扑提取单元420进一步用于:提取特定风险类型中已判定为风险的关系网络拓扑中的共有子拓扑;所述风险模式子拓扑生成单元进一步用于:对所述共有子拓扑中的节点或有向边,添加该特定风险类型中已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为该特定风险类型的风险模式子拓扑。

在一个实施例中,所述子拓扑规则判定单元430进一步用于:如果所述共有子拓扑不符合与该特定风险类型对应的预定子拓扑规则,丢弃所述共有子拓扑。

在一个实施例中,所述风险判定单元460进一步用于:将所述待判定关系网络拓扑与每一种风险类型的风险模式子拓扑对比,如果待判定关系网络拓扑含有其中一种风险类型的风险模式子拓扑,则判定该待判定关系网络拓扑为风险。

在一个实施例中,如果所述要素为节点类型,所述公共要素通过以下来判定:对于所述共有子拓扑中的节点,如果所述多个已判定为风险的关系网络拓扑中该节点的节点类型相同,或节点类型属于同一节点类型组,则该相同的节点类型或该同一节点类型组为公共要素。

在一个实施例中,如果所述要素为节点属性,所述公共要素通过以下来判定:对于所述共有子拓扑中的节点,如果所述多个已判定为风险的关系网络拓扑中该节点的特定非数值节点属性相同,或特定数值节点属性属于同一属性值范围,则该相同的非数值节点属性或该同一属性值范围为公共要素。

在一个实施例中,如果所述要素为边类型,所述公共要素通过以下来判定:对于所述共有子拓扑中的有向边,如果所述多个已判定为风险的关系网络拓扑中该有向边的边类型相同,或边类型属于同一边类型组,则该相同的边类型或该同一边类型组为公共要素。

在一个实施例中,如果所述要素为边属性,所述公共要素通过以下来判定:对于所述共有子拓扑中的有向边,如果所述多个已判定为风险的关系网络拓扑中该有向边的特定非数值边属性相同,或特定数值边属性属于同一属性值范围,则该相同的非数值边属性或该同一属性值范围为公共要素。

在一个实施例中,所述装置还包括:调整单元450,用于在对所述共有子拓扑中的节点或有向边,添加所述多个已判定为风险的关系网络拓扑中该节点或有向边的公共要素,添加后的共有子拓扑作为风险模式子拓扑之后,基于用户输入的调整指令,对该风险模式子拓扑进行调整。

下面参照图11来描述根据本公开实施例的关系网络拓扑的风险判定装置110的硬件结构。图11显示的关系网络拓扑的风险判定装置110仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。

如图11所示,关系网络拓扑的风险判定装置110以通用计算设备的形式表现。关系网络拓扑的风险判定装置110的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830。

其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元810执行,使得所述处理单元810执行本说明书上述示例性方法的描述部分中描述的本发明各种示例性实施方式的步骤。例如,所述处理单元810可以执行如图8中所示的各个步骤。

存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)8201和/或高速缓存存储单元8202,还可以进一步包括只读存储单元(rom)8203。

存储单元820还可以包括具有一组(至少一个)程序模块8205的程序/实用工具8204,这样的程序模块8205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

关系网络拓扑的风险判定装置110也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该关系网络拓扑的风险判定装置110交互的设备通信,和/或与使得该关系网络拓扑的风险判定装置110能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口850进行。并且,关系网络拓扑的风险判定装置110还可以通过网络适配器860与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与关系网络拓扑的风险判定装置110的其它模块通信。应当明白,尽管图中未示出,可以结合关系网络拓扑的风险判定装置110使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。

在本公开的示例性实施例中,还提供了一种计算机程序介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行上述方法实施例描述的方法。

根据本公开的一个实施例,还提供了一种用于实现上述方法实施例中的方法的程序产品,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1