一种社区分割方法和装置与流程

文档序号:18642821发布日期:2019-09-11 23:45阅读:462来源:国知局
一种社区分割方法和装置与流程

本发明涉及数据处理技术领域,尤其是涉及一种社区分割方法和装置。



背景技术:

作为网络的一种常见属性,社区结构是一种对网络节点的分割,其中,同一个社区中的节点联系紧密,而隶属不同社区的节点之间的联系则相对松散。揭示网络社区界都对分析复杂网络拓扑结构,理解其功能,发现其隐含模式,以及预测其行为都具有十分重要的理论意义,在生物网,社会网和万维网中具有广泛的应用。

但是由于网络社区内各个节点之件具有的复杂的连接关系,因此,在对网络社区内的节点进行分析时,需要将复杂网络社区分割为多个较为简单的网络社区,从而降低分析难度。现有的网络社区分割方法的分割效率较低,导致对网络社区内节点的分析也造成了困难。

针对上述问题,还未提出有效的解决方案。



技术实现要素:

有鉴于此,本发明的目的在于提供一种社区分割方法和装置,以缓解了现有的社区分割方法对待分割网络社区的分割效率较低技术问题。

第一方面,本发明实施例提供了一种社区分割方法,包括:获取待分割网络社区内目标业务的申请信息;所述申请信息包括以下至少之一:申请编号,申请人的身份信息,申请人的居住位置信息,申请人的通信信息;基于所述申请信息构建所述待分割网络社区的二分图;所述二分图中包括:申请节点和/或属性节点,所述申请节点表示申请编号,所述属性节点表示身份信息、居住位置信息和通信信息中的至少之一;将所述待分割网络社区分割为多个社区,得到社区分割结果;并基于所述二分图确定出每个社区中包含的申请节点的数量;在多个社区中确定申请节点数量大于第一预设数量的目标社区;删除所述目标社区内连通度大于预设值的目标属性节点;并将所述目标社区确定为待分割网络社区,并返回执行利用社区发现算法将所述待分割网络社区分割为多个社区的步骤,直至多个社区满足预设条件,并将满足预设条件的社区分割结果作为目标社区分割结果,其中,所述预设条件为每个社区包含的申请节点数量小于或等于第二预设数量。

进一步地,基于所述申请信息构建所述待分割网络社区的二分图包括:根据所述申请信息确定申请节点的集合和属性节点的集合;确定所述申请节点的集合中每个申请节点和所述属性节点的集合中属性节点之间的关联关系,并按照所述关联关系建立所述申请节点的集合中申请节点和所述属性节点的集合中属性节点之间的关联关系,得到所述二分图。

进一步地,根据所述申请信息确定申请节点的集合和属性节点的集合包括:根据所述申请信息中的申请编号确定所述待分割网络社区内的申请节点;并根据所述申请信息中的身份信息、居住信息和通信信息,确定每个申请节点对应的属性节点;将所述待分割网络社区内全部申请节点确定为所述申请节点的集合;将所述待分割网络社区内全部申请节点所对应的属性节点确定为所述属性节点的集合。

进一步地,计算每个目标社区中包含的申请节点对应的属性节点的连通度。

进一步地,所述方法还包括:在利用社区发现算法将所述待分割网络社区分割为多个社区,得到社区分割结果之后,通过所述社区发现算法确定出每个申请节点所属的社区。

第一方面,本发明实施例提供了一种社区分割装置,包括:获取单元,构建单元,分割单元,第一确定单元和执行单元,其中,

所述获取单元用于获取待分割网络社区内目标业务的申请信息;所述申请信息包括以下至少之一:申请编号,申请人的身份信息,申请人的居住位置信息,申请人的通信信息;所述构建单元用于基于所述申请信息构建所述待分割网络社区的二分图;所述二分图中包括:申请节点和/或属性节点,所述申请节点表示申请编号,所述属性节点表示身份信息、居住位置信息和通信信息中的至少之一;所述分割单元用于将所述待分割网络社区分割为多个社区,得到社区分割结果;并基于所述二分图确定出每个社区中包含的申请节点的数量;所述第一确定单元用于在多个社区中确定申请节点数量大于第一预设数量的目标社区;所述执行单元用于删除所述目标社区内连通度大于预设值的目标属性节点;并将所述目标社区确定为待分割网络社区,并返回执行利用社区发现算法将所述待分割网络社区分割为多个社区的步骤,直至多个社区满足预设条件,并将满足预设条件的社区分割结果作为目标社区分割结果,其中,所述预设条件为每个社区包含的申请节点数量小于或等于第二预设数量。

进一步地,所述构建单元还用于:根据所述申请信息确定申请节点的集合和属性节点的集合;确定所述申请节点的集合中每个申请节点和所述属性节点的集合中属性节点之间的关联关系,并按照所述关联关系建立所述申请节点的集合中申请节点和所述属性节点的集合中属性节点之间的关联关系,得到所述二分图。

进一步地,所述构建单元还用于:根据所述申请信息中的申请编号确定所述待分割网络社区内的申请节点;并根据所述申请信息中的身份信息、居住信息和通信信息,确定每个申请节点对应的属性节点;将所述待分割网络社区内全部申请节点确定为所述申请节点的集合;将所述待分割网络社区内全部申请节点所对应的属性节点确定为所述属性节点的集合。

进一步地,所述装置还包括:计算单元,用于计算每个目标社区中包含的申请节点对应的属性节点的连通度。

进一步地,所述装置还包括:第二确定单元,用于利用社区发现算法将所述待分割网络社区分割为多个社区,得到社区分割结果之后,通过所述社区发现算法确定出每个申请节点所属的社区。

在本发明实施例中,通过获取待分割网络社区内目标业务的申请信息,并根据申请信息构建待分割网络社区的二分图,然后,将待分割网络社区分割为多个社区,并根据二分图确定出每个社区中包含的申请节点数量,接着,删除每个社区中申请节点数量大于第一预设数量的目标社区中的连通度大于预设值的属性节点,最后,将目标社区确定为待分割网络社区,并返回执行利用社区发现算法将待分割网络社区分割为多个社区的步骤,直到每个社区包含的申请节点数量小于或等于第二预设数量,从而完成对待分割网络社区的分割。

在本发明实施例中,通过结合二分图和社区发现算法对包含大量申请节点的规模较大待分割网络社区进行分割,将规模较大待分割网络社区分割为多个包含申请节点数量较少的小规模网络社区,达到了对待分割网络社区进行精细化分割的目的,进而解决了由于现有的网络社区的结构较为复杂导致的对网络社区中的节点进行分析时较为困难的技术问题,从而实现了降低对网络社区中的节点进行分析时的难度的技术效果。

本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种社区分割方法的流程图;

图2为本发明实施例提供的二分图构建方法的流程图;

图3为本发明实施例提供的另一种社区分割方法的流程图;

图4为本发明实施例提供的一种社区分割装置的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一:

根据本发明实施例,提供了一种社区分割方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的一种社区分割方法的流程图,如图1所示,该方法包括如下步骤:

步骤s102,获取待分割网络社区内目标业务的申请信息;所述申请信息包括以下至少之一:申请编号,申请人的身份信息,申请人的居住位置信息,申请人的通信信息;

需要说明的是,在本实施例中,目标业务可以是银行业务,还可以是除银行业务之外的其他业务,本申请对此不作具体限定。

步骤s104,基于所述申请信息构建所述待分割网络社区的二分图;所述二分图中包括:申请节点和/或属性节点,所述申请节点表示申请编号,所述属性节点表示身份信息、居住位置信息和通信信息中的至少之一;

步骤s106,利用社区发现算法将所述待分割网络社区分割为多个社区,得到社区分割结果;并基于所述二分图确定出每个社区中包含的申请节点的数量;

步骤s108,在多个社区中确定申请节点数量大于第一预设数量的目标社区;

步骤s110,删除所述目标社区内连通度大于预设值的目标属性节点;并将所述目标社区确定为待分割网络社区,并返回执行步骤s106,即利用社区发现算法将所述待分割网络社区分割为多个社区的步骤,直至多个社区满足预设条件,并将满足预设条件的社区分割结果作为目标社区分割结果,其中,所述预设条件为每个社区包含的申请节点数量小于或等于第二预设数量。

在本发明实施例中,通过结合二分图和社区发现算法对包含大量申请节点的规模较大待分割网络社区进行分割,将规模较大待分割网络社区分割为多个包含申请节点数量较少的小规模网络社区,达到了对待分割网络社区进行精细化分割的目的,进而解决了由于现有的网络社区的结构较为复杂导致的对网络社区中的节点进行分析时较为困难的技术问题,从而实现了降低对网络社区中的节点进行分析时的难度的技术效果。

需要说明的是,上述的社区算法可以采用louvin算法,louvain算法是一种基于多层次优化modularity的算法,它的优点是快速、准确,被认为是性能最好的社区发现算法之一,因此通过采用louvin算法和二分图能够快速、准确对待分割网络社区进行分割。

louvin算法通过扫描待分割网络社区中的所有申请节点,针对每个申请节点遍历该申请节点的所有邻居申请节点,衡量把该申请节点加入其邻居申请节点所在的社区所带来的模块度的收益。并选择对应最大收益的邻居申请节点,加入其所在的社区。这一过程化重复进行指导每一个节点的社区归属都不在发生变化。

接着对形成的社区进行折叠,把每个社区折叠成一个单点,从而达到对待分割社区进行分割的技术效果。

另外,还需要说明的是,在本发明实施例中,连通度用于表征连通图即,二分图)的连通程度,连通度分为点连通度和边连通度,在本发明实施例中的连通度为二分图中属性节点的点连通度。

另外,上述的第一预设数量、第二预设数量以及连通度的预设值可以由用户根据实际情况自行设定,在本发明实施例中不做具体限定。

在本发明实施例中,如图2所示,步骤s104还包括如下步骤:

步骤s11,根据所述申请信息确定申请节点的集合和属性节点的集合;

步骤s12,确定所述申请节点的集合中每个申请节点和所述属性节点的集合中属性节点之间的关联关系,并按照所述关联关系建立所述申请节点的集合中申请节点和所述属性节点的集合中属性节点之间的关联关系,得到所述二分图。

在本发明实施例中,为了构建待分割区域的二分图,首先要根据获取到目标业务的申请信息构建二分图所需的两个互不相交的集合(即,申请节点的集合和属性节点的集合)。

可选地,构建申请节点的集合的步骤如下:

首先,将每个申请信息中的申请编号确定为每个申请信息对应的申请节点,然后,将所有申请节点的集合确定为二分图所需的申请节点的集合。

可选地,构建属性节点的集合的步骤如下:

首先,将每个申请信息中的身份信息、居住信息和通信信息确定为每个申请信息对应的属性节点,然后,将所有属性节点的集合确定为二分图所需的属性节点的集合。

在构建完成申请节点的集合和属性节点的集合后,根据每条申请信息中,申请编号与申请人的身份信息,申请人的居住位置信息和申请人的通信信息之前的对应关系,确定出申请节点的集合中每个申请节点和属性节点的集合中属性节点之间的关联关系,并按照关联关系建立申请节点的集合中申请节点和属性节点的集合中属性节点之间的关联关系,从而得到待分割网络社区的二分图。在二分图中,该关联关系可以通过连线来进行表示,除此之外,还可以采用其他的表示方式,本申请对此不作具体限定。

在本发明实施例中,如图3所示,所述方法还包括如下步骤:

步骤s109,计算每个目标社区中包含的申请节点对应的属性节点的连通度。

在本发明实施例中,为了确定出步骤s110中的目标属性节点,需要在确定出目标社区之后,计算每个目标社区中包含的申请节点对应的属性节点的连通度。

具体地,在本实施例中,首先,获取待分割网络社区内目标业务的申请信息;然后,基于申请信息构建所述待分割网络社区的二分图;之后,利用社区发现算法将待分割网络社区分割为多个社区,得到社区分割结果;并基于二分图确定出每个社区中包含的申请节点的数量,并在确定出多个社区中确定申请节点数量大于第一预设数量的目标社区之后,计算每个目标社区中包含的申请节点对应的属性节点的连通度,最后执行上述步骤s110,此处不再详细赘述。

需要说明的是,在本实施例中,属性节点连通度是通过与属性节点直接相连的申请节点的数量得出的,这个是图论中概念。图是一种数据结构,它可以通过点边两种数据结构构建,也可以通过矩阵来构建,此处使用的是点边,节点(vertex)包含节点编号和相关属性,边(edge)包申请节点编号和属性节点编号,具体的做法是,首先查找要计算的属性节点的编号,然后遍历边,统计出所有以这个编号为源节点的边,这些边中的所有不重复申请节点个数就是这个属性节点的连通度。

在本发明实施例中,所述方法还包括如下步骤:

步骤s114,利用社区发现算法将所述待分割网络社区分割为多个社区,得到社区分割结果之后,通过所述社区发现算法确定出每个申请节点所属的社区。

在本发明实施例中,为了确定出每个社区中包含的申请节点的数量,需要在构建待分割网络社区的二分图之后,通过社区发现算法确定每个申请节点所属的社区,接着对每个社区中包含的申请节点进行统计,从而确定出每个社区中包含的申请节点的数量。

具体地,在本实施例中,首先,获取待分割网络社区内目标业务的申请信息;然后,基于申请信息构建所述待分割网络社区的二分图;之后,利用社区发现算法将待分割网络社区分割为多个社区,得到社区分割结果之后,利用社区发现算法将所述待分割网络社区分割为多个社区,得到社区分割结果之后,通过所述社区发现算法确定出每个申请节点所属的社区;并基于二分图确定出每个社区中包含的申请节点的数量,最后执行上述步骤s108至步骤s110,此处不再详细赘述。

下面将结合具体实施场景对上述的社区分割方法进行说明:

上述的社区分割方法能够应用于信用卡社区的分割。

首先,获取待分割信用卡社区内的信用卡申请记录,信用卡申请记录包括:信用卡申请编号,信用卡申请人的身份证信息,信用卡申请人的居住地址,信用卡申请人的电话号码。

接着,将每个信用卡申请记录中的申请编号确定为每个信用卡申请记录对应的申请节点,然后,将所有申请节点的集合确定为二分图所需的申请节点的集合。

将信用卡申请记录中的信用卡申请人的身份证信息,信用卡申请人的居住地址,信用卡申请人的电话号码对应的属性节点,然后,将所有属性节点的集合确定为二分图所需的属性节点的集合。

然后,根据上述的申请节点的集合和属性节点的集合,构建出待分割信用卡社区的二分图,并计算出每个属性节点的连通度。

接着,利用社区发现算法将待分割信用卡社区分割为多个社区,得到社区分割结果,并基于二分图确定出每个社区中包含的申请节点的数量,根据每个社区中包含的申请节点的数量,确定出申请节点数量大于第一预设数量的目标社区。

最后,删除目标社区中包含的申请节点对应的属性节点中连通度大于预设值的属性节点。

再次执行利用社区发现算法将待分割信用卡社区分割为多个社区的步骤,直到多个社区中的每个社区中包含的申请节点数量小于或等于第二预设数量。

将满足多个社区中的每个社区中包含的申请节点数量小于或等于第二预设数量的社区分割结果确定为目标社区分割结果,从而达到对待分割信用卡社区分割的目的。

由于在进行信用卡社区发现的过程中,信用卡社区中会包含上千个申请节点,因此,如果利用未分割的信用卡社区进行信用卡的使用记录、使用流水等进行分析时,会造成分析过程复杂,不符合信用卡分析业务的需求。

当采用上述的社区分割方法将信用卡社区分割为多个申请节点数量较小的信用卡社区后,再对信用卡的使用记录、使用流水等进行分析,能够有效的降低分析过程复杂程度,同时还能够根据分析结果确定出信用卡诈骗团伙的信用卡使用记录,从而保障了信用卡发卡机构的资金安全。

实施例二:

本发明还提供了一种社区分割装置,该装置用于执行本发明实施例上述内容所提供的社区分割方法,以下是本发明实施例提供的社区分割装置的具体介绍。

图4为社区分割装置的示意图,该装置包括:获取单元10,构建单元20,分割单元30,第一确定单元40和执行单元50,其中,

所述获取单元10用于获取待分割网络社区内目标业务的申请信息;所述申请信息包括以下至少之一:申请编号,申请人的身份信息,申请人的居住位置信息,申请人的通信信息;

所述构建单元20用于基于所述申请信息构建所述待分割网络社区的二分图;所述二分图中包括:申请节点和/或属性节点,所述申请节点表示申请编号,所述属性节点表示身份信息、居住位置信息和通信信息中的至少之一;

所述分割单元30用于利用社区发现算法将所述待分割网络社区分割为多个社区,得到社区分割结果;并基于所述二分图确定出每个社区中包含的申请节点的数量;

所述第一确定单元40用于在多个社区中确定申请节点数量大于第一预设数量的目标社区;

所述执行单元50用于删除所述目标社区内连通度大于预设值的目标属性节点;并将所述目标社区确定为待分割网络社区,并返回执行利用社区发现算法将所述待分割网络社区分割为多个社区的步骤,直至多个社区满足预设条件,并将满足预设条件的社区分割结果作为目标社区分割结果,其中,所述预设条件为每个社区包含的申请节点数量小于或等于第二预设数量。

在本发明实施例中,通过结合二分图和社区发现算法对包含大量申请节点的规模较大待分割网络社区进行分割,将规模较大待分割网络社区分割为多个包含申请节点数量较少的小规模网络社区,达到了对待分割网络社区进行精细化分割的目的,进而解决了由于现有的网络社区的结构较为复杂导致的对网络社区中的节点进行分析时较为困难的技术问题,从而实现了降低对网络社区中的节点进行分析时的难度的技术效果。

优选地,所述构建单元还用于:根据所述申请信息确定申请节点的集合和属性节点的集合;确定所述申请节点的集合中每个申请节点和所述属性节点的集合中属性节点之间的关联关系,并按照所述关联关系建立所述申请节点的集合中申请节点和所述属性节点的集合中属性节点之间的关联关系,得到所述二分图。

优选地,所述构建单元还用于:根据所述申请信息中的申请编号确定所述待分割网络社区内的申请节点;并根据所述申请信息中的身份信息、居住信息和通信信息,确定每个申请节点对应的属性节点;将所述待分割网络社区内全部申请节点确定为所述申请节点的集合;将所述待分割网络社区内全部申请节点所对应的属性节点确定为所述属性节点的集合。

优选地,所述装置还包括:计算单元,用于计算每个目标社区中包含的申请节点对应的属性节点的连通度。

优选地,所述装置还包括:第二确定单元,用于利用社区发现算法将所述待分割网络社区分割为多个社区,得到社区分割结果之后,通过所述社区发现算法确定出每个申请节点所属的社区。

另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1