团网络识别方法、装置、服务器及计算机可读存储介质与流程

文档序号:18629981发布日期:2019-09-06 23:29阅读:107来源:国知局
团网络识别方法、装置、服务器及计算机可读存储介质与流程

本发明涉及数据处理领域,尤其涉及一种团网络识别方法、装置、服务器及计算机可读存储介质。



背景技术:

随着关系网信息的发展,不同类型的团在数据传输关系网中逐渐形成,在数据传输关系网中挖掘具有目标特性的团,对关系网信息的监管有着极为重要的意义。

目前,在数据传输关系网中进行子关系网挖掘主要通过标签扩散算法实现,这种算法普遍存在将具有目标特性的团中的数据传输和不具有目标特性的团中的数据传输混淆的问题。



技术实现要素:

本申请提供了一种团网络识别方法、装置、服务器及计算机可读存储介质,可以解决将具有目标特性的团中的数据传输和不具有目标特性的团中的数据传输混淆的问题。

本申请实施例一方面提供了一种团网络识别方法,包括:

根据待识别的目标团的数据转移特征,确认各节点的属性值发送方向;

在构建的数据传输关系网中,在第一节点与相邻的第二节点连接的边上沿着所述发送方向,将所述边的边向量和所述第一节点属性值发送给所述第二节点,所述边向量包括多个数据转移的特征值;

将所述第二节点接收到的边向量,按照预设计算逻辑进行加权计算,得到最优权重的边,所述计算逻辑与所述待识别的目标团的数据转移特征相匹配;

根据所述最优权重的边连接的所述第一节点的属性值,更新所述第二节点的属性值;

迭代执行所述在第一节点与相邻的第二节点连接的边上沿着所述发送方向,将所述边的边向量和所述第一节点属性值发送给所述第二节点,将所述第二节点接收到的边向量,按照预设计算逻辑进行加权计算,得到的最优权重的边,以及根据所述最优权重的边连接的所述第一节点的属性值,更新所述第二节点的属性值的步骤,直至迭代符合预设停止条件;

根据迭代后的各节点的属性值,确认同在所述目标团的各节点,以及确认所述目标团中各节点的属性。

本申请实施例一方面提供了一种团网络识别装置,包括:

确认模块,用于根据待识别的目标团的数据转移特征,确认各节点的属性值发送方向;

发送模块,用于在构建的数据传输关系网中,在第一节点与相邻的第二节点连接的边上沿着所述发送方向,将所述边的边向量和所述第一节点属性值发送给所述第二节点,所述边向量包括多个数据转移的特征值;

计算模块,用于将所述第二节点接收到的边向量,按照预设计算逻辑进行加权计算,得到最优权重的边,所述计算逻辑与所述待识别的目标团的数据转移特征相匹配;

更新模块,用于根据所述最优权重的边连接的所述第一节点的属性值,更新所述第二节点的属性值;

迭代模块,用于触发迭代执行所述在第一节点与相邻的第二节点连接的边上沿着所述发送方向,将所述边的边向量和所述第一节点属性值发送给所述第二节点,将所述第二节点接收到的边向量,按照预设计算逻辑进行加权计算,得到的最优权重的边,以及根据所述最优权重的边连接的所述第一节点的属性值,更新所述第二节点的属性值的步骤,直至迭代符合预设停止条件;

所述确认模块,还用于根据迭代后的各节点的属性值,确认同在所述目标团的各节点,以及确认所述目标团中各节点的属性。

本申请实施例一方面提供了一种服务器,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述本申请实施例提供的团网络识别方法。

本申请实施例一方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述本申请实施例提供的团网络识别方法。

上述本申请各实施例,通过沿着根据待识别目标团的数据转移特征确认的发送方向,将第一节点的与第二节点之间的边的边向量发送给第二节点,并对第二节点接收到边向量,根据预设计算逻辑进行加权计算,得到最优权重的边,根据最优权重的边连接的第一节点的属性值更新第二节点的属性值,多次迭代上述步骤后根据迭代后的节点的属性值确认团以及节点在图中的属性,由于该边向量包括多个描述第二节点和第一节点之间数据转移特征的特征值,因此可以更准确地分辨出具有该数据转移特征的该目标团,并且,由于迭代只限于用第一节点的属性值更新第二节点的属性值,这种单向计算降低了迭代的时间复杂度。

附图说明

图1为本申请实施例提供的团网络识别方法的应用环境图;

图2为本申请实施例提供的团网络识别方法中的数据传输关系网的示意图;

图3为本申请实施例提供的团网络识别方法的流程图;

图4为本申请实施例提供的团网络识别方法的流程图;

图5为本申请实施例提供的团网络识别方法中虚拟资源转移关系网的示意图;

图6为图5中的虚拟资源转移关系网,在分配了初始的团核心指数后的示意图;

图7为图6中的虚拟资源转移关系网,在发送多维向量时的示意图;

图8为从图7中的虚拟资源转移关系网中识别的目标团的示意图;

图9为本申请实施例提供的团网络识别装置的结构示意图;

图10为本申请实施例提供的团网络识别装置的结构示意图;

图11为本申请实施例提供的服务器的硬件结构示意图。

具体实施方式

为使得本申请的发明目的、特性、优点能够更加的明显和易懂,下面将结合本申请实施例提供的附图,对本申请实施例提供的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请提供的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

请参阅图1,为本申请实施例提供的团网络识别方法的应用环境图。如图1所示,多个终端100构成一个数据传输关系网,存储服务器200记录数据传输关系网中各个终端100之间进行数据交互的相关信息数据,服务器300根据存储服务器200记录的相关信息数据,通过下述各实施例提供的团网络识别方法,从该数据传输关系网中识别出目标团。在实际应用中,服务器300可以是pregel图计算框架的分布式服务器集群。服务器200也可以是分布式服务器集群。

其中,数据传输关系网是指由至少两个节点和各节点之间的关系共同组成的网络拓扑结构。例如,现有三个存在通讯关系的计算机设备,为了更清楚地描述这三个计算机设备之间的通讯关系,将这三个计算机设备抽象为三个节点:节点a、节点b和节点c,并用连接两个节点的边表示两个计算机设备之间的通讯关系,于是形成了一个由这三个计算机设备构成的一个数据传输关系网。存储服务器记录了相关信息数据,例如一个计算机设备与另一个计算机设备的通讯时长,在预设时间段内一个计算机设备与另一个计算机设备的通讯频率,以及一个计算机设备与另一个计算机设备进行通讯的时间段。

团(clique)是指在数据传输关系网中具有相同特性的一组节点,这组节点的节点之间形成数据转移关系。团网络是团中所有节点之间由于数据传输关系形成的网络拓扑结构。例如,在具有虚拟资源转移关系的数据传输关系网中,节点为转移虚拟资源的账户对应的计算机设备,在节点之间进行虚拟资源转移时,备注的虚拟资源转移关键词为“押大、赌资、筹码”等与赌博相关的词语,则对应地,这些节点构成一个赌博性质的团。这些节点与节点之间虚拟资源转移关系共同构成了团网络。

请参阅图2,图2为本申请实施例提供的团网络识别方法中的数据传输关系网的示意图。本申请各实施例中的数据传输关系网,具体可以是虚拟资源转移关系网,但不应以虚拟资源转移关系构成对本申请适用的数据传输关系网的类型进行任何限定。虚拟资源转移关系网中包括多个节点,节点表示虚拟资源转出方或接收方对应的计算机设备,例如资金转出账户或资金接收账户使用的计算机设备,每条边代表该边连接的两个节点之间有数据传输,也即,两个节点之间存在虚拟资源转移关系而形成边(edge)。

以图2为例,图2为一个虚拟资源转移关系网,该虚拟资源转移关系网中的节点包括:节点a、节点b和节点c。各节点之间的箭头方向表示虚拟资源转移关系,即,节点b向节点a进行虚拟资源转移,节点c向节点b进行虚拟资源转移。在实际情况中,数据传输关系网中存在大量节点,需要根据要识别出的目标团的特性,从大量节点中划分出该团,目标团可以是在虚拟资源转移关系网中,属于赌博团伙的节点构成的目标团;还可以是在客运交通运输网络中,具有通勤关系的节点构成的目标团,还可以是通讯关系网络中,具有通讯业务的节点构成的目标团。以及进一步明确该团中各节点的属性,属性可以是指该节点在团中的核心程度。

下面在各实施例中详细说明团网络识别方法、装置、服务器和计算机可读存储介质。以下各实施例均可以利用pregel图计算框架和sparkgraphx中的api进行团网络识别,在多个服务器中保存有数据传输关系网中的各节点的数据传输信息,根据该数据传输信息执行本实施中的团网络识别方法。

请参阅图3,图3为本申请实施例提供的团网络识别方法的流程图,如图3所示,该方法可应用在服务器中,该方法包括:

101、根据待识别的目标团的数据转移特征,确认各节点的属性值发送方向;

服务器根据待识别的目标团的数据转移特征,确认各节点的属性值发送方向。

具体地,若该待识别的目标团的数据转移特征为发散型,则确认各节点的属性值发送方向为节点之间数据转移的反方向。

发散型是指针对同一个数据发送方节点存在多个数据接收方节点,例如节点a转移数据给节点b和节点c,节点b转移数据给节点d和节点e,节点c转移数据给节点f和节点g,则在由abcdefg组成的团中,数据从一个节点a经过节点b和节点c,转移到了四个节点d、e、f、g,该数据转移特征为发散型;上述发散型目标团的同一个数据发送方节点会对应存在至少2个数据接收方节点。

若该待识别的目标团的数据转移特征为汇聚型,则确认各节点的属性值发送方向为节点之间数据转移的正方向,汇聚型是指针对同一个数据接收方节点存在多个数据发送方节点,例如节点b和节点c向节点a转移数据,节点d和节点e向节点b转移数据,节点f和节点g向节点c转移数据,则在由abcdefg组成的团中,数据从节点d、e、f、g四个节点经过节点b、节点c,转移到了一个节点a,数据转移特征为汇聚型;上述汇聚型目标团的同一个数据接收方节点会对应存在至少2个数据发送方节点。

在实际应用中,数据传输关系网为客运交通网络,节点为停靠站点对应的计算机设备,待识别的目标团为最具开通客运线价值的停靠站点组成的待开通站点团,则待开通站点团的交通运输数据转移的特征为汇聚型,即,客运车均向一个站点汇聚,则在识别该待开通站点团构成的网络时,确认各节点的属性值发送方向为节点之间数据转移的正方向。

102、在构建的数据传输关系网中,在第一节点与相邻的第二节点连接的边上沿着该发送方向,将该边的边向量和该第一节点属性值发送给第二节点;

具体的,可根据图1中存储服务器200中记录的信息数据,构建数据传输关系网,构建的数据传输关系网与现实存在的数据传输网络对应。

边向量包括多个数据转移的特征值,即,该边向量用于根据至少一个单维向量描述该数据转移的特性,例如,该边向量可包括与待识别的目标团的数据转移特征中关键词匹配的次数,预设周期内数据的转移频率、转移次数以及转移总数等单维向量。

该关键词是指与待识别的目标团的特征对应的关键词,例如,若在虚拟资源转移关系网中待识别的目标团是赌博团伙,则资源转移关键词则是与赌博相关的词语,例如:押大、赌资、筹码;在客运交通运输网络中,服务器以一年为统计周期,以一个月为采样分辨率,采集各站点之间一年内每个月的乘客运输关系数据,该边向量可包括一年内各站点之间乘客运输数量的均值,一年内各站点之间乘客运输数量在每个月内的分布,一年内各站点之间乘客运输数量在每个月之间的方差。

边是指因节点之间存在数据转移关系而在节点之间形成的边。例如a节点向b节点转移数据,则a节点和b节点之间形成一条边。

属性值是指表征节点属性的参数值,可以包括节点的节点id(identification,身份标识符)和团核心指数以及其它表征节点属性的参数值。其中,团核心指数可表征一个节点在数据传输关系网中的核心程度。

需要说明的是,在该数据传输关系网中,可以是第二节点同时向多个第一节点转移数据,或者,可以是多个第一节点同时向第二节点转移数据,所以沿着该发送方向,有多个边向量和第一节点的属性值发送给第二节点,第二节点可以是数据转移的转入方或者转出方,第二节点是属性值的接收方。发送的具体形式可以通过消息发送,在消息中包含有边向量和属性值。

由于团内数据转移关系的汇聚性和层级性,因此沿着该发送方向发送边向量,若目标团是发散型的,则用数据转移的转入方的属性去影响数据转移的转出方的属性;若目标团是汇聚型的,则用数据转移的转出方的属性去影响数据转移的转入方的属性。

因本发明实施例的算法是在服务器中完成,因此服务器可以将该边的边向量和第一节点属性值发送给第二节点,开始目标团的计算过程。

103、将第二节点接收到的边向量,按照预设计算逻辑进行加权计算,得到最优权重的边,该计算逻辑与待识别的目标团的数据转移特征相匹配;

该最优权重的边是第一节点与第二节点之间的权重最大的一条边,这条边表示的数据转移关系权重最大。

计算逻辑是权重相关的计算逻辑,与待识别的目标团的数据转移特征相匹配,即,最优权重的边因计算逻辑不同而不同,而权重是与该目标团的数据转移特征相匹配的。

边向量中各数据转移的特征值的权重值是该计算逻辑赋予的,该计算逻辑所赋予数据转移的特征值的权重值是由目标团的数据转移特征匹配的。最优权重的边的确认对最终确认的团有重大影响。

具体地,该计算逻辑中预先赋予各数据转移的特征值不同的权重值,例如,数据转移频率、转移次数、转移数量分别被赋予权重值0.6、0.3和0.1,那么在第一条边上,边向量包括数据转移频率是每天1次,转移次数是4次,转移数量是100万(按10万为单位,折合为10);在第二条边上,边向量包括数据转移频率是每天1.5次,转移次数是6次,转移数量是20万(按10万为单位,折合为2),则分别进行加权计算,该第一条边的边权重为1*0.6+4*0.3+10*0.1=2.8,该第二条边的边权重为1.5*0.6+6*0.3+2*0.1=2.9,则二者相比,第二条边为最优权重的边。

104、根据该最优权重的边连接的第一节点的属性值,更新第二节点的属性值;

具体的,在该数据传输关系网中,每个第二节点有且仅有一个第一节点通过最优权重的边与该第二节点相连,根据该第一节点的属性值,更新该第二节点的属性值。

105、迭代执行步骤101至104;

106、判断迭代是否符合预设停止条件;

具体的,迭代执行在第一节点与相邻的第二节点连接的边上沿着该属性值的发送方向,将多个该边的边向量和第一节点属性值发送给第二节点,将第二节点接收到的多个边向量,按照预设计算逻辑进行加权计算,得到的最优权重的边,以及根据最优权重的边连接的第一节点的属性值,更新第二节点的属性值的步骤,即迭代执行步骤101~104,不断更新接收边向量一方的属性值,直至迭代符合预设停止条件。

该预设停止条件可以是进行迭代的次数超过预设的迭代次数阈值,或者迭代计算的耗时超过预设的迭代时间阈值。

该预设停止条件也可以是在数据传输网络里,没有了可更新属性值的第二节点。

可以理解的,在每一轮迭代结束时,判断迭代是否符合预设停止条件,若迭代符合预设停止条件时,执行步骤107,否则,继续下一轮迭代。

107、根据迭代后的各节点的属性值,确认同在该目标团的各节点,以及确认该目标团中各节点的属性。

节点的属性值可以确认同属于一个团的节点,以此得出目标团网络的构成。

节点的属性值还可以确认在该团中各节点的属性,属性是指各节点在团中的核心程度,也即每个节点的重要程度。例如,在一个营销团网络中,根据节点的属性值可以确认该营销团中的供应商、代理商、顾客等属性。在一个赌博团网络中,根据节点的属性值可以确认该赌博团中的庄家、理赔员、参赌者等属性。

本实施例提供的团网络识别方法,通过沿着根据待识别目标团的数据转移特征确认的发送方向,将第一节点的与第二节点之间的边的边向量发送给第二节点,并对第二节点接收到边向量,根据预设计算逻辑进行加权计算,得到最优权重的边,根据最优权重的边连接的第一节点的属性值更新第二节点的属性值,多次迭代上述步骤后根据迭代后的节点的属性值确认团以及节点在图中的属性,由于该边向量包括多个描述第二节点和第一节点之间数据转移特征的特征值,因此可以更准确地分辨出具有该数据转移特征的该目标团,并且,由于迭代只限于用第一节点的属性值更新第二节点的属性值,这种单向计算降低了迭代的时间复杂度。

请参阅图4,图4为本申请另一实施例提供的团网络识别方法的流程图,如图所示,该方法包括:

201、初始化数据传输关系网中每个节点的属性值;

服务器初始化数据传输关系网中每个节点的属性值,属性值包括:节点id和团核心指数。则初始化每个节点的属性值具体为:将该第一节点的节点id作为该第一节点的初始id,将该第二节点的节点id作为该第二节点的初始id,以及,初始化第一节点和第二节点的团核心指数同为预设数值,可选地,该预设数值为0。

团核心指数可以用于衡量数据传输关系网中各节点的重要程度。具体地,团核心指数的更新规则可以预先设置,可包括在该预设数值的基础上每次增加或减少一个更新数值,该更新数值也可以自定义,例如更新数值为1,更新数值为10等,该更新数值可以是任意数值,只要在数据传输关系网全网络均设定同一个更新数值,便不影响判断一个节点的重要程度高低。

可选地,若团核心指数的更新规则为在该预设数值的基础上每次增加一个更新数值,则一个节点的团核心指数越小,该节点在团中处于越核心的位置;若团核心指数的更新方式为在该预设数值的基础上每次减少一个更新数值,则一个节点的团核心指数越大,该节点在团中处于越核心的位置。

202、根据待识别的目标团的数据转移特征,确认各节点的属性值发送方向;

服务器根据待识别的目标团的数据转移特征,确认各节点的属性值发送方向。

具体地,若该待识别的目标团的数据转移特征为发散型,则确认各节点的属性值发送方向为节点之间数据转移的反方向。

若该待识别的目标团的数据转移特征为汇聚型,则确认各节点的属性值发送方向为节点之间数据转移的正方向。

203、在数据传输关系网中,在第一节点与相邻的第二节点连接的边上沿着该发送方向,将该边的边向量和该第一节点属性值发送给第二节点;

服务器在第一节点与相邻的第二节点连接的边上沿着该发送方向,将该边的边向量和该第一节点属性值发送给第二节点。

边向量包括多个数据转移的特征值,具体可包括:数据转移的关键字与目标团的数据转移特征中关键词匹配的次数,预设周期内数据的转移频率、转移次数以及转移数量。

其中,数据转移的关键字与目标团的数据转移特征中关键词匹配的次数,是指目标团的数据转移特征中存在很多关键词,而在数据转移时的附加信息中,与这些关键词匹配的次数,可以表明与该目标团性质是否相同的重要特征值,例如,目标团为营销团,其数据转移特征中关键词可包括:销售款、代理费、数额、各种货物名称,两个节点之间进行数据转移的附加信息中的关键词与这些关键词匹配上的次数越多,表示该节点越可能属于该营销团,该附加信息可以是备注、留言等。

第一节点在预设周期内向第二节点进行的数据转移的转移频率越高,第一节点和第二节点形成的数据转移关系权重越大,转移频率具体如一周内转移数据的天数。

第一节点在预设周期内向第二节点进行的数据转移的转移次数越多,表示第一节点和第二节点形成的数据转移关系权重越大,转移次数具体如一周内转移数据的次数。

第一节点在预设周期内向第二节点进行的数据转移的转移数量越大,表示第一节点和第二节点形成的数据转移关系权重越大,转移次数具体如一周内转移数据的总数,

204、将第二节点接收到的边向量,按照预设计算逻辑进行加权计算,得到最优权重的边;

可选的,将该第二节点接收到的多个边向量中数据转移的特征值,按照该预设计算逻辑中每个特征值各自对应的权重由大到小的顺序,将同类型特征值的值进行比较,值最大的特征值对应的边为最优权重的边。

可选地,该数据传输关系网为虚拟资源转移关系网,第二节点接收到的边向量为虚拟资源转移的特征向量,则将第二节点接收到的多个边向量中虚拟资源转移的特征值,按照预设计算逻辑中每个特征值各自对应的权重由大到小的顺序,将同类型特征值的值进行比较,值最大的特征值对应的边为最优权重的边。

该多个数据转移的特征值包括数据转移的关键字与该目标团的数据转移特征中关键词匹配的次数,预设周期内数据的转移频率、转移次数以及转移数量。

可选的,该将该第二节点接收到的边向量中数据转移的特征值,按照该预设计算逻辑中每个该特征值各自对应的权重由大到小的顺序,将同类型该特征值的值进行比较,值最大的特征值对应的边为最优权重的边包括:

将该数据转移的关键字与该目标团的数据转移特征中关键词匹配的次数,该预设周期内数据转移的转移频率、转移次数以及转移数量,按照该预设计算逻辑中各自对应的权重由大到小的顺序进行值的比较,值最大的特征值对应的边为最优权重的边。可选地,多个虚拟资源转移的特征值包括虚拟资源转移的关键字与目标团的虚拟资源转移特征中关键词匹配的次数,预设周期内虚拟资源的转移频率、转移次数以及转移金额,则将第二节点接收到的边向量,按照预设计算逻辑进行加权计算,得到最优权重的边,则为将虚拟资源转移的关键字与目标团的虚拟资源转移特征中关键词匹配的次数,预设周期内虚拟资源的转移频率、转移次数以及转移金额,按照预设计算逻辑中各自对应的权重由大到小的顺序进行值的比较,值最大的特征值对应的边为最优权重的边。

该最优权重的边是第一节点与第二节点之间的权重最大的一条边,这条边表示的虚拟资源转账关系权重最大。

可选的,计算逻辑是权重相关的计算逻辑,与待识别的目标团的虚拟资源转移特征相匹配,即,最优权重的边因计算逻辑不同而不同,而权重是与该目标团的虚拟资源转移特征相匹配的。

边向量中各向量的权重值是该计算逻辑赋予的,该计算逻辑所赋予各向量的权重值是由目标团的虚拟资源转移特征匹配的。最优权重的边的确认对最终确认的团有重大影响。

具体的,该预设计算逻辑与目标团的特性相匹配。根据要确认出的团的特性不同,预设计算逻辑不同。

205、根据最优权重的边连接的第一节点的属性值,更新第二节点的属性值;

具体的,将第二节点的节点id,更新为最优权重的边连接的第一节点的节点id,以及,按照更新规则将第二节点的团核心指数,更新为最优权重的边连接的第一节点的团核心指数增加或减少预设的更新数值,该更新数值可以是预设的任意值,例如1,则更新规则可以是将第二节点的团核心指数,更新为最优权重的边连接的第一节点的团核心指数加1,或者,将第二节点的团核心指数,更新为最优权重的边连接的第一节点的团核心指数减1。

在更新规则是将第二节点的团核心指数,更新为最优权重的边连接的第一节点的团核心指数加1时,一个节点的团核心指数每增加1,该节点的节点id同时被更新为其他节点的节点id,则说明该节点的重要性没有此其他节点重要,因此一个节点的团核心指数越大,表示该节点的核心程度越低。团核心指数增加,核心程度则下降。

206、迭代执行步骤202至205;

207、判断迭代是否符合预设停止条件;

进一步地,迭代执行在第一节点与相邻的第二节点连接的边上沿着属性值发送方向,将多个第一节点的边向量发送给第二节点,将第二节点接收到的多个边向量,按照预设计算逻辑进行加权计算,得到的最优权重的边,以及根据最优权重的边连接的第一节点的属性值,更新第二节点的属性值的步骤,直至迭代符合预设停止条件,即,迭代执行步骤202~205,直至迭代符合预设停止条件。

可以理解的,在每一轮迭代结束时,判断迭代是否符合预设停止条件,若迭代符合预设停止条件时,执行步骤208,否则,继续下一轮迭代。

具体的,该预设的停止条件为,执行步骤202至步骤205的迭代次数达到预设的迭代次数,或执行步骤202至步骤205后数据传输关系网中的各节点的节点id不发生改变。

需要说明的是,在迭代过程中,最优权重的边连接的第一节点的属性值中的节点id与第二节点的节点id相同,则不更新节点id,也不更新团核心指数。

在迭代符合预设停止条件时,执行步骤208。

208、根据迭代后的各节点的属性值,确认同在该目标团的各节点,以及确认该目标团中各节点的属性;

节点的属性值可以确认同属于一个团的节点,以此得出目标团网络的构成。具体地,节点id相同的节点为同一个团。

节点的属性值还可以确认在该团中各节点的属性,具体按照该更新规则以及各节点的团核心指数确认各节点的属性,属性是指各节点在团中的核心程度,也即每个节点的重要程度。具体的确认方式参见前述内容的相关描述,此处不再赘述。

209、根据属于同一团的节点在所述数据传输关系网中的连接关系,生成团网络图,为团网络图中不同团核心指数的节点,标注不同的预设区别特征,并输出该团网络图。

根据属于同一团的节点在该数据传输关系网中的连接关系,生成团网络图,为团网络图中不同团核心指数的节点,标注不同的预设区别特征,例如,标注不同的预设颜色,并输出该团网络图,将节点按照团核心指数可视化的进行显示,可使用户直观地查看该团的节点的核心程度。

进一步地,在输出该团网络图之前,在团网络图中每个节点上标注节点的节点id和团核心指数,以及,在每两个连接的节点之间的边上标注边向量,方便用户在查看该团网络图时,能够明确获知该团网络图的各节点的信息以及节点之间的关系,为判断该团的性质提供必要的信息,提高判断的准确性。

为了更清楚地说明本实施例提供的团网络识别方法,下面以从一个虚拟资源转移关系网中挖掘赌博团伙关系网为例进行说明,并非对本实施例提供的团网络识别方法进行任何形式的限定。挖掘出赌博团伙后上报相关部门,对该赌博团伙进行监控可打击。

请参阅图5,图5为本申请实施例提供的团网络识别方法中虚拟资源转移关系网的示意图。如图5所示,该虚拟资源转移关系网包括13个节点:节点a、节点b、…、节点m,在以上各节点之间,基于虚拟资源转移关系产生12条边:边edge1、边edge2、…、边edge11和边edge12,每个边可传递一个边向量,每个边向量包括三个虚拟资源转移的特征值:特征值a1、特征值a2和特征值a3,这三个虚拟资源转移的特征值分别为进行虚拟资源转移的关键字和目标团的虚拟资源转移特征中关键词匹配的次数、一周内进行虚拟资源转移的次数和一周内转移的虚拟资源的总额。若在虚拟资源转移关系网中挖掘出赌博性质的团,则特征值a1可具体为在转移虚拟资源时的备注中的关键词与赌博相关的关键词匹配上的次数,这类关键词例如可以是:“赌资”、“筹码”、“押大”等与赌博相关的词。

首先,初始化虚拟资源转移关系网中每个节点的属性值。每个节点各自的节点id即为各自初始的节点id,为每个节点定义一个相同的初始的团核心指数,该初始的团核心指数可以是0。其中,初始的节点id和初始的团核心指数都标注在对应的节点旁,如图6中节点a的初始的节点id为1,初始的团核心指数为0,则以(1,0)的形式标注在节点a旁;如图6中节点b的初始的节点id为2,初始的团核心指数为0,则以(2,0)的形式标注在节点b旁,其他节点采用相同的形式标注。

请参阅图6,图6为图5中的虚拟资源转移关系网在分配了初始的团核心指数后的示意图,图6中每个节点的初始的节点id均不相同,具体地,在本实例中,以每个节点的初始的团核心指数均为0,团核心指数的更新规则为每次更新均增加1为例。

若赌博团伙这一目标团的虚拟资源转移特征为发散型,则在第一节点与第二节点连接的每条边上沿着虚拟资源转移方向的反方向,第一节点以消息的形式向第二节点发送边向量和第一节点的属性值,其中,第一节点为虚拟资源转移的接收方,第二节点为虚拟资源转移的发送方,请参阅图7,图7为图6中的虚拟资源转移关系网,在发送多维向量时的示意图。

将第二节点接收到的多个消息中的边向量,按照预设计算逻辑进行加权计算,得到目标消息。

节点d接收到第一消息msg1和第二消息msg2。第一消息msg1中包括:节点a的节点id、节点a的团核心指数以及连接节点a和节点d的边的第一边向量edge1。其中,第一边向量egde1包括三个虚拟资源转移的特征值:msg1.a1、msg1.a2和msg1.a3,分别表示节点d向节点a进行虚拟资源转移时备注中关键词与目标团的虚拟资源转移关键词的匹配次数,一周内转移节点d向节点a进行虚拟资源转移的次数和一周内节点d向节点a转移的虚拟资源的总额。第二消息msg2中包括:节点b的节点id、节点b的团核心指数以及第二边向量edge2,第二边向量edge2包括三个虚拟资源转移的特征值:msg2.a1、msg2.a2和msg2.a3,分别表示节点d向节点b进行虚拟资源转移时备注中关键词与目标团的虚拟资源转移关键词的匹配次数,一周内转移节点d向节点b进行虚拟资源转移的次数和一周内节点d向节点b转移的虚拟资源的总额。

根据赌博团伙的虚拟资源转移特性,确定对各虚拟资源转移的特征值进行加权计算的计算逻辑,权重越大的虚拟资源转移的特征值,越优先比较,反之,权重越小的虚拟资源转移的特征值,越靠后比较,在本实例中,首先比较权重最大的a1的值,即比较msg1.a1的值和msg2.a1的值的大小,若msg1.a1的值大于msg2.a1的值,且msg1.a1的值与msg2.a1的值之差的绝对值大于第一预设偏差值,则将发送第一消息msg1的边作为当前最优权重边;若msg1.a1的值小于msg2.a1的值,且msg1.a1的值与msg2.a1的值之差的绝对值大于该第一预设偏差值,则将发送第二消息msg2的边作为当前最优权重边;若msg1.a1的值与msg2.a1的值之差的绝对值小于该第一预设偏差值,则比较权重小于a1的a2的值,即比较msg1.a2的值与msg2.a2的值的大小,若msg1.a2的值大于msg2.a2的值,且msg1.a2的值与msg2.a2的值之差的绝对值大于第二预设偏差值,以及msg1.a2的值大于预设数值时,则将发送第一消息msg1的边作为当前最优权重边,其中,msg1.a2的值大于预设数值表示msg1.a2才构成有意义的虚拟资源转移的特征值;若msg1.a2的值小于msg2.a2的值,且msg1.a2的值与msg2.a2的值之差的绝对值大于第二预设偏差值,且msg2.a2的值大于该预设数值,则将发送第二消息msg2的边作为当前最优权重边;若msg1.a2的值与msg2.a2的值之差的绝对值小于该第二预设偏差值,或msg1.a2的值和msg2.a2的值均不大于该预设数值,则比较权重小于a1也小于a2的a3的值,即比较msg1.a3的值与msg2.a3的值的大小,若msg1.a3的值大于msg2.a3的值,且msg1.a3的值与msg2.a3的值之间的绝对值大于第三预设偏差值,则将发送第一消息msg1的边作为当前最优权重边,若msg1.a3的值小于msg2.a3的值,且msg1.a3的值与msg2.a3的值之间的绝对值大于第三预设偏差值,则将发送第二消息msg2的边作为当前最优权重边。

在此例中经过加权计算后,得到最优权重的边为节点b与节点d之间发送第二消息msg2的边,则将节点b的节点id更新为节点d的节点id,将节点b的团核心指数加1后更新为节点d的团核心指数。

请参阅图8,图8为从图7中的虚拟资源转移关系网中识别的目标团的示意图。该团网络为一个赌博团伙的虚拟资源转移关系网。根据各节点的团核心指数,可以判断这些节点在这个赌博团伙中的角色,团核心指数越小,表示该节点在该赌博团伙中的地位越重要,在本例子中,节点h、节点f、节点g和节点i的团核心指数为2,是外围的参赌者,节点e和节点d的团核心指数为1,是理赔员,节点b的团核心指数为0,是庄家。

可选的,在向相关部门上报这个赌博团伙的信息时,还可以将节点b的所有虚拟资源转移行为进行汇总,上报反洗钱部门。

在本实施例中,通过沿着根据待识别目标团的数据转移特征确认的发送方向,将第一节点的与第二节点之间的边的边向量发送给第二节点,并对第二节点接收到边向量,根据预设计算逻辑进行加权计算,得到最优权重的边,根据最优权重的边连接的第一节点的属性值更新第二节点的属性值,多次迭代上述步骤后根据迭代后的节点的属性值确认团以及节点在图中的属性,由于该边向量包括多个描述第二节点和第一节点之间数据转移特征的特征值,因此可以更准确地分辨出具有该数据转移特征的该目标团,并且,由于迭代只限于用第一节点的属性值更新第二节点的属性值,这种单向计算降低了迭代的时间复杂度。

请参阅图9,图9为本申请一实施例提供的团网络识别装置的结构示意图,如图9所示,该团网络识别装置包括:

确认模块401,用于根据待识别的目标团的数据转移特征,确认各节点的属性值发送方向;

可选的,确认模块401还用于若待识别的目标团的数据转移特征为发散型,则确认各节点的属性值发送方向为节点之间数据转移的反方向;

确认模块401还用于若待识别的目标团的数据转移特征为汇聚型,则确认各节点的属性值发送方向为节点之间数据转移的正方向。

发送模块402,用于在构建的数据传输关系网中,在第一节点与相邻的第二节点连接的边上沿着所述发送方向,将该边的边向量和该第一节点属性值发送给该第二节点,该边向量包括多个数据转移的特征值;

计算模块403,用于将该第二节点接收到的边向量,按照预设计算逻辑进行加权计算,得到最优权重的边,该计算逻辑与该待识别的目标团的数据转移特征相匹配;

更新模块404,用于根据该最优权重的边连接的该第一节点的属性值,更新该第二节点的属性值;

迭代模块405,用于触发迭代执行该在第一节点与相邻的第二节点连接的边上沿着该发送方向,将该边的边向量和第一节属性值发送给该第二节点,将该第二节点接收到的边向量,按照预设计算逻辑进行加权计算,得到的最优权重的边,以及根据该最优权重的边连接的该第一节点的属性值,更新该第二节点的属性值的步骤,直至迭代符合预设停止条件;

确认模块401,还用于根据迭代后的各节点的属性值,确认同在该目标团的各节点,以及确认该目标团中各节点的属性。

本实施例相关细节请参见前述图3所示实施例的描述。

在本实施例中,通过沿着根据待识别目标团的数据转移特征确认的发送方向,将第一节点的与第二节点之间的边的边向量发送给第二节点,并对第二节点接收到边向量,根据预设计算逻辑进行加权计算,得到最优权重的边,根据最优权重的边连接的第一节点的属性值更新第二节点的属性值,多次迭代上述步骤后根据迭代后的节点的属性值确认团以及节点在图中的属性,由于该边向量包括多个描述第二节点和第一节点之间数据转移特征的特征值,因此可以更准确地分辨出具有该数据转移特征的该目标团,并且,由于迭代只限于用第一节点的属性值更新第二节点的属性值,这种单向计算降低了迭代的时间复杂度。

请参阅图10,图10为本申请一实施例提供的团网络识别装置的结构示意图,与图9所示的团网络识别装置不同的是,在本实施例中:

属性值包括:节点id和团核心指数,则该装置进一步包括:

初始化模块501用于将该第一节点的节点id作为该第一节点的初始id,将该第二节点的节点id作为该第二节点的初始id,以及,初始化该第一节点和该第二节点的团核心指数同为预设数值。

更新模块404,还用于将该第二节点的节点id,更新为该最优权重的边连接的第一节点的节点id,以及,按照更新规则将该第二节点的团核心指数,更新为该最优权重的边连接的第一节点的团核心指数增加或减少预设的更新数值。

确认模块401,还用于按照该更新规则以及该各节点的团核心指数,确认该各节点的属性。

计算模块403,还用于将该第二节点接收到的多个边向量中数据转移的特征值,按照该预设计算逻辑中每个该特征值各自对应的权重由大到小的顺序,将同类型该特征值的值进行比较,值最大的特征值对应的边为最优权重的边。

该多个数据转移的特征值包括数据转移的关键字与该目标团的数据转移特征中关键词匹配的次数,预设周期内数据的转移频率、转移次数以及转移金额,则计算模块403,还用于将该数据转移的关键字与该目标团的数据转移特征中关键词匹配的次数,该预设周期内数据转移的转移频率、转移次数以及转移金额,按照该预设计算逻辑中各自对应的权重由大到小的顺序进行值的比较,值最大的特征值对应的边为最优权重的边。

进一步地,该装置还包括:

生成模块502,用于根据属于同一团的节点在该数据传输关系网中的连接关系,生成团网络图;

标注模块503,用于为该团网络图中不同团核心指数的节点,标注不同的预设区别特征;

输出模块504,用于输出该团网络图;

标注模块503,还用于在该团网络图中每个节点上标注节点的该节点id和该团核心指数,以及,在每两个连接的节点之间的边上标注该边向量。

在本实施例中,通过沿着根据待识别目标团的数据转移特征确认的发送方向,将第一节点的与第二节点之间的边的边向量发送给第二节点,并对第二节点接收到边向量,根据预设计算逻辑进行加权计算,得到最优权重的边,根据最优权重的边连接的第一节点的属性值更新第二节点的属性值,多次迭代上述步骤后根据迭代后的节点的属性值确认团以及节点在图中的属性,由于该边向量包括多个描述第二节点和第一节点之间数据转移特征的特征值,因此可以更准确地分辨出具有该数据转移特征的该目标团,并且,由于迭代只限于用第一节点的属性值更新第二节点的属性值,这种单向计算降低了迭代的时间复杂度。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

请参阅图11,图11为本申请一实施例提供的服务器的硬件结构图。

本实施例中所描述的服务器,包括:

存储器701、处理器702及存储在存储器701上并可在处理器702上运行的计算机程序,处理器702执行该计算机程序时,实现前述图3至图8所示实施例中描述的团网络识别方法。

进一步地,该服务器还包括:

至少一个输入设备703以及至少一个输出设备704。

上述存储器701、处理器702、输入设备703和输出设备704通过总线705连接。

其中,输入设备703具体可为摄像头、触控面板、物理按键或者鼠标等等。输出设备704具体可为显示屏。

存储器701可以是高速随机存取记忆体(ram,randomaccessmemory)存储器,也可为非不稳定的存储器(non-volatilememory),例如磁盘存储器。存储器701用于存储一组可执行程序代码,处理器702与存储器701耦合。

进一步地,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以设置于上述各实施例中的团网络识别装置中。该计算机可读存储介质可以是前述图11所示实施例中的存储器。该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现前述图3至图8所示实施例中描述的团网络识别方法。进一步地,该计算机可存储介质还可以是u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。

在上述各实施例中,所述“第一”、“第二”等表述仅用于命名时的区分,并非是对顺序做出任何限定。

以上为对本申请所提供的团网络识别方法、装置、服务器和计算机可读存储介质的描述,对于本领域的技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1