1.一种基于图神经网络的团伙发现方法,包括:
获取客户属性数据和客户间资金关系数据;
获取有标记黑样本客户的属性数据;
基于所述客户属性数据和所述客户间资金关系数据,构建图神经网络中的节点和边;
对所述图神经网络进行无监督训练,以将每个节点映射成低维向量,其中所述低维向量包括所述节点的图结构信息和邻居节点的特征信息;
将所述低维向量进行聚类,以获取所聚类团伙;以及
将所述有标记黑样本客户的属性数据输入所述图神经网络,计算所聚类团伙中所述有标记黑样本客户的密度,并按密度确定目标团伙。
2.如权利要求1所述的方法,其特征在于,所述客户属性数据和所述客户间资金关系数据需要进行预处理。
3.如权利要求2所述的方法,其特征在于,对所述客户属性数据和所述客户间资金关系数据的预处理是进行向量化和归一化处理。
4.如权利要求1所述的方法,其特征在于,对所述图神经网络进行无监督训练进一步包括:
通过编码将每个节点映射为一个低维向量;
经由资金关系进行随机采样,生成节点序列;
通过负采样机制定义损失函数;以及
基于所定义的损失函数,通过随机梯度下降逐步迭代更新所述低维向量的参数。
5.如权利要求4所述的方法,其特征在于,所述将每个节点映射为一个低维向量可采用attention机制和资金加权方法,将每一个节点的信息用此节点的邻居节点的信息加权求和来表示。
6.如权利要求4所述的方法,其特征在于,所述将每个节点映射为一个低维向量可直接对邻居节点的特征进行加和求平均。
7.如权利要求1所述的方法,其特征在于,所述将所述低维向量进行聚类采用K-means聚类算法。
8.如权利要求1所述的方法,其特征在于,所述按密度确定目标团伙包括按所述密度从高到低进行排序,确定排名最高的团伙为目标团伙。
9.如权利要求1所述的方法,其特征在于,所述按密度确定目标团伙包括按所述密度从高到低进行排序,将所述密度在阈值以上的团伙确定为目标团伙。
10.一种基于图神经网络的团伙发现系统,包括:
数据预处理模块,获取客户属性数据和客户间资金关系数据,并获取有标记黑样本客户的属性数据;
图神经网络构建模块,基于所述客户属性数据和所述客户间资金关系数据,构建图神经网络中的节点和边;
无监督训练模块,对所述图神经网络进行无监督训练,以将每个节点映射成低维向量,其中所述低维向量包括所述节点的图结构信息和邻居节点的特征信息;
聚类模块,将所述低维向量进行聚类,以获取所聚类团伙;以及
团伙发现模块,将所述有标记黑样本客户的属性数据输入所述图神经网络,计算所聚类团伙中所述有标记黑样本客户的密度,并按密度确定目标团伙。
11.如权利要求10所述的系统,其特征在于,所述数据预处理模块对所述客户属性数据和所述客户间资金关系数据进行预处理。
12.如权利要求10所述的系统,其特征在于,所述数据预处理模块对所述客户属性数据和所述客户间资金关系数据进行的预处理是进行向量化和归一化处理。
13.如权利要求10所述的系统,其特征在于,所述无监督训练模块进一步:
通过编码将每个节点映射为一个低维向量;
经由资金关系进行随机采样,生成节点序列;
通过负采样机制定义损失函数;以及
基于所定义的损失函数,通过随机梯度下降逐步迭代更新所述低维向量的参数。
14.如权利要求13所述的系统,其特征在于,所述无监督训练模块可采用attention机制和资金加权系统,将每一个节点的信息用此节点的邻居节点的信息加权求和来表示。
15.如权利要求13所述的系统,其特征在于,所述无监督训练模块可直接对邻居节点的特征进行加和求平均。
16.如权利要求10所述的系统,其特征在于,所述聚类模块采用K-means聚类算法。
17.如权利要求10所述的系统,其特征在于,所述团伙发现模块按所述密度从高到低进行排序,确定排名最高的团伙为目标团伙。
18.如权利要求10所述的系统,其特征在于,所述团伙发现模块按所述密度从高到低进行排序,将所述密度在阈值以上的团伙确定为目标团伙。
19.一种存储有指令的计算机可读存储介质,当所述指令被执行时使得机器执行如权利要求1-9中任一项所述的方法。