本技术涉及大数据安全,具体而言,本技术涉及一种异常账号的识别方法、数据调度平台、图计算平台、电子设备、存储介质及计算机程序产品。
背景技术:
1、随着互联网技术的蓬勃发展,越来越多的用户通过电商平台或者金融平台进行交易,给用户带来了极大地便利。但是,随之也出现了诸多异常交易的情况,例如不法分子通过恶意交易,盗刷银行卡套取卡内资金,谋取非法利益,给用户造成了经济损失。
2、相关技术中,在识别异常交易的账号(也即异常账号)的过程中,通常基于neo4j图数据库构建,而neo4j免费版本只能应用于单机系统,另外在采用图神经网络识别异常账号时,通常使用graphsage构建同构图,缺乏对不同支付关系的表达,导致识别效率和识别精度较低。
技术实现思路
1、本技术实施例提供了一种异常账号的识别方法、数据调度平台、图计算平台、电子设备、计算机可读存储介质及计算机程序产品,可以解决现有技术的上述问题。所述技术方案如下:
2、根据本技术实施例的第一个方面,提供了一种异常账号的识别方法,应用于数据调度平台,该方法包括:
3、获得至少一个关系图,所述关系图中的每个节点表征一个待识别账号的账号描述信息,所述账号描述信息包括至少一个子描述信息,任意两个节点之间的连边表征对应的两个待识别账号具有的相同的子描述信息;
4、对于各关系图中每个节点对应的待识别账号,基于所述待识别账号对应节点、以及以所述节点为起始节点的预设跳数内的邻居节点,获得所述待识别账号的子关系图;
5、将各待识别账号的子关系图存储至分布式存储平台,以使得分布式的图计算平台从所述分布式存储平台获得各待识别账号的子关系图,利用预先训练的异常账号识别模型,得到各待识别账号的识别结果,所述识别结果用于指示相应账号是否为异常账号。
6、作为一种可选的实施例,基于所述待识别账号对应节点所在的关系图,获得所述待识别账号的子关系图,包括:
7、将各关系图划分为至少两个分组,每个分组包括至少一个关系图,各组包括的关系图中的数量均处于预设范围;
8、根据分组数创建相应数量的处理进程,通过各处理进程确定相应分组的关系图中,每个节点对应的待识别账号的子关系图。
9、作为一种可选的实施例,基于所述待识别账号对应节点所在的关系图,获得所述待识别账号的子关系图,之前还包括:
10、对于每个关系图,若确定具有同一个子描述信息的待识别账号的总数超过预设阈值,则将所述具有同一个子描述信息的待识别账号作为待处理账号;
11、将关系图中两两待处理账号对应的节点之间的连线删除。
12、作为一种可选的实施例,将各待识别账号对应的子关系图存储至分布式存储平台,之后还包括:
13、在所述分布式存储平台中更新第一状态信息,所述第一状态信息用于指示数据调度平台已在所述分布式存储平台中存储各待识别账号的子关系图,以使得所述图计算平台在查询到所述第一状态信息更新时,根据所述分布式存储平台中的各待识别账号的子关系图,利用预先训练的异常账号识别模型,得到各待识别账号的识别结果。
14、作为一种可选的实施例,在所述分布式存储平台中更新第一状态信息,之后还包括:
15、当确定所述分布式存储平台中的第二状态信息更新时,从所述分布式存储平台中获得各待识别账号的识别结果,所述第二状态信息用于指示图计算平台已在所述分布式存储平台中存储各待识别账号的识别结果。
16、根据本技术实施例的第二个方面,提供一种异常账号的识别方法,应用于图计算平台,所述方法包括:
17、从分布式存储平台中获得各待识别账号的子关系图,所述子关系图是基于待识别账号对应节点所在的关系图确定的,所述关系图中的每个节点表征一个待识别账号的账号描述信息,所述账号描述信息包括至少一个子描述信息,任意两个节点之间的连边表征对应的两个待识别账号具有的相同的子描述信息,所述子关系图中的节点包括待识别账号对应的起始节点以及所述起始节点预设跳数内的邻居节点;
18、根据各待识别账号对应的子关系图,利用预先训练的异常账号识别模型,得到各待识别账号的识别结果,所述识别结果用于指示相应账号是否为异常账号。
19、作为一种可选的实施例,根据各待识别账号对应的子关系图,利用预先训练的异常账号识别模型,得到各待识别账号的识别结果,包括:
20、根据所述子关系图中最后一跳节点表征的账号描述信息,获得最后一跳节点的初始特征向量,根据每条边表征的对应两个待识别账号具有的相同的子描述信息,获得边的边特征;
21、通过融合所述子关系图中最后一跳节点的初始特征向量以及各边的边特征,获得所述子关系图中起始节点的目标特征向量;
22、根据所述子关系图中起始节点的目标特征向量,获得所述起始节点对应的待识别账号的识别结果。
23、作为一种可选的实施例,通过融合所述子关系图中最后一跳节点的初始特征向量以及各边的边特征,获得所述子关系图中起始节点的目标特征向量,包括:
24、从所述子关系图中倒数第二跳的节点开始,采用以下操作逐跳向起始节点遍历,直至获得所述起始节点的中间特征向量,并作为目标特征向量,所述操作包括:
25、对于当前跳数的每个节点的每个参考节点,所述参考节点为当前跳数的下一跳数中该节点的邻居节点,根据该参考节点的中间特征向量以及该节点和该参考节点对应的边特征,获得该参考节点的参考特征向量,当当前跳数为倒数第二跳时,该参考节点的中间特征向量为初始特征向量;
26、对于当前跳数的每个节点,对该节点的各参考节点的参考特征向量进行聚合,获得该节点的中间特征向量。
27、作为一种可选的实施例,从分布式存储平台中获得各待识别账号的子关系图,包括:
28、当确定所述分布式存储平台中的第一状态信息更新时,所述第一状态信息用于指示数据调度平台已在所述分布式存储平台中存储各待识别账号的子关系图,从所述分布式存储平台中获得各待识别账号的子关系图。
29、作为一种可选的实施例,得到各待识别账号的识别结果,之后还包括:
30、在所述分布式存储平台中存储各待识别账号的识别结果,在所述分布式存储平台中更新第二状态信息,所述第二状态信息用于指示图计算平台已在所述分布式存储平台中存储各待识别账号的识别结果,以使得数据调度平台在在查询到所述第二状态信息更新时,获得所述分布式存储平台中各待识别账号的识别结果。
31、根据本技术实施例的第三个方面,提供了一种数据调度平台,该平台包括:
32、关系图获得模块,用于获得至少一个关系图,所述关系图中的每个节点表征一个待识别账号的账号描述信息,所述账号描述信息包括至少一个子描述信息,任意两个节点之间的连边表征对应的两个待识别账号具有的相同的子描述信息;
33、子关系图获得模块,用于对于各关系图中每个节点对应的待识别账号,基于所述待识别账号对应节点、以及以所述节点为起始节点的预设跳数内的邻居节点,获得所述待识别账号的子关系图;
34、图存储模块,用于将各待识别账号的子关系图存储至分布式存储平台,以使得分布式的图计算平台从所述分布式存储平台获得各待识别账号的子关系图,利用预先训练的异常账号识别模型,得到各待识别账号的识别结果,所述识别结果用于指示相应账号是否为异常账号。
35、作为一种可选的实施方式,子关系图获得模块包括:
36、分组单元,用于将各关系图划分为至少两个分组,每个分组包括至少一个关系图,各组包括的关系图中的数量均处于预设范围;
37、进程创建模块,用于根据分组数创建相应数量的处理进程,通过各处理进程确定相应分组的关系图中,每个节点对应的待识别账号的子关系图。
38、作为一种可选的实施方式,数据调度平台还包括:
39、关系图调整模块,用于在获得所述待识别账号的子关系图之前,对于每个关系图,若确定具有同一个子描述信息的待识别账号的总数超过预设阈值,则将所述具有同一个子描述信息的待识别账号作为待处理账号;将关系图中两两待处理账号对应的节点之间的连线删除。
40、作为一种可选的实施方式,数据调度平台还包括:
41、第一状态更新模块,用于在将各待识别账号对应的子关系图存储至分布式存储平台之后,在所述分布式存储平台中更新第一状态信息,所述第一状态信息用于指示数据调度平台已在所述分布式存储平台中存储各待识别账号的子关系图,以使得所述图计算平台在查询到所述第一状态信息更新时,根据所述分布式存储平台中的各待识别账号的子关系图,利用预先训练的异常账号识别模型,得到各待识别账号的识别结果。
42、作为一种可选的实施方式,数据调度平台还包括:
43、第二状态信息查询模块,用于当确定所述分布式存储平台中的第二状态信息更新时,从所述分布式存储平台中获得各待识别账号的识别结果,所述第二状态信息用于指示图计算平台已在所述分布式存储平台中存储各待识别账号的识别结果。
44、根据本技术实施例的第四个方面,提供了一种图计算平台,包括:
45、图获取模块,用于从分布式存储平台中获得各待识别账号的子关系图,所述子关系图是基于待识别账号对应节点所在的关系图确定的,所述关系图中的每个节点表征一个待识别账号的账号描述信息,所述账号描述信息包括至少一个子描述信息,任意两个节点之间的连边表征对应的两个待识别账号具有的相同的子描述信息,所述子关系图中的节点包括待识别账号对应的起始节点以及所述起始节点预设跳数内的邻居节点;
46、账号识别模块,用于根据各待识别账号对应的子关系图,利用预先训练的异常账号识别模型,得到各待识别账号的识别结果,所述识别结果用于指示相应账号是否为异常账号。
47、作为一种可选的实施方式,账号识别模块包括:
48、特征获得子模块,用于根据所述子关系图中最后一跳节点表征的账号描述信息,获得最后一跳节点的初始特征向量,根据每条边表征的对应两个待识别账号具有的相同的子描述信息,获得边的边特征;
49、起始特征获得子模块,用于通过融合所述子关系图中最后一跳节点的初始特征向量以及各边的边特征,获得所述子关系图中起始节点的目标特征向量;
50、预测子模块,用于根据所述子关系图中起始节点的目标特征向量,获得所述起始节点对应的待识别账号的识别结果。
51、作为一种可选的实施方式,起始特征获得模块从所述子关系图中倒数第二跳的节点开始,采用以下操作逐跳向起始节点遍历,直至获得所述起始节点的中间特征向量,并作为目标特征向量,所述操作包括:
52、对于当前跳数的每个节点的每个参考节点,所述参考节点为当前跳数的下一跳数中该节点的邻居节点,根据该参考节点的中间特征向量以及该节点和该参考节点对应的边特征,获得该参考节点的参考特征向量,当当前跳数为倒数第二跳时,该参考节点的中间特征向量为初始特征向量;
53、对于当前跳数的每个节点,对该节点的各参考节点的参考特征向量进行聚合,获得该节点的中间特征向量。
54、作为一种可选的实施方式,图获取模块具体用于:
55、当确定所述分布式存储平台中的第一状态信息更新时,所述第一状态信息用于指示数据调度平台已在所述分布式存储平台中存储各待识别账号的子关系图,从所述分布式存储平台中获得各待识别账号的子关系图。
56、作为一种可选的实施方式,图计算平台还包括:
57、第二状态信息更新模块,用于在所述分布式存储平台中存储各待识别账号的识别结果,在所述分布式存储平台中更新第二状态信息,所述第二状态信息用于指示图计算平台已在所述分布式存储平台中存储各待识别账号的识别结果,以使得数据调度平台在在查询到所述第二状态信息更新时,获得所述分布式存储平台中各待识别账号的识别结果。根据本技术实施例的第五个方面,提供了一种电子设备,该电子设备包括:存储器、处理器及存储在存储器上的计算机程序,处理器执行计算机程序以实现第一或第二方面的异常账号的识别方法的步骤。
58、根据本技术实施例的第六个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现第一或第二方面的异常账号的识别方法的步骤。
59、根据本技术实施例的第七个方面,提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现第一或第二方面的异常账号的识别方法的步骤。
60、本技术实施例提供的技术方案带来的有益效果是:
61、通过获得至少一个关系图,关系图中的节点的连边表征对应的两个待识别账号具有的相同的子描述信息,使得连边的类型不再仅有一种,也即本技术获得固定关系图为异构关系图,进一步从关系图中获得每个节点的子关系图,后续图计算平台可以专注于对子关系图的处理,提高了处理效率,并且利用子关系图中连边所表征的更丰富的节点关联关系,可以更准确地获得待识别账号的识别结果。并且,本技术通过将异常账号的识别过程解耦为子关系图的生成过程和对子关系图的图计算过程,两个平台各自的运行和优化不受另一侧的干扰,增加了系统架构的灵活性。