异常用户群组识别方法、装置、存储介质与电子设备与流程

文档序号:34902962发布日期:2023-07-26 15:06阅读:51来源:国知局
异常用户群组识别方法、装置、存储介质与电子设备与流程

本公开涉及数据处理,尤其涉及一种异常用户群组识别方法、异常用户群组识别装置、计算机可读存储介质与电子设备。


背景技术:

1、异常用户群组是指具有关联的异常用户所形成的群体,其可能对他人的利益造成非法侵害。例如,在互联网金融领域,异常用户群组可能表现为欺诈团队,该类欺诈团伙通常表现为存在着非常多的网上交易行为,由于此类交易行为是虚拟的,需要通过对数据的处理才能实现。因此,在金融数据处理的过程中,为了降低欺诈团伙恶意篡改和攻击金融数据造成的用户损失,形成了金融交易的反欺诈行为。比如:在金融贷款、交易欺诈等金融行为中,通常需要对用户的信息进行核查、分析与识别,以进行风险管控,最大限度地保护用户权益;或者,在电商或社交等平台上,同一机构或同一人可能创建大量“小号”,用于刷单、刷评论、粉丝买卖等,这些“小号”也形成异常用户群组。

2、相关技术中,采用知识图谱进行异常用户群组的识别,传统的知识图谱运用方法主要是通过计算最短路径、扩散汇聚、节点重要性等抽取节点特征。近年来对于异构图的研究比较多,然而,相关技术中,异构图存在数据稀疏、节点和边的异质等问题,导致基于异构图对异常用户群组的识别较为困难。


技术实现思路

1、本公开提供一种异常用户群组识别方法、异常用户群组识别装置、计算机可读存储介质与电子设备,以至少在一定程度上降低异常用户群组的识别难度。

2、根据本公开的第一方面,提供一种异常用户群组识别方法,包括:以用户以及与所述用户相关的个人信息为节点,以所述用户和所述个人信息之间的关联关系为边,构建异构图;根据所述异构图中连接到相同个人信息的不同用户之间的关联关系,构建以所述用户为节点的同构图;对所述同构图中的用户节点进行聚类,得到若干个用户群组;根据预设指标确定所述用户群组的风险评分,并根据所述风险评分确定所述用户群组是否为异常用户群组。

3、在一种实施方式中,所述以用户以及与所述用户相关的个人信息为节点,以所述用户和所述个人信息之间的关联关系为边,构建异构图,包括:以用户以及与所述用户相关的个人信息为节点,以所述用户和所述个人信息之间的关系、不同用户之间的关系为边,构建异构图;对应的,所述根据所述异构图中连接到相同个人信息的不同用户之间的关联关系,构建以所述用户为节点的同构图,包括:根据所述异构图中连接到相同个人信息的不同用户之间的关联关系,和直接连接的不同用户之间的关联关系,构建以所述用户为节点的同构图。

4、在一种实施方式中,在所述对所述同构图中的用户节点进行聚类,得到若干个用户群组之前,所述方法还包括:根据所述异构图中两个用户在不同关联关系下的预设边权重,将所述异构图中所述两个用户在每一关联关系下的预设边权重累加,得到所述同构图中所述两个用户之间的边权重。

5、在一种实施方式中,所述方法还包括:当所述同构图中两个用户之间的边权重大于边权重阈值时,将所述边权重阈值作为所述同构图中所述两个用户之间的边权重。

6、在一种实施方式中,所述对所述同构图中的用户节点进行聚类,得到若干个用户群组,包括:采用带权重的leiden社区发现算法对所述同构图中的用户节点进行聚类,得到若干个用户群组。

7、在一种实施方式中,所述采用带权重的leiden社区发现算法对所述同构图中的用户节点进行聚类,得到若干个用户群组,包括:基于质量函数增大的原则,对所述同构图中的用户节点进行快速局部移动,得到第一聚类结果;基于质量函数增大的原则,对所述第一聚类结果中的用户节点进行合并,得到第二聚类结果;对所述第二聚类结果进行凝聚操作,并对所述第一聚类结果进行初始化凝聚操作;重复上述步骤,直到所述质量函数不再增大,得到若干个所述群组。

8、在一种实施方式中,所述根据预设指标确定所述用户群组的风险评分,并根据所述风险评分确定所述用户群组是否为异常用户群组,包括:根据所述预设指标确定所述用户群组的各真实指标值;根据所述预设指标对应的预设权重,对所述用户群组的各真实指标值进行加权求和,得到所述用户群组的风险评分;获取风险评分高于风险阈值的候选用户群组的源数据,并对所述候选用户群组的源数据进行分析,以从所述候选用户群组中确定所述异常用户群组;所述源数据包括征信数据和逾期数据。

9、在一种实施方式中,所述预设指标包括:平均节点排序(pagerank)、平均局部集聚系数、群组的直径、群组的节点数量、群组的异常用户数量、群组的异常用户占比、群组中用户之间关联关系的平均权重。

10、在一种实施方式中,所述方法还包括:基于所述异常用户群组的同构图构建所述异常用户群组的异构图,并生成群组报告,以展示所述异常用户群组的特征;所述群组报告包括群组的各真实指标值、群组中的重要程度高于预设阈值的用户和/或个人信息、群组中用户和/或个人信息的分布情况。

11、根据本公开的第二方面,提供一种异常用户群组识别装置,包括:异构图构建模块,被配置为以用户以及与所述用户相关的个人信息为节点,以所述用户和所述个人信息之间的关联关系为边,构建异构图;图谱转换模块,被配置为根据所述异构图中连接到相同个人信息的不同用户之间的关联关系,构建以所述用户为节点的同构图;聚类模块,被配置为对所述同构图中的用户节点进行聚类,得到若干个用户群组;识别模块,被配置为根据预设指标确定所述用户群组的风险评分,并根据所述风险评分确定所述用户群组是否为异常用户群组。

12、在一种实施方式中,所述异构图构建模块还被配置为:以用户以及与所述用户相关的个人信息为节点,以所述用户和所述个人信息之间的关系、不同用户之间的关系为边,构建异构图;对应的,所述图谱转换模块被配置为:根据所述异构图中连接到相同个人信息的不同用户之间的关联关系,和直接连接的不同用户之间的关联关系,构建以所述用户为节点的同构图。

13、在一种实施方式中,所述图谱转换模块还被配置为:根据所述异构图中两个用户在不同关联关系下的预设边权重,将所述异构图中所述两个用户在每一关联关系下的预设边权重累加,得到所述同构图中所述两个用户之间的边权重。

14、在一种实施方式中,所述聚类模块被配置为:采用带权重的leiden社区发现算法对所述同构图中的用户节点进行聚类,得到若干个用户群组。

15、在一种实施方式中,所述聚类模块被配置为:基于质量函数增大的原则,对所述同构图中的用户节点进行快速局部移动,得到第一聚类结果;基于质量函数增大的原则,对所述第一聚类结果中的用户节点进行合并,得到第二聚类结果;对所述第二聚类结果进行凝聚操作,并对所述第一聚类结果进行初始化凝聚操作;重复上述步骤,直到所述质量函数不再增大,得到若干个所述群组。

16、在一种实施方式中,所述识别模块被配置为:根据所述预设指标确定所述用户群组的各真实指标值;根据所述预设指标对应的预设权重,对所述用户群组的各真实指标值进行加权求和,得到所述用户群组的风险评分;获取风险评分高于风险阈值的候选用户群组的源数据,并对所述候选用户群组的源数据进行分析,以从所述候选用户群组中确定所述异常用户群组;所述源数据包括征信数据和逾期数据。

17、在一种实施方式中,所述预设指标包括:平均节点排序、平均lcc、群组的直径、群组的节点数量、群组的异常用户数量、群组的异常用户占比、群组中用户之间关联关系的平均权重。

18、在一种实施方式中,所述异常用户群组识别装置还包括展示模块,所述展示模块被配置为:基于所述异常用户群组的同构图构建所述异常用户群组的异构图,并生成群组报告,以展示所述异常用户群组的特征;所述群组报告包括群组的各真实指标值、群组中的重要程度高于预设阈值的用户和/或个人信息、群组中用户和/或个人信息的分布情况。

19、根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面的异常用户群组识别方法及其可能的实现方式。

20、根据本公开的第四方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述第一方面的异常用户群组识别方法及其可能的实现方式。

21、本方案以用户以及与用户相关的个人信息为节点,以用户和个人信息之间的关联关系为边,构建异构图;根据异构图中连接到相同个人信息的不同用户之间的关联关系,构建以用户为节点的同构图;对同构图中的用户节点进行聚类,得到若干个用户群组;根据预设指标确定用户群组的风险评分,并根据风险评分确定用户群组是否为异常用户群组。如此,基于同构图对异常用户群组进行识别,降低了异常用户群组的识别难度;同时,由于同构图中仅包括一种类型的节点和边,因此,采用统一的算法即可实现异常用户群组的识别,降低了对算法的要求。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1