一种基于图分类的套利团伙识别方法与流程

文档序号:29790040发布日期:2022-04-23 17:23阅读:来源:国知局

技术特征:
1.一种基于图分类的套利团伙识别方法,其特征在于,包括以下:s1:获取数据预处理,抽取构图的实体和关系,构建知识图谱;s2:对构建好的图谱,利用连通子图算法进行群组划分;s3:计算每个群组的风险指标信息,形成业务风险评分;s4:搭建并训练深度图卷积神经网络,用于预测群组的结构风险评分;s5:综合业务风险评分和结构风险评分计算群组的综合风险评分,筛选风险群组;上述的步骤s1,包含:s1.1:从业务数据表中获取原始交易数据和操作数据,进行数据清洗等预处理工作,抽取构图所需的实体和关系信息。实体包括:账户、商户、设备、ip等;关系包括:消费,登录,转账,提现等;s1.2:根据步骤s1.1中抽取的实体和关系,将数据导入图数据库neo4j构建图谱,或使用networkx等构图工具构图,当数据量较大时neo4j的性能明显优于networkx;上述的步骤s2,包含:s2.1:基于步骤s1.2中构建的图谱,采用连通子图算法在全图上进行子图划分,形成一个个彼此之间互相割裂,但内部联系紧密的群组;上述的步骤s3,包含:s3.1:根据步骤s2.1划分的用户群组,使用fp-growth频繁集挖掘算法,计算群组中用户的聚集度指标,得到聚集度评分;s3.2:基于步骤s3.1的聚集度指标和现有的用户黑名单、设备黑名单等,计算群组的风险程度评分;s3.3:基于步骤s3.1和步骤s3.2中得到的聚集度评分和风险程度评分,计算群组总的业务风险评分;上述的步骤s4,包含:s4.1:搭建深度图卷积神经网络,模型可以接受任意的图作为输入而不限制图的结构和节点数量,基于部分标签群组训练神经网络。s4.2:基于步骤s4.1的训练好的神经网络,将步骤s1.2中得到的用户群组作为输入,得到每个群组是否是套利群组的概率,将该概率处理后作为每个群组的结构风险评分;上述的步骤s5,包含:s5.1:基于步骤s3和步骤s4中得到的群组业务风险评分和群组结构风险评分,计算每个群组的综合风险评分,筛选群组综合风险评分大于一定阈值的群组或取前topn的群组,作为风险群组输出。

技术总结
本发明公开了一种基于图分类的套利团伙识别方法,包括以下:S1:获取数据预处理,抽取构图的实体和关系,构建知识图谱;S2:对构建好的图谱,利用连通子图算法进行群组划分;S3:计算每个群组的风险指标信息,形成业务风险评分;S4:搭建并训练深度图卷积神经网络,用于预测群组的结构风险评分。本发明采用连通子图算法对构建的图谱进行群组划分,可以使得套利团伙更容易被发现;采用深度图卷积神经网络对整个图进行分类,直接预测整个群组的风险;本发明不仅通过深度图神经网络判断群组的结构风险,同时还结合业务指标,使用频繁集挖掘算法分析群组的业务指标信息,计算业务风险评分,和业务数据相结合,增加了模型结果的可解释性。性。性。


技术研发人员:余杰潮 徐德华 汤敏伟 李真
受保护的技术使用者:天翼电子商务有限公司
技术研发日:2021.12.02
技术公布日:2022/4/22
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1