本发明涉及风险决策领域,具体是一种关联性欺诈识别与防控的方法。
背景技术:
1、在信贷业务中,一般包括营销获客、贷前授信、贷中动支、贷后催收等业务场景。其中贷前授信和贷中动支是关联风险的高发环节,根据不同环节的关联特征衍生相关关联变量,训练图谱模型用于贷前监测。
2、欺诈风险目前日益呈现产业链化的特征,围绕着欺诈的实施,形成了专业的技术开发产业,比如虚假资料,伪冒申请,虚假交易等;身份包装和虚假身份提供产业,比如到偏远地区低价收购身份证等;业务漏洞发现和欺诈方法传授产业,而且从事这些产业的人都具有较高的技术水平,他们会各种试探金融机构的反欺诈规则,然后利用前两种产业提供的技术、资料实施欺诈。这种团伙欺诈有时不容易被侦测,使用人工智能算法识别可能产生漏网之鱼,通过复杂网络的挖掘方法可以有效弥补这一缺点;
技术实现思路
1、本发明的目的在于解决信贷业务各场景下欺诈事件呈专业性和有组织性,导致欺诈风险类型多,覆盖面广,风控人员难以对欺诈事件进行全方位捕捉和管控的问题,通过有向关联网络可以挖掘全局场景下有关联的高风险订单,从而进行预警和处置,探索更有效、更适用于风控场景的关联性欺诈识别与防控的方法。
2、本发明为了解决上述技术问题,采用以下技术方案:
3、本发明提供了一种关联性欺诈识别与防控的方法,包括以下步骤:
4、步骤1、定义信贷风控应用业务场景:
5、在信贷业务中,关联欺诈业务场景包括贷前授信、贷中动支;
6、定义不同场景的关联欺诈特征:
7、贷前授信的关联欺诈特征以批量申请为主,贷中环节的关联欺诈特征以关联交易,时间序列上的集中交易为主;
8、步骤2、根据不同的业务场景,收集对应的节点原始数据;
9、步骤3、基于获取到的原始数据进行梳理清洗,保证字段类型及格式统一,且符合业务逻辑,便于后续构建网络;
10、步骤4、根据清洗好的节点数据设计并构建底表,将数据分为节点和属性两大类,制定底表数据的更新方式,保证底表数据完整且统一;
11、步骤5、基于构建好的关联底表构建有向关联网络,并线上化系统化,可视化,支持实时展示,查询等功能;
12、步骤6、基于构建好的网络利用图算法构建关联网络,训练关联特征并构建无监督模型,输出关联图谱评分,根据评分判断申请用户的关联欺诈风险程度;
13、步骤7、进行代码封装,形成可泛化使用的标准化工具,使得生产可直接调用,贷前贷中及时响应并处置。
14、上述技术方案中,步骤2包括以下步骤:
15、步骤2.1:根据需衍生的关联网络,分别提取贷前授信和贷中动支业务场景对应的节点原始数据,具体如下:
16、获取贷前授信环节中的联系人手机号码,单位电话,单位地址,device_id,imei,idfa,ip,wifi_mac;
17、获取贷中动支环节的银行卡号,银行卡预留手机号,device_id,imei,idfa,ip,wifi_mac;
18、步骤2.2:确认节点原始数据的获取方式,分为用户填写手机号码,单位信息,授权设备信息;
19、步骤2.3:确认属性数据(如内部根据用户的借贷行为衍生的标签,如是否命中各类名单库,当前订单状态是否逾期,历史是否逾期及最大逾期天数)的储存位置及获取方式,便于构图时能准确获取到入图的数据,确认属性数据的计算逻辑,确保入图数据的准确性。
20、上述技术方案中,步骤3包括以下步骤:
21、步骤3.1:将获取到的数据分为节点类和属性类;
22、步骤3.2:清洗获取到的节点数据,使用正则表达式使单个变量格式保持统一,保证变量逻辑符合业务定义,如联系人手机号字段出现非11位号码的情况;
23、步骤3.3:确认属性数据的来源和逻辑是否满足业务需求,如用户逾期口径需与应用部门的业务口径保持一致,是否入黑标签底层对应的名单库需与应用部门的名单库保持一致;
24、上述技术方案中,步骤4包括以下步骤:
25、步骤4.1:将节点类数据、属性类数据归类储存在各个业务系统并实时更新;
26、步骤4.2:将各个业务系统清洗好的原始数据通过接口汇总,组成关联底表,设置数据更新方式,保持数据一致性;
27、上述技术方案中,步骤5包括以下步骤:
28、步骤5.1:基于步骤4构建好的关联底表,利用图算法生成节点和有向边,从而在业务服务器上构建关联图谱网络;
29、步骤5.2:将业务系统与业务服务器上构建好的关联图谱网络通过实时数据接口连接,实现线上的系统化操作和可视化监控查询;
30、步骤5.3:涉及业务系统的复杂网络模块架构,根据节点查询关联信息的节点关联图,根据用户订单查询的本人关联风险图;
31、上述技术方案中,步骤6包括以下步骤:
32、步骤6.1:基于构建好的关联网络图谱,利用无监督机器学习算法训练图谱模型,输出图评分;
33、步骤6.2:确认模型底层数据加工及储存管理方式,依赖服务器上的图数据库实现实时评分衍生,根据评分判断申请用户的关联欺诈风险程度。
34、因为本发明采用上述技术方案,因此具备以下有益效果:
35、1、本发明将关联欺诈识别引入风控信贷领域,为从业者在依靠关联欺诈风险指标进行决策时是否可靠提供参考标准,考虑到了信贷领域关联欺诈风险场景多,欺诈手段多样化的特点。
36、2、本发明采用收集用户基础信息构建网络的方法,先针对不同风控场景下可能发生的关联欺诈风险,收集不同场景下能合法获取的用户基础信息,从而构建关联网络。这种方式从用户基础数据出发,避免了数据难获取,数据准确性低,数据维度单一的问题。
37、3、本发明将上述模式实验的计算过程最终封装成标准化的函数,使用者只需输入用户的基础信息,如银行卡,手机号,地址,设备信息等,即可自动计算出对应的图评分,具备较强的复用性。
1.一种关联性欺诈识别与防控的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种关联性欺诈识别与防控的方法,其特征在于,步骤2包括以下步骤:
3.根据权利1所述的一种关联性欺诈识别与防控的方法,其特征在于,步骤3包括以下步骤:
4.根据权利1所述的一种关联性欺诈识别与防控的方法,其特征在于步骤4包括以下步骤:
5.根据权利1所述的一种关联性欺诈识别与防控的方法,其特征在于,步骤5包括以下步骤:
6.根据权利1所述的一种关联性欺诈识别与防控的方法,其特征在于,步骤6包括以下步骤: