本发明涉及网贷欺诈风险识别,更具体的说是涉及一种基于通信数据的网贷欺诈风险识别方法及系统。
背景技术:
1、网贷欺诈风险识别的意义在于加强风险管理、提高信用评估准确性、防止借贷欺诈,降低风险成本;通过网贷欺诈风险识别,有助于维护市场稳定、保护投资者和借款人的权益,促进金融领域的可持续发展。
2、目前,现有信贷风险识别方法需要银行用户的信贷风险、个体身份、资产信息等涉敏数据,且需要对涉敏数据进行大量规范化处理和标记,生成知识图谱、标签特征等数据形式,并应用经训练的嵌套于风险评估体系中的深度学习模型进行风险识别。
3、该类方法对数据种类和数据质量要求高,数据标注工作量较大,且应用过程复杂。同时,对于风险对象缺乏针对性的行为特征刻画和欺诈风险判断。
技术实现思路
1、有鉴于此,本发明提供了一种基于通信数据的网贷欺诈风险识别方法及系统,目的在于基于通信数据提供一种新型网贷欺诈风险识别方法,以降低对数据种类和质量的要求,以及数据标注的工作量;从而在有限的数据下,实现大范围群体内网贷低信用用户号码的准确定位和识别。
2、为了实现上述目的,本发明采用如下技术方案:
3、一方面,本发明公开了一种基于通信数据的网贷欺诈风险识别方法,包括:
4、根据种子逾期号码确定候选sp号码集合,对集合中各候选sp号码进行度量得到催缴系数,根据催缴系数确定催缴sp号码;
5、以催缴sp号码的通联号码作为本期逾期号码;
6、对本期逾期号码进行风险度量,得到目标逾期号码,根据目标逾期号码对网贷欺诈风险进行识别。
7、作为优选,风险度量结果根据风险阈值划分为多个等级的目标逾期号码;
8、作为优选,将不同等级的目标逾期号码及风险信息进行推送。
9、作为优选,对集合中各候选sp号码进行度量得到催缴系数的过程包括:
10、构建回归预测模型并进行训练,训练数据包括候选sp号码的涉贷统计信息,历史使用信息和号码序列嵌入信息,
11、通过训练完成的回归预测模型对候选sp号码进行度量;
12、作为优选,涉贷统计信息包括主动通联密度重要性,被动通联密度重要性,主动通联覆盖占比,和被动通联覆盖占比;
13、主动通联密度重要性,由sp号码同目标号码主动通联数量均值除以同非目标号码主动通联数量均值计算得到;
14、被动通联密度重要性,由sp号码同目标号码被动通联数量均值除以同非目标号码被动通联数量均值计算得到;
15、主动通联覆盖占比,由该sp号码主动通联的目标号码数量除以该sp号码主动通联的所有号码数量;
16、被动通联覆盖占比,由向该sp号码主动通联的目标号码数量除以向该sp号码主动通联的所有号码数量计算得到。
17、作为优选,通过号码地域聚集风险,号码近似操作风险,特殊出现行为风险,和贷款生命周期风险对本期逾期号码进行风险度量,生成涉贷风险画像。
18、作为优选,所述号码地域聚集风险,由地域聚集算法识别逾期号码中的可疑区域和可疑号码;
19、所述号码近似操作风险,包括同时间片段同对象近距离通联、同时间片段开/关机、imei一致;同时间片段同对象近距离通联,指在同一个时间范围向同一个对象通联的两个用户,且该两个用户距离相近;
20、特殊出现行为风险包括离省风险和静默风险;
21、贷款生命周期风险包括贷前、贷期和贷后风险,其中,
22、贷前风险包括新建卡风险和养卡风险;
23、贷期风险包括可疑聚集通联风险;
24、贷后风险包括割离风险。
25、作为优选,号码地域聚集风险基于时空同位次数或用户轨迹相似度进行挖掘。
26、所述利用时空同位次数挖掘地域聚集群体,即对于目标群体,统计号码间同一个时间片段下处同一个地域区间的号码数量,大于所设阈值,则纳入候选时空位置集合,计算一个号码一定时间范围内轨迹所含不同候选时空位置数量,即时空同位次数,符合所设阈值区间,即判定存在地域聚集风险;
27、所述利用用户轨迹相似度挖掘地域聚集群体,计算两两号码在同一天轨迹所涉地理区域块的重合程度,符合所设阈值区间,纳入候选相似号码对集合。进而,可定位可疑聚集号码集合,可疑聚集号码集合数量符合所设阈值区间,即判定存在地域聚集风险;
28、作为优选,对催缴sp号码进行迭代更替,步骤包括:以本期目标逾期号码作为下一期的初始逾期号码,确定sp号码后进行度量得到下一期逾期号码,以及对下一期逾期号码进行风险度量,得到下一期目标逾期号码。
29、另一方面,本发明提供了一种基于通信数据的网贷欺诈风险识别系统,包括:
30、催缴sp号码确定单元,用于根据种子逾期号码确定候选sp号码集合,对集合中各候选sp号码进行度量得到催缴系数,以及根据催缴系数确定催缴sp号码;
31、目标逾期号码识别单元,用于根据催缴sp号码确定本期逾期号码,对本期逾期号码进行风险度量,得到目标逾期号码,以及根据目标逾期号码对网贷欺诈风险进行识别。
32、作为优选,还包括迭代更替单元,用于按如下步骤对催缴sp号码进行迭代更替,包括:以本期目标逾期号码作为下一期的初始逾期号码,确定sp号码后进行度量得到下一期逾期号码,以及对下一期逾期号码进行风险度量,得到下一期目标逾期号码。
33、作为优选,还包括号码推送单元,用于推送根据风险度量结果确定的不同风险等级号码及风险信息。
34、经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于通信数据的网贷欺诈风险识别方法及系统,首先基于种子逾期号码确定催缴sp号码,进一步结合sp号码确定本期逾期号码,并通过对本期逾期号码进行交并分析,从而识别网贷欺诈风险。
35、本发明能够在数据有限条件下,快速而准确的从大范围群体内识别出网贷欺诈风险。
36、本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
37、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
1.一种基于通信数据的网贷欺诈风险识别方法,其特征在于,包括:
2.根据权利要求1所述的一种基于通信数据的网贷欺诈风险识别方法,其特征在于,对集合中各候选sp号码进行度量得到催缴系数的过程包括:
3.根据权利要求1所述的一种基于通信数据的网贷欺诈风险识别方法,其特征在于,通过号码地域聚集风险,号码近似操作风险,特殊出现行为风险,和贷款生命周期风险对本期逾期号码进行风险度量,生成涉贷风险画像。
4.根据权利要求3所述的一种基于通信数据的网贷欺诈风险识别方法,其特征在于,特殊出现行为风险包括离省风险和静默风险;贷款生命周期风险包括贷前、贷期和贷后风险,其中,
5.根据权利要求3所述的一种基于通信数据的网贷欺诈风险识别方法,其特征在于,号码地域聚集风险基于时空同位次数或用户轨迹相似度进行挖掘。
6.根据权利要求1所述的一种基于通信数据的网贷欺诈风险识别方法,其特征在于,对催缴sp号码进行迭代更替,步骤包括:以本期目标逾期号码作为下一期的初始逾期号码,确定sp号码后进行度量得到下一期逾期号码,以及对下一期逾期号码进行风险度量,得到下一期目标逾期号码。
7.一种基于通信数据的网贷欺诈风险识别系统,其特征在于,包括:
8.根据权利要求7所述的一种基于通信数据的网贷欺诈风险识别系统,其特征在于,还包括迭代更替单元,用于按如下步骤对催缴sp号码进行迭代更替,包括:以本期目标逾期号码作为下一期的初始逾期号码,确定sp号码后进行度量得到下一期逾期号码,以及对下一期逾期号码进行风险度量,得到下一期目标逾期号码。