反欺诈模型的生成方法、装置、设备及存储介质与流程

文档序号:17009433发布日期:2019-03-02 02:11阅读:253来源:国知局
反欺诈模型的生成方法、装置、设备及存储介质与流程

本发明涉及数据处理技术领域,尤其涉及一种反欺诈模型的生成方法、装置、设备及存储介质。



背景技术:

一般情况下对于反欺诈规则的建模通常需要以下过程,首先,对用户的交易数据进行预处理,对于交易数据存在严重不均衡的情况,还需要进行欠采样,另外,为了实现对交易数据的处理,还需将交易数据转换为模型支持的数据格式,将交易数据提取的特征聚合为向量,通过向量将交易数据划分为训练集和测试集,通过训练集构造反欺诈模型以及通过测试集进行预测,此建模过程比较复杂,需要耗费大量的时间和人工成本。



技术实现要素:

本发明的主要目的在于提出一种反欺诈模型的生成方法、装置、设备及存储介质,旨在减少模型构建时间和成本。

为实现上述目的,本发明提供一种反欺诈模型的生成方法,所述反欺诈模型的生成方法包括以下步骤:

获取预设欺诈规则流信息以及用户交易的样本信息,其中,所述预设欺诈规则流信息中包括多个判断欺诈行为的分支信息;

将所述样本信息放入所述预设欺诈规则流信息中进行分析,根据分析结果得到所述分支信息中的命中分支信息和相似分支信息;

将所述命中分支信息和相似分支信息根据所述预设关键字的逻辑关系进行细分,将细分后的分支信息进行组合生成目标分支信息;

提取所述目标分支信息中的欺诈行为特征信息,根据所述欺诈行为特征信息对预设反欺诈模型进行训练,生成目标反欺诈模型。

优选地,所述获取预设欺诈规则流信息,所述预设欺诈规则流信息中包括多个判断欺诈行为的分支信息之前,所述方法还包括:

获取历史欺诈用户的欺诈数据信息,将所述欺诈数据信息作为判定规则生成所述预设欺诈规则流信息。

优选地,所述将用户交易的样本信息放入所述预设欺诈规则流信息中进行分析,根据分析结果得到所述分支信息中的命中分支信息和相似分支信息,具体包括:

将用户交易的样本信息放入所述预设欺诈规则流信息中进行分析,根据分析结果得到所述分支信息中的命中分支信息,提取所述命中分支信息中的反欺诈规则信息,将包含所述反欺诈规则信息达到预设阈值的未命中分支信息作为所述相似分支信息。

优选地,所述将所述命中分支信息和相似分支信息根据所述预设关键字的逻辑关系进行细分,将细分后的分支信息进行组合生成目标分支信息之前,所述方法还包括:

判断所述分支信息和相似分支信息是否含有预设关键字,在含有所述预设关键字时,执行将所述分支信息和相似分支信息根据预设条件进行细分,将细分后的分支信息生成目标分支信息。

优选地,所述提取所述目标分支信息中的欺诈行为特征信息,根据欺诈行为特征信息对预设反欺诈模型进行训练,生成目标反欺诈模型,具体包括:

提取所述目标分支信息中的欺诈行为特征信息,根据所述欺诈行为特征信息对所述预设反欺诈模型进行训练得到预测行为信息,判断所述预测行为信息与所述欺诈行为信息之间的距离,根据所述距离调整所述预设反欺诈模型,并将调整后的预设反欺诈模型生成所述目标反欺诈模型。

优选地,所述提取所述目标分支信息中的欺诈行为特征信息,根据所述欺诈行为特征信息对预设反欺诈模型进行训练,生成目标反欺诈模型之后,所述方法还包括:

通过欺诈数据对所述目标反欺诈模型进行验证,提取所述目标分支信息中相似分支信息的命中次数,在所述命中次数未达到预设数量阈值时,将所述相似分支信息进行删除,根据删除后的分支信息对所述目标反欺诈模型进行迭代更新。

优选地,所述提取所述目标分支信息中的欺诈行为特征信息,根据所述欺诈行为特征信息对预设反欺诈模型进行训练,生成目标反欺诈模型之前,所述方法还包括:

获取历史用户的交易行为数据,提取所述交易行为数据中的欺诈数据,将所述欺诈数据生成预设维度的欺诈模型数据放入卷积神经网络进行训练,根据训练结果生成所述预设反欺诈模型。

此外,为实现上述目的,本发明还提出一种反欺诈模型的生成装置,所述反欺诈模型的生成装置包括:

获取模块,用于获取预设欺诈规则流信息,所述预设欺诈规则流信息中包括多个判断欺诈行为的分支信息;

分析模块,用于将用户交易的样本信息放入所述预设欺诈规则流信息中进行分析,根据分析结果得到所述分支信息中的命中分支信息和相似分支信息;

细分模块,用于将所述命中分支信息和相似分支信息根据所述预设关键字的逻辑关系进行细分,将细分后的分支信息进行组合生成目标分支信息;

生成模块,用于提取所述目标分支信息中的欺诈行为特征信息,根据所述欺诈行为特征信息对预设反欺诈模型进行训练,生成目标反欺诈模型。

此外,为实现上述目的,本发明还提出一种设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的反欺诈模型的生成程序,所述反欺诈模型的生成程序配置为实现如上所述的反欺诈模型的生成方法的步骤。

此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有反欺诈模型的生成程序,所述反欺诈模型的生成程序被处理器执行时实现如上文所述的反欺诈模型的生成方法的步骤。

本发明提出的反欺诈模型的生成方法,通过获取欺诈规则流信息中的命中分支信息和相似分支信息,提取命中分支信息和相似分支信息的欺诈行为特征信息,将欺诈行为特征信息对预设反欺诈模型进行训练,从而预先对欺诈规则流中的有效特征信息进行提取,通过有效的特征信息对反欺诈模型进行训练,从而减少模型构建时间和成本。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;

图2为本发明反欺诈模型的生成方法第一实施例的流程示意图;

图3为本发明反欺诈模型的生成方法第二实施例的流程示意图;

图4为本发明反欺诈模型的生成方法第三实施例的流程示意图;

图5为本发明反欺诈模型的生成装置第一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

参照图1,图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。

如图1所示,该设备可以包括:处理器1001,例如cpu,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如按键,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及反欺诈模型的生成程序。

在图1所示的设备中,网络接口1004主要用于连接外网,与其他网络设备进行数据通信;用户接口1003主要用于连接用户终端,与终端进行数据通信;本发明设备通过处理器1001调用存储器1005中存储的反欺诈模型的生成程序,并执行本发明实施例提供的反欺诈模型的生成的实施方法。

基于上述硬件结构,提出本发明反欺诈模型的生成方法实施例。

参照图2,图2为本发明反欺诈模型的生成方法第一实施例的流程示意图。

在第一实施例中,所述反欺诈模型的生成方法包括以下步骤:

步骤s10,获取预设欺诈规则流信息以及用户交易的样本信息,其中,所述预设欺诈规则流信息中包括多个判断欺诈行为的分支信息。

需要说明的是,所述预设欺诈规则流信息为原先制定的判断欺诈的规则流信息,例如包括节点信息、路径信息、条件信息以及分支信息,其中,所述条件信息可为逾期时间,将逾期时间在一定时间内的用户可根据逾期时间的长短判断用户是否存有欺诈行为,例如将超过预设还款期限的用户为逾期客户,超过还款期限时间为逾期时间,在逾期时间超过两个月的用户判定具有欺诈行为的用户,还可包括具有多个条件信息的分支信息,所述分支信息中为带有多个判定欺诈行为的信息,例如上述中的逾期时间等,还可包括其他的判定条件,本实施例对此不作限制。

步骤s20,将所述样本信息放入所述预设欺诈规则流信息中进行分析,根据分析结果得到所述分支信息中的命中分支信息和相似分支信息。

需要说明的是,所述用户交易的样本信息为记录用户交易行为的交易数据,例如用户a在b时间获取额度为10000的贷款信息,并设有还款期限以及还款数额,可将用户交易的样本信息导入本实施例的执行主体设备中,从为获取用户交易的样本信息。

在具体实现中,对所述样本信息的在预设欺诈规则流中的分析状况进行跟踪,例如获取样本信息通过预设欺诈规则流中的那一条分支的情况,从而获得命中分支信息以及未命中的分支信息,从而提取所述预设欺诈规则流中的有效分支信息。

可以理解的是,获取命中分支信息时,还可为未命中的分支信息中提取与命中分支信息相似的分支信息,作为相似分支信息,将所述命中分支信息与相似分支信息进行保留,便于对反欺诈模型进行训练,将未命中分支信息进行删除,从而提高系统处理效率,避免过多冗余以及无效的条件信息进行判定。

在具体实现中,获取命中分支信息,通过所述命中分支信息获取与命中分支信息中条件信息达到阈值的分支信息,作为相似分支信息,将所述命中分支信息与相似分支信息进行保留,对反欺诈模型进行训练,提高反欺诈模型的判定正确性。

步骤s30,将所述命中分支信息和相似分支信息根据所述预设关键字的逻辑关系进行细分,将细分后的分支信息进行组合生成目标分支信息。

需要说明的是,所述预设关键字可为将处于“和”或者“或”逻辑关系的分支信息,分成两个并列的分支信息,从而实现对分支信息的细化,加大训练模型的特征信息。

在具体实现中,例如所述命中分支信息中包括逾期时间是否超过2个月以及个人信息中用户名信息或者工作单位信息,可将用户名信息与工作单位信息进行拆分并组合生成多条分支信息,从而更细化分支信息,提高分支信息的命中率,从而提高系统处理效率,在本实施例中,所述目标分支信息为将命中分支信息和相似分支信息进行细化,并将细化后的分支信息生成新的分支信息,将新的分支信息进行重新组合生成所述目标分支信息,从而更有效的提取出命中分支信息和相似分支信息中有效的的判定条件特征。

步骤s40,提取所述目标分支信息中的欺诈行为特征信息,根据所述欺诈行为特征信息对预设反欺诈模型进行训练,生成目标反欺诈模型。

需要说明的是,所述预设反欺诈模型为预先建立的原始反欺诈初步模型,主要是基于卷积神经网络模型或者支持向量机模型建立的,还可通过其他基本模型进行建立,本实施例对此不作限制,在本实施例中,以卷积神经网络模型为例进行说明。

在本实施例中,将生成的目标分支信息对所述预设反欺诈模型进行迭代,在具体迭代过程中,还可跟踪相似分支信息的命中信息,将测试数据放入迭代后的反欺诈模型中进行训练,获取所述相似分支信息对反欺诈模型的迭代次数,随着测试数据的增加或者变化,判断相似分支信息的迭代次数超过预设阈值后仍未命中,则将所述相似分支信息进行删除,从而将所述相似分支信息判定为无效的特征信息,提高反欺诈模型迭代的效率。

本实施例通过上述方案,通过获取欺诈规则流信息中的命中分支信息和相似分支信息,提取命中分支信息和相似分支信息的欺诈行为特征信息,将欺诈行为特征信息对预设反欺诈模型进行训练,从而预先对欺诈规则流中的有效特征信息进行提取,通过有效的特征信息对反欺诈模型进行训练,从而提高反欺诈模型的迭代效率,减少模型构建时间和成本。

进一步地,如图3所示,基于第一实施例提出本发明反欺诈模型的生成方法第二实施例,在本实施例中,所述步骤s10之前,所述方法还包括:

步骤s101,获取历史欺诈用户的欺诈数据信息,将所述欺诈数据信息作为判定规则生成所述预设欺诈规则流信息。

需要说明的是,所述历史欺诈用户的欺诈数据信息,包括用户的重名,即用户的命名一致但是住址不一致,或者用户的姓名不一致但是住址一致,还可包括用户的逾期时间,将这些可以表征具有欺诈行为的欺诈数据信息作为判定欺诈行为的判定规则,通过判定规则生成所述预设欺诈规则流信息,从而首先通过预设欺诈规则流信息中的欺诈行为更有效的提取具有欺诈行为的特征信息。

在具体实现中,提取所述欺诈数据信息中欺诈条件信息以及条件信息之间的逻辑关系,将所述欺诈条件信息以及条件信息之间的逻辑关系作为规则流中的节点信息和分支中节点信息的逻辑关系生成所述预设欺诈规则流信息。

进一步地,所述步骤s20,具体包括:

步骤s201,将用户交易的样本信息放入所述预设欺诈规则流信息中进行分析,根据分析结果得到所述分支信息中的命中分支信息,提取所述命中分支信息中的反欺诈规则信息,将包含所述反欺诈规则信息达到预设阈值的未命中分支信息作为所述相似分支信息。

需要说明的是,所述预设阈值可为相似度为50%,还可为其他指数信息,本实施例对此不作限制。

在具体实现中,获取所述分支信息中的命中分支信息,提取所述命中分支信息中的反欺诈条件信息,例如逾期天数为2个月,还包括其他条件信息,将未命中分支信息中查找是否有所述逾期天数以及其他条件信息一致的条件信息,并统计一致的条件信息的数量,所述数量占整个条件信息的50%,则将所述分支信息判定为相似条件信息,从而对分支信息进行更精细化的处理,最大限度地提取出规则流信息中的有效条件信息。

本实施例提供的方案,根据命中分支信息获取相似分支信息,从而对分支信息进行更精细化的处理,最大限度地提取出规则流信息中的有效条件信息,实现对数据处理的智能化。

进一步地,如图4所示,基于第一实施例或第二实施例提出本发明反欺诈模型的生成方法第三实施例,在本实施例中,基于第一实施例进行说明,所述步骤s30之前,所述方法还包括:

步骤s301,判断所述分支信息和相似分支信息是否含有预设关键字,在含有所述预设关键字时,执行将所述分支信息和相似分支信息根据预设条件进行细分,将细分后的分支信息生成目标分支信息。

需要说明的是,所述预设关键字为“与”或者“或”等可表示分支信息中的逻辑关系,在所述分支信息中包含所述预设关键字时,则表示所述分支信息可进行细分,并将细分后的分支信息生成目标分支信息,从而实现对分支信息更精细化的分析。

进一步地,所述步骤s40,具体包括:

步骤s401,提取所述目标分支信息中的欺诈行为特征信息,根据所述欺诈行为特征信息对所述预设反欺诈模型进行训练得到预测行为信息,判断所述预测行为信息与所述欺诈行为信息之间的距离,根据所述距离调整所述预设反欺诈模型,并将调整后的预设反欺诈模型生成所述目标反欺诈模型。

在具体实现中,首先通过提取所述目标分支信息中的欺诈行为特征信息,例如提取欺诈行为特征信息(ai,bi),由于已知(ai,bi)为欺诈行为特征信息,将(ai,bi)放入所述预设反欺诈模型中进行训练,得到输出结果c,将bi与c进行比较,例如求出距离d=bi-c,从而得到实际输出与输入数据之间的区别,通过距离d调整所述预设反欺诈模型的矩阵w,并通过对每个样本重复上述过程,直到误差不超过规定范围,从而得到更符合业务需求的目标反欺诈模型。

进一步地,所述步骤s40之后,所述方法还包括:

步骤s402,通过欺诈数据对所述目标反欺诈模型进行验证,提取所述目标分支信息中相似分支信息的命中次数,在所述命中次数未达到预设数量阈值时,将所述相似分支信息进行删除,根据删除后的分支信息对所述目标反欺诈模型进行迭代更新。

需要说明的是,所述预设数量阈值可为5次,还可为其他参数指标,本实施例对此不作限制,在本实施例中,以5次为例进行说明,细分之后加入预设反欺诈模型,并进行迭代,随着迭代的进行,欺诈数据可能会有增加或变化,所述相似分支信息可能会命中,若相似分支信息的迭代次数超过某5次后仍然未命,则可将该相似分支信息进行删除。

进一步地,所述步骤s40之前,所述方法还包括:

步骤s403,获取历史用户的交易行为数据,提取所述交易行为数据中的欺诈数据,将所述欺诈数据生成预设维度的欺诈模型数据放入卷积神经网络进行训练,根据训练结果生成所述预设反欺诈模型。

需要说明的是,在本实施例中,所述预设反欺诈模型为基于卷积神经网络建立的预设反欺诈模型,通过历史用户的交易行为数据,例如包括用户的重名,即用户的命名一致但是住址不一致,或者用户的姓名不一致但是住址一致,还可包括用户的逾期时间,提取所述交易行为数据中的欺诈数据,将所述欺诈数据,根据逾期时间或者用户信息生成预设维度的欺诈模型数据,其中,所述预设维度为多维度,例如从时间维度,或者用户信息维度,并将生成的欺诈模型数据放入卷积神经网络进行训练,根据训练结果生成所述预设反欺诈模型,从而实现反欺诈模型的建立。

本实施例提供的方案,将历史用户的交易行为数据生成预设维度的欺诈模型数据放入卷积神经网络进行训练,从而实现反欺诈模型的建立。

本发明进一步提供一种反欺诈模型的生成装置。

参照图5,图5为本发明反欺诈模型的生成装置第一实施例的功能模块示意图。

本发明反欺诈模型的生成装置第一实施例中,该反欺诈模型的生成装置包括:

获取模块10,用于获取预设欺诈规则流信息以及用户交易的样本信息,其中,所述预设欺诈规则流信息中包括多个判断欺诈行为的分支信息。

需要说明的是,所述预设欺诈规则流信息为原先制定的判断欺诈的规则流信息,例如包括节点信息、路径信息、条件信息以及分支信息,其中,所述条件信息可为逾期时间,将逾期时间在一定时间内的用户可根据逾期时间的长短判断用户是否存有欺诈行为,例如将超过预设还款期限的用户为逾期客户,超过还款期限时间为逾期时间,在逾期时间超过两个月的用户判定具有欺诈行为的用户,还可包括具有多个条件信息的分支信息,所述分支信息中为带有多个判定欺诈行为的信息,例如上述中的逾期时间等,还可包括其他的判定条件,本实施例对此不作限制。

分析模块20,用于将所述样本信息放入所述预设欺诈规则流信息中进行分析,根据分析结果得到所述分支信息中的命中分支信息和相似分支信息。

需要说明的是,所述用户交易的样本信息为记录用户交易行为的交易数据,例如用户a在b时间获取额度为10000的贷款信息,并设有还款期限以及还款数额,可将用户交易的样本信息导入本实施例的执行主体设备中,从为获取用户交易的样本信息。

在具体实现中,对所述样本信息的在预设欺诈规则流中的分析状况进行跟踪,例如获取样本信息通过预设欺诈规则流中的那一条分支的情况,从而获得命中分支信息以及未命中的分支信息,从而提取所述预设欺诈规则流中的有效分支信息。

可以理解的是,获取命中分支信息时,还可为未命中的分支信息中提取与命中分支信息相似的分支信息,作为相似分支信息,将所述命中分支信息与相似分支信息进行保留,便于对反欺诈模型进行训练,将未命中分支信息进行删除,从而提高系统处理效率,避免过多冗余以及无效的条件信息进行判定。

在具体实现中,获取命中分支信息,通过所述命中分支信息获取与命中分支信息中条件信息达到阈值的分支信息,作为相似分支信息,将所述命中分支信息与相似分支信息进行保留,对反欺诈模型进行训练,提高反欺诈模型的判定正确性。

细分模块30,用于将所述命中分支信息和相似分支信息根据所述预设关键字的逻辑关系进行细分,将细分后的分支信息进行组合生成目标分支信息。

需要说明的是,所述预设关键字可为将处于“和”或者“或”逻辑关系的分支信息,分成两个并列的分支信息,从而实现对分支信息的细化,加大训练模型的特征信息。

在具体实现中,例如所述命中分支信息中包括逾期时间是否超过2个月以及个人信息中用户名信息或者工作单位信息,可将用户名信息与工作单位信息进行拆分并组合生成多条分支信息,从而更细化分支信息,提高分支信息的命中率,从而提高系统处理效率,在本实施例中,所述目标分支信息为将命中分支信息和相似分支信息进行细化,并将细化后的分支信息生成新的分支信息,将新的分支信息进行重新组合生成所述目标分支信息,从而更有效的提取出命中分支信息和相似分支信息中有效的的判定条件特征。

生成模块40,用于提取所述目标分支信息中的欺诈行为特征信息,根据所述欺诈行为特征信息对预设反欺诈模型进行训练,生成目标反欺诈模型。

需要说明的是,所述预设反欺诈模型为预先建立的原始反欺诈初步模型,主要是基于卷积神经网络模型或者支持向量机模型建立的,还可通过其他基本模型进行建立,本实施例对此不作限制,在本实施例中,以卷积神经网络模型为例进行说明。

在本实施例中,将生成的目标分支信息对所述预设反欺诈模型进行迭代,在具体迭代过程中,还可跟踪相似分支信息的命中信息,将测试数据放入迭代后的反欺诈模型中进行训练,获取所述相似分支信息对反欺诈模型的迭代次数,随着测试数据的增加或者变化,判断相似分支信息的迭代次数超过预设阈值后仍未命中,则将所述相似分支信息进行删除,从而将所述相似分支信息判定为无效的特征信息,提高反欺诈模型迭代的效率。

本实施例通过上述方案,通过获取欺诈规则流信息中的命中分支信息和相似分支信息,提取命中分支信息和相似分支信息的欺诈行为特征信息,将欺诈行为特征信息对预设反欺诈模型进行训练,从而预先对欺诈规则流中的有效特征信息进行提取,通过有效的特征信息对反欺诈模型进行训练,从而提高反欺诈模型的迭代效率,减少模型构建时间和成本。

此外,为实现上述目的,本发明还提出一种设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的反欺诈模型的生成程序,所述反欺诈模型的生成程序配置为实现如上文所述的反欺诈模型的生成方法的步骤。

此外,本发明实施例还提出一种存储介质,所述存储介质上存储有反欺诈模型的生成程序,所述反欺诈模型的生成程序被处理器执行如上文所述的反欺诈模型的生成方法的步骤。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台智能终端(可以是手机,计算机,终端设备,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1