一种基于深度学习的信用卡欺诈检测方法与流程

文档序号:23728706发布日期:2021-01-26 18:51阅读:64来源:国知局
一种基于深度学习的信用卡欺诈检测方法与流程

[0001]
本发明属于信用卡欺诈检测技术领域,具体涉及一种基于深度学习(deep learning)的信用卡欺诈检测方法。


背景技术:

[0002]
近年来,随着移动支付的普及,信用卡交易的数量急剧增加。随之而来的是相应的问题,即随着信用卡的大规模使用,信用卡欺诈的问题变得越来越普遍,并且发生了重大损失。
[0003]
一些机器学习已经应用于相关的欺诈检测问题,并取得了优异的成绩。应该注意的是,这些方法都属于监督学习,并且是具有浅层结构的统计模型。这里的浅层是指仅包含一层非线性变化的模型。这种结构的功能是将输入数据从原始空间映射到特征空间以进行特征提取。相反,深层结构是指具有多层非线性变化的结构。这些结构逐层连接,上一层的输出用作下一层的输入。深层结构可以提取数据的高级特征,这是提取的特征的重新组合,而高级特征是原始数据属性的高度概括。近年来,深度结构模型在图像和语音编码,图像和语音识别以及信息检索等领域取得了丰硕的成果,其结果优于传统的机器学习方法。


技术实现要素:

[0004]
有鉴于此,本发明的目的在于提供一种基于深度学习的信用卡欺诈检测方法,所述方法提出了包括两个神经网络的特征工程框架,以生成用于欺诈检测模型的特征变量,然后,将提取的特征与原始数据融合,然后输入到分类器中,以获得良好的欺诈检测性能。
[0005]
本发明的目的是这样实现的,一种基于深度学习的信用卡欺诈检测方法,包括以下步骤:
[0006]
步骤1,获取信用卡欺诈交易的原始数据集,并且对数据集进行预处理;
[0007]
步骤2,将数据划分为两部分,一部分作为训练集,另一部分作为测试集;
[0008]
步骤3,将训练集输入深度学习的模型之中进行训练,优化模型参数,并且调整超参数,使得模型的性能达到最佳;
[0009]
步骤4,将测试集输入训练好的模型,得出分类标签。
[0010]
具体地,步骤3中所述的深度学习的模型的训练,包括以下步骤:
[0011]
步骤301,原始数据特征data先经过全连接神经网络fc1,神经网络有29个神经元,得到数据特征data1;
[0012]
步骤302,数据特征data1再经过全连接神经网络fc2,神经网络有116个神经元,得到数据特征data2;
[0013]
步骤303,数据特征data2再经过全连接神经网络fc3,神经网络有99个神经元,得到数据特征data3;
[0014]
步骤304,数据特征data3与原始数据特征data融合之后再经过全连接神经网络fc4,神经网络有128个神经元,得到数据特征data4;
[0015]
步骤305,数据特征data4再经过全连接神经网络fc5,神经网络有64个神经元,得到数据特征data5;
[0016]
步骤306,数据特征data5再经过全连接神经网络fc6,神经网络有2个神经元,得到数据标签。
[0017]
优选地,所述的训练集为样本总数的三分之二,测试集为样本总数的三分之一。
[0018]
具体地,所述的数据标签为0或1,0表示此交易为正常交易,1表示此交易为欺诈交易。
[0019]
更进一步地,对分类标签进行相关的计算,得出相应指标的数值,指标包括精确度和召回率。
[0020]
本发明方法经过历史数据训练之后,可以对在线交易数据进行检测,从而识别出欺诈交易,本方法使用全连接网络提取原始数据的深层特征并与原始数据融合成新的特征,提出了一个新的信用卡欺诈检测模型,可以更有效的模拟交易行为并在敏感度上取得了出色的表现。
附图说明
[0021]
图1为本发明方法的整体流程示意图;
[0022]
图2为本发明实施例中深度学习方法的流程示意图;
[0023]
图3为本发明实施例中精确度的结果对比图;
[0024]
图4为本发明实施例中召回率的结果对比图;
[0025]
图5为本发明实施例中f1分数的结果对比图;
[0026]
图6为本发明实施例中特异度的结果对比图;
[0027]
图7为本发明实施例中准确率的结果对比图。
具体实施方式
[0028]
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0029]
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0030]
图1示出了本发明实施例的流程示意图,一种基于深度学习的信用卡欺诈检测方法,包括以下步骤:
[0031]
步骤1,获取信用卡欺诈交易的原始数据集,并且对数据集进行预处理;
[0032]
步骤2,将数据划分为两部分,一部分作为训练集,另一部分作为测试集;
[0033]
步骤3,将训练集输入深度学习的模型之中进行训练,优化模型参数,并且调整超参数,使得模型的性能达到最佳;
[0034]
步骤4,将测试集输入训练好的模型,得出分类标签。
[0035]
具体地,如图2所示,步骤3中所述的深度学习的模型的训练,包括以下步骤:
[0036]
步骤301,原始数据特征data先经过全连接神经网络fc1,神经网络有29个神经元,得到数据特征data1;
[0037]
步骤302,数据特征data1再经过全连接神经网络fc2,神经网络有116个神经元,得到数据特征data2;
[0038]
步骤303,数据特征data2再经过全连接神经网络fc3,神经网络有99个神经元,得到数据特征data3;
[0039]
步骤304,数据特征data3与原始数据特征data融合之后再经过全连接神经网络fc4,神经网络有128个神经元,得到数据特征data4;
[0040]
步骤305,数据特征data4再经过全连接神经网络fc5,神经网络有64个神经元,得到数据特征data5;
[0041]
步骤306,数据特征data5再经过全连接神经网络fc6,神经网络有2个神经元,得到数据标签。
[0042]
优选地,所述的训练集为样本总数的三分之二,测试集为样本总数的三分之一。
[0043]
具体地,所述的数据标签为0或1,0表示此交易为正常交易,1表示此交易为欺诈交易。
[0044]
更进一步地,对分类标签进行相关的计算,得出相应指标的数值,指标包括精确度和召回率。
[0045]
数据集为来自知名的竞赛网站kaggle,该数据集包含2012年九月的两天内的信用卡交易数据。数据只包含数字信息,由于保密原因,大部分的数据属性是经由pca转换之后的数据,这些属性共有27个。唯一未经处理的数据部分为交易金额与交易时间,因此数据预处理之后,共有29个属性特征。
[0046]
数据集中的标签为二元分类标签,按照是否为欺诈交易划分。数据共有交易284807例,其中欺诈交易有492例,是典型的不平衡分类数据。数据被划分为训练集与测试集,其训练集中包含有184694例交易,欺诈交易314例,约占三分之二;测试集包含有90969例交易,欺诈交易有159例,约占三分之一。
[0047]
在实验中,我们进行了多次独立重复实验,对其结果取平均值。模型训练共有70次迭代,通常在第10次迭代时模型开始收敛,因此我们取10次之后的迭代进行分析比较两种算法的性能。
[0048]
图3展示的是两种算法的精确度,实线展示的是我们所提出方法的精确度,虚线是传统的深度学习方法。可以看出,模型在基本收敛之后,本发明方法的准确率一直在传统方法之上,直到迭代时结束。并且两种算法的精确度一直保持平稳的上升趋势,从第10次迭代开始,到30次迭代时是急剧增加,随后10次迭代中缓缓增加,从40次迭代至结束是逐步增加。
[0049]
图4展示的是两种算法的召回率,实线展示的是我们所提出方法的召回率,虚线是传统的深度学习方法。可以看出,模型在基本收敛之后,本发明方法的召回率一直在传统方法之上,直到60次迭代时结束,随后传统方法表现较好。20至50次迭代期间,两种算法的精确度一直保持平稳的上升趋势,且两种算法的差值较大,随后逐渐缩小;在60至70次迭代时,本发明方法的召回率开始下降,而传统算法的召回率还在提升。综合以上可知,本发明方法的召回率收敛速度优于传统算法,且召回率较高。
[0050]
图5展示的是两种算法的f1分数,实线展示的是我们所提出方法的f1分数,虚线是传统的深度学习方法。可以看出,模型在基本收敛之后,本发明方法的f1分数一直在传统方
法之上,直到迭代时结束。并且两种算法的精确度一直保持平稳的上升趋势,其中,在30至50次迭代左右的时候,两种算法的差值较大,随后逐渐缩小。
[0051]
图6展示的是两种算法的特异度,实线展示的是我们所提出方法的特异度,虚线是传统的深度学习方法。可以看出,模型在基本收敛之后,本发明方法的特异度一直在传统方法之上,直到迭代时结束。并且两种算法的精确度一直保持平稳的上升趋势,从第10次迭代开始,到30次迭代时是急剧增加,随后10次迭代中保持平稳不变,从40次迭代至结束是逐步增加。
[0052]
图7展示的是两种算法的准确率,实线展示的是我们所提出方法的准确率,虚线是传统的深度学习方法。可以看出,模型在基本收敛之后,本发明方法的准确率一直在传统方法之上,直到60次迭代时才有所缓解。推测其原因为模型过拟合,导致两种算法的准确率开始下降。期间两种算法的精确度一直保持平稳的上升趋势,在40次迭代之前增长较快,随后缓缓增长直至结束。
[0053]
表1:算法对比结果
[0054][0055]
表1展示了两种算法的均值,即10次独立重复实验从迭代开始至迭代结束时的均值。其中,准确率与特异度的提升较小,原因为数据中的阴性样本较多,修正的样本数量相对于阴性样本数量太小;而另外三种度量的提升就比较明显,均达到了2%左右。
[0056]
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1