基于深度学习的欺诈交易识别方法、系统及存储介质与流程

文档序号:15616902发布日期:2018-10-09 21:36阅读:338来源:国知局

本发明涉及金融风险控制领域,尤其涉及一种基于深度学习的欺诈交易识别方法、系统及存储介质。



背景技术:

金融领域对交易风险控制的要求较高。在利用深度学习进行欺诈交易的识别中,目前一般采用监督学习算法训练检测模型,而用于训练检测模型的特征是基于有标签的历史交易数据而构造的,因此采用监督学习算法训练的检测模型,可以有效识别历史欺诈类型,而对缺乏欺诈样本的未知欺诈类型(比如未曾出现过或变种的欺诈交易)一般无能为力,这种后验性导致交易风险识别具有滞后性,准确性较低。

另一方面,现有采用无监督学习算法来训练检测模型的方法,是利用k-means算法或基于密度的聚类算法直接对数据进行聚类而将数据划分成若干个群组(没有经过降维),这种聚类算法极易受数据噪声点的影响,且其本质是基于相似度的度量学习(metriclearning),需预先根据经验人工定义样本之间的距离,对于高维特征的数据人工难以确定合适的相似度度量方法;而目前最常用的特征降维方法是主成分分析(pca),然而,pca适应于线性且服从高斯分布的数据,实际应用中的数据基本是非线性的,故在实际应用中pca并不能达到预期的降维效果甚至失效。因而,现有方式中,对于实际应用中的非线性高维特征数据,不管是直接进行聚类,或是通过pca进行降维,最终都不能精确描述群组信息,从而影响欺诈交易识别的合理性。

这就给欺诈交易的识别带来了挑战,说明现有识别欺诈交易的方法,无法应对复杂的实际情况。



技术实现要素:

本发明的主要目的在于提供一种基于深度学习的欺诈交易识别方法,旨在解决现有欺诈交易识别方法不够准确与合理的技术问题。

为实现上述目的,本发明提供一种基于深度学习的欺诈交易识别方法,所述方法包括:

获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;

构建堆叠的受限玻尔兹曼机rbm神经网络结构并进行训练,并通过训练完成的rbm神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;

计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;

根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;

获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。

可选地,所述构建堆叠的rbm神经网络结构并进行训练的步骤包括:

设置所述堆叠的rbm神经网络结构的层数和每一层rbm神经网络的输出节点数;

逐一训练所述每一层rbm神经网络,以确定各层rbm神经网络的参数;

将训练完成的各层rbm神经网络进行堆叠。

可选地,所述逐一训练所述每一层rbm神经网络,以确定各层rbm神经网络的参数的步骤包括:

确定所述训练样本的特征,并根据所述特征构建高维特征向量,由所述高维特征向量构成高维特征空间;

基于所述高维特征空间,逐一训练所述每一层rbm神经网络,以确定各层rbm神经网络的参数。

可选地,所述基于所述高维特征空间,逐一训练所述每一层rbm神经网络,以确定各层rbm神经网络的参数的步骤包括:

利用正态分布随机产生第一层rbm神经网络的参数初始值;

利用所述高维特征空间的维度作为第一层rbm神经网络的输入节点数训练第一层rbm神经网络,训练时通过调整所述第一层rbm神经网络的参数初始值,得到第一层rbm神经网络的参数;

在得到第n-1层rbm神经网络的参数后,利用正态分布随机产生第n层rbm神经网络的参数初始值;

利用第n-1层rbm神经网络的输出节点数作为第n层rbm神经网络的输入节点数训练第n层神经网络,训练时通过调整所述第n层rbm神经网络的参数初始值,得到第n层rbm神经网络的参数,以得到各层rbm神经网络的参数,其中,n≥2。

可选地,所述每一层rbm神经网络包括可见层和隐藏层,所述每一层rbm神经网络的参数包括所述可见层和隐藏层之间的权重矩阵、可见层中可见节点的偏移量和隐藏层中隐藏节点的偏移量。

可选地,所述通过训练完成的rbm神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组的步骤包括:

通过所述训练完成的rbm神经网络结构,将所述训练样本映射为二元状态向量;

将具有相同二元状态向量的训练样本归为同一群组,以将所述训练样本划分为若干个群组。

可选地,所述根据所述计算的各个汉明距离确定各个群组的欺诈概率的步骤包括:

将所述计算的各个汉明距离与预设汉明距离阈值进行比对;

将汉明距离大于预设汉明距离阈值的群组,设置为高欺诈概率。

可选地,所述根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易的步骤包括:

将所述待检测交易数据,代入所述欺诈交易检测模型中,得到待检测交易数据基于群组的欺诈概率;

加重审核高欺诈概率对应群组中的待检测交易数据,以识别出欺诈交易。

此外,为实现上述目的,本发明还提供一种基于深度学习的欺诈交易识别系统,所述基于深度学习的欺诈交易识别系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于深度学习的欺诈交易识别程序,所述基于深度学习的欺诈交易识别程序被所述处理器执行时实现如下步骤:

获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;

构建堆叠的受限玻尔兹曼机rbm神经网络结构并进行训练,并通过训练完成的rbm神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;

计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;

根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;

获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。

此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有基于深度学习的欺诈交易识别程序,所述基于深度学习的欺诈交易识别程序被处理器执行时实现如下步骤:

获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;

构建堆叠的受限玻尔兹曼机rbm神经网络结构并进行训练,并通过训练完成的rbm神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;

计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;

根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;

获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。

本发明构建堆叠的rbm神经网络结构并进行训练,通过训练完成的rbm神经网络结构将无监督的高维数据样本进行降维和聚类,将样本划分为具有鲜明特性的各个群组,然后计算样本所有群组的质心,分别计算各个样本群组与所述质心的汉明距离,从而利用汉明距离衡量群组之间的距离,进而基于汉明距离确定各个样本群组的欺诈概率,由此建立欺诈交易检测模型,用于分析待检测交易数据,实现了基于欺诈交易检测模型确定待检测交易数据对应的欺诈概率,为有效识别历史欺诈类型和未知欺诈类型的欺诈交易提供了精确的分析依据,提高了欺诈交易识别的准确性和合理性。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;

图2为本发明基于深度学习的欺诈交易识别方法第一实施例的流程示意图;

图3为本发明基于深度学习的欺诈交易识别方法第一实施例的细化流程示意图;

图4为本发明涉及的3层rbm神经网络结构示意图;

图5为本发明基于深度学习的欺诈交易识别方法第二实施例的流程示意图;

图6为本发明涉及的每一层rbm神经网络的示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例的主要解决方案是:获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;构建堆叠的受限玻尔兹曼机rbm神经网络结构并进行训练,并通过训练完成的rbm神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例终端承载有基于深度学习的欺诈交易识别系统。

如图1所示,该终端可以包括:处理器1001,例如cpu,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选的用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于深度学习的欺诈交易识别程序。

在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的基于深度学习的欺诈交易识别程序,并执行以下操作:

获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;

构建堆叠的受限玻尔兹曼机rbm神经网络结构并进行训练,并通过训练完成的rbm神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;

计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;

根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;

获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。

进一步地,处理器1001可以调用存储器1005中存储的基于深度学习的欺诈交易识别程序,还执行以下操作:

设置所述堆叠的rbm神经网络结构的层数和每一层rbm神经网络的输出节点数;

逐一训练所述每一层rbm神经网络,以确定各层rbm神经网络的参数;

将训练完成的各层rbm神经网络进行堆叠。

进一步地,处理器1001可以调用存储器1005中存储的基于深度学习的欺诈交易识别程序,还执行以下操作:

确定所述训练样本的特征,并根据所述特征构建高维特征向量,由所述高维特征向量构成高维特征空间;

基于所述高维特征空间,逐一训练所述每一层rbm神经网络,以确定各层rbm神经网络的参数。

进一步地,处理器1001可以调用存储器1005中存储的基于深度学习的欺诈交易识别程序,还执行以下操作:

利用正态分布随机产生第一层rbm神经网络的参数初始值;

利用所述高维特征空间的维度作为第一层rbm神经网络的输入节点数训练第一层rbm神经网络,训练时通过调整所述第一层rbm神经网络的参数初始值,得到第一层rbm神经网络的参数;

在得到第n-1层rbm神经网络的参数后,利用正态分布随机产生第n层rbm神经网络的参数初始值;

利用第n-1层rbm神经网络的输出节点数作为第n层rbm神经网络的输入节点数训练第n层神经网络,训练时通过调整所述第n层rbm神经网络的参数初始值,得到第n层rbm神经网络的参数,以得到各层rbm神经网络的参数,其中,n≥2。

进一步地,所述每一层rbm神经网络包括可见层和隐藏层,所述每一层rbm神经网络的参数包括所述可见层和隐藏层之间的权重矩阵、可见层中可见节点的偏移量和隐藏层中隐藏节点的偏移量。

进一步地,处理器1001可以调用存储器1005中存储的基于深度学习的欺诈交易识别程序,还执行以下操作:

通过所述训练完成的rbm神经网络结构,将所述训练样本映射为二元状态向量;

将具有相同二元状态向量的训练样本归为同一群组,以将所述训练样本划分为若干个群组。

进一步地,处理器1001可以调用存储器1005中存储的基于深度学习的欺诈交易识别程序,还执行以下操作:

将所述计算的各个汉明距离与预设汉明距离阈值进行比对;

将汉明距离大于预设汉明距离阈值的群组,设置为高欺诈概率。

进一步地,处理器1001可以调用存储器1005中存储的基于深度学习的欺诈交易识别程序,还执行以下操作:

将所述待检测交易数据,代入所述欺诈交易检测模型中,得到待检测交易数据基于群组的欺诈概率;

加重审核高欺诈概率对应群组中的待检测交易数据,以识别出欺诈交易。

基于上述终端的硬件结构,提出本发明基于深度学习的欺诈交易识别方法的各个实施例。

参照图2,本发明基于深度学习的欺诈交易识别方法第一实施例提供一种基于深度学习的欺诈交易识别方法,所述方法包括:

步骤s10,获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;

在本实施例中,该基于深度学习的欺诈交易识别方法应用于基于深度学习的欺诈交易识别系统。本实施例利用无监督学习方法,并基于汉明距离(hamming)衡量欺诈概率,从而建立欺诈交易检测模型,进而通过建立的欺诈交易检测模型识别待检测交易数据的欺诈概率。

在本实施例中,步骤s10之前,包括采集一段时间内的历史交易数据的步骤,该历史交易数据包括交易时间、交易ip地址、交易地区、交易金额、交易设备等基本信息,将采集的历史交易数据作为用于建立欺诈交易检测模型的训练样本,所述训练样本是一个集合,集合里面的元素是一个个交易数据样例,例如:

训练样本={交易数据样例1,交易数据样例2,...}

={(交易时间1、交易ip地址1、交易地区1、交易金额1、交易设备1),(交易时间2、交易ip地址2、交易地区2、交易金额2、交易设备2),...}。

即,训练样本中的每个样例都是由交易的基本信息组成的高维数据,且该训练样本不具有数据标签。

步骤s20,构建堆叠的受限玻尔兹曼机rbm神经网络结构并进行训练,并通过训练完成的rbm神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;

其中,参照图3,构建堆叠的rbm神经网络结构并进行训练的步骤包括:

步骤s21,设置所述堆叠的rbm神经网络结构的层数和每一层rbm神经网络的输出节点数;

步骤s22,逐一训练所述每一层rbm神经网络,以确定各层rbm神经网络的参数;

步骤s23,将训练完成的各层rbm神经网络进行堆叠。

在本实施例中,需要构建堆叠的rbm神经网络结构,并基于训练样本对该rbm神经网络结构进行训练。rbm(restrictedboltzmannmachine,受限玻尔兹曼机)是一种可用随机神经网络(stochasticneuralnetwork)来解释的概率图模型(probabilisticgraphicalmodel);所谓“随机”,是指这种网络中的神经元是随机神经元,其输出只有两种状态(未激活、激活),一般用二进制的0和1来表示,也就是说,rbm每个输出节点都取值0或1,其具体取值需根据概率统计法则来确定;神经元之间的连接具有层内无连接、层间全连接的特点。由此可知,rbm是基于二分(概率)图的结构。可以设置rbm神经网络结构的层数和每一层rbm神经网络的输出节点数,来构建堆叠的rbm神经网络结构,以图4为例,图4为3层的rbm神经网络结构示意图,即将rbm神经网络结构的层数设置为3层,从底层(第一层)自下而上,可以依次将每一层rbm神经网络的输出节点数分别设置为6、4、3。之后,可以逐一对每一层的rbm神经网络结构进行训练,逐一对每一层rbm神经网络的训练即意味着调整每一层rbm神经网络的参数,当确定了各层rbm神经网络的参数,即表示各层rbm神经网络训练完成,将训练完成的各层rbm神经网络进行堆叠,可得到训练完成的rbm神经网络结构,训练完成的rbm神经网络结构就是一个降维器。

之后,通过训练完成的rbm神经网络结构对样本数据进行降维和聚类,从而将训练样本划分为若干个群组。具体地,继续参照图3,所述通过训练完成的rbm神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组的步骤,可以包括:

步骤s24,通过所述训练完成的rbm神经网络结构,将所述训练样本映射为二元状态向量;

步骤s25,将具有相同二元状态向量的训练样本归为同一群组,以将所述训练样本划分为若干个群组。

本实施例可以通过训练完成的rbm神经网络结构对训练样本进行降维,如此,训练样本的每个样例均被映射为一个二元状态向量。假设降维器将具有n维特征空间的训练样本降维至m维(m≤n),理论上可以产生2m个二元状态向量。需要说明的是,只有m≤n时才能够达到降维的目的。在实际试验中,一个2000维的样本被映射为35维的二元状态向量:(11101111001011111110111111111111111),即当n=2000时,经过降维器降维处理后,m=35。在此过程中,无需预先定义相似度度量方法,也就无需人工通过大量实验确定高维数据样本的相似度,不仅难度降低,而且降低了成本。

之后,将经过降维得到的二元状态向量进行聚类,即将具有相同二元状态向量的训练样本归为同一群组,所述训练样本被划分为若干个群组(定义为g个群组)。在实际试验中,最终得到的群组个数g远远低于2m,这也说明了rbm有很强的特征提取能力和噪声处理能力,对样本容忍度高。

步骤s30,计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;

步骤s40,根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;

其中,所述根据所述计算的各个汉明距离确定各个群组的欺诈概率的步骤,可以包括:

步骤s41,将所述计算的各个汉明距离与预设汉明距离阈值进行比对;

步骤s42,将汉明距离大于预设汉明距离阈值的群组,设置为高欺诈概率。

在得到基于训练样本的各个群组后,计算所有群组的质心。本实施例预先设置有质心计算公式,如下:

其中,g表示群组个数;

表示每个群组对应的二元状态向量,其中,m表示顶层rbm的输出节点数;

ni=(n1,n2,…ng),表示每个群组的交易记录个数;

round(x,0)表示与x最接近的整数。

假设训练样本经过训练完成的rbm神经网络结构的降维和聚类后,共划分为g个群组,每个群组的交易记录个数分别为n1、n2、…、ng,第i个群组对应的二元状态向量为顶层rbm的输出节点数为m,由上述质心计算公式,可计算得到g个群组的质心。然后分别计算各个群组与质心的汉明距离。汉明距离表示两个字符串对应位置的不同字符的个数,本实施例利用汉明距离衡量群组之间的距离,如果一个群组与质心的汉明距离越大,说明其欺诈概率越高。计算汉明距离的具体过程可参照现有技术,此处不再赘述。

之后,将计算得到的各个汉明距离与预设距离阈值进行比对,将汉明距离大于预设汉明距离阈值的群组,设置为高欺诈概率(比如概率值设置为50%~100%);将汉明距离小于预设汉明距离阈值的群组,对应为低欺诈概率(比如概率值设置为0%~20%),从而建立欺诈交易检测模型。需要说明的是,汉明距离阈值可预先根据实际处理情况设置,欺诈概率的设定值也可根据实际处理情况设置,此处均不作限定。本实施例基于无监督的高维数据样本,通过构建堆叠的rbm神经网络结构和引入汉明距离,建立欺诈交易检测模型,故所述交易检测模型可提高交易数据检测的精确性和合理性。

步骤s50,获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。

其中,所述根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易的步骤,可以包括:

步骤s51,将所述待检测交易数据,代入所述欺诈交易检测模型中,得到待检测交易数据基于群组的欺诈概率;

步骤s52,加重审核高欺诈概率对应群组中的待检测交易数据,以识别出欺诈交易。

在本实施例中,在接收到待检测交易数据时,就可以将待检测交易数据代入欺诈交易检测模型中,基于欺诈交易检测模型分析待检测交易数据,该分析过程为:对待检测交易数据进行降维和聚类处理,得到待检测交易数据对应的各个群组,然后确定各个群组对应的欺诈概率;之后,对高欺诈概率对应群组中的待检测交易数据进行加重审核,从而识别出欺诈交易。也就是说,如果一个群组与质心的汉明距离越大,说明其欺诈概率越高,落入该群组的交易需要加重交易审核的条件。

本实施例构建堆叠的rbm神经网络结构并进行训练,通过训练完成的rbm神经网络结构将无监督的高维数据样本进行降维和聚类,将样本划分为具有鲜明特性的各个群组,然后计算样本所有群组的质心,分别计算各个样本群组与所述质心的汉明距离,从而利用汉明距离衡量群组之间的距离,进而基于汉明距离确定各个样本群组的欺诈概率,由此建立欺诈交易检测模型,用于分析待检测交易数据,实现了基于欺诈交易检测模型确定待检测交易数据对应的欺诈概率,为有效识别历史欺诈类型和未知欺诈类型的欺诈交易提供了精确的分析依据,提高了欺诈交易识别的准确性和合理性。

进一步的,参照图5,本发明基于深度学习的欺诈交易识别方法第二实施例提供一种基于深度学习的欺诈交易识别方法,基于上述图2所示的实施例,所述步骤s22,可以包括:

步骤s220,确定所述训练样本的特征,并根据所述特征构建高维特征向量,由所述高维特征向量构成高维特征空间;

步骤s221,基于所述高维特征空间,逐一训练所述每一层rbm神经网络,以确定各层rbm神经网络的参数;

其中,所述步骤s221,可以包括:

步骤s2210,利用正态分布随机产生第一层rbm神经网络的参数初始值;

步骤s2211,利用所述高维特征空间的维度作为第一层rbm神经网络的输入节点数训练第一层rbm神经网络,训练时通过调整所述第一层rbm神经网络的参数初始值,得到第一层rbm神经网络的参数;

步骤s2212,在得到第n-1层rbm神经网络的参数后,利用正态分布随机产生第n层rbm神经网络的参数初始值;

步骤s2213,利用第n-1层rbm神经网络的输出节点数作为第n层rbm神经网络的输入节点数训练第n层神经网络,训练时通过调整所述第n层rbm神经网络的参数初始值,得到第n层rbm神经网络的参数,以得到各层rbm神经网络的参数,其中,n≥2。

本实施例逐一对每一层的rbm神经网络结构进行训练,逐一对每一层rbm神经网络的训练即意味着调整每一层rbm神经网络的参数。首先需确定训练样本的特征。由于训练样本中的每个样例都是由交易的基本信息组成的高维数据,可以基于交易的基本信息构造高维特征向量,高维特征向量构成高维特征空间。比如,训练样本中的每个样例是由交易时间、交易ip地址、交易地区、交易金额和交易设备组成的5维数据时,可以分别构造基于交易时间、交易ip地址、交易地区、交易金额、交易设备的特征向量,那么,训练样本中的每个样例均含有5维特征空间。

参照图5,图5为每一层rbm神经网络的示意图,每一层rbm神经网络包括可见层和隐藏层,每一层rbm神经网络的参数包括所述可见层和隐藏层之间的权重矩阵wi,j,wi,j表示可见层中第i个可见节点(神经元)与隐藏层中第j个隐藏节点(神经元)之间的连接权重;每一层rbm神经网络的参数还包括可见层中可见节点的偏移量b=(b1,b2,b3,…,bi),bi表示可见层中第i个可见节点的偏移量;每一层rbm神经网络的参数还包括隐藏层中隐藏节点的偏移量c=(c1,c2,c3,…,cj),cj表示隐藏层中第j个隐藏节点的偏移量。

具体地,逐一训练每一层rbm神经网络的步骤如下:

首先初始化底层(第一层)rbm神经网络的参数,即利用正态分布随机产生底层(第一层)rbm神经网络的参数初始值,也就是说,底层(第一层)rbm神经网络的参数初始值为来自正态分布(0,1)的随机数,然后利用上述高维特征空间的维度作为底层(第一层)rbm神经网络的输入节点数训练第一层rbm神经网络,训练时学习得到底层(第一层)rbm神经网络的参数,即通过调整所述第一层rbm神经网络的参数初始值,得到底层(第一层)rbm神经网络的参数;在得到底层(第一层)rbm神经网络的参数后,利用正态分布随机产生第二层rbm神经网络的参数初始值,然后利用底层(第一层)rbm神经网络的输出节点数作为第二层rbm神经网络的输入节点数训练第二层神经网络,训练时通过调整所述第二层rbm神经网络的参数初始值,得到第二层rbm神经网络的参数;以此类推,即利用第n-1层rbm神经网络的输出节点数作为第n层rbm神经网络的输入节点数训练第n层神经网络,训练时通过调整所述第n层rbm神经网络的参数初始值,得到第n层rbm神经网络的参数,其中,n≥2,由此可得到各层rbm神经网络的参数,此时表示各层rbm神经网络训练完成,将训练完成的各层rbm神经网络进行堆叠,可得到训练完成的rbm神经网络结构。

本实施例对构建的rbm神经网络结构进行训练,由于训练样本不具有数据标签,是一种无监督的高维数据样本,可以有效代表数据特征,利用此样本训练预先构建的rbm神经网络结构,加上rbm有很强的特征提取能力和噪声处理能力,训练完成的rbm神经网络结构具备较准确的降维和聚类能力。

此外,本发明实施例还提出一种存储介质。

本发明所存储介质上存储有基于深度学习的欺诈交易识别程序,所述基于深度学习的欺诈交易识别程序被处理器执行时实现如下操作:

获取训练样本,所述训练样本为用于建立欺诈交易检测模型的交易数据;

构建堆叠的受限玻尔兹曼机rbm神经网络结构并进行训练,并通过训练完成的rbm神经网络结构对所述训练样本进行降维和聚类,以将训练样本划分为若干个群组;

计算所有群组的质心,并分别计算各个群组与所述质心的汉明距离;

根据所述计算的各个汉明距离确定各个群组的欺诈概率,以建立欺诈交易检测模型;

获取待检测交易数据,并根据所述欺诈交易检测模型,分析待检测交易数据,以得出待检测交易数据的欺诈概率,从而识别出欺诈交易。

本发明存储介质的具体实施例与上述基于深度学习的欺诈交易识别方法各实施例基本相同,在此不作赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1