一种识别异常商户的方法及装置与流程

文档序号:27103638发布日期:2021-10-27 18:00阅读:106来源:国知局
一种识别异常商户的方法及装置与流程

1.本技术涉及网络技术领域,尤其涉及一种识别异常商户的方法及装置。


背景技术:

2.随着金融行业业务的不断创新与快速发展,基于业务系统中清算功能的支付体系日趋完善和成熟,业务的覆盖范围与影响力愈发提升。而与此同时,各种以非法获利为目的的违规交易也开始大量出现,且逐渐呈现出复杂化和规模化的态势,极大地影响了金融环境的稳定。为了保证金融业务的安全健康运行,需要对涉及违规的交易进行分析和处置。
3.现有技术中,一般通过深度学习模型/机器学习模型对交易数据进行训练,通过训练后的深度学习模型/机器学习模型,对生产中的交易数据进行检测以侦测异常交易数据。但交易数据属于并不具备固定拓扑结构的非欧式(non

euclidean)数据,这使得常规深度学习模型,如,卷积神经网络、神经网络模型等在其上的应用受到了很大限制;使得传统机器学习模型,如,logistic模型、决策树等因为交易数据缺少准确的浅层特征表示,而同样无法实现有效的侦测识别。
4.因此,现在亟需一种识别异常商户的方法及装置,用于提高异常交易数据侦测的准确度。


技术实现要素:

5.本发明实施例提供一种识别异常商户的方法及装置,用于提高异常交易数据侦测的准确度。
6.第一方面,本发明实施例提供一种识别异常商户的方法,该方法包括:
7.获取待识别的商户交易数据,所述待识别的商户交易数据是根据商户在预设时间内发生的各交易数据得到的;
8.从所述待识别的商户交易数据中确定出包含预设数量的特征字段的特征向量;所述预设数量的特征字段是根据所述待识别的商户交易数据中各特征字段对异常商户识别的重要程度确定的;
9.将所述特征向量输入图卷积网络模型,确定所述商户是否为异常商户待识别的商户交易数据,所述图卷积网络模型中包含交易权值参数,所述交易权值参数用于表征所述图卷积网络模型中商户节点的互联程度,所述交易权值参数是通过历史的商户交易数据中用户在各商户之间的交易次数和交易权重确定的。
10.上述方法中,令待识别的商户交易数据中包含商户在预设时间内的发生交易的汇总交易数据,待识别的商户交易数据中包含用户行为信息,如,交易次数信息。如此,使得待识别的商户交易数据中包含商户维度和用户维度的信息,提高对待识别的商户交易数据的识别准确度。通过特征筛选模型确定待识别的商户交易数据的特征字段和特征字段的重要程度,且特征字段是重要程度最大的预设数量个字段中的。如此,使得特征向量可以准确表征待识别的商户交易数据为异常商户交易数据的可能性。通过使得图卷积网络模型中包含
交易权值参数,交易权值参数用于表征图卷积网络模型中商户节点的互联程度,且互联程度由用户在各商户节点之间的交易次数和交易权重确定。如此,使得图卷积网络模型可以根据两个维度,即,商户维度和用户维度信息获取识别结果。
11.可选的,将所述特征向量输入图卷积网络模型判断所述待识别的商户交易数据的识别结果之后,还包括:
12.对所述识别结果和所述待识别的商户交易数据的真实结果进行核验;
13.若所述识别结果与所述真实结果不同,则根据包含所述真实结果的待识别的商户交易数据更新所述特征筛选模型和所述图卷积网络模型。
14.上述方法中,真实结果可以是人工抽样确定的待识别的商户交易数据的真实的结果,也可以是多个识别商户异常交易数据的模型得到的共同的判断结果;例如,每段时间(可以是周期性的,也可以是非周期性的,根据需要确定)可以抽取部分待识别的商户交易数据分别输入多个用于识别商户异常交易数据的模型得到多个判断结果,分别确定为正常商户交易数据判断结果或异常商户交易数据判断结果占所有判断结果的比例,当该比例大于一定比例值时,将该比例对应的判断结果确定为真实结果,与图卷积网络模型判断得到的识别结果做核验;若真实结果与识别结果不同,根据包含该真实结果的待识别的商户交易数据更新特征筛选模型和图卷积网络模型,可以使得特征筛选模型和图卷积网络模型自动适应生产中商户交易数据的结构变化,长期保持高准确度,增加特征筛选模型和图卷积网络模型的长期有效性。
15.可选的,从所述待识别的商户交易数据中确定出包含预设数量的特征字段的特征向量,包括:通过特征筛选模型,从所述待识别的商户交易数据中确定出包含预设数量的特征字段的特征向量;所述特征筛选模型用于确定待识别的商户交易数据中各特征字段的重要程度,并输出重要程度位于前n位待识别的商户交易数据的特征字段;n为所述预设数量。
16.上述方法中,重要程度位于前n位待识别的商户交易数据的特征字段;n为所述预设数量。如此,使得获取的特征向量可以更准确的表征待识别的商户交易数据的异常可能性,进而准确获得待识别的商户交易数据的识别结果。
17.可选的,所述特征筛选模型为随机森林算法/分布式梯度增强库,所述随机森林算法/所述分布式梯度增强库用于获取所述待识别的商户交易数据的各字段和所述各字段的重要程度,将所述各字段的重要程度从大到小进行排序,根据重要程度排序从前向后选取预设数量的字段作为所述待识别的商户交易数据的各特征字段。
18.上述方法中,令随机森林算法和分布式梯度增强库选取重要程度最大的预设数量的特征字段,并根据该预设数量个特征字段确定特征向量。如此,使得获取的特征向量可以准确的表征待识别的商户交易数据的异常可能性,进而准确获得待识别的商户交易数据的识别结果。
19.可选的,所述图卷积网络模型满足:
[0020][0021]
其中,h
(l)
为所述图卷积网络模型的第l层隐层特征,为所述图卷积网络模型的度矩阵,为交易权重参数组成的交易权值矩阵的增广矩阵,为商户节点间的邻接矩阵
的增广矩阵,θ
(l)
为所述图卷积网络模型的第l层卷积核参数矩阵,σ为激活函数。
[0022]
上述方法中,在图卷积网络模型的计算公式中增加权值矩阵的增广矩阵,也就是增加用户行为信息,防止公式仅仅基于商户维度出现过拟合现象,导致的识别结果不准确的问题。
[0023]
可选的,所述图卷积网络模型的训练过程中针对任一样本采用交替训练所述卷积核参数矩阵和所述交易权值矩阵的方式进行。
[0024]
上述方法中,通过对卷积核参数矩阵和交易权值矩阵进行交替训练的方式,可以提高训练准确度。
[0025]
可选的,所述交易权值参数满足:
[0026][0027]
其中,表示商户i和商户j之间的c名用户与商户i发生的交易笔数,表示商户i和商户j之间的c名用户与商户j发生的交易笔数,k用于表示用户,(k=1、2

c),表示c名用户与商户i发生的交易在所述图卷积网络模型中的权值,表示c名用户与商户i发生的交易在所述图卷积网络模型中的权值;代表用户与商户i之间的交易笔数,代表用户与商户j之间的交易笔数,代表用户与商户i之间的交易权值向量,代表用户与商户j之间的交易权值向量。
[0028]
上述方法中,两个商户之间的联系通过多名用户的行为信息建立,即,通过交易笔数表征,并设置用户与商户交易的权值。如此,令商户之间的用户行为信息更加准确的计算出来,提高待识别的商户交易数据识别结果的准确性。此处,用户与商户交易的权值可以设置初始权值,初始权值可以由xavier(初始化函数,是一种很有效的神经网络初始化方法)或gaussian(高斯)函数随机预设,在模型训练中获取准确权值。
[0029]
可选的,所述特征筛选模型和所述图卷积网络模型是通过如下方式得到的,包括:获取样本数据集,所述样本数据集中包含正常标签的商户交易数据、异常标签的商户交易数据以及无标签的商户交易数据;根据所述样本数据集,对初始的特征筛选模型进行训练得到所述特征筛选模型;根据所述样本数据集中任一样本,通过所述特征筛选模型得到样本的特征向量;将所述样本的特征向量输入初始的图卷积网络模型进行训练,得到所述图卷积网络模型;所述初始的图卷积网络模型中的商户节点是根据所述样本数据集确定。初始的特征筛选模型初始的图卷积网络模型。
[0030]
上述方法中,样本数据集中包含正常标签的商户交易数据、异常标签的商户交易数据以及无标签的商户交易数据。如此,实现半监督式的训练,使得模型学习到无标签的商户交易数据的内部结构,并通过有标签的商户交易数据调整模型参数;可以提高特征筛选模型和图卷积网络模型的准确度。
[0031]
可选的,根据所述样本数据集对初始的特征筛选模型进行训练,包括:
[0032]
将所述样本数据集输入所述初始的特征筛选模型,确定所述样本数据集中每个交
易数据包含的字段,并确定所述每个交易数据中各字段的重要程度,所述重要程度用于表征对应的字段对交易数据为异常商户交易数据的影响程度;
[0033]
将所述各字段的重要程度从大到小进行排序,根据重要程度排序从前向后选取预设数量的字段作为所述每个商户交易数据的各特征字段;
[0034]
根据所述每个商户交易数据的特征字段确定特征向量;
[0035]
将所述每个商户交易数据的特征向量输入所述初始的图卷积网络模型,获取所述每个商户交易数据的识别结果;
[0036]
根据所述每个商户交易数据的识别结果优化所述初始的特征筛选模型。
[0037]
上述方法中,通过初始的特征筛选模型获取交易数据包含的字段和各字段的重要程度,并确定重要程度最大的预设数量的字段为特征字段,根据特征字段获取特征向量。如此,后续对待识别交易数据进行交易时,可以通过训练完成后获取的特征筛选模型,获取能够准确表征交易数据异常程度的特征向量。
[0038]
可选的,根据所述样本数据集对初始的图卷积网络模型进行训练,包括:
[0039]
将样本数据集中的每个商户交易数据的特征向量输入所述初始的图卷积网络模型,获取所述每个商户交易数据的识别结果,所述初始的图卷积网络模型以所述每个商户交易数据的特征向量表征商户节点和商户节点之间的连接线,所述连接线表征用户行为信息;
[0040]
根据所述每个商户交易数据的识别结果优化所述初始的图卷积网络模型中的卷积核参数矩阵和交易权值参数。
[0041]
上述方法中,在初始的图卷积网络模型中加入交易权值参数以表示用户行为信息。用户与商户交易的权值,初始权值—由xavier或gaussian函数随机预设,后续训练过程中调整。如此,防止初始的图卷积网络模型仅仅根据商户维度的数据进行训练导致的过拟合,准确度降低的现象。
[0042]
可选的,还包括:更新所述特征筛选模型和所述图卷积网络模型。
[0043]
上述方法中,可以采集后续识别中的商户交易数据作为样本更新特征筛选模型和图卷积网络模型。如此,提高特征筛选模型和图卷积网络模型识别的准确度。
[0044]
第二方面,本发明实施例提供一种识别异常商户的装置,该装置包括:
[0045]
获取模块,用于获取待识别的商户交易数据,所述待识别的商户交易数据是根据商户在预设时间内发生的各交易数据得到的;
[0046]
处理模块,用于从所述待识别的商户交易数据中确定出包含预设数量的特征字段的特征向量;所述预设数量的特征字段是根据所述待识别的商户交易数据中各特征字段对异常商户识别的重要程度确定的;
[0047]
所述处理模块还用于,将所述特征向量输入图卷积网络模型,确定所述商户是否为异常商户,所述图卷积网络模型中包含交易权值参数,所述交易权值参数用于表征所述图卷积网络模型中商户节点的互联程度,所述交易权值参数是通过历史的商户交易数据中用户在各商户之间的交易次数和交易权重确定的。
[0048]
第三方面,本技术实施例还提供一种计算设备,包括:存储器,用于存储程序;处理器,用于调用所述存储器中存储的程序,按照获得的程序执行如第一方面的各种可能的设计中所述的方法。
[0049]
第四方面,本技术实施例还提供一种计算机可读非易失性存储介质,包括计算机可读程序,当计算机读取并执行所述计算机可读程序时,使得计算机执行如第一方面的各种可能的设计中所述的方法。
[0050]
本技术的这些实现方式或其他实现方式在以下实施例的描述中会更加简明易懂。
附图说明
[0051]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0052]
图1为本发明实施例提供的一种识别异常商户的架构示意图;
[0053]
图2为本发明实施例提供的一种识别异常商户的架构示意图;
[0054]
图3为本发明实施例提供的一种识别异常商户的方法的流程示意图;
[0055]
图4(a)为本发明实施例提供的一种商户节点连接的示意图;
[0056]
图4(b)为本发明实施例提供的一种商户节点连接的示意图;
[0057]
图5为本发明实施例提供的一种识别异常商户的方法的流程示意图;
[0058]
图6为本发明实施例提供的一种识别异常商户的装置示意图。
具体实施方式
[0059]
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0060]
图1为本发明实施例提供的一种识别异常商户的系统架构,该识别异常商户的系统架构中包含特征筛选模型102和图卷积网络模型103,特征筛选模型102和图卷积网络模型103是通过包含正常标签的商户交易数据、异常标签的商户交易数据以及无标签的商户交易数据的样本数据集训练获取的,即,通过半监督式的模型训练,使得模型学习到无标签的商户交易数据的内部结构,并通过有标签的商户交易数据调整模型参数;可以提高特征筛选模型102和图卷积网络模型103的准确度。获取训练后的特征筛选模型102和图卷积网络模型103后,通过数据采集器101获取待识别的商户交易数据,并对待识别的商户交易数据进行清洗后输入特征筛选模型102获取特征向量,将特征向量输入图卷积网络模型103获取识别结果。
[0061]
本发明实施例还提供的一种识别异常商户的系统架构,如图2所示,该系统架构中还包含反馈机制204,用于获取通过数据采集器201、特征筛选模型202、图卷积网络模型203得到的待识别的商户交易数据的识别结果,根据反馈机制204中的待识别的商户交易数据的真实结果和待识别的商户交易数据的识别结果的核验情况,对特征筛选模型202、图卷积网络模型203进行训练,以实现特征筛选模型202、图卷积网络模型203的参数持续更新。其中,待识别的商户交易数据的真实结果可以通过人工抽样确定的,也可以是多个识别异常交易数据的模型得到的共同的判断结果;例如,每段时间(可以是周期性的,也可以是非周
期性的,根据需要确定)可以抽取部分待识别的商户交易数据分别输入多个用于识别异常交易数据的模型得到多个判断结果,分别确定为正常交易数据判断结果或异常交易数据识别结果占所有判断结果的比例,当该比例大于一定比例值时,将该比例对应的判断结果确定为真实结果,这里对真实结果的获取方法具体不做限定。
[0062]
基于此,本技术实施例提供了一种识别异常商户方法的流程,如图3所示,包括:
[0063]
步骤301、获取待识别的商户交易数据,所述待识别的商户交易数据是根据商户在预设时间内发生的各交易数据得到的;
[0064]
步骤302、从所述待识别的商户交易数据中确定出包含预设数量的特征字段的特征向量;所述预设数量的特征字段是根据所述待识别的商户交易数据中各特征字段对异常商户识别的重要程度确定的;
[0065]
步骤303、将所述特征向量输入图卷积网络模型,确定所述商户是否为异常商户待识别的商户交易数据,所述图卷积网络模型中包含交易权值参数,所述交易权值参数用于表征所述图卷积网络模型中商户节点的互联程度,所述交易权值参数是通过历史的商户交易数据中用户在各商户之间的交易次数和交易权重确定的。
[0066]
上述方法中,令待识别的商户交易数据中包含商户行为信息和用户行为信息。如此,使得待识别的商户交易数据中包含商户维度和用户维度的信息,提高对待识别的商户交易数据的识别准确度。通过特征筛选模型确定待识别的商户交易数据的特征字段和特征字段的重要程度,且特征字段是重要程度最大的预设数量个字段中的。如此,使得特征向量可以准确表征待识别的商户交易数据为异常交易数据的可能性。通过使得图卷积网络模型中包含交易权值参数,交易权值参数用于表征图卷积网络模型中商户节点的互联程度,且互联程度由用户在各商户节点之间的交易次数和交易权重确定。如此,使得图卷积网络模型可以根据两个维度,即,商户维度和用户维度信息获取识别结果。
[0067]
本技术实施例提供了一种识别结果核验方法,将所述特征向量输入图卷积网络模型判断所述待识别的商户交易数据的识别结果之后,还包括:对所述识别结果和所述待识别的商户交易数据的真实结果进行核验;若所述识别结果与所述真实结果不同,则根据包含所述真实结果的待识别的商户交易数据更新所述特征筛选模型和所述图卷积网络模型。也就是说,特征筛选模型和图卷积网络模型在生产应用时,还可以根据需要更新参数,以使得特征筛选模型和图卷积网络模型可以学习数据结构的变化,保证识别准确度,提高使用寿命。真实结果为待识别的商户交易数据为正常交易数据或异常交易数据的真实结果。若识别结果与真实识别结果不同,则根据包含真实结果的待识别的商户交易数据更新特征筛选模型和图卷积网络模型。
[0068]
本技术实施例提供了一种获取特征向量的方法,从所述待识别的商户交易数据中确定出包含预设数量的特征字段的特征向量,包括:
[0069]
通过特征筛选模型,从所述待识别的商户交易数据中确定出包含预设数量的特征字段的特征向量;所述特征筛选模型用于确定待识别的商户交易数据中各特征字段的重要程度,并输出重要程度位于前n位待识别的商户交易数据的特征字段;n为所述预设数量。也就是说,可以通过特征筛选模型确定出包含预设数量的特征字段的特征向量,特征筛选模型可以获取待识别的商户交易数据中各字段,并根据各字段对应的重要程度进行排序,选取前n位待识别的商户交易数据的特征字段。如此,保证特征向量可以最大程度的表征待识
别的商户交易数据的异常可能性。
[0070]
本技术实施例提供了一种特征筛选模型,所述特征筛选模型为随机森林算法/分布式梯度增强库,所述随机森林算法/所述分布式梯度增强库用于获取所述待识别的商户交易数据的各字段和所述各字段的重要程度,将所述各字段的重要程度从大到小进行排序,根据重要程度排序从前向后选取预设数量的字段作为所述待识别的商户交易数据的各特征字段。也就是说,特征筛选模型可以为随机森林算法/分布式梯度增强库,这里只是一种示例,特征筛选模型还可以是其它可以获取特征向量的算法,具体不做限定。此处,随机森林算法/分布式梯度增强库可以获取待识别的商户交易数据的各字段和各字段的重要程度,并将各字段根据重要程度的大小进行排序,选取预设数量个重要程度最大的字段作为各特征字段,根据各特征字段确定特征向量。如此,使得特征向量能够终于大限度的表征待识别的商户交易数据可能为异常交易数据的可能性,提高识别准确度。
[0071]
本技术实施例提供了一种图卷积网络模型公式,所述图卷积网络模型满足:
[0072][0073]
其中,h
(l)
为所述图卷积网络模型的第l层隐层特征,为所述图卷积网络模型的度矩阵的增广矩阵,为交易权重参数组成的交易权值矩阵的增广矩阵,为商户节点间的邻接矩阵的增广矩阵,θ
(l)
为所述图卷积网络模型的第l层卷积核参数矩阵,σ为激活函数。也就是说,该图卷积网络模型公式中增加权值矩阵的增广矩阵,即,增加可以表征用户行为信息的交易权值,使得图卷积网络模型基于商户维度和用户维度进行识别异常交易数据,提高识别准确度,防止公式仅仅基于商户维度出现过拟合现象,导致的识别结果不准确的问题。
[0074]
本技术实施例提供了一种模型训练方法,所述图卷积网络模型的训练过程中针对任一样本采用交替训练所述卷积核参数矩阵和所述交易权值矩阵的方式进行。其中,变化可得到作为卷积层公式。因此,可以先固定卷积核权值θ,采用最优化理论中的交替优化乘子法(admm)优化和然后再固定交易权值优化θ,交替迭代直至模型收敛或迭代达到规定次数。
[0075]
本技术实施例提供了一种交易权值参数确定公式,所述交易权值参数满足:
[0076][0077]
其中,表示商户i和商户j之间的c名用户与商户i发生的交易笔数,表示商户i和商户j之间的c名用户与商户j发生的交易笔数,k用于表示用户,(k=1、2

c),表示c名用户与商户i发生的交易在所述图卷积网络模型中的权值,表示c名用
户与商户i发生的交易在所述图卷积网络模型中的权值;代表用户与商户i之间的交易笔数,代表用户与商户j之间的交易笔数,代表用户与商户i之间的交易权值向量,代表用户与商户j之间的交易权值向量。也就是说,可以根据商户之间相同的用户数量和交易笔数,以及用户与商户间交易的权值确定交易权值参数。即,两个商户之间的联系通过相同的多名用户的行为信息建立,即,通过交易笔数表征,并设置用户与商户交易的权值。
[0078]
例如,如图4(a)和4(b)所示,若不设置交易权值参数,则商户i和j只通过与用户a发生的两笔交易互联,和商户m和n通过用户b、c、d的共12笔交易互联这两种场景,在图卷积网络模型的邻接矩阵中a
ij
和a
mn
的取值均为1,这将导致商户节点间的关联程度缺乏区分度,导致对待识别的商户交易数据的识别准确度低。而增加交易权值参数则可以表征出每个用户行为信息(与那一个商户发生了交易,以及交易的数量),通过上述公式可以得到交易权值矩阵:
[0079][0080]
如此,令商户之间的用户行为信息更加准确的计算出来,提高待识别的商户交易数据识别结果的准确性。此处,用户与商户交易的权值可以设置初始权值,初始权值可以由xavier(初始化函数,是一种很有效的神经网络初始化方法)或gaussian(高斯)函数随机预设,在模型训练中获取准确权值。
[0081]
基于上述方法,本技术实施例提供了一种图卷积网络模型公式的确定方法,以交易流水数据及图数据库为例,对于商户节点及相关交易构成的图g(v,e),设全部商户节点数量为n∈z
+
,其中每个商户节点的输入为通过上述特征筛选模型选取的f个特征字段x
i
∈r1×
f
,(i=1,2,...,n),则整个图卷积网络模型的节点特征矩阵可以表示为x=[x1,x2,...,x
n
],x∈r
n
×
f
。a∈r
n
×
n
为商户节点间邻接矩阵(adjacency matrix),其元素a
ij
表示任意两个节点v
i
与v
j
间的连接情况,连接则a
ij
=1,否则a
ij
=0。对角矩阵d∈r
n
×
n
为度矩阵(degree matrix),其对角线元素代表每个商户节点的度,即该节点连接的节点个数,则图卷积网络模型中卷积层的基本表达式为:
[0082][0083]
其中i
n
为n阶单位矩阵,为补充邻接矩阵中节点自连接权重的补偿项。h
(l)
为所述图卷积网络模型的第l层隐层特征,h
(0)
即为初始节点特征矩阵x,θ为卷积核参数矩阵,最后加入激活函数σ。
[0084]
但由上述公式(2)、(3)可知商户i和和商户j之间的交易权值q
ij
,交易权值矩阵q;
将交易权值矩阵的增广矩阵引入式(4)后图卷积网络模型卷积层的表达式变为:
[0085][0086]
上式中

为哈达玛积(hadamart product)运算,即维度相同的两个矩阵对应元素相乘,由于邻接矩阵a中定义非零项均为1,故可以等效为
[0087]
在图卷积网络模型的预训练中,用户与商户间的交易笔数已由初始数据集确定,即为固定值,基于随机梯度下降(stochastic gradient descent)训练图卷积网络模型的网络参数时,仅的梯度对参数更新产生影响,因此在预训练阶段式(2)可以表示为:
[0088][0089]
由此得到图卷积模型卷积层的最终表达式
[0090]
本技术实施例提供了一种训练识别异常交易数据模型方法,所述特征筛选模型和所述图卷积网络模型是通过如下方式得到的,包括:
[0091]
获取样本数据集,所述样本数据集中包含正常标签的商户交易数据、异常标签的商户交易数据以及无标签的商户交易数据;
[0092]
根据所述样本数据集,对初始的特征筛选模型进行训练得到所述特征筛选模型;
[0093]
根据所述样本数据集中任一样本,通过所述特征筛选模型得到样本的特征向量;将所述样本的特征向量输入初始的图卷积网络模型进行训练,得到所述图卷积网络模型;所述初始的图卷积网络模型中的商户节点是根据所述样本数据集确定初始的特征筛选模型初始的图卷积网络模型。也就是说,通过包含正常标签的商户交易数据、异常标签的商户交易数据以及无标签的商户交易数据的样本数据集对初始的特征筛选模型和初始的图卷积网络模型进行训练。使得对初始的特征筛选模型和初始的图卷积网络模型进行半监督式的训练,令训练获得的特征筛选模型和图卷积网络模型既可以学习到商户交易数据的内部结构又可以通过有标签的商户交易数据调整模型参数;可以提高特征筛选模型和图卷积网络模型的准确度。
[0094]
本技术实施例提供了一种训练识别异常交易数据模型方法,根据所述样本数据集对初始的特征筛选模型进行训练,包括:将所述样本数据集输入所述初始的特征筛选模型,确定所述样本数据集中每个商户交易数据包含的字段,并确定所述每个商户交易数据中各
字段的重要程度,所述重要程度用于表征对应的字段对交易数据为异常商户交易数据的影响程度;将所述各字段的重要程度从大到小进行排序,根据重要程度排序从前向后选取预设数量的字段作为所述每个商户交易数据的各特征字段;根据所述每个商户交易数据的特征字段确定特征向量;将所述每个商户交易数据的特征向量输入所述初始的图卷积网络模型,获取所述每个交易数据的识别结果;根据所述每个交易数据的识别结果优化所述初始的特征筛选模型。例如,交易数据中包含交易金额、交易类型、交易时间、交易方式的字段,通过初始的特征筛选模型后获取交易数据的字段和对应的重要程度:交易时间、交易方式、交易金额、交易类型的重要程度分别为4、3、7、5,则根据重要程度排序为7、5、4、3,对应的字段排序为交易金额、交易类型、交易时间、交易方式,预设数量为3,则选取前三个字段作为特征字段交易金额、交易类型、交易时间,则根据交易金额、交易类型、交易时间得到特征向量,并将特征向量输入初始的图卷积网络模型获取识别结果,根据识别结果优化初始的特征筛选模型,使得后续初始的特征筛选模型获取的商户交易数据的特征向量更准确。
[0095]
可选的,根据所述样本数据集对初始的图卷积网络模型进行训练,包括:
[0096]
将样本数据集中的每个商户交易数据的特征向量输入所述初始的图卷积网络模型,获取所述每个商户交易数据的识别结果,所述初始的图卷积网络模型以所述每个商户交易数据的特征向量表征商户节点和商户节点之间的连接线,所述连接线表征用户行为信息;根据所述每个商户交易数据的识别结果优化所述初始的图卷积网络模型中的卷积核参数矩阵和交易权值参数。此处,如图4(b)中所示,用户b、c、d的行为信息通过商户节点之间的连接线表示,图卷积网络模型采用有标签的商户交易数据对应节点的交叉熵(cross entropy)损失函数来更新网络参数。在识别异常商户交易数据模型中,卷积核参数矩阵θ及两个交易权值矩阵和共同影响最终损失函数大小,式(5)中的层特征传播公式可以表示为
[0097][0098]
其中,在训练过程中,先固定卷积核权值θ,采用最优化理论中的交替优化乘子法(admm)优化和然后再固定交易权值优化θ,交替迭代直至模型收敛或迭代达到规定次数。用户与商户交易的权值,初始权值—由xavier或gaussian函数随机预设,后续训练过程中调整。如此,防止初始的图卷积网络模型仅仅根据商户维度的数据进行训练导致的过拟合,准确度降低的现象。另外,预训练阶段识别异常交易数据模型的输入样本数据集为前期积累的经人工核验标注的异常商户和正常商户及其交易流水构成的图结构数据;与传统卷积神经网络结构不同,图卷积网络不需要过深的网络结构,也不需要池化和全连接层,通常在经过二至三个图卷积层后,最后一层直接采用softmax输出节点类别的概率分布向量。如此,还可以提高识别效率。
[0099]
基于上述方法的流程,本技术实施例提供了一种识别异常商户方法的流程,如图5所示,包括:
[0100]
步骤501、获取样本数据集。
[0101]
步骤502、将样本数据集输入初始的特征筛选模型,获取样本数据集中各商户交易数据对应的特征向量。
[0102]
步骤503、将各特征向量输入初始的图卷积网络模型获取识别结果。
[0103]
步骤504、根据识别结果对初始的特征筛选模型和初始的图卷积网络模型进行优化,获取特征筛选模型和图卷积网络模型。
[0104]
步骤505、获取生产的待识别的商户交易数据。
[0105]
步骤506、对待识别的商户交易数据进行清洗后输入特征筛选模型获取特征向量。
[0106]
步骤507、将待识别的商户交易数据的特征向量输入图卷积网络模型,获取识别结果。
[0107]
步骤508、根据识别结果和真实结果对特征筛选模型和图卷积网络模型进行更新。
[0108]
这里需要说明的是,上述流程步骤并不唯一,步骤508可以执行,也可以不执行。
[0109]
基于同样的构思,本发明实施例提供一种识别异常商户的装置,图6为本技术实施例提供的一种识别异常商户的装置示意图,如图6示,包括:
[0110]
获取模块601,用于获取待识别的商户交易数据,所述待识别的商户交易数据是根据商户在预设时间内发生的各交易数据得到的;
[0111]
处理模块602,用于从所述待识别的商户交易数据中确定出包含预设数量的特征字段的特征向量;所述预设数量的特征字段是根据所述待识别的商户交易数据中各特征字段对异常商户识别的重要程度确定的;
[0112]
所述处理模块602还用于,将所述特征向量输入图卷积网络模型,确定所述商户是否为异常商户待识别的商户交易数据,所述图卷积网络模型中包含交易权值参数,所述交易权值参数用于表征所述图卷积网络模型中商户节点的互联程度,所述交易权值参数是通过历史的商户交易数据中用户在各商户之间的交易次数和交易权重确定的。
[0113]
可选的,所述处理模块602还用于,对所述识别结果和所述待识别的商户交易数据的真实结果进行核验;若所述识别结果与所述真实结果不同,则根据包含所述真实结果的待识别的商户交易数据更新所述特征筛选模型和所述图卷积网络模型。
[0114]
可选的,所述处理模块602具体用于,通过特征筛选模型,从所述待识别的商户交易数据中确定出包含预设数量的特征字段的特征向量;所述特征筛选模型用于确定待识别的商户交易数据中各特征字段的重要程度,并输出重要程度位于前n位待识别的商户交易数据的特征字段;n为所述预设数量。可选的,所述特征筛选模型为随机森林算法/分布式梯度增强库,所述随机森林算法/所述分布式梯度增强库用于获取所述待识别的商户交易数据的各字段和所述各字段的重要程度,将所述各字段的重要程度从大到小进行排序,根据重要程度排序从前向后选取预设数量的字段作为所述待识别的商户交易数据的各特征字段。
[0115]
可选的,所述图卷积网络模型中的卷积层满足:
[0116][0117]
其中,h
(l)
为所述图卷积网络模型的第l层隐层特征,为所述图卷积网络模型的度矩阵的增广矩阵,为交易权重参数组成的交易权值矩阵的增广矩阵,为商户节点间的邻接矩阵的增广矩阵,θ
(l)
为所述图卷积网络模型的第l层卷积核参数矩阵,σ为激活函数。可选的,所述图卷积网络模型的训练过程中针对任一样本采用交替训练所述卷积核参
数矩阵和所述交易权值矩阵的方式进行。
[0118]
可选的,所述交易权值参数满足:
[0119][0120]
其中,表示商户i和商户j之间的c名用户与商户i发生的交易笔数,表示商户i和商户j之间的c名用户与商户j发生的交易笔数,k用于表示用户,(k=1、2

c),表示c名用户与商户i发生的交易在所述图卷积网络模型中的权值,表示c名用户与商户i发生的交易在所述图卷积网络模型中的权值;代表用户与商户i之间的交易笔数,代表用户与商户j之间的交易笔数,代表用户与商户i之间的交易权值向量,代表用户与商户j之间的交易权值向量。
[0121]
可选的,所述获取模块601具体用于,
[0122]
获取样本数据集,所述样本数据集中包含正常标签的商户交易数据、异常标签的商户交易数据以及无标签的商户交易数据;
[0123]
根据所述样本数据集,对初始的特征筛选模型进行训练得到所述特征筛选模型;
[0124]
根据所述样本数据集中任一样本,通过所述特征筛选模型得到样本的特征向量;将所述样本的特征向量输入初始的图卷积网络模型进行训练,得到所述图卷积网络模型;所述初始的图卷积网络模型中的商户节点是根据所述样本数据集确定。
[0125]
可选的,可选的,所述处理模块602还用于,更新所述特征筛选模型和所述图卷积网络模型。
[0126]
可选的,所述处理模块602具体用于,将所述样本数据集输入所述初始的特征筛选模型,确定所述样本数据集中每个交易数据包含的字段,并确定所述每个交易数据中各字段的重要程度,所述重要程度用于表征对应的字段对交易数据为异常交易数据的影响程度;将所述各字段的重要程度从大到小进行排序,根据重要程度排序从前向后选取预设数量的字段作为所述每个交易数据的各特征字段;根据所述每个交易数据的特征字段确定特征向量;将所述每个交易数据的特征向量输入所述初始的图卷积网络模型,获取所述每个交易数据的识别结果;根据所述每个交易数据的识别结果优化所述初始的特征筛选模型。
[0127]
可选的,所述处理模块602具体用于,将样本数据集中的每个交易数据的特征向量输入所述初始的图卷积网络模型,获取所述每个交易数据的识别结果,所述初始的图卷积网络模型以所述每个交易数据的特征向量表征商户节点和商户节点之间的连接线,所述连接线表征用户行为信息;根据所述每个交易数据的识别结果优化所述初始的图卷积网络模型中的卷积核参数矩阵和交易权值参数。
[0128]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产
品的形式。
[0129]
本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0130]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0131]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0132]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1