欺诈交易检测方法、装置、计算机设备和存储介质与流程

文档序号:26845271发布日期:2021-10-09 00:16阅读:102来源:国知局
欺诈交易检测方法、装置、计算机设备和存储介质与流程

1.本技术涉及欺诈检测技术领域,特别是涉及一种欺诈交易检测方法、装置、计算机设备和存储介质。


背景技术:

2.随着近几十年经济全球化的迅速发展,信用卡在商业交易中越来越流行。相应地信用卡欺诈问题也随之涌现,检测信用卡欺诈交易成为了银行业面临的挑战之一。互联网技术的普及,传统金融领域迎来了创新,信用卡欺诈检测系统是互联网金融科技的一个重要研究领域,信用卡欺诈检测系统利用用户的用户信息和信用卡交易事务数据,通过其核心算法,检测用户是否为欺诈用户,从而帮助银行或金融公司降低风险,提高利润。
3.现有技术中,对于信用卡欺诈交易的检测算法是基于二分类检测模型生成的,二分类检测模型中简单地将交易行为分为正常交易和欺诈交易,没有对正常交易的类型进行细分,在欺诈交易的实际检测中,导致了对于欺诈交易检测精度低的问题。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种能够提高欺诈检测精度的欺诈交易检测方法、装置、计算机设备和存储介质。
5.一种欺诈交易检测方法,所述方法包括:
6.获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
7.基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
8.建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
9.基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
10.在其中一个实施例中,还包括:对所述正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;
11.在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;
12.将所述正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点;
13.重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与前一次获取的质心点之间的欧氏距离达到预设的收敛阈值;
14.将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
15.在其中一个实施例中,还包括:分别为所述欺诈交易样本数据和正常交易样本簇
数据设置对应的标签;
16.根据所述欺诈交易样本数据及其对应的标签,和所述正常交易样本簇数据及其对应的标签,生成样本训练集;
17.基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
18.在其中一个实施例中,还包括:为所述欺诈交易样本数据设置对应的标签为欺诈交易;
19.为所述正常交易样本簇数据中的各簇数据分别设置不同的且不为欺诈交易的标签。
20.在其中一个实施例中,还包括:以所述样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以所述样本训练集中的各标签作为输出,对所述多分类检测模型进行训练,生成多分类检测模型参数;
21.基于所述多分类检测模型参数,获取训练后的多分类检测模型。
22.在其中一个实施例中,还包括:获取待检测交易信息;所述待检测交易信息是待检测交易行为的交易信息;
23.对所述待检测交易信息进行特征提取,获取待检测交易数据;
24.将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
25.在其中一个实施例中,还包括:将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签;
26.若所述待检测交易数据的标签是欺诈交易,确定待检测交易行为为欺诈交易;否则,确定待检测交易行为为正常交易。
27.一种欺诈交易检测装置,所述装置包括:
28.信息获取模块,用于获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
29.聚类处理模块,用于基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
30.模型训练模块,用于建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
31.欺诈检测模块,用于基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
32.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
33.获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
34.基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
35.建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
36.基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
37.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
38.获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
39.基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
40.建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
41.基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
42.上述欺诈交易检测方法、装置、计算机设备和存储介质,根据样本交易信息获取正常交易样本数据和欺诈交易样本数据,并基于k均值聚类算法对正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。最后,建立多分类检测模型,基于欺诈交易样本数据和正常交易样本簇数据对多分类检测模型进行训练,基于训练后的多分类检测模型对待检测交易信息进行处理,判断出待检测交易行为是否为欺诈交易。通过基于k均值聚类处理后获取的正常交易样本簇数据和欺诈交易样本数据对多分类检测模型进行训练,获取到检测成功率更高的欺诈检测模型,提高了对欺诈交易的检测精度。
附图说明
43.图1为一个实施例中欺诈交易检测方法的应用环境图;
44.图2为一个实施例中欺诈交易检测方法的流程示意图;
45.图3为一个实施例中对正常交易样本数据进行聚类处理的流程示意图;
46.图4为一个实施例中欺诈交易检测装置的结构框图;
47.图5为一个实施例中计算机设备的内部结构图。
具体实施方式
48.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
49.本技术提供的欺诈交易检测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102和服务器104可分别单独用于执行本技术提供的欺诈交易检测方法。终端102和服务器104也可用于协同执行本技术提供的欺诈交易检测方法。例如,服务器104用于获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否
为欺诈交易。
50.其中,终端102可以但不限于能够生成交易信息的金融服交易终端,如atm机、pos机等,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
51.在一个实施例中,如图2所示,提供了一种欺诈交易检测方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
52.步骤202,获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据。
53.其中,样本交易信息是用于训练检测欺诈交易的检测模型的交易信息;样本交易信息包括正常交易样本数据和欺诈交易样本数据;其中,正常交易样本数据是样本交易信息中正常交易的交易数据;欺诈交易样本数据是样本交易信息中欺诈交易的交易数据;正常交易样本数据包括正常交易的交易信息,包括但不限于交易用户的姓名、性别、年龄、身份证号码、交易类型、交易地点、交易时间和交易金额等;欺诈交易样本数据包括欺诈交易的交易信息,包括但不限于交易用户的姓名、性别、年龄、身份证号码、交易类型、交易地点、交易时间和交易金额等。
54.具体地,样本交易信息通常是选取的某时间范围内某交易终端进行的部分或全部信用卡交易的信息,通常保存于交易终端的后台数据库。获取数据库中样本交易信息,通过样本交易信息中的交易类型将样本交易信息分为正常交易样本数据和欺诈交易样本数据。
55.步骤204,基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。
56.具体地,通过k均值聚类算法对正常交易样本数据进行聚类处理,通过聚类处理将正常交易样本数据分为k个聚类,每个聚类的数据构成一个正常交易样本簇数据;其中k是大于1的整数,k的取值可根据应用需求进行测试选取出最优k值,如通过间隙统计的方法对k进行取值。
57.步骤206,建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
58.具体地,建立多分类检测模型时,多分类检测模型的类型可以是任意的多分类模型,如多标签决策树等,但不是二分类模型;建立好多分类检测模型以后,多分类检测模型以后会生成初始的多分类模型参数。根据欺诈交易样本数据和正常交易样本簇数据对建立的初始的多分类检测模型进行训练,训练完成后生成训练后的多分类检测模型。
59.步骤208,基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
60.其中,待检测交易信息是待检测交易的交易信息,待检测交易的交易信息内包含的交易信息类型与样本交易信息中的正常交易样本数据的信息类型和欺诈交易样本数据的信息类型是相同的,包括但不限于交易用户的姓名、性别、年龄、身份证号码、交易类型、交易地点、交易时间和交易金额等。
61.具体地,多分类检测模型训练完成以后,将待检测交易信息输入训练完成的多分类检测模型,根据多分类检测模型的输出结果,对待检测交易信息对应的交易行为的交易类型作出判定,进而实现识别待检测交易行为是否为欺诈交易的目的。
62.上述欺诈交易检测方法中,获取样本交易信息,根据样本交易信息获取正常交易
样本数据和欺诈交易样本数据,并基于k均值聚类算法对正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。最后,建立多分类检测模型,基于欺诈交易样本数据和正常交易样本簇数据对多分类检测模型进行训练,基于训练后的多分类检测模型对待检测交易信息进行处理,判断出待检测交易行为是否为欺诈交易。通过基于k均值聚类处理后获取的正常交易样本簇数据和欺诈交易样本数据对多分类检测模型进行训练,获取到检测成功率更高的欺诈检测模型,提高了对欺诈交易的检测精度。
63.在一个实施例中,如图3所示,所述基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据包括:
64.步骤301,对所述正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;
65.步骤302,在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;
66.具体地,对正常交易样本数据进行聚类处理的目的是将正常交易样本数据划分为不同个正常交易样本簇数据,以保证每个正常交易样本簇数据中的数据是最相似的。进行k均值聚类处理时,首先对正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;归一化的作用是使正常交易样本数据中的各数据处于同一数量级,保证能够适合进行综合对比评价。归一化处理完成后,在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;k是大于1的整数,k的取值可根据应用需求进行测试选取出最优k值,如通过间隙统计的方法对k进行取值。
67.步骤303,将所述正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点;
68.步骤304,重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与前一次获取的质心点之间的欧氏距离达到预设的收敛阈值;
69.步骤305,将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
70.具体地,每次聚类处理完成以后,将正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点,并重复上述计算正常交易样本数据中的各数据点与各质心点的欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与最后一次聚类处理完成以后前一次获取的质心点之间的欧氏距离达到预设的收敛阈值,通常是小于等于收敛阈值时,将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
71.本实施例中,对正常交易样本数据进行归一化处理,在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算正常交易样本数据中的各数据点与各质心点的欧氏距离,并将正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类重新计算新的聚类的质心点,重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至符合预设目标时,将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。通过正常交易样本簇数据的获取,提高了对于正常交易样本数据的分类精度。
72.在一个实施例中,所述建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型包
括:
73.分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签;
74.根据所述欺诈交易样本数据及其对应的标签,和所述正常交易样本簇数据及其对应的标签,生成样本训练集;
75.基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
76.具体地,对多分类检测模型进行训练时,首先分别为欺诈交易样本数据和正常交易样本簇数据设置对应的不同的标签。其中,由于正常交易样本簇数据中包含不同的簇数据,为每簇数据分别设置对应的标签,正常交易样本簇数据中各簇数据的标签不同于欺诈交易样本数据的标签。标签设置好以后,根据欺诈交易样本数据及其对应的标签,和正常交易样本簇数据及其对应的标签,生成样本训练集;最后,基于样本训练集对多分类检测模型进行训练,获取训练后的多分类检测模型。
77.本实施例中,通过分别为欺诈交易样本数据和正常交易样本簇数据设置对应的不同的标签,并根据设置好标签的欺诈交易样本数据和正常交易样本簇数据生成样本训练集,最后根据样本训练集对多分类检测模型进行训练,实现了多分类检测模型的生成,提高了多分类检测模型的检测精度。
78.在一个实施例中,所述分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签包括:
79.为所述欺诈交易样本数据设置对应的标签为欺诈交易;
80.为所述正常交易样本簇数据中的各簇数据分别设置不同的且不为欺诈交易的标签。
81.具体地,为欺诈交易样本数据和正常交易样本簇数据设置对应的标签时,分别为欺诈交易样本数据和正常交易样本簇数据设置对应的不同的标签。欺诈交易样本数据设置对应的标签为欺诈交易;正常交易样本簇数据中各簇数据的标签不同于欺诈交易样本数据的标签,各簇数据的标签可以相同也可以不同,标签的类型可根据需要进行对应选择。如需要通过多分类检测模型检测出待检测交易的交易类型时,可以将各簇数据的标签设置为对应的交易类型。若只需要简单的判断待检测交易是否属于欺诈交易,可简单将各簇数据的标签设置为简单的数字,如0、1、2、3、4、5等。
82.本实施例中,通过为欺诈交易样本数据和正常交易样本簇数据分别设置对应的标签,提高了多分类检测模型的训练精度,同时提高了多分类检测模型的检测精度。
83.在一个实施例中,所述基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型包括:
84.以所述样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以所述样本训练集中的各标签作为输出,对所述多分类检测模型进行训练,生成多分类检测模型参数;
85.基于所述多分类检测模型参数,获取训练后的多分类检测模型。
86.具体地,训练后的多分类检测模型时,以样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以样本训练集中的各标签作为输出,对多分类检测模型进行训练,当训练达到预期的要求时,生成训练后的多分类检测模型参数。根据多分类检测模型
参数,能够确定训练后的多分类检测模型的模型参数,并确定训练后的多分类检测模型。
87.本实施例中,通过以样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以样本训练集中的各标签作为输出,对多分类检测模型进行训练,生成多分类检测模型参数,并基于多分类检测模型参数,获取训练后的多分类检测模型,提高了对多分类检测模型的训练精度。
88.在一个实施例中,所述基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易包括:
89.获取待检测交易信息;所述待检测交易信息是待检测交易行为的交易信息;
90.对所述待检测交易信息进行特征提取,获取待检测交易数据;
91.将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
92.具体地,基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易时,首先获取待检测交易信息,并对待检测交易信息信息进行特征提取,获取待检测交易数据;待检测交易数据中数据类型和对多分类检测模型进行训练时输入的数据类型是一致的。获取待检测交易数据以后,将待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
93.本实施例中,通过获取待检测交易信息,并对待检测交易信息进行特征提取,获取待检测交易数据,最后将待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易,实现了对待检查交易行为是否为欺诈交易的判定,提高了对欺诈交易的检测精度。
94.在一个实施例中,所述将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易包括:
95.将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签;
96.若所述待检测交易数据的标签是欺诈交易,确定待检测交易行为为欺诈交易;否则,确定待检测交易行为为正常交易。
97.具体地,基于训练后的多分类检测模型对待检测交易数据进行处理时,将将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签。根据待检测交易数据对应的标签能够获取待检测交易行为是否为欺诈交易。若待检测交易数据的标签是欺诈交易,能够确定待检测交易行为为欺诈交易。若待检测交易数据的标签不是欺诈交易,能够确定待检测交易行为为正常交易,根据待检测交易数据的标签的不同类型还能够进一步确定待检测交易的其他标签信息,例如当待检测交易行为不是欺诈交易时,还可根据获取的标签信息确定交易类型,如0、1、2、3和4等。
98.本实施例中,通过将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签,并进一步根据待检测交易数据对应的标签判断出待检测交易行为是否是欺诈交易,提高了通过多分类检测模型对欺诈交易的检测精度。
99.应该理解的是,虽然图2

3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤
的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2

3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
100.在一个实施例中,如图4所示,提供了一种欺诈交易检测装置,包括:信息获取模块401、聚类处理模块402、模型训练模块403和欺诈检测模块404,其中:
101.信息获取模块401,用于获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据。
102.聚类处理模块402,用于基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。
103.模型训练模块403,用于建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
104.欺诈检测模块404,用于基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
105.在其中一个实施例中,聚类处理模块402,还用于对所述正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;将所述正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点;重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与前一次获取的质心点之间的欧氏距离达到预设的收敛阈值;将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
106.在其中一个实施例中,模型训练模块403,还用于分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签;根据所述欺诈交易样本数据及其对应的标签,和所述正常交易样本簇数据及其对应的标签,生成样本训练集;基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
107.在其中一个实施例中,模型训练模块403,还用于为所述欺诈交易样本数据设置对应的标签为欺诈交易;为所述正常交易样本簇数据中的各簇数据分别设置不同的且不为欺诈交易的标签。
108.在其中一个实施例中,模型训练模块403,还用于以所述样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以所述样本训练集中的各标签作为输出,对所述多分类检测模型进行训练,生成多分类检测模型参数;基于所述多分类检测模型参数,获取训练后的多分类检测模型。
109.在其中一个实施例中,欺诈检测模块404,还用于获取待检测交易信息;所述待检测交易信息是待检测交易行为的交易信息;对所述待检测交易信息进行特征提取,获取待检测交易数据;将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
110.在其中一个实施例中,欺诈检测模块404,还用于将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签;若所述待检测交易数据的标签是欺诈交易,确定待检测交易行为为欺诈交易;否则,确定待检测交易行为为正常交易。
111.上述欺诈交易检测装置,根据样本交易信息获取正常交易样本数据和欺诈交易样本数据,并基于k均值聚类算法对正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。最后,建立多分类检测模型,基于欺诈交易样本数据和正常交易样本簇数据对多分类检测模型进行训练,基于训练后的多分类检测模型对待检测交易信息进行处理,判断出待检测交易行为是否为欺诈交易。通过基于k均值聚类处理后获取的正常交易样本簇数据和欺诈交易样本数据对多分类检测模型进行训练,获取到检测成功率更高的欺诈检测模型,提高了对欺诈交易的检测精度。
112.关于欺诈交易检测装置的具体限定可以参见上文中对于欺诈交易检测方法的限定,在此不再赘述。上述欺诈交易检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
113.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种欺诈交易检测方法。
114.本领域技术人员可以理解,图5中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
115.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
116.获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
117.基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
118.建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
119.基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
120.在一个实施例中,处理器执行计算机程序时还实现以下步骤:对所述正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点与各质心点的欧氏距离;将所述正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点;重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与前一次获取的质心点之间的欧氏距离达到预设的收敛阈值;将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
121.在一个实施例中,处理器执行计算机程序时还实现以下步骤:分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签;根据所述欺诈交易样本数据及其对应的标签,和所述正常交易样本簇数据及其对应的标签,生成样本训练集;基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
122.在一个实施例中,处理器执行计算机程序时还实现以下步骤:为所述欺诈交易样本数据设置对应的标签为欺诈交易;为所述正常交易样本簇数据中的各簇数据分别设置不同的且不为欺诈交易的标签。
123.在一个实施例中,处理器执行计算机程序时还实现以下步骤:以所述样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以所述样本训练集中的各标签作为输出,对所述多分类检测模型进行训练,生成多分类检测模型参数;基于所述多分类检测模型参数,获取训练后的多分类检测模型。
124.在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取待检测交易信息;所述待检测交易信息是待检测交易行为的交易信息;对所述待检测交易信息进行特征提取,获取待检测交易数据;将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
125.在一个实施例中,处理器执行计算机程序时还实现以下步骤:将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签;若所述待检测交易数据的标签是欺诈交易,确定待检测交易行为为欺诈交易;否则,确定待检测交易行为为正常交易。
126.上述计算机设备,根据样本交易信息获取正常交易样本数据和欺诈交易样本数据,并基于k均值聚类算法对正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。最后,建立多分类检测模型,基于欺诈交易样本数据和正常交易样本簇数据对多分类检测模型进行训练,基于训练后的多分类检测模型对待检测交易信息进行处理,判断出待检测交易行为是否为欺诈交易。通过基于k均值聚类处理后获取的正常交易样本簇数据和欺诈交易样本数据对多分类检测模型进行训练,获取到检测成功率更高的欺诈检测模型,提高了对欺诈交易的检测精度。
127.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
128.获取样本交易信息,根据所述样本交易信息获取正常交易样本数据和欺诈交易样本数据;
129.基于k均值聚类算法对所述正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据;
130.建立多分类检测模型,基于所述欺诈交易样本数据和所述正常交易样本簇数据对所述多分类检测模型进行训练,获取训练后的多分类检测模型;
131.基于训练后的多分类检测模型对待检测交易信息进行处理,判断待检测交易行为是否为欺诈交易。
132.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对所述正常交易样本数据进行归一化处理,获取归一化后的正常交易样本数据;在归一化后的正常交易样本数据中随机选取k个初始聚类的质心点,分别计算所述正常交易样本数据中的各数据点
与各质心点的欧氏距离;将所述正常交易样本数据中的各数据点分配给距离其最近的质心点,组成新的聚类,并重新计算新的聚类的质心点;重复上述计算欧氏距离和计算新的聚类的质心点的步骤,直至最后一次获取的聚类的质心点与前一次获取的质心点之间的欧氏距离达到预设的收敛阈值;将最后一次聚类处理获取的各簇数据作为正常交易样本簇数据。
133.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:分别为所述欺诈交易样本数据和正常交易样本簇数据设置对应的标签;根据所述欺诈交易样本数据及其对应的标签,和所述正常交易样本簇数据及其对应的标签,生成样本训练集;基于所述样本训练集对所述多分类检测模型进行训练,获取训练后的多分类检测模型。
134.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:为所述欺诈交易样本数据设置对应的标签为欺诈交易;为所述正常交易样本簇数据中的各簇数据分别设置不同的且不为欺诈交易的标签。
135.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:以所述样本训练集中的欺诈交易样本数据和正常交易样本簇数据作为输入,以所述样本训练集中的各标签作为输出,对所述多分类检测模型进行训练,生成多分类检测模型参数;基于所述多分类检测模型参数,获取训练后的多分类检测模型。
136.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取待检测交易信息;所述待检测交易信息是待检测交易行为的交易信息;对所述待检测交易信息进行特征提取,获取待检测交易数据;将所述待检测交易数据输入至训练后的多分类检测模型,根据训练后的多分类检测模型的输出结果判断待检测交易行为是否为欺诈交易。
137.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将待检测交易数据输入至训练后的多分类检测模型,获取待检测交易数据对应的标签;若所述待检测交易数据的标签是欺诈交易,确定待检测交易行为为欺诈交易;否则,确定待检测交易行为为正常交易。
138.上述存储介质,根据样本交易信息获取正常交易样本数据和欺诈交易样本数据,并基于k均值聚类算法对正常交易样本数据进行聚类处理,获取不少于一个正常交易样本簇数据。最后,建立多分类检测模型,基于欺诈交易样本数据和正常交易样本簇数据对多分类检测模型进行训练,基于训练后的多分类检测模型对待检测交易信息进行处理,判断出待检测交易行为是否为欺诈交易。通过基于k均值聚类处理后获取的正常交易样本簇数据和欺诈交易样本数据对多分类检测模型进行训练,获取到检测成功率更高的欺诈检测模型,提高了对欺诈交易的检测精度。
139.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read

only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
140.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
141.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1