一种融合事前预测和事中检测的网络交易反欺诈方法与流程

文档序号：19158332发布日期：2019-11-16 01:05阅读：298来源：国知局

本发明涉及网络交易反欺诈技术领域，特别涉及一种融合事前预测和事中检测的网络交易反欺诈方法。

背景技术：

随着移动互联网的兴起，网络交易得到了快速的发展。虽然网络交易给人们的日常生活带来了极大的便利，但同时也面临着诸多挑战。欺诈交易就是网络交易面临的重要挑战之一，欺诈者利用非法手段窃取电子账户，并试图通过在第三方购物平台购买一些商品来快速转移资金。欺诈交易每年给金融平台和平台用户造成巨大了的经济损失。因此，金融平台急需建立一个有效的欺诈交易检测系统，阻止欺诈交易的发生。

目前传统的网络交易欺诈检测系统都是基于事中检测的方法。事中检测的方法是指当交易正在发生的时候，对交易进行检测，如果系统判定当前正在发生的交易是欺诈交易，系统就会立即终止当前发生的交易。基于事中的检测方法具有很强的时效性，但是它只能在交易发生时才能进行检测，缺乏前瞻性。

技术实现要素：

本发明的目的是提供一种融合事前预测和事中检测的网络交易反欺诈方法，从事前和事中两个时间维度进行风险预测和欺诈检测，既能在交易还没发生时就对账户的欺诈风险进行预测，防止欺诈交易的发生，又能在交易正在发生时对交易进行检测，有效减少欺诈交易的发生。

本发明的上述技术目的是通过以下技术方案得以实现的：

一种融合事前预测和事中检测的网络交易反欺诈方法，其特征是，包括有以下步骤：

根据交易完成的序列保留近期设定数量的交易记录并于每笔交易完成后更新交易记录；

对最新完成的交易记录进行处理并通过事前风险预测模型进行预测，对应输出风险值，锁定风险值高于设定风险阈值的账户；

未被事前预测锁定的账户当前正在进行新的交易时，交易记录输入至事中检测模型进行检测并输出检测标签；

对输入的交易记录进行判断，若为欺诈交易则终止交易并锁定账户；反之允许当前交易完成。

作为优选，事前风险预测和事中检测的具体步骤如下：

每个账户保留一个近期交易序列的序列窗口，并且在当前账户每完成一笔交易时更新序列窗口内的交易记录；

对序列窗口内的交易记录进行预处理，完成特征选取及特征融合；

将融合后的特征输入事前风险预测模型进行风险预测，并输出对应的风险值；

设定风险阈值，并且在事前风险预测模型输出的风险值高于设定的风险阈值时，判断为高风险欺诈，并且锁定当前账户同时禁止后续交易；若输出的风险值低于设定的风险阈值，则允许当前账户进行后续交易；

当前账户未被锁定时，将正在进行的交易记录输入至事中检测模型中进行检测并且输出对应的检测标签；

对输出的检测标签进行判断，判断为欺诈交易时终止正在进行的交易并锁定当前账户；反之允许当前交易完成。

作为优选，对交易记录进行处理的具体步骤包括有：

对交易数据进行类型转换及空值填充预处理，将非数值型特征转化成数值型特征，并且将处理后获得的交易记录和数据标签通过随机森林进行重要性排序，并按照重要性从高到低分别选择和剔除原始特征；

对用户的历史交易记录按照时间顺序进行排序，设定一个固定大小的滑动窗口在历史交易序列上进行滑动，每滑动一次生成一个窗口样本，完成滑动采样；

对每个窗口样本内的多条交易记录进行特征融合，使每个窗口内的交易记录融合成一个样本记录。

作为优选，所述特征融合包括有对交易行为特征的融合及账户信息特征的融合；所述交易行为特征根据用户在不同交易中的不同表征可分为离散型特征和连续型特征。

作为优选，账户每完成一笔交易时更新交易记录的步骤具体为：按照交易时间进行排序，并且舍弃窗口内距离当前交易时间最久的交易记录，并将当前完成的交易记录加入到该账户的序列窗口中。

作为优选，所述事前风险预测模型及事中检测模型的学习训练具体如下：

对交易数据进行类型转换及空值填充预处理，并根据重要性进行特征选择；

对用户的历史交易记录按照时间顺序排序并进行窗口滑动采样；

对每个窗口样本内的多条交易记录进行特征融合，使每个窗口内的交易记录融合成一个样本记录；

当所有窗口数据融均完成特征融合后，对样本记录进行欠采样，保留所有的欺诈样本且选取部分正常样本，并将选取的欺诈样本和正常样本输入至xgboost分类器中训练生成事前风险预测模型及事中检测模型。

综上所述，本发明具有以下有益效果：

通过融合事前预测和事中检测的系统，克服现有反欺诈技术的不足，增加了对账户风险的提前预测，既能提前预测欺诈交易的发生，又能对正在进行的交易进行实时检测，对阻止欺诈交易的发生和保护用户与金融平台的资金安全有更好的保障。

附图说明

图1为本发明的结构图；

图2为本发明的流程图。

具体实施方式

以下结合附图对本发明作进一步详细说明。

本实施例公开的一种融合事前预测和事中检测的网络交易反欺诈方法，如图1及图2所示，包括有以下步骤：

根据交易完成的序列保留近期设定数量的交易记录并于每笔交易完成后更新交易记录；

对最新完成的交易记录进行处理并通过基于机器学习的事前风险预测模型进行预测，对应输出风险值，锁定风险值高于设定风险阈值的账户；

未被事前预测锁定的账户当前正在进行新的交易时，交易记录输入至基于机器学习的事中检测模型进行检测并输出检测标签；

对输入的交易记录进行判断，若为欺诈交易则终止交易并锁定账户；反之允许当前交易完成。

事前风险预测及事中检测的具体步骤如下：

每个账户保留一个近期交易序列的序列窗口，并且在当前账户每完成一笔交易时更新序列窗口内的交易记录；具体的更新方法为：按照交易时间进行排序，并且舍弃窗口内距离当前交易时间最久的交易记录，并将当前完成的交易记录加入到该账户的序列窗口中。

对序列窗口内的交易记录进行预处理，完成特征选取及特征融合；

具体的：对交易数据进行类型转换及空值填充预处理，将非数值型特征转化成数值型特征，并且将处理后获得的交易记录和数据标签通过随机森林进行重要性排序，并按照重要性从高到低分别选择和剔除原始特征；

对每个窗口样本内的多条交易记录进行特征融合，使每个窗口内的交易记录融合成一个样本记录，特征融合包括有对交易行为特征的融合及账户信息特征的融合；交易行为特征根据用户在不同交易中的不同表征又可分为离散型特征和连续型特征。

将融合后的特征输入基于机器学习的事前风险预测模型进行风险预测，并输出对应的风险值；

当前账户未被锁定时，将正在进行的交易记录输入至事中检测模型中进行检测并且输出对应的检测标签；

对输出的检测标签进行判断，判断为欺诈交易时终止正在进行的交易并锁定当前账户；反之允许当前交易完成。

事前风险预测模型及事中检测模型的学习训练具体如下：

对交易数据进行类型转换及空值填充预处理，并根据重要性进行特征选择；

对用户的历史交易记录按照时间顺序排序并进行窗口滑动采样；

对每个窗口样本内的多条交易记录进行特征融合，使每个窗口内的交易记录融合成一个样本记录；

如图1及图2所示，具体的整体实施包括有三个部分：

第一部分针对用户的历史交易数据，训练一个基于滑动窗口的用户交易序列的事前风险预测模型；

第二部分针对用户的历史交易数据，训练一个基于用户行为的事中检测模型；

第三部分融合事前预测和事中检测，负责用户网络交易数据的收集处理，特征选择和融合，进行实时的风险预测和欺诈交易检测。

第一阶段具体实施步骤：

步骤1-1，对样本数据进行类型转换和空值填充等预处理，将非数值型特征转化成数值型特征，然后将处理好的交易记录和数据标签输入到随机森林中，训练一个随机森林模型，输出所有原始特征的重要性度量，选择重要性高的特征，并从所有样本中剔除特征重要性低的特征，利用随机森林对交易的原始特征进行评估，选择特征重要性较高的特征作为分类特征，剔除所有重要性低得特征；

步骤1-2，设计一个固定大小的滑动窗口，其大小设为n，利用该滑动窗口在用户的历史交易序列上进行滑动，历史交易序列按时间顺序排列，每滑动一次就生成了一条窗口训练样本；将预处理完成的用户历史交易按时间顺序排成一个序列t＝{t1,t2,…,tm}，设计一个大小为n的滑动窗口，利用该窗口在用户的历史交易序列上进行滑动，每滑动一次，就生成了一个窗口样本s＝{ti,ti+1,…,ti+n-1}。

步骤1-3，对每个窗口样本内的多条记录进行特征融合，使每个窗口内的交易记录融合成一个样本，具体的融合方法如下：

(a)交易行为特征：用户的某一交易行为在不同的交易中会有不同的表征，用户行为特征可分为离散型特征和连续型特征，具体的融合方法如下：

a.离散型特征：对于某一离散型特征f，它有m中不同的表征值f＝{f1,f2,…,fm}，对于每一种表征fi，我们统计它在窗口中出现的次数count(fi)，并将它的支持度作为新的特征值。如果原始特征有k个，每个特征有m个不同的表征值，那么融合后的特征就有km个。

b.连续型特征：对于连续型特征，例如交易时间和交易金额，将这些特征融合成一些统计特征，例如交易序列的平均交易间隔，平均交易金额、最大交易金额差、窗口时间维度等。

(b)账户信息特征：对于账户的信息特征，比如账户类型、开卡地等，在窗口中的多条交易中，一般是不发生变化的，只需要对这些特征进行one-hot编码即可。

步骤1-4，当所有的窗口数据都融合了之后，为了解决类别不均衡问题，对训练样本进行欠采样，保留所有的欺诈样本，并选取部分的正常样本，将采样后的欺诈样本和正常样本输入到xgboost分类器中，训练一个分类模型xgb_1，即为事前风险预测模型。

第二阶段具体实施步骤：

步骤2-1，对所有的交易记录进行预处理，选择步骤1-1中利用随机森林选择的原始特征，剔除不重要的原始特征；

步骤2-2，将预处理后的交易记录采样后，输入到xgboost分类器中，训练一个分类器模型xgb_2，即为事中检测模型；

第三阶段具体实施步骤：

步骤3-1，系统为每个账户保留了一个窗口大小的近期交易序列，当当前账户完成一笔交易后，更新用户的序列窗口内的交易记录，具体的方法为：舍弃窗口内距离当前交易时间最久的交易记录，并将当前的交易记录加入到该账户的序列窗口内。

步骤3-2，对窗口内的交易记录进行预处理，选择步骤1-1中利用随机森林选择的原始特征，剔除不重要的原始特征，然后利用步骤1-3中的方法对当前窗口内的交易序列进行特征融合；

步骤3-3，将步骤3-2融合后的特征输入到步骤1-4线下训练好的分类模型xgb_1中，经过模型预测，会输出一个介于0-1之间的风险值，为risk_value；

步骤3-4，设定一个风险阈值threshold，当步骤3-3中输出的风险值risk_value大于或等于设定的阈值threshold，系统判断当前账户会发生欺诈的风险较高，则立即锁定该账户，禁止后续的交易发生；如果输出的风险值低于设定的阈值，系统容许该账户的后续交易。

步骤3-5，如果步骤3-4中交易账户没有被锁定，用户正在发生一笔新的交易时，将正在发生的交易记录输入到分类器xgb_2中，事中检测模型输出一个检测标签test_label；

步骤3-6，如果检测标签test_label＝1，则当前正在发生的交易为欺诈交易，系统立即终止当前正在发生的交易，并立即锁定账户；如果test_label＝0，则当前正在发生的交易为正常交易，允许当前交易完成，并且返回执行步骤3-1。

本具体实施例仅仅是对本发明的解释，其并不是对本发明的限制，本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改，但只要在本发明的权利要求范围内都受到专利法的保护。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王成;舒鹏飞
技术所有人：同济大学
我是此专利的发明人

上一篇：集成在PCB中的尼尔效应隔离式DC/AC电流传感器的制作方法
上一篇：接触式探针及探针单元的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。