一种基于交易数据的机器学习反欺诈监测系统的制作方法

文档序号：11918761阅读：来源：国知局

技术特征：

1.一种基于交易数据的机器学习反欺诈监测系统，其特征在于，该系统包括管理平台、ETL模块、采样引擎、流处理引擎、训练引擎、预测引擎和决策引擎；

所述管理平台提供每个模块的配置信息，并发起模型训练请求和预测请求，对模型进行管理和更新操作；所述配置信息包括ETL模块所需的数据时间区间，采样引擎所需的数据库字段，流处理引擎所需的特征名称和计算方式，训练引擎所需的算法名称和算法参数。

所述ETL模块根据管理平台的配置信息，提取原始数据库数据，进行数据抽取、转换、入库操作；所述数据转换操作主要对数据进行清洗和标准化，包括两部分：将原始数据库自定义的数据转化为标准数据；将机器学习模型无法处理的字段进行转化；数据入库操作将处理完毕的数据存入任意常用数据库。

所述采样引擎根据管理平台的配置信息对原始数据进行采样，从原始数据中提取流处理引擎需要的数据库字段。

所述流处理引擎根据管理平台配置的特征名称和计算方式，对采样数据进行特征提取和计算。

所述训练引擎包括数据清洗、模型训练、模型评估；所述数据清洗，对数据进行缺失值处理、归一化处理等标准数据清洗操作；所述模型训练，根据设定的模型参数，利用清洗后的特征数据进行训练，具体为：读取管理平台配置的算法名称和算法参数，调用常见的机器学习算法，包括有监督算法和无监督算法进行学习；有监督算法包括逻辑回归、线性回归、支持向量机、决策树算法等；无监督算法包括k‐means聚类等；所述模型评估，利用新的数据集对训练好的模型进行评价，根据输出的查全率、查准率，KS值，ROC曲线等指标对模型质量进行评价，如果质量符合要求即可进行模型部署和使用；所述模型训练模块通过预先设置的更新时间，自动获取最新数据并重新训练模型，从而使模型始终保持有效性。

所述预测引擎调用训练好的模型对依次流过ETL模块、采样引擎、流处理引擎的实际交易数据进行判别，输出属于正常交易的概率和属于欺诈交易的概率，将预测结果传给决策引擎。

所述决策引擎根据预测引擎的输出，对该笔交易的危险性进行决策。

2.根据权利要求1所述的一种基于交易数据的机器学习反欺诈监测系统，其特征在于，所述训练引擎中的机器学习算法，针对黑样本查全率进行改造，具体为：给黑样本损失函数赋以比白样本大的权重，使其更倾向于找出更多的黑样本；或者，对黑样本进行过采样，白样本进行欠采样；或者，在损失函数后增加正则项，降低模型复杂度，提高模型范化能力；或者，采用集成学习框架，克服单模型的过拟合。

针对资金损失率进行改造，对高金额样本赋以低金额大的权重，使模型更倾向于少分错高金额样本；或者，根据单笔交易金额动态调整概率阈值，使对高金额的交易更难被判别为白样本；

针对算法性能做优化，使用GPU加速算法中可以并行化执行的函数，大大降低训练和预测时间；或者，使用线性代数库实现算法底层的计算操作；或者，使用多线程技术并行化实现算法。

3.根据权利要求1所述的一种基于交易数据的机器学习反欺诈监测系统，其特征在于，流处理引擎通过流式大数据处理对庞大的交易原始数据进行特征的快速提取和计算，可以获取某个时间区间内某个维度下某用户历史交易量累计、占比、方差、均值、求和、计数、最小数统计、标准差统计计算、偏度、峰度、去重等特征量。

完整全部详细技术资料下载

当前第2页1 2 3