交易的风险预测方法、装置及存储介质与流程

文档序号:37242611发布日期:2024-03-06 17:12阅读:143来源:国知局
交易的风险预测方法、装置及存储介质与流程

本技术涉及人工智能领域,具体而言,涉及一种交易的风险预测方法、装置及存储介质。


背景技术:

1、随着互联网技术的不断发展及应用,互联网技术提供的各种服务以其便捷、高效的特点,吸引了越来越多企业参与其中,也融入了生活的方方面面。然而,互联网的广泛应用也伴随着风险交易等各种网络黑产的出现。因此,有必要对网络上的各种风险事件进行控制,完善各种风控措施,提早发现网络黑产并对其进行打击。

2、相关技术中,针对风险事件的监控可以分为两个方面,一是基于策略规则方法,这一般需要业务人员对业务数据进行大量分析,总结出黑产具有的模式和特点,从而制定出相应的规则进行拦截,这类方法往往比较耗时且依赖业务人员的专业知识,难以形成统一的规则生成方法,并且人为筛选出的用于生成规则的数据主观性较强,选择的数据不够准确。另一种是基于各种机器学习或神经网络方法的黑盒模型,这类模型往往复杂性比较高,可解释性比较差,难以对检测出的风险数据进行合理的解释,也很难人为的对模型进行一些调整。

3、针对相关技术中由于交易数据选择的不够准确,导致交易是否存在风险的预测结果的准确率低的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本技术的主要目的在于提供一种交易的风险预测方法、装置及存储介质,以解决相关技术中由于交易数据选择的不够准确,导致交易是否存在风险的预测结果的准确率低的问题。

2、为了实现上述目的,根据本技术的一个方面,提供了一种交易的风险预测方法。该方法包括:确定目标交易的n种交易数据,并将n种交易数据输入集成树模型,得到第一预设数量的决策树,其中,n为正整数,集成树模型由多组训练样本训练得到,每组训练样本包括样本交易数据和第一预设数量的样本决策树;从第一预设数量的决策树中提取m条规则链,并通过规则链的精确率和召回率从m条规则链中筛选出p条候选规则链,其中,m和p为正整数,m大于p,规则链为决策树中从根节点到叶子节点之间的所有节点组成的链,每个节点表征一种交易数据;通过特征筛选方法对p条候选规则链进行筛选,得到q条目标规则链,确定目标交易的交易数据符合的目标规则链的目标数量,其中,特征筛选方法为基于候选规则链中的交易数据的重要性评估值进行筛选的方法,q小于p,q为正整数;在目标数量大于等于规则链数量阈值的情况下,确定目标交易为风险交易。

3、可选地,集成树模型由以下方式得到:获取每个历史交易的交易数据,得到多组样本交易数据,将每组样本交易数据输入初始集成树模型,得到每组样本交易数据对应的第一预设数量的样本决策树;将每组样本交易数据和样本交易数据对应的样本决策树确定为一组训练样本,得到多组训练样本;基于多组训练样本对初始集成树模型进行多次迭代训练,得到预设性能评估值大于等于性能评估值阈值的集成树模型,其中,每次迭代训练更新初始集成树模型的模型参数。

4、可选地,通过规则链的精确率和召回率从m条规则链中筛选出p条候选规则链包括:获取测试样本集合,其中,测试样本集合包含多个测试样本,每个测试样本包含测试交易数据和风险测试结果;对于m条规则链中的每条规则链,通过当前规则链对测试样本集合进行预测,得到测试样本集合中每个测试样本的风险预测结果;基于风险预测结果和风险测试结果计算每条规则链的准确率和召回率;在准确率大于等于准确率阈值,并且召回率大于等于召回率阈值的情况下,将准确率和召回率对应的规则链确定为候选规则链。

5、可选地,通过当前规则链对测试样本集合进行预测,得到测试样本集合中每个测试样本的风险预测结果包括:确定当前规则链中包含的f种第一交易数据,并确定每种第一交易数据的目标约束条件,其中,f小于n,f为正整数,目标约束条件为第一交易数据的特征值所属的特征值范围;对于每个测试样本,从测试样本中提取出第一交易数据的特征值,得到目标特征值;在f种第一交易数据的目标特征值均符合目标约束条件的情况下,确定测试样本的风险预测结果为风险交易;在至少存在一种第一交易数据的目标特征值不符合目标约束条件的情况下,确定测试样本的风险预测结果为非风险交易。

6、可选地,基于风险预测结果和风险测试结果计算每条规则链的准确率和召回率包括:确定测试样本集合中第一测试样本的数量,得到第一数量,其中,第一测试样本为风险测试结果和风险预测结果均为风险交易的样本;确定测试样本集合中第二测试样本的数量,得到第二数量,其中,第二测试样本为风险测试结果为风险交易,风险预测结果为非风险交易的样本;确定测试样本集合中第三测试样本的数量,得到第三数量,其中,第三测试样本为风险测试结果为非风险交易,风险预测结果为风险交易的样本;计算第一数量与第二数量的和,得到第一和值,并计算第一数量与第一和值的比值,得到准确率;计算第一数量与第三数量的和,得到第二和值,并计算第一数量与第二和值的比值,得到召回率。

7、可选地,通过特征筛选方法对p条候选规则链进行筛选,得到q条目标规则链包括:确定第二预设数量的特征筛选方法,并计算第二预设数量与预设值的比值,得到方法数量阈值;对于p条候选规则链中的每条候选规则链,确定每个特征筛选方法对当前候选规则链的筛选结果,得到筛选结果集合,其中,筛选结果包括赞同和不赞同,筛选结果为赞同表征当前候选规则链的重要性评估值大于等于重要性评估值阈值,筛选结果为不赞同表征当前候选规则链的重要性评估值小于重要性评估值阈值;从筛选结果集合中确定筛选结果为赞同的数量,得到目标筛选结果数量;在目标筛选结果数量大于等于方法数量阈值的情况下,将当前候选规则链确定为待定规则链;通过遗传算法对所有待定规则链进行优化,得到q条目标规则链。

8、可选地,通过遗传算法对所有待定规则链进行优化,得到q条目标规则链包括:将每个待定规则链确定为个体,将所有待定规则链确定为初始种群;通过遗传算法对初始种群执行遗传操作,得到多代种群,其中,遗传操作至少包括以下之一:选择操作、交叉操作和变异操作;计算每一代种群的适应度函数值,在适应度函数值小于适应度函数阈值的情况下,将适应度函数值对应的种群确定为目标种群;依据目标种群中包含的规则链确定q条目标规则链。

9、可选地,适应度函数值的计算公式如下:

10、

11、其中,min obj为适应度函数值,α为预设常数,0小于等于α小于等于1,num_consub为目标种群中包含的交易数据的种类,num_cons为初始种群中包含的交易数据的种类,num_rulesub为目标种群中约束条件的数量,num_rules为初始种群中约束条件的数量,aucsub为目标种群的性能评估值,约束条件为交易数据的特征值需要满足的特征值范围。

12、为了实现上述目的,根据本技术的另一方面,提供了一种交易的风险预测装置。该装置包括:第一确定单元,用于确定目标交易的n种交易数据,并将n种交易数据输入集成树模型,得到第一预设数量的决策树,其中,n为正整数,集成树模型由多组训练样本训练得到,每组训练样本包括样本交易数据和第一预设数量的样本决策树;提取单元,用于从第一预设数量的决策树中提取m条规则链,并通过规则链的精确率和召回率从m条规则链中筛选出p条候选规则链,其中,m和p为正整数,m大于p,规则链为决策树中从根节点到叶子节点之间的所有节点组成的链,每个节点表征一种交易数据;筛选单元,用于通过特征筛选方法对p条候选规则链进行筛选,得到q条目标规则链,确定目标交易的交易数据符合的目标规则链的目标数量,其中,特征筛选方法为基于候选规则链中的交易数据的重要性评估值进行筛选的方法,q小于p,q为正整数;第二确定单元,用于在目标数量大于等于规则链数量阈值的情况下,确定目标交易为风险交易。

13、通过本技术,采用以下步骤:确定目标交易的n种交易数据,并将n种交易数据输入集成树模型,得到第一预设数量的决策树,其中,n为正整数,集成树模型由多组训练样本训练得到,每组训练样本包括样本交易数据和第一预设数量的样本决策树;从第一预设数量的决策树中提取m条规则链,并通过规则链的精确率和召回率从m条规则链中筛选出p条候选规则链,其中,m和p为正整数,m大于p,规则链为决策树中从根节点到叶子节点之间的所有节点组成的链,每个节点表征一种交易数据;通过特征筛选方法对p条候选规则链进行筛选,得到q条目标规则链,确定目标交易的交易数据符合的目标规则链的目标数量,其中,特征筛选方法为基于候选规则链中的交易数据的重要性评估值进行筛选的方法,q小于p,q为正整数;在目标数量大于等于规则链数量阈值的情况下,确定目标交易为风险交易,解决了相关技术中由于交易数据选择的不够准确,导致交易是否存在风险的预测结果的准确率低的问题。通过将n种交易数据输入集成树模型获得决策树,并从决策树中提取规则链,对提取到的规则链经过精确率、召回率以及特征筛选方法的筛选得到目标规则链,根据目标规则链来评估目标交易是否存在风险,进而达到了提高交易是否存在风险的预测结果的准确率的效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1