本申请涉及智能决策,尤其涉及一种基于决策树的数据评估方法、装置、设备及存储介质。
背景技术:
1、目前,大数据结合人工智能的机器学习、深度学习已经普遍应用于各行各业,机器学习的决策树是人工智能领域比较常用的监督学习的分类算法,决策树分析法,也称为概率分析决策方法,是将构成决策方案的相关要素表现为树状,并在此基础上对决策方案进行分析选择的系统分析法。这是风险型决策最常用的方法之一,特别适用于分析比较复杂的问题。她以损益值为依据,比较不同方案的期待损益值(期待值),决定方案的取舍。其最大特点是可以形象地展示整个决策问题在时间、不同阶段的决策过程,逻辑思维清晰,层次清晰,非常直观。决策树具有如下优点:1、易于理解和实现;2、数据的准备简单或不必要,能够同时处理数据型和常规型属性,在相对短的时间内能够对大型数据源做出可行且效果良好的结果,易于通过静态测试来对模型进行评测。
2、基于银行贷款场景,银行在审核贷款,常常利用发票对企业的经营状况分析时,但是很难排除一些可能存在业务真实性问题的发票,无法真实准确的反应企业的经营价值,导致银行对中小企业的授信效率低。因此,如何提高对企业的授信效率成为目前亟待解决的技术问题。
技术实现思路
1、本申请提供了一种基于决策树的数据评估方法、装置、设备及存储介质,以提高对企业的授信效率。
2、第一方面,本申请提供了一种基于决策树的数据评估方法,所述基于决策树的数据评估方法包括:
3、获取目标数据,并通过预设标准化引擎对所述目标数据进行标准化处理,生成所述目标数据对应的目标数据特征;
4、通过预设规则引擎与所述数据特征,生成所述目标数据特征的目标指标;
5、将预设决策树模型与所述目标指标进行比对,得到基于所述预设决策树模型的所述目标数据的评估结果。
6、进一步地,将预设决策树模型与所述目标指标进行比对,得到基于所述预设决策树模型的所述目标数据的评估结果之前,包括:
7、获取历史数据作为训练集;
8、对所述训练集进行训练,生成所述预设决策树模型。
9、进一步地,对所述训练集进行训练,生成所述预设决策树模型,包括:
10、基于所述预设规则引擎与所述训练集,提取所述训练集的训练数据特征;
11、通过所述预设规则引擎,确定所述训练数据特征对应的至少一个训练指标;
12、通过预设信息增益函数计算各所述训练指标的信息增益,并根据所述信息增益确定各所述训练指标对应的节点位置,生成所述预设决策树模型。
13、进一步地,通过预设函数计算各所述训练指标的信息增益,包括:
14、通过不纯度减少量的方式,将所述训练数据特征划分为预设数量的取值区间,并计算各所述取值区间对应的档位熵值;
15、基于总信息熵值函数与所述取值区间,计算各所述训练指标的总信息熵值,并根据所述总信息熵值与各所述档位熵值计算所述信息增益。
16、进一步地,总信息熵值函数为:
17、i(x)=-∑pi*logpi,i=1,2,…,n;
18、其中,i(x)为所述总信息熵值,pi为当前样本集合中第i类样本所占的比例。
19、进一步地,预设信息增益函数为:
20、δi(x,f)=i(x)-(p1i(x1)+…+pni(xn));
21、其中,δi(x,f)为所述信息增益,x为所述样本集,pn为x中划分到子集的样本比例。
22、进一步地,通过预设信息增益函数计算各所述训练指标的信息增益,并根据所述信息增益确定各所述训练指标对应的节点位置,生成所述预设决策树模型,包括:
23、将各所述信息增益进行降序处理,并将各所述信息增益对应的各所述训练指标按照降序后的排列生成所述预设决策树模型。
24、第二方面,本申请还提供了一种基于决策树的数据评估装置,所述基于决策树的数据评估装置包括:
25、数据标准化模块,用于获取目标数据,并通过预设标准化引擎对所述目标数据进行标准化处理,生成所述目标数据对应的目标数据特征;
26、指标生成模块,用于通过预设规则引擎与所述数据特征,生成所述目标数据特征的目标指标;
27、决策树比对模块,用于将预设决策树模型与所述目标指标进行比对,得到基于所述预设决策树模型的所述目标数据的评估结果。
28、第三方面,本申请还提供了一种设备,所述设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的基于决策树的数据评估方法。
29、第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的基于决策树的数据评估方法。
30、本申请公开了一种基于决策树的数据评估方法、装置、设备及存储介质,所述基于决策树的数据评估方法包括获取目标数据,并通过预设标准化引擎对所述目标数据进行标准化处理,生成所述目标数据对应的目标数据特征;通过预设规则引擎与所述数据特征,生成所述目标数据特征的目标指标;将预设决策树模型与所述目标指标进行比对,得到基于所述预设决策树模型的所述目标数据的评估结果。通过上述方式,本申请获取目标数据后对数据进行标准化处理,提取数据特征后,从数据特征中确定各数据指标,并将各数据指标与决策树模型中的预设指标进行比对,根据比对结果确定最终的授信评估结果,提高了对企业的授信效率。
1.一种基于决策树的数据评估方法,其特征在于,所述基于决策树的数据评估方法包括:
2.根据权利要求1所述的基于决策树的数据评估方法,其特征在于,所述将预设决策树模型与所述目标指标进行比对,得到基于所述预设决策树模型的所述目标数据的评估结果之前,包括:
3.根据权利要求2所述的基于决策树的数据评估方法,其特征在于,所述对所述训练集进行训练,生成所述预设决策树模型,包括:
4.根据权利要求3所述的基于决策树的数据评估方法,其特征在于,所述通过预设函数计算各所述训练指标的信息增益,包括:
5.根据权利要求4所述的基于决策树的数据评估方法,其特征在于,所述总信息熵值函数为:
6.根据权利要求4所述的基于决策树的数据评估方法,其特征在于,所述预设信息增益函数为:
7.根据权利要求3所述的基于决策树的数据评估方法,其特征在于,所述通过预设信息增益函数计算各所述训练指标的信息增益,并根据所述信息增益确定各所述训练指标对应的节点位置,生成所述预设决策树模型,包括:
8.一种基于决策树的数据评估装置,其特征在于,包括:
9.一种设备,其特征在于,所述设备包括存储器和处理器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的基于决策树的数据评估方法。