一种授信数据的确定方法、装置及电子设备与流程

文档序号:32392711发布日期:2022-11-30 08:58阅读:36来源:国知局
一种授信数据的确定方法、装置及电子设备与流程

1.本发明涉及数据处理领域,更具体的说,涉及一种授信数据的确定方法、装置及电子设备。


背景技术:

2.金融机构作为国家用以调控经济的核心枢纽,其稳定、健康发展对于一个国家的经济来说至关重要。信贷业务又被称之为贷款业务,是如今金融机构最主要的盈利渠道。然而,贷款给金融机构带来了许多利益同时,也使得机构面临了一定的贷款风险。因此,如何准确的对企业授信进行分析,对于金融的稳健发展来说有着至关重要的意义。
3.目前,在对企业授信进行分析时,主要是人工基于经验进行授信分析,分析准确度较差,无法满足企业授信分析需求。


技术实现要素:

4.有鉴于此,本发明提供一种授信数据的确定方法、装置及电子设备,以解决人工基于经验进行授信分析,分析准确度较差,无法满足企业授信分析需求的问题。
5.为解决上述技术问题,本发明采用了如下技术方案:
6.一种授信数据的确定方法,包括:
7.获取授信基础数据,并对所述授信基础数据进行数据预处理操作,得到目标基础数据;
8.将所述目标基础数据输入预先生成的授信数据分析模型中,得到授信分析结果;所述授信数据分析模型的训练过程包括:
9.获取授信训练样本和授信测试样本,所述授信训练样本包括授信训练数据样本以及所述授信训练数据样本对应的参考授信分析结果;所述授信测试样本包括授信测试数据样本以及所述授信测试数据样本对应的参考授信分析结果;
10.基于所述授信训练样本,对朴素贝叶斯模型进行训练,得到初始授信数据分析模型;
11.调用所述初始授信数据分析模型对所述授信测试数据样本进行分析,得到所述授信测试数据样本的实际授信分析结果;
12.在所述授信测试数据样本的实际授信分析结果与参考授信分析结果不同的情况下,增大所述授信测试数据样本属于所述参考授信分析结果的条件概率,以及降低所述授信测试数据样本属于所述实际授信分析结果的条件概率;
13.至少基于所述授信测试数据样本属于所述参考授信分析结果的条件概率和属于所述实际授信分析结果的条件概率,对所述初始授信数据分析模型进行迭代训练,得到授信数据分析模型。
14.可选地,对所述授信基础数据进行数据预处理操作,得到目标基础数据,包括:
15.确定出所述授信基础数据中的属性的缺失值;
16.基于所述授信基础数据中的属性的非缺失值的众数或均值,对所述缺失值进行填充操作;
17.对所述授信基础数据中的属性的数值型数据进行离散化操作,得到目标基础数据。
18.可选地,基于所述授信训练样本,对朴素贝叶斯模型进行训练,得到初始授信数据分析模型,包括:
19.计算所述授信训练数据样本的先验概率和条件概率;
20.基于所述授信训练数据样本的先验概率、条件概率和参考授信分析结果,对朴素贝叶斯模型进行训练,得到初始授信数据分析模型。
21.可选地,增大所述授信测试数据样本属于所述参考授信分析结果的条件概率,以及降低所述授信测试数据样本属于所述实际授信分析结果的条件概率,包括:
22.获取条件概率调整公式;所述条件概率调整公式包括第一条件概率调整公式和第二条件概率调整公式;所述第一条件概率调整公式用于计算所述授信测试数据样本属于所述参考授信分析结果的增大后的条件概率;所述第二条件概率调整公式用于计算所述授信测试数据样本属于所述实际授信分析结果的减少后的条件概率;
23.根据所述第一条件概率调整公式,计算所述授信测试数据样本属于所述参考授信分析结果的增大后的条件概率;
24.根据所述第二条件概率调整公式,计算所述授信测试数据样本属于所述实际授信分析结果的减少后的条件概率。
25.可选地,至少基于所述授信测试数据样本属于所述参考授信分析结果的条件概率和属于所述实际授信分析结果的条件概率,对所述初始授信数据分析模型进行迭代训练,得到授信数据分析模型,包括:
26.至少基于所述授信测试数据样本属于所述参考授信分析结果的条件概率和属于所述实际授信分析结果的条件概率,对所述初始授信数据分析模型进行迭代训练,并在迭代训练过程中,将训练得到的分类精度最大的初始授信数据分析模型,作为授信数据分析模型。
27.一种授信数据的确定装置,包括:
28.数据处理模块,用于获取授信基础数据,并对所述授信基础数据进行数据预处理操作,得到目标基础数据;
29.授信分析模块,用于将所述目标基础数据输入预先生成的授信数据分析模型中,得到授信分析结果;所述授信数据分析模型为模型训练模块生成;
30.所述模型训练模块包括:
31.样本获取子模块,用于获取授信训练样本和授信测试样本,所述授信训练样本包括授信训练数据样本以及所述授信训练数据样本对应的参考授信分析结果;所述授信测试样本包括授信测试数据样本以及所述授信测试数据样本对应的参考授信分析结果;
32.第一训练子模块,用于基于所述授信训练样本,对朴素贝叶斯模型进行训练,得到初始授信数据分析模型;
33.结果分析子模块,用于调用所述初始授信数据分析模型对所述授信测试数据样本进行分析,得到所述授信测试数据样本的实际授信分析结果;
34.概率调整子模块,用于在所述授信测试数据样本的实际授信分析结果与参考授信分析结果不同的情况下,增大所述授信测试数据样本属于所述参考授信分析结果的条件概率,以及降低所述授信测试数据样本属于所述实际授信分析结果的条件概率;
35.第二训练子模块,用于至少基于所述授信测试数据样本属于所述参考授信分析结果的条件概率和属于所述实际授信分析结果的条件概率,对所述初始授信数据分析模型进行迭代训练,得到授信数据分析模型。
36.可选地,所述数据处理模块包括:
37.缺失值确定子模块,用于确定出所述授信基础数据中的属性的缺失值;
38.缺失值填充子模块,用于基于所述授信基础数据中的属性的非缺失值的众数或均值,对所述缺失值进行填充操作;
39.离散化操作子模块,用于对所述授信基础数据中的属性的数值型数据进行离散化操作,得到目标基础数据。
40.可选地,所述第一训练子模块具体用于:
41.计算所述授信训练数据样本的先验概率和条件概率,基于所述授信训练数据样本的先验概率、条件概率和参考授信分析结果,对朴素贝叶斯模型进行训练,得到初始授信数据分析模型。
42.可选地,所述概率调整子模块包括:
43.公式获取单元,用于获取条件概率调整公式;所述条件概率调整公式包括第一条件概率调整公式和第二条件概率调整公式;所述第一条件概率调整公式用于计算所述授信测试数据样本属于所述参考授信分析结果的增大后的条件概率;所述第二条件概率调整公式用于计算所述授信测试数据样本属于所述实际授信分析结果的减少后的条件概率;
44.第一计算单元,用于根据所述第一条件概率调整公式,计算所述授信测试数据样本属于所述参考授信分析结果的增大后的条件概率;
45.第二计算单元,用于根据所述第二条件概率调整公式,计算所述授信测试数据样本属于所述实际授信分析结果的减少后的条件概率。
46.一种电子设备,包括:存储器和处理器;
47.其中,所述存储器用于存储程序;
48.处理器调用程序并用于执行上述的授信数据的确定方法。
49.相较于现有技术,本发明具有以下有益效果:
50.本发明提供了一种授信数据的确定方法、装置及电子设备,获取授信基础数据,并对所述授信基础数据进行数据预处理操作,得到目标基础数据,将所述目标基础数据输入预先生成的授信数据分析模型中,得到授信分析结果。本发明中的授信数据分析模型基于训练得到,并且在训练后的测试过程中,若是授信测试样本的实际授信分析结果与参考授信分析结果不同时,会增大所述授信测试数据样本属于所述参考授信分析结果的条件概率,降低所述授信测试数据样本属于所述实际授信分析结果的条件概率,并对模型进行再训练,使得训练得到的模型的精度较高。则使用该模型进行授信分析时,得到的授信分析结果的准确度也会较高,能够满足企业授信分析需求。
附图说明
51.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
52.图1为本发明实施例提供的一种授信数据的确定方法的方法流程图;
53.图2为本发明实施例提供的另一种授信数据的确定方法的方法流程图;
54.图3为本发明实施例提供的再一种授信数据的确定方法的方法流程图;
55.图4为本发明实施例提供的又一种授信数据的确定方法的方法流程图;
56.图5为本发明实施例提供的一种授信数据的确定装置的结构示意图。
具体实施方式
57.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
58.金融机构作为国家用以调控经济的核心枢纽,其稳定、健康发展对于一个国家的经济来说至关重要。信贷业务又被称之为贷款业务,是如今金融机构最主要的盈利渠道。然而,贷款给金融机构带来了许多利益同时,也使得机构面临了一定的贷款风险。因此,如何准确的对企业授信进行分析,对于金融的稳健发展来说有着至关重要的意义。
59.目前,在对企业授信进行分析时,主要是人工基于经验进行授信分析,分析准确度较差,无法满足企业授信分析需求。
60.为了解决准确度差的问题,可以采用模型进行企业授信分析,如可以将机器学习技术应用于企业的授信分析,其中朴素贝叶斯算法以其简单、高效等特点,可以取得较好的分类性能。
61.其中,朴素贝叶斯(naive bayes,nb)是一种基于概率统计和贝叶斯定理的分类算法,其在贝叶斯算法的基础上进行了相应的简化,即假定给定目标值时属性之间相互条件独立,没有哪个属性变量对于决策结果来说占有着较大的比重,也没有哪个属性变量对于决策结果占有着较小的比重。通过这种方式极大地简化了贝叶斯方法的复杂性,且由于其简单、高效、具备坚实的数学基础等优点,目前已经被广泛应用于各种真实世界的分类问题中。
62.在使用朴素贝叶斯算法时,通常都是直接利用朴素贝叶斯算法构建机器学习模型。然而,企业授信分析场景的样本量通常较小,在小样本的情况下,由于出现的样本量组合数目较少,导致朴素贝叶斯算法的条件概率估计往往并不准确,从而在一定程度上降低模型的分类性能。
63.为了提高分类性能,本发明中,通过构建初始模型,用分类错误的训练样本来反复迭代调整条件概率,提高条件概率估计的准确性,从而获得更高的模型分类性能,解决了企业授信分析场景中样本量较少导致的条件概率估计不准确问题。
64.具体的,本发明提供了一种授信数据的确定方法、装置及电子设备,获取授信基础
数据,并对所述授信基础数据进行数据预处理操作,得到目标基础数据,将所述目标基础数据输入预先生成的授信数据分析模型中,得到授信分析结果。本发明中的授信数据分析模型基于训练得到,并且在训练后的测试过程中,若是授信测试样本的实际授信分析结果与参考授信分析结果不同时,会增大所述授信测试数据样本属于所述参考授信分析结果的条件概率,降低所述授信测试数据样本属于所述实际授信分析结果的条件概率,并对模型进行再训练,使得训练得到的模型的精度较高。则使用该模型进行授信分析时,得到的授信分析结果的准确度也会较高,能够满足企业授信分析需求。
65.需要说明的是,本发明提供的一种授信数据的确定方法、装置及电子设备可用于人工智能领域或金融领域。上述仅为示例,并不对本发明提供的一种授信数据的确定方法、装置及电子设备的应用领域进行限定。
66.在上述内容的基础上,参照图1,一种授信数据的确定方法,可以包括:
67.s11、获取授信基础数据,并对所述授信基础数据进行数据预处理操作,得到目标基础数据。
68.本实施例中的授信基础数据可以包括:企业历史能耗数据和财务数据,企业历史能耗数据和财务数据中包括多个属性的属性值。如财务数据包括主营业收入、存货、固定资产等属性的属性值。企业历史能耗数据包括水电气等属性的属性值。
69.在获取到授信基础数据之后,为了保证授信基础数据的准确性,需要对授信基础数据进行数据预处理操作,得到目标基础数据。
70.参照图2,“对所述授信基础数据进行数据预处理操作,得到目标基础数据”,可以包括:
71.s21、确定出所述授信基础数据中的属性的缺失值。
72.具体的,上述的各个属性的属性值中,可能有部分属性的属性值缺失,如主营业收入仅有1-11月份的数据,缺失12月份的数据,此时,12月份的主营业收入即为确定出的缺失值。
73.s22、基于所述授信基础数据中的属性的非缺失值的众数或均值,对所述缺失值进行填充操作。
74.具体的,使用该属性中非缺失的属性值的众数(名词性属性)或均值(数值型属性)填充。
75.如将1-11月份的主营业收入的众数,作为12月份的主营业收入。
76.s23、对所述授信基础数据中的属性的数值型数据进行离散化操作,得到目标基础数据。
77.具体的,将数值型属性离散化:采用10段等宽离散化的方式,即取该数值型属性的最大值和最小值,平均等分10份,将数值属性离散化成a、b、...、i、j。本实施例中,对于数值型属性,对其进行离散化,使得模型对数据数据的拟合程度更高。
78.s12、将所述目标基础数据输入预先生成的授信数据分析模型中,得到授信分析结果。
79.本实施例中的,授信数据分析模型可以是机器学习模型,如朴素贝叶斯模型。授信数据分析模型能够分析得到授信分析结果:经营良好或经营较差。
80.在实际应用中,授信数据分析模型基于训练生成,参照图3,所述授信数据分析模
型的训练过程包括:
81.s31、获取授信训练样本和授信测试样本。
82.所述授信训练样本包括授信训练数据样本以及所述授信训练数据样本对应的参考授信分析结果;所述授信测试样本包括授信测试数据样本以及所述授信测试数据样本对应的参考授信分析结果。
83.在实际应用中,可以获取多个训练实例,每个训练实例包括企业历史能耗数据和财务数据,人工分析企业历史能耗数据和财务数据,对每一家企业的信用进行分类(经营良好或经营较差),信用分类结果即为参考授信分析结果。
84.然后,将上述的训练实例分为授信训练样本和授信测试样本,如按照7:3的比例分为授信训练样本和授信测试样本。
85.授信训练样本中的训练实例称为授信训练数据样本,训练实例的参考授信分析结果,即为授信训练数据样本对应的参考授信分析结果。
86.授信测试样本中的训练实例称为授信测试数据样本,训练实例的参考授信分析结果,即为授信测试数据样本对应的参考授信分析结果。
87.s32、基于所述授信训练样本,对朴素贝叶斯模型进行训练,得到初始授信数据分析模型。
88.在实际应用中,步骤s32包括:
89.1)计算所述授信训练数据样本的先验概率和条件概率。
90.具体的,采用下述的公式1,计算授信训练数据样本的先验概率p(c),采用下述的公式2,计算所述授信训练数据样本的条件概率p(aj|c)。
[0091][0092][0093]
其中,公式1和2中,c表示类别,即经营良好或经营较差,ci表示第i个训练实例的类别,即参考授信分析结果,aj表示训练实例的第j个属性值,a
ij
表示第i个训练实例的第j个属性值,q表示类别总数,n表示训练实例数,nj表示第j个属性的属性值总数。
[0094]
2)基于所述授信训练数据样本的先验概率、条件概率和参考授信分析结果,对朴素贝叶斯模型进行训练,得到初始授信数据分析模型。
[0095]
在计算得到所述授信训练数据样本的先验概率和条件概率后,结合授信训练数据样本的参考授信分析结果,用公式3(朴素贝叶斯模型)对授信训练数据样本进行分类,使得训练得到的模型的分类结果与授信训练数据样本的参考授信分析结果相同,即可得到初始授信数据分析模型。
[0096]
公式3为:
[0097][0098]
其中,c(x)nb表示训练实例x的预测类别,c表示类别c的可取值集合,即为经营良好或经营较差,m表示属性个数,p(c)为先验概率,p(aj|c)为条件概率,j为第j个属性值。
[0099]
s33、调用所述初始授信数据分析模型对所述授信测试数据样本进行分析,得到所述授信测试数据样本的实际授信分析结果。
[0100]
在使用授信训练数据样本训练得到初始授信数据分析模型之后,需要使用授信测试数据样本验证模型的分类准确性。此时,可以调用所述初始授信数据分析模型对所述授信测试数据样本进行分析,得到所述授信测试数据样本的实际授信分析结果。实际授信分析结果可以为经营良好或经营较差。
[0101]
s34、在所述授信测试数据样本的实际授信分析结果与参考授信分析结果不同的情况下,增大所述授信测试数据样本属于所述参考授信分析结果的条件概率,以及降低所述授信测试数据样本属于所述实际授信分析结果的条件概率。
[0102]
具体的,在授信测试数据样本的实际授信分析结果与参考授信分析结果时,说明,授信测试数据样本属于所述参考授信分析结果的条件概率较小,此时应该增加该条件概率,此外,所述授信测试数据样本属于所述实际授信分析结果的条件概率较大,应该减少该条件概率。
[0103]
则,参照图4,步骤s34可以包括:
[0104]
s41、获取条件概率调整公式。
[0105]
所述条件概率调整公式包括第一条件概率调整公式和第二条件概率调整公式。
[0106]
所述第一条件概率调整公式用于计算所述授信测试数据样本属于所述参考授信分析结果的增大后的条件概率。第一条件概率调整公式参照公式4,具体为:
[0107]
δ(aj,c
actu
)=η
·
(2
·
p

max
(aj|c
actu
)-p

(aj|c
actu
))
·
error
ꢀꢀꢀꢀ
(4)
[0108]
所述第二条件概率调整公式用于计算所述授信测试数据样本属于所述实际授信分析结果的减少后的条件概率。第二条件概率调整公式参照公式5,具体为:
[0109]
δ(aj,c
pred
)=η
·
(2
·
p

(aj|c
pred
)-p

min
(aj|c
pred
))
·
error
ꢀꢀꢀꢀ
(5)
[0110]
其中,
[0111]
error=p(c
pred
|ti)-p(c
actu
|ti)
ꢀꢀꢀꢀ
(6)
[0112]
在实际应用中,被分类错误的训练实例,利用公式4提高其属于真实类别(即参考授信分析结果)的条件概率,利用公式5降低其属于预测类别(即实际授信分析结果)的条件概率。
[0113]
其中,η表示学习率,取值在[0,1]之间,默认值0.01,c
pred
表示模型得到的预测类别,即实际授信分析结果,c
actu
表示训练实例的真实类别,即参考授信分析结果,p(c
pred
|ti)表示第i个训练实例ti预测为c
pred
类别的概率,p(c
actu
|ti)表示第i个训练实例ti预测为c
actu
类别的概率,p

max
(aj|c
actu
)表示在给定类别为c
actu
的条件下,条件概率最大的属性值aj对应的条件概率,p

min
(aj|c
pred
)表示在给定类别为c
pred
的条件下,条件概率最小的属性值aj对应的条件概率。p

(aj|c
pred
)表示在给定类别为c
pred
的条件下,属性值aj的条件概率。p

(aj|c
actu
)表示在给定类别为c
actu
的条件下,属性值aj的条件概率。δ(aj,c
actu
)和δ(aj,c
pred
)分别表示真实类c
actu
和预测类c
pred
的第j个属性对应的属性值aj在本轮迭代的条件概率调整值。
[0114]
s42、根据所述第一条件概率调整公式,计算所述授信测试数据样本属于所述参考授信分析结果的增大后的条件概率。
[0115]
s43、根据所述第二条件概率调整公式,计算所述授信测试数据样本属于所述实际
授信分析结果的减少后的条件概率。
[0116]
在获取到上述的第一条件概率调整公式和第二条件概率调整公式后,使用这两个公式计算得到调整后的条件概率即可。
[0117]
s35、至少基于所述授信测试数据样本属于所述参考授信分析结果的条件概率和属于所述实际授信分析结果的条件概率,对所述初始授信数据分析模型进行迭代训练,得到授信数据分析模型。
[0118]
具体的,至少基于所述授信测试数据样本属于所述参考授信分析结果的条件概率和属于所述实际授信分析结果的条件概率,对所述初始授信数据分析模型进行迭代训练,并在迭代训练过程中,将训练得到的分类精度最大的初始授信数据分析模型,作为授信数据分析模型。
[0119]
详细来说,可以基于所述授信测试数据样本属于所述参考授信分析结果的条件概率、属于所述实际授信分析结果的条件概率以及按照上述相应计算方式计算得到的先验概率,对所述初始授信数据分析模型进行迭代训练,并在迭代训练过程中,将训练得到的分类精度最大的初始授信数据分析模型,作为授信数据分析模型。
[0120]
在实际应用中,概率调整是通过迭代的方式,利用前一轮训练的模型,来依次预测每个训练实例,如果预测错误,则增大其所属真实类的概率,减小其所属预测类的概率。最后,直到分类精度不再提高时,就停止对条件概率的调整。通过这种方式,可以缓解朴素贝叶斯中,条件概率估计不准确的问题,尤其是当训练样本数目不足时,仅仅依靠训练样本本身构建的初始朴素贝叶斯模型,更难以准确的进行条件概率。而通过对概率的不断调整,可以使得构建的模型更加逼近真实的条件概率,从而提高分类性能。
[0121]
当本轮概率调整后构建的模型,训练分类精度高于前一轮构建的模型时,概率调整将反复迭代进行。否则,停止迭代。构建出最终的,即分类精度最大的朴素贝叶斯模型,即授信数据分析模型,授信数据分析模型的内容仍参照公式3。
[0122]
在得到授信数据分析模型后,在后续需要进行授信分析时,即可将需要分析的基础数据输入到授信数据分析模型中,即可得到最终的授信分析结果。
[0123]
如当新的贷款申请提交时,通过最终的授信数据分析模型,得到该企业的经营情况分类,为金融授信分析提供有效的数据支持,同时克服了现有方法在条件概率估计准确性方面的不足,从而进一步提高朴素贝叶斯算法在企业授信分析预测场景下的分类性能。
[0124]
本实施例中,获取授信基础数据,并对所述授信基础数据进行数据预处理操作,得到目标基础数据,将所述目标基础数据输入预先生成的授信数据分析模型中,得到授信分析结果。本发明中的授信数据分析模型基于训练得到,并且在训练后的测试过程中,若是授信测试样本的实际授信分析结果与参考授信分析结果不同时,会增大所述授信测试数据样本属于所述参考授信分析结果的条件概率,降低所述授信测试数据样本属于所述实际授信分析结果的条件概率,并对模型进行再训练,使得训练得到的模型的精度较高。则使用该模型进行授信分析时,得到的授信分析结果的准确度也会较高,能够满足企业授信分析需求。
[0125]
可选地,在上述授信数据的确定方法的实施例的基础上,本发明的另一实施例提供了一种授信数据的确定装置,参照图5,包括:
[0126]
数据处理模块11,用于获取授信基础数据,并对所述授信基础数据进行数据预处理操作,得到目标基础数据;
[0127]
授信分析模块12,用于将所述目标基础数据输入预先生成的授信数据分析模型中,得到授信分析结果;所述授信数据分析模型为模型训练模块生成;
[0128]
所述模型训练模块包括:
[0129]
样本获取子模块,用于获取授信训练样本和授信测试样本,所述授信训练样本包括授信训练数据样本以及所述授信训练数据样本对应的参考授信分析结果;所述授信测试样本包括授信测试数据样本以及所述授信测试数据样本对应的参考授信分析结果;
[0130]
第一训练子模块,用于基于所述授信训练样本,对朴素贝叶斯模型进行训练,得到初始授信数据分析模型;
[0131]
结果分析子模块,用于调用所述初始授信数据分析模型对所述授信测试数据样本进行分析,得到所述授信测试数据样本的实际授信分析结果;
[0132]
概率调整子模块,用于在所述授信测试数据样本的实际授信分析结果与参考授信分析结果不同的情况下,增大所述授信测试数据样本属于所述参考授信分析结果的条件概率,以及降低所述授信测试数据样本属于所述实际授信分析结果的条件概率;
[0133]
第二训练子模块,用于至少基于所述授信测试数据样本属于所述参考授信分析结果的条件概率和属于所述实际授信分析结果的条件概率,对所述初始授信数据分析模型进行迭代训练,得到授信数据分析模型。
[0134]
进一步,所述数据处理模块包括:
[0135]
缺失值确定子模块,用于确定出所述授信基础数据中的属性的缺失值;
[0136]
缺失值填充子模块,用于基于所述授信基础数据中的属性的非缺失值的众数或均值,对所述缺失值进行填充操作;
[0137]
离散化操作子模块,用于对所述授信基础数据中的属性的数值型数据进行离散化操作,得到目标基础数据。
[0138]
进一步,所述第一训练子模块具体用于:
[0139]
计算所述授信训练数据样本的先验概率和条件概率,基于所述授信训练数据样本的先验概率、条件概率和参考授信分析结果,对朴素贝叶斯模型进行训练,得到初始授信数据分析模型。
[0140]
进一步,所述概率调整子模块包括:
[0141]
公式获取单元,用于获取条件概率调整公式;所述条件概率调整公式包括第一条件概率调整公式和第二条件概率调整公式;所述第一条件概率调整公式用于计算所述授信测试数据样本属于所述参考授信分析结果的增大后的条件概率;所述第二条件概率调整公式用于计算所述授信测试数据样本属于所述实际授信分析结果的减少后的条件概率;
[0142]
第一计算单元,用于根据所述第一条件概率调整公式,计算所述授信测试数据样本属于所述参考授信分析结果的增大后的条件概率;
[0143]
第二计算单元,用于根据所述第二条件概率调整公式,计算所述授信测试数据样本属于所述实际授信分析结果的减少后的条件概率。
[0144]
进一步,第二训练子模块具体用于:
[0145]
至少基于所述授信测试数据样本属于所述参考授信分析结果的条件概率和属于所述实际授信分析结果的条件概率,对所述初始授信数据分析模型进行迭代训练,并在迭代训练过程中,将训练得到的分类精度最大的初始授信数据分析模型,作为授信数据分析
模型。
[0146]
本实施例中,获取授信基础数据,并对所述授信基础数据进行数据预处理操作,得到目标基础数据,将所述目标基础数据输入预先生成的授信数据分析模型中,得到授信分析结果。本发明中的授信数据分析模型基于训练得到,并且在训练后的测试过程中,若是授信测试样本的实际授信分析结果与参考授信分析结果不同时,会增大所述授信测试数据样本属于所述参考授信分析结果的条件概率,降低所述授信测试数据样本属于所述实际授信分析结果的条件概率,并对模型进行再训练,使得训练得到的模型的精度较高。则使用该模型进行授信分析时,得到的授信分析结果的准确度也会较高,能够满足企业授信分析需求。
[0147]
需要说明的是,本实施例中的各个模块、子模块和单元的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
[0148]
可选地,在上述授信数据的确定方法及装置的实施例的基础上,本发明的另一实施例提供了一种电子设备,包括:存储器和处理器;
[0149]
其中,所述存储器用于存储程序;
[0150]
处理器调用程序并用于执行上述的授信数据的确定方法。
[0151]
本实施例中,获取授信基础数据,并对所述授信基础数据进行数据预处理操作,得到目标基础数据,将所述目标基础数据输入预先生成的授信数据分析模型中,得到授信分析结果。本发明中的授信数据分析模型基于训练得到,并且在训练后的测试过程中,若是授信测试样本的实际授信分析结果与参考授信分析结果不同时,会增大所述授信测试数据样本属于所述参考授信分析结果的条件概率,降低所述授信测试数据样本属于所述实际授信分析结果的条件概率,并对模型进行再训练,使得训练得到的模型的精度较高。则使用该模型进行授信分析时,得到的授信分析结果的准确度也会较高,能够满足企业授信分析需求。
[0152]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1