本发明属于机器学习及企业风控领域,具体涉及一种基于变分自编码器的企业资金链风险判定方法。
背景技术:
1、随着经济技术的发展,企业将面临着各种各样的经营风险。资金链风险是一种常见的企业经营风险。随着市场竞争的加剧,资金链风险已经逐步成为了企业经营过程中所面临的最重要的风险之一。
2、为了防范和化解资金链风险,企业通常需要及时识别和预测资金缺口,从而制定相应的风险控制措施。目前,传统的企业资金链风险判定方法,依旧依赖于企业的财务报表和财务指标,即企业财务人员根据自身的经验和技术背景,根据企业的财务报表和财务指标,人为的对企业的资金链风险进行预测和判定。但是,明显的,现有的人工判定的方式,不仅费时费力,而且主观性高,缺乏高效且客观科学的企业资金链的风险判定方案。
技术实现思路
1、本发明的目的在于提供一种可靠性高、准确性好且客观科学的基于变分自编码器的企业资金链风险判定方法。
2、本发明提供的这种基于变分自编码器的企业资金链风险判定方法,包括如下步骤:
3、s1. 获取企业历史财务数据信息;
4、s2. 根据步骤s1获取的数据信息,基于财务指标索引和财务指标数据构建二维财务数据矩阵,从而得到训练数据集;
5、s3. 基于卷积神经网络模型和变分自编码器模型,构建企业资金链风险判定模型;
6、s4. 采用步骤s2得到的训练数据集,对步骤s3构建的企业资金链风险判定模型进行训练,得到训练后的企业资金链风险判定模型;
7、s5. 将目标企业的实际财务数据信息,输入到步骤s4得到的训练后的企业资金链风险判定模型,得到资金链缺口数据;
8、s6. 根据步骤s5得到的资金链缺口数据,进行企业资金链风险的判定。
9、所述的步骤s2,具体包括如下步骤:
10、构建二维财务数据矩阵 x为,其中元素 x i,j表示第 i个财务指标所对应的第 j个时间段的取值; n为财务指标索引的总数; m为时间段的总数。
11、所述的步骤s3,具体包括如下步骤:
12、所述的企业资金链风险判定模型包括资金链特征提取模型和资金链风险判定模型;
13、所述的资金链特征提取模型基于低秩卷积神经网络构成,用于从输入的二维财务数据矩阵中提取得到企业的资金链特征数据;
14、所述的资金链风险判定模型基于变分自编码器构成,用于根据输入的资金链特征数据,对企业的资金链风险程度和风险类型进行判定。
15、所述的步骤s3,具体包括如下内容:
16、资金链特征提取模型:
17、基于低秩卷积神经网络构建资金链特征提取模型;资金链特征提取模型包括第一卷积层、第二卷积层、最大池化层和全连接层,并采用relu函数作为激活函数;其中,第一卷积层的通道数为32,第二卷积层的通道数为64;
18、对两个卷积层的卷积核均进行svd分解:卷积层的输入为,卷积核为,则将卷积核 w分解为第一矩阵、第二矩阵和第三矩阵的乘积;其中,表示 x为 n× m的实数矩阵,表示 w为 h× w的实数矩阵, h为卷积核的高度, w为卷积核的宽度, r为奇异值的个数,表示 u为 h× r的实数矩阵,表示 x为 r× r的实数矩阵,表示 v t为 r× r的实数矩阵;
19、将第二卷积层的输出通过最大池化层进行特征融合,并将融合后的特征采用全连接层进行展平,从而得到最终的资金链特征向量 f;
20、资金链特征提取模型的计算过程表示为:
21、 f=fc( maxpool( conv svd( x)));
22、式中 conv svd()为低秩卷积神经网络的处理函数; maxpool()为最大池化层的处理函数; fc()为全连接层的处理函数;最终得到的资金链特征向量 f为长度为128的特征向量;
23、资金链风险判定模型:
24、基于变分自编码器构建资金链风险判定模型;资金链风险判定模型包括编码器和解码器;
25、编码器包括一个均值网络和一个方差网络,均值网络和方差网络均采用全连接神经网络结构;均值网络用于生成潜在表示的均值,方差网络用于生成潜在表示的方差;编码器的计算过程表示为:
26、;
27、其中 z为潜在表示,也为编码器的输出量; μ为均值网络的输出值,且 μ= fc μ( f), fc μ()为均值网络的处理函数, f为资金链特征向量; ε为从标准正态分布中采样得到的噪声向量; σ2为方差;为方差网络的输出值,且, fc σ()为方差网络的处理函数;
28、解码器包括一个全连接层结构,用于生成预测的资金链缺口;解码器的计算过程表示为:
29、;
30、式中 decoder()为解码器的处理函数。
31、步骤s4所述的训练,具体包括如下步骤:
32、训练时,通过最小化预测误差和最小化潜在表示的正则优化项,实现对企业资金链风险判定模型中参数的优化;
33、训练时,采用如下函数作为损失函数 loss:
34、;
35、式中mse()为求均方差函数; g为实际的资金链缺口;为预测的资金链缺口; β为正则化参数;kl()为kl散度计算函数; q e( z| f)为编码器的概率分布; z为潜在表示; f为资金链特征向量; p( z)为先验分布;
36、采用梯度下降算法来最小化损失函数 loss,并更新模型参数;梯度下降算法的更新规则表示为:
37、;
38、式中 w t+1为第 t+1轮迭代的模型参数; w t为第 t轮迭代的模型参数; α为学习率;为损失函数 loss对模型参数 w t的偏导数;采用反向传播算法来计算损失函数对模型参数的偏导数,计算梯度并更新模型参数。
39、所述的步骤s6,具体包括如下步骤:
40、a. 根据得到的预测的资金链缺口,采用如下规则进行企业资金链风险程度的判定:
41、若,则判定企业资金链的风险程度为“高”; τ为设定的风险程度阈值;
42、否则,则判定企业资金链的风险程度为“低”;
43、b. 根据得到的预测的资金链缺口,采用如下步骤进行企业资金链风险类型的判定:
44、计算预测的资金链缺口与企业当前的财务指标向量 x'之间的相关性;
45、根据相关性,采用如下规则进行企业资金链风险类型的判定:
46、若,则判定企业资金链风险由企业内部问题导致;为设定的风险类型阈值;
47、否则,判定企业资金链风险由企业外部问题导致。
48、本发明提供的这种基于变分自编码器的企业资金链风险判定方法,基于低秩卷积网络对企业的财务数据进行处理,提取出企业资金链特征,再基于变分自编码器对企业的资金链缺口进行预测,并结合企业财务数据,实现了对企业资金链的风险程度和风险类型进行判定;因此本发明能够有效提高企业的风险识别和预测能力,而且可靠性高、准确性好且客观科学。