一种基于超图对比学习的金融违约风险预测方法

文档序号:35027943发布日期:2023-08-05 15:48阅读:41来源:国知局
一种基于超图对比学习的金融违约风险预测方法

本发明涉及金融违约预测,尤其是涉及一种基于超图对比学习的金融违约风险预测方法。


背景技术:

1、我国资本市场的融资功能不断完备,发行债券逐渐成为企业融资的重要渠道,投资人数量逐渐增加,债券市场在金融市场中的地位日益重要。信用是金融市场有序运转和经济稳健发展的重要基础,也是信用债的发行基础。及时预测发债企业的信用违约风险显得尤为重要。

2、企业的违约风险预测问题中,通常将企业分为两类,一类为违约状态,一类为非违约状态,即是二分类问题。现有的风险预测方法可以大致分为基于统计的方法和基于机器学习的方法。与其他分类问题相比,在风险预测场景中,最重要的违约样本在全体样本中所占比例较小,相对于准确率,代表着正确预测出违约样本占比的召回率更值得关注。

3、经典的基于统计的方法大多应用逻辑回归方法,通过企业的财务指标数据构建逻辑回归模型预测企业的违约概率。逻辑回归模型在信用风险评估过程中,不仅可以判断企业属于哪一种状态,还可以对企业出现违约情况的概率进行评估。以逻辑回归为代表的统计学方法以财务指标数据分析为主,对违约风险的预测准确率不足。预测模型适用的数据必须服从一定的分布,并且变量之间需要存在线性相关关系。企业财务数据直接由于情景变量和风险因素存在非线性关系,随着机器学习的逐渐发展与债券市场数据规模的急速扩大、数据形式的多样化,早期的基于统计的方法在违约风险预测的适用性上已出现不足。

4、基于机器学习的方法主要包括支持向量机、随机森林和神经网络。其中支持向量机的准确率较高但难以处理大规模数据,随机森林由多个决策树组成,能够处理大样本的高维数据,但在大规模数据集上的效果表现不如神经网络。数据规模与数据形式的变化使得基于神经网络的方法得到了较为长足的发展。越来越多的研究者试图引入形式更加多样的非企业财务数据,应用神经网络模型学习多种数据间的非线性关系,进而实现更为精准的预测。一些工作取得了很好的效果。bp神经网络模型和基于mlp的神经网络模型首先被引入违约风险预测领域,对发债企业进行信用风险的评估。但是普通的神经网络模型只能处理非欧数据,不能对现实世界中市场主体间复杂的关系进行建模表示。

5、基于transformer的风险预测方法采用构建复杂网络的方法,来描绘市场主体之间的关系。利用企业的股东关系构建复杂网络,利用transformer模型将复杂网络嵌入到特征空间得到企业向量表示。最后将企业向量表示输入到深度神经网络进行违约风险预测。但基于transformer的方法难以处理相对稀疏的网络结构,并且很难准确描述市场主体间形成的高维关系信息。

6、综上,现有的金融违约风险预测方法主要存在以下的不足:

7、(1)传统的统计学方法要求数据服从一定的分布,且变量间存在线性关系。

8、(2)支持向量机难以用于大规模数据集,而随机森林的方法在大量数据上的性能较低,并且都需要对特征进行预处理,无法重复利用日益丰富的数据形式。

9、(3)普通神经网络在大规模数据上泛用能力强,但不具备处理非欧数据的能力,transformer能够处理图结构的非欧数据,但不足以准确描述金融市场主体间的多元高维关系。

10、因此,如何充分利用规模庞大、结构复杂、种类多样的数据进行违约风险预测,并且尽可能地提高预测的准确率和召回率,成为当前研究的关键问题。


技术实现思路

1、本发明的目的是提供一种基于超图对比学习的金融违约风险预测方法,解决上述背景技术中提出的问题。

2、为实现上述目的,本发明提供了一种基于超图对比学习的金融违约风险预测方法,包括以下步骤:

3、步骤1,获取发债企业的基本数据、是否违约情况和发债企业之间的关联关系;

4、步骤2,根据发债企业基本数据生成企业初始特征矩阵和负样本特征矩阵,根据发债企业间关联关系,构建超图,得到超图点边关联矩阵,计算超图节点度矩阵和超边度矩阵,得到超图拉普拉斯矩阵;

5、步骤3,基于超图拉普拉斯矩阵,将企业初始特征矩阵和负样本特征矩阵输入超图卷积网络层,得到企业表征矩阵和负样本表征矩阵;

6、步骤4,基于企业表征矩阵生成全图表征向量,基于对比损失和分类损失进行联合训练,完成对企业违约风险的预测。

7、优选的,步骤1中,发债企业主体为在债券市场发行过债券的主体,发债企业基本数据包括企业的工商信息及财务报表信息,发债企业关联关系包括企业间的股东关系、对外投资关系、控股关系、上游供应商关系和下游客户关系。

8、优选的,步骤2中:

9、步骤21,根据发债企业间关联关系,构建以发债企业作为节点,关联关系作为超边的超图;

10、步骤22,根据发债企业的基础数据及超图数据,对发债企业数据集合中的数据进行id编号,对超图中的超边进行id编号,初始化超图点边关联矩阵并根据超边数据对初始化矩阵进行填充,得到超图点边关联矩阵h;

11、步骤23,根据发债企业基础数据生成企业初始特征矩阵x和负样本特征矩阵

12、步骤24,根据超图点边关联矩阵h计算节点度矩阵dv和超边度矩阵de,并得到超图拉普拉斯矩阵l。

13、优选的,步骤22中:

14、步骤221,初始化一个维度为企业数量*超边数量的初始超图点边关联矩阵;

15、步骤222,对初始超图点边关联矩阵进行填充,将具有id编号的企业数据和具有id编号的超边数据作为初始化矩阵的行标和列标;若具有id编号为i的企业存在于具有id编号为j的超边中,则在初始化矩阵的第i行第j列位置的值为第一参数,否则为第二参数,公式如下:

16、

17、其中,v代表节点,e代表超边。

18、优选的,步骤23中:

19、步骤231,对发债企业基础数据中数值型数据进行归一化作为特征,时间数据转换为时间戳后进行归一化作为特征,非数值型数据按照出现频率进行编码转换为数值后进行归一化作为特征;

20、步骤232,生成维度为发债企业数量*总特征数量的企业初始特征矩阵x,其中第i行第j列为id为i的企业的第j维特征;

21、步骤233,随机扰乱初始特征矩阵x的行号顺序,得到负样本特征矩阵

22、优选的,步骤24中:

23、步骤241,分别对节点度矩阵dv和超边度矩阵de进行初始化,且dv的维度与超图点边关联矩阵h的行数相同,de的维度与超图点边关联矩阵h的列数相同;

24、步骤242,分别对超图点边关联矩阵h中每行的数值进行相加,获得多个行向量,将多个行向量依次添加到初始化后的dv中,实现对dv的计算;

25、步骤243,分别对超图点边关联矩阵h中每列的数值进行相加,获得多个列向量,将多个列向量依次添加到初始化后的de中,实现对de的计算;

26、步骤244,基于超图点边关联矩阵h、节点度矩阵dv和超边度矩阵de,通过计算得出超图的标准化拉普拉斯矩阵,对应的计算公式表示为:

27、

28、其中ht是超图点边关联矩阵的转置,w是边权重矩阵,hwde-1ht是超图的邻接矩阵,i是维度为发债企业数量的单位矩阵,主对角线上的元素都为1,其余元素全为0。

29、优选的,步骤3中:

30、步骤31,基于超图的标准化拉普拉斯矩阵l,通过计算得出企业表示传播序列:

31、φ={x(i)|0≤i≤k}

32、

33、其中,φ代表企业表示传播序列;k代表传播轮次;x(i)代表第i个传播轮次所对应的传播结果,θ是超图卷积核参数矩阵,σ是relu激活函数,

34、

35、步骤32,分别将企业初始特征矩阵x和负样本特征矩阵输入超图卷积网络层,分别令x(0)=x和得到企业表征矩阵xcom和负样本表征矩阵xneg,表征矩阵中每一行为一个企业的表征向量:

36、优选的,步骤4中:

37、步骤41,基于企业表征矩阵xcom通过聚合函数计算得出图层面的全图表征向量g:

38、

39、其中聚合函数σ是sigmoid激活函数:

40、

41、步骤42,基于对比损失和分类损失进行联合训练,完成对企业违约风险的预测。

42、优选的,步骤42中:

43、步骤421,将企业表征矩阵xcom输入多层感知机中,获得每个企业在违约分类上的得分,将得分与真实分类的交叉熵损失作为分类损失,分类损失lcls计算公式如下:

44、

45、其中lce代表交叉熵损失,c代表类别数,pi为真实值,qi为预测值;lcls代表分类损失,分类损失是对企业违约分类预测值的交叉熵,在分类损失中c代表的是企业的违约风险类别,p=[p1,...,pc]是一个c维向量,以one-hot形式的当前企业真实风险类别,当企业风险类别为n时第n维为1,其他维为0;p=[p1,...,pc],qi为多层感知机预测输出的当前企业属于风险类别i的概率;

46、步骤422,分别将企业表征矩阵xcom和全图表征向量g、负样本表征矩阵xneg和全图表征向量g输入判别器,计算对比损失;企业表征矩阵xcom中每一行的企业向量与g互为正样本对,负样本表征矩阵xneg中每一行的企业向量与g互为负样本对,判别器对每一个正样本对和每一个负样本进行判别,以二元交叉熵作为对比损失;

47、步骤423,根据对比损失和分类损失联合对整体模型进行联合训练,直到损失趋于稳定时停止训练,最终多层感知机输出的违约分类中得分最高的项为最终预测结果。

48、因此,本发明采用上述基于超图对比学习的金融违约风险预测方法,具有以下有益效果:

49、本发明采用的方法能够将金融市场中发债企业间复杂的关联关系转化为仅包含企业结点的同质超图数据,减少信息的丢失,并使用对比学习的方法更有效地学习隐藏的超图结构信息,能够提高金融违约风险的预测效果。

50、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1