基于多关系重构与融合图神经网络的股价崩盘风险预测方法

文档序号:37557461发布日期:2024-04-09 17:49阅读:14来源:国知局
基于多关系重构与融合图神经网络的股价崩盘风险预测方法

本发明涉及金融科技,特别是一种基于多关系重构与融合图神经网络的股价崩盘风险预测方法。


背景技术:

1、股价崩盘通常指证券市场在短时间内发生大规模的股票抛售,导致证券价格急剧下跌的现象。股价崩盘风险的本质被认为是由于价格泡沫的破裂。在不完全成熟的市场中,股票价格并不总是实时或合理地反映上市公司的基本资产估值。相反,这些价格往往受到分析师和交易者对信息解读的主观影响,这导致股价估值预期偏差,并形成正面的价格泡沫。随着这些正向价格泡沫的累积,证券市场的市场价格与合理估值之间的偏差也在增大。一旦外部刺激触发了正向价格泡沫的破裂,就容易引发投资者恐慌性抛售,从而导致股价崩盘,甚至可能触发系统性风险。

2、在传统经济学领域,对上市公司股价崩盘风险的研究主要集中于识别特定特征与崩盘风险之间的因果关系,即确定与崩盘风险最密切相关的影响因素。研究发现,具有高收益率、高收益率偏差、投资者评价高方差等特征的上市公司可能面临更大的股价崩盘风险。此外,一些学者开始关注崩盘风险分析模型的构建与优化,借鉴其他研究领域的经验,提高对上市公司股灾风险的预测精度,包括流行病型余震序列模型(etas)、债券-股票收益差异模型(bseyd)、对数周期幂律模型(lppl)等。

3、另一个相关领域是图神经网络,图神经网络(gnn)的出现为研究基于图数据结构的数据提供了一个新的视角。在金融领域,考虑到金融数据产生的图结构的复杂性,gnn模型被广泛应用于预测和分析金融风险任务。gnn模型将企业视为图中的节点,企业间的关系视为边,通过聚合相邻节点的信息来预测企业风险的变化。本质上,企业间存在众多影响企业风险的关系,这些关系对公司产生综合影响。

4、目前的现有技术是利用gnn模型来预测和分析金融风险,特别是在股价崩盘风险的研究领域。这些模型将整个股票概念化为一个网络图,其中公司作为节点,通过代表动量溢出的边互相连接。然而,大多数现有研究并没有深入分析股价崩盘风险,特别是忽略了公司间关系和关系互动的重要性。当前的实现方案涉及到以下几个关键方面:

5、(1)单一关系图神经网络:现有技术中,许多研究利用gnn来分析金融市场,尤其是股价波动和崩盘风险。这些研究通常构建以公司为节点、以公司间的单一类型关系(如行业联系、共同股东关系等)为边的图模型,然后利用gcn,gat等图神经网络对其进行建模。

6、(2)多关系图神经网络:由于在真实的市场环境中,公司之间是存在多种关系的,因此,一些较新的研究开始探索使用多关系图神经网络(例如,r-gcn、r-gat等)。这些模型试图通过将企业间的多种关系(如供应链关系、投资关系等)融合到图模型中来提高分析的精确度和深度。

7、而现有的gnn模型在应用于股价崩盘风险研究时面临若干挑战。首先,虽然存在许多上市公司间的关系,但一些难以捕捉和定义的隐性关系往往无法被获取,只考虑几种预定义关系会导致信息丢失。一些研究人员利用上市公司的历史信息推断出相应股票之间的隐含关系,但只能推断单一的隐式关系,忽略了显式关系和隐式关系的多样性。其次,这些关系在信息传播过程中并非独立的,而是相互作用的。例如,如果两家公司同时具有行业相似性和供应链联系,它们可能处于既竞争又合作的双重状态。所以,当一家公司的股价变化时,它对另一家公司的影响不是简单的加法,而是需要通过多种关系之间的复杂相互作用共同反映。现有的多关系图神经网络未能有效利用关系之间的相关性,也忽视了不同关系的语义,从而降低了节点嵌入的表达能力。

8、总的来说,现有的图神经网络(gnn)模型在股价崩盘风险研究中的主要缺点包括:1.难以捕捉和定义隐性关系,导致信息丢失;2.以及未能有效利用关系间的相关性和忽视不同关系的语义,降低了模型的表达能力。


技术实现思路

1、为解决现有技术中存在的问题,本发明的目的是提供一种基于多关系重构与融合图神经网络的股价崩盘风险预测方法,本发明将gnn模型引入上市公司股价崩盘风险研究,通过合理建模其图结构关系,来探究上市公司股价崩盘风险的运行趋势。

2、为实现上述目的,本发明采用的技术方案是:一种基于多关系重构与融合图神经网络的股价崩盘风险预测方法,包括以下步骤:

3、步骤1、将每只股票的时间序列数据输入长短期记忆lstm模型,捕捉股票的时间信息并生成序列嵌入;

4、步骤2、将序列嵌入和关系输入多关系重构mrr模块;多关系重构mrr模块首先对输入的关系进行编码,得到初始化的关系嵌入,然后利用关系嵌入进行图神经网络信息传播,接着进行多关系对比学习,利用显性关系重构企业间的隐性关系,最终得到重构后的显性和隐性关系编码以及企业节点嵌入;

5、步骤3、将重构后的显式关系、隐式关系和企业节点嵌入的编码输入多关系融合mrf模块;多关系融合mrf模块首先对每个关系图分别进行关系嵌入的图神经网络信息传播,然后使用关系自注意力机制对每个关系图内的关系之间的交互作用进行建模,计算关系的整体影响,从而得到企业节点的表示;

6、步骤4、将序列嵌入和企业节点表示法串联起来,输入输出映射om模块,用于预测股票暴跌风险。

7、作为本发明的进一步改进,在步骤1中,对于给定的公司i,以该公司的输入特征表示为vi,使用lstm来提取时序特征:

8、

9、作为本发明的进一步改进,所述步骤2具体包括以下步骤:

10、步骤2.1、关系嵌入:

11、初始关系嵌入:首先,对关系进行编码,假设有n种关系类型,n是一个超参数,其中有n1种显性关系和n2种隐性关系,采用全局关系嵌入层对关系进行编码,r表示r类型的关系:

12、rr=embedding(r)

13、动态关系嵌入:

14、首先将两个节点向量hi,hj经过图的信息传播后进行拼接,使用带边信息的gat作为图信息传播函数;表示关系r的动态嵌入,α表示节点间关系的强度,为可学习参数:

15、

16、

17、步骤2.2、多关系对比学习:

18、结合对比学习,利用显式关系来说明关系之间的分布和语义,从而指导基于显式关系的隐式关系的生成,通过数据增强来构建正反样本对:

19、d(f(x),f(x+)≤d(f(x),f(x-))

20、s(f(x),f(x+)≥s(f(x),f(x-))

21、f(x),f(x+)是相似的实例,f(x),f(x-)是不相似的实例;

22、将多关系图划分为多个关系子图,并在每个子图上使用关系嵌入进行图的信息传播,计算节点的隐藏状态,从而生成动态关系嵌入;将在相同关系空间下计算的关系嵌入视为相似实例,而在不同关系空间下计算的关系嵌入视为不相似实例;

23、假设在同一个关系图中,节点i和节点j之间的初始关系嵌入是节点i′和节点j′之间的动态关系嵌入是将它们视为相似的实例,目标是最大化的余弦距离;鉴于在同一个关系图中需要计算o(n2)阶数量级的计算量,将从关系嵌入中抽取部分关系嵌入:

24、

25、将同一图中不同节点的关系嵌入平均化,从而为关系r生成一个嵌入

26、

27、

28、假设存在n个显式关系,将最初n个推断出的隐式关系近似为显式关系,给定显式关系嵌入为rn∈n,其邻接矩阵为an∈n,最初n个隐式关系嵌入为rr∈n,其相关邻接矩阵为ar∈n.;最小化公式如下:

29、

30、基于对比学习的多关系重构的损失lr包括三个方面:最大化相似关系的距离、最小化不相似关系的距离、最小化推断出的显式关系与实际显式关系之间的距离。

31、作为本发明的进一步改进,所述步骤3具体包括以下步骤:

32、步骤3.1、带边信息的图注意力网络:

33、根据关系类型将主图分割成特定类型的子图,执行gnn信息传播,整合每个子图中的边缘信息,生成包含空间特征的节点嵌入:

34、

35、

36、

37、

38、其中,w是线性变换,hi,hj是节点向量,是节点i和节点j之间关系r的编码向量,αij是节点之间的权重,是进行信息传播后的向量;σ是leakrelu激活函数;为了确保gat注意机制学习过程的稳定性,采用多头注意方法:

39、

40、步骤3.2、多关系融合学习:

41、将不同关系的节点嵌入表示为hr,其中r代表关系类型;采用自注意力机制将不同关系中的节点类比为语言中的单词:

42、

43、

44、

45、其中,是关系类型r下和关系r′下节点的关系注意力分数,是它们的注意力权重,q,k,v是线性变换,mr是考虑了关系间交互的节点嵌入;

46、最后,将不同关系下考虑了关系间相互作用的节点内嵌累积起来,得到关系融合下的最终节点的嵌入;vφ是可训练参数:

47、

48、作为本发明的进一步改进,所述步骤4具体如下:

49、将关系融合后得到的节点嵌入与初始节点向量连接起来,然后使用全连接网络和softmax函数生成股票崩盘的概率,w′i,b′i是可训练参数:

50、

51、本发明的有益效果是:

52、本发明利用先进的图神经网络技术,结合金融市场的复杂性,为股价崩盘风险的分析和预测提供一个更加深入和全面的方法,提高对上市公司股价崩盘风险的预测准确性和理解深度,特别是通过开发和应用一种基于多关系图神经网络(gnn)的创新方法;具体包括:

53、(1)多维度关系的整合:本发明通过构建多关系图神经网络模型,综合考虑了上市公司之间多种类型的关系。这不仅包括显性关系,如行业联系和供应链关系,还包括难以捕捉的隐性关系,如市场信号驱动的关系。这种多维度的关系整合使模型能够更全面地理解和预测股票市场的动态。

54、(2)隐性关系的挖掘与融合:本发明采用先进的自监督学习和对比学习方法来识别和重构隐性关系。通过这种方法,模型能够从现有数据中挖掘出更深层次的市场动态,并将这些动态融入到预测模型中。

55、(3)复杂关系交互的高效处理:为了更好地处理不同关系间的复杂交互作用,本发明引入了自注意力机制。这种机制能够对不同关系的影响进行动态加权,从而更准确地反映和预测公司间复杂关系的相互影响。

56、综上,本发明有效解决了现有技术在处理股价崩盘风险分析时的主要问题,包括:隐性关系的捕捉难题,传统模型往往忽视或无法准确捕捉上市公司间的隐性关系。关系间复杂交互的挑战,现有技术中难以处理不同关系之间的复杂交互作用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1