一种时间序列股票数据的网络构建方法

文档序号:25421760发布日期:2021-06-11 21:33阅读:208来源:国知局
一种时间序列股票数据的网络构建方法

本发明属于金融数据处理方法的领域,具体涉及一种时间序列股票数据的网络构建方法。可以识别金融危机期间股票市场结构的显著差异,从而展示时间序列股票数据的变化过程。



背景技术:

股票价格常常被认为是金融市场经济活动的主要代表之一,它反映了每个人和公司之间的相互交易情况。不同金融实体之间的关联是一个复杂的随时间演化的过程,探索这个相互关联的动态变化过程揭示了金融市场的内在机制,吸引了来自不同领域的科学家。为了表达这样的相互关联过程,网络结构的工具被用来研究股票市场的时间序列价格。然而,现有的研究大多集中在金融网络的时间特性上,它们只介绍特定时期的全球信息。由于股票市场的变化具有很强的相关性,研究相互关联网络的结构特性,尤其是金融危机期间的拓扑结构特性具有非常重要的意义。



技术实现要素:

本发明的目的是提出一种时间序列股票数据的网络构建方法,在上市公司股票交易之间建立相关性联系,提出随时间发展网络结构变化的框架。

基于以上目的,本发明采用如下技术方案:

时间序列股票数据的网络构建,包括以下步骤:

步骤1、获取一组固定时间段内上市公司股票每日收盘价格;

步骤2、对收集到的每只上市公司每日股票收盘价格进行处理,计算每天收益率;

步骤3、用网络结构的方式表示每只股票收益率之间的相似性,其中网络的节点表示上市公司的股票,网络的边缘表示股票之间的相似关系;

步骤4、利用关联矩阵的形式构建网络结构;

步骤5、设定时间滑动窗口,计算不同时间段内时间序列股票之间的相似关系,构建多个关联矩阵;

步骤6、设定关系阈值,将股票关联矩阵二值化;

步骤7、利用可视化的方法,对关联矩阵进行展示,分析金融危机前后网络结构的差异。

进一步地,步骤2中,所述每只上市公司每日股票收盘价格的处理和收益率计算具体包括:

s01:去除每只上市公司股票中因停牌和退市所产生的交易异常数据;

s02:使用公式计算收益率,其中表示第第i支股票在第t天的收益率,表示第i支股票第t天的收盘价格,表示股票交易期间收盘价格的对数形式。

进一步地,步骤3具体包括:

计算股票收益率之间的相似性公式:

其中,表示第i支股票和第j支股票收益率之间的相似性,其值在0到1之间;中括号表示股票收益率在单位时间长度内的平均值。

进一步地,步骤4中,关联矩阵构建具体包括:

关联矩阵的计算公式是:

其中是第i支股票和第j支股票的关联矩阵;表示阶跃函数;是步骤3所计算出来的收益率相似性;是关系阈值;是kronecker(克罗内克)函数。

进一步地,步骤5滑动窗口设计具体包括:

利用时间窗口的滑动来计算每对股票的时间序列之间的相似关系,设置窗口长度分别为5天、10天、20天、30天,顺序滑动窗口的时间步长分别为1天、2天、5天、10天。

进一步地,步骤6设定关系阈值,将股票关联矩阵二值化具体包括:

关系阈值的设置分别为0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95,但不限于列举的这几个值,可以是0到1之间的任意数值。

股票关联矩阵二值化是指矩阵中的元素只有0或1两个值,0表示两支股票之间没有关联,1表示两支股票之间有关联。

与现有技术相比,本发明的有益效果为:

(1)可以图像化的展示时间序列股票数据之间的相互关联信息,相比于其它网络构建方法,本发明方案在金融危机期间表现出更加显著的网络结构变化,表明了集群结构的变化在危机时刻的重要性。

(2)本发明对股票市场网络的研究不仅改善了与产业实体相关的决策,而且为金融市场的变化和发生的金融危机的时刻提供了参考性的指标,为推断潜在的金融活动和伙伴关系提供了重要依据。

(3)本发明方案不仅为股票数据集提供了新的网络构建方法,而且可以扩展到金融市场的其它相关领域,例如期权和期货交易,为随时间变化的市场行情提供了更加实用的关联信息。

附图说明

图1是股票市场网络构建流程图;

图2是滑动窗口构建时间序列股票网络结构示意图;

图3是金融危机前后网络结构对比示意图。

具体实施方式

本发明旨在提出一种时间序列股票数据的网络构建方法,在上市公司股票交易之间建立相关性联系,提出随时间发展网络结构变化的框架。本发明以固定时间段内上市公司股票每日收盘价格数据为研究对象,并对数据进行预处理。用网络结构的方式表示每只股票收益率之间的相似性,利用关联矩阵的形式构建网络结构,通过可视化方法展示关联矩阵,从而分析金融危机前后网络结构的差异。

本发明中的时间序列股票数据的网络构建方法包括一下实现步骤:

步骤1、获取一组固定时间段内上市公司股票每日收盘价格;

步骤2、对收集到的每只上市公司每日股票收盘价格进行处理,计算每天收益率;

步骤3、用网络结构的方式表示每只股票收益率之间的相似性,其中网络的节点表示上市公司的股票,网络的边缘表示股票之间的相似关系;

步骤4、利用关联矩阵的形式构建网络结构;

步骤5、设定时间滑动窗口,计算不同时间段内时间序列股票之间的相似关系,构建多个关联矩阵;

步骤6、设定关系阈值,将股票关联矩阵二值化;

步骤7、利用可视化的方法,对关联矩阵进行展示,分析金融危机前后网络结构的差异。

实施例:

本实施例中使用的纽约股票交易所的数据集,包含了3799支股票的每日收盘价格。在选中分析的347支股票中,详细列出所有股票从1986年1月到2011年2月的历史股价。

首先,需要对原始的数据集进行预处理,去除每只上市公司股票中因停牌和退市所产生的交易异常数据。

在数据预处理的基础之上,本实施例将完成一下研究:

一、股票市场网络构建:

金融股票相关性的研究对提高股票投资组合和脆弱性等金融实体的建模能力具有非常重要的作用,其基本原理是利用金融时间序列来构建网络。

使用收益率的对数来描述股票在交易期间的收盘价格,则第i支股票在第t天的收益率可通过公式计算得出,表示第i支股票第t天的收盘价格,使用对数形式可以使其不依赖于通货膨胀等因素。

因此,所处理的数据集中包含了6004天内347支股票的收盘价格。

在网络表示中使用节点对应于不同的股票,边缘表示股票收盘价格相关联的时间序列之间的相似性,相似性可通过公式计算得出:

其中,表示第i支股票和第j支股票收益率之间的相似性,其值在0到1之间;中括号表示股票收益率在单位时间长度内的平均值。

由于相关系数矩阵不能直接表示金融网络的拓扑结构,因此利用邻接矩阵来分析网络结构,并对其设置了一个边缘的强连接矩阵的阈值,关联矩阵的计算公式是:

其中是第i支股票和第j支股票的关联矩阵;表示阶跃函数;是步骤3所计算出来的收益率相似性;是关系阈值;是kronecker(克罗内克)函数。

为了分析股票市场网络的时间演化,利用时间窗口来计算每对股票的时间序列之间的相关系数。设置窗口长度分别为5天、10天、20天、30天,在该时间窗口内,网络由相关性构建,如果相关性超过确定的阈值,则在两者之间创建连接。

利用时间窗口的滑动来计算每对股票的时间序列之间的相似关系,顺序滑动窗口的时间步长分别为1天、2天、5天、10天,这样就产生了一个时变的股票市场网络。

设定关系阈值,关系阈值的设置分别为0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95,但不限于列举的这几个值,可以是0到1之间的任意数值。

股票关联矩阵二值化是指矩阵中的元素只有0或1两个值,0表示两支股票之间没有关联,1表示两支股票之间有关联。

二、金融危机前后网络结构分析:

本部分主要证明金融危机的发生会导致网络结构发生显著的变化,网络之间节点的相关性会因为金融危机而受到影响。

在图3中,可以注意到在危机之前,网络结构中主要由两个群落组成,随着经济危机的发生,网络结构发生了强烈的变化。网络中心只有一个高度连接的集群,之前的两种群落的结构基本消失。

在危机期间,网络结构表现出更同质的联系,在这个时代,大多数股票都是脱节的,价格的演变没有很强的相关性。

1997年亚洲金融危机的相似模式可以在时间网络分析中找到。这一结果也与金融市场网络结构的其它研究结果一致。

危机前网络结构具有密集的集群,在金融危机期间连接数量显著减少,之后股票开始恢复与其他股票的联系,少数股票往往在网络结构中形成一些集群。网络开始重新连接,并逐渐恢复,网络结构再次发生变化。

三、金融危机发生时网络结构分析:

通过分析不同时期发生的同一性质的金融危机,分析不同时间步长下的网络结构的差异。

从图3可以看出,网络拓扑展现出相似的模式。

在危机期间,网络结构表现出更加同质的连接,只在网络的中心保持高度连接的集群。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1