一种基于高维点过程的金融时间序列的因果关系学习方法与流程

文档序号：22042054发布日期：2020-08-28 18:14阅读：467来源：国知局

本发明涉及金融数据分析领域，尤其涉及一种基于高维点过程的金融时间序列的因果关系学习方法。

背景技术：

发现存在联系的因果关系是有向网络的一项有趣而又重要的任务，它在实际应用中扮演着越来越重要的角色，包括金融数据的预报、预测和数据分析。因果关系的概念最初由c.w.granger提出，它主要用于时间序列数据，试图通过回归和统计检验来探究时间序列x在预测另一个y时是否有意义，以此来构造x到y之间的因果关系。例如，当美元指数变化时，它是否会导致石油价格的重大变化。如果是的话，人们可以认为美国农业部与油价有因果关系。如今，因果关系发现和学习在经济学、计算机和社会分析等领域有广泛的应用，包括政府支出和经济产出税、图像像素和标签、iptv项目中的granger因果关系等等，具有较为普遍的适用性。

针对目前因果关系学习的大多数方法都是基于自回归模型和相应的统计检验，但自回归模型难以应用于现实世界中，尤其是应用于金融数据中。自回归模型的适用范围毕竟窄，只能用于时间序列数据。通过基于对点过程的因果模型的改进，使其既适用于事件序列又适用于时间序列，并可以在大量数据发现可能存在的因果联系。

高维点过程已经取代了基于离散时滞变量的自回归模型，成为进行因果推理的新的重要工具。这些过程试图模拟不同维度或类型的影响，这通常用于评估因果关系。hawkes过程是最常用的进行因果推理的点过程，它在实际数据中表现得非常好，通常用于低维和高维领域的因果推理。

然而，大多数基于高维hawkes过程学习因果关系的现有工作都是为事件序列数据设计的，但对于时间序列（如在离散时间点上固定时间滞后下观测到的财务数据）是不可行的。这严重限制了点过程模型在因果分析领域的应用。

技术实现要素：

本发明的目的在于针对现有因果关系方法的不足而提供一种基于高维点过程的金融时间序列的因果关系学习方法，该基于高维点过程的金融时间序列的因果关系学习方法能够有效地发掘金融数据中的因果关系，并能够更好地满足金融时间序列的因果关系学习的需求，本发明能够有效地替代传统的因果关系学习方法。

为达到上述目的，本发明通过以下技术方案来实现：一种基于高维点过程的金融时间序列的因果关系学习方法，包括以下步骤：

步骤1：事件序列提取，将金融时间序列数据事件化，使得金融时间序列可以用点过程模型进行建模与分析；

步骤2：事件序列建模，对多维hawkes过程进行修正，并使用该过程对步骤1中抽取得到的金融事件序列进行建模，估计转化矩阵；

步骤3：参数估计，使用正则化的极大似然估计和em算法估计模型参数；

步骤4：因果关系网络构建，利用步骤3中得到的转化矩阵构建因果关系网络，提取多种金融数据间的因果关系。

优选的，所述步骤1包括以下步骤：

步骤1-1：将时间序列数据规范化处理；

步骤1-2：抽取其中超过阈值的时间点组成事件数据。

优选的，所述步骤2中对多维hawkes过程进行修正具体为在原hawkes过程的基础上加入滞后项。

优选的，所述步骤3包括以下步骤：

步骤3-1：使用正则化的极大似然估计构建优化目标，对极大似然估计中的对数似然函数进行正则化处理，防止过拟合；

步骤3-2：em算法估计模型参数，通过迭代计算e步和m步，基于em的学习算法来求解正则化的极大似然估计问题。

优选的，所述步骤4具体为：基于步骤3中估计得到的转化矩阵，选择其中超过指定阈值的项，将此项对应的两种金融数据加入到因果关系网络中，并在因果关系网络中添加连接这两种金融数据的边。

与现有技术相比，本发明的有益效果为：

1、本发明避免了价格平稳时多余的冗余数据对模型造成的干扰；

2、本发明能够避免事件在同一天发生而产生的估计错误；

3、本发明可以处理高维数据的同时可以避免过拟合；

4、本发明能够在大量时间序列指标中成批发现因果联系；

5、本发明不需要大量的人工寻找与选择即可以构建因果关系的复杂网络；

6、本发明寻找到的因果关系有实际的物理意义，具有可解释性。

附图说明

图1为本发明的流程示意图。

具体实施方式

如图1所示，一种基于高维点过程的金融时间序列的因果关系学习方法，包括以下步骤：

步骤1：事件序列提取，将金融时间序列数据事件化，使得金融时间序列可以用点过程模型进行建模与分析；

步骤2：事件序列建模，对多维hawkes过程进行修正，并使用该过程来对步骤1中抽取得到的金融事件序列进行建模，估计转化矩阵；

步骤3：参数估计，使用正则化的极大似然估计和em算法估计模型参数；

步骤4：因果关系网络构建，利用步骤3中得到的转化矩阵构建因果关系网络，提取多种金融数据间的因果关系。

上述步骤1包括以下步骤：

步骤1-1：将金融时间序列数据规范化处理；

步骤1-2：抽取其中超过阈值的时间点组成事件数据。

上述步骤2中对多维hawkes过程进行修正具体为在原hawkes过程的基础上加入滞后项。

上述步骤3包括以下步骤：

步骤3-1：使用正则化的极大似然估计构建优化目标，对极大似然估计中的对数似然函数进行正则化处理，防止过拟合；

步骤3-2：em算法估计模型参数，通过迭代计算e步和m步，基于em的学习算法来求解正则化的极大似然估计问题。

上述步骤4具体为：基于步骤3中估计得到的转化矩阵，选择其中超过指定阈值的项，将此项对应的两种金融数据加入到因果关系网络中，并在因果关系网络中添加连接这两种金融数据的边。

本发明并不局限于上述实施例，在本发明公开的技术方案的基础上，本领域的技术人员根据所公开的技术内容，不需要创造性的劳动就可以对其中的一些技术特征作出一些替换和变形，这些替换和变形均在本发明的保护范围内。

技术特征：

1.一种基于高维点过程的金融时间序列的因果关系学习方法，其特征在于，包括以下步骤：

步骤1：事件序列提取，将金融时间序列数据事件化，使得时间序列可以用点过程模型进行建模与分析；

步骤2：事件序列建模，对多维hawkes过程进行修正，并使用该过程对步骤1中抽取得到的金融事件序列进行建模，估计转化矩阵；

步骤3：参数估计，使用正则化的极大似然估计和em算法估计模型参数；

步骤4：因果关系网络构建，利用步骤3中得到的转化矩阵构建因果关系网络，提取多种金融数据间的因果关系。

2.根据权利要求1所述的一种基于高维点过程的金融时间序列的因果关系学习方法，其特征在于，所述步骤1包括以下步骤：

步骤1-1：将时间序列数据规范化处理；

步骤1-2：抽取其中超过阈值的时间点组成事件数据。

3.根据权利要求1所述的一种基于高维点过程的金融时间序列的因果关系学习方法，其特征在于，所述步骤2中对多维hawkes过程进行修正具体为在原hawkes过程的基础上加入滞后项。

4.根据权利要求1所述的一种基于高维点过程的金融时间序列的因果关系学习方法，其特征在于，所述步骤3包括以下步骤：

步骤3-1：使用正则化的极大似然估计构建优化目标，对极大似然估计中的对数似然函数进行正则化处理，防止过拟合；

步骤3-2：em算法估计模型参数，通过迭代计算e步和m步，基于em的学习算法来求解正则化的极大似然估计问题。

5.根据权利要求1所述的一种基于高维点过程的金融时间序列的因果关系学习方法，其特征在于，所述步骤4具体为：基于步骤3中估计得到的转化矩阵，选择其中超过指定阈值的项，将此项对应的两种金融数据加入到因果关系网络中，并在因果关系网络中添加连接这两种金融数据的边。

技术总结
本发明公开了金融数据分析领域的一种基于高维点过程的金融时间序列的因果关系学习方法，包括以下步骤：步骤1：事件序列提取，将金融时间序列数据事件化，使得时间序列可以用点过程模型进行建模与分析；步骤2：事件序列建模，对多维Hawkes过程进行修正，并使用该过程对步骤1中抽取得到的金融事件序列进行建模，估计转化矩阵；步骤3：参数估计，使用正则化的极大似然估计和EM算法估计模型参数；步骤4：因果关系网络构建，利用步骤3中得到的转化矩阵构建因果关系网络，提取多种金融数据间的因果关系。本发明能够有效地发掘金融数据中的因果关系，并能够更好地满足金融时间序列的因果关系学习的需求，能够有效地替代传统的因果关系学习方法。

技术研发人员：陆培丽
受保护的技术使用者：上海明寰科技有限公司
技术研发日：2020.05.15
技术公布日：2020.08.28

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陆培丽
技术所有人：上海明寰科技有限公司
我是此专利的发明人

上一篇：基于MapReduce的并行密度聚类挖掘方法与流程
上一篇：一种自润滑不粘熔铝的环保涂料和涂膜及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。