本发明涉及人工智能领域,尤其是涉及一种基于跨市场影响的股价预测方法、装置、设备及存储介质。
背景技术:
lstm:longshorttermmemory的缩写,中文名称为长短期记忆。
relu激活函数:是神经网络中的一个激活函数。
batchnormalization操作:神经网络中的一个算法。
z-score标准化:数据标准化处理的一种方法,中文名称为零-均值规范化。
在资本市场上,多品种的股票之间会互相影响。如美股股价的上升或下跌可能会对a股市场产生一定影响,而a股股市的波动可能不会对美股造成影响。
现有技术中,如图1所示,构建一维lstm模型预测多个股票市场相互之间的影响,这里的一维指的是神经元只有一个输入门结构。网络的输入向量
技术实现要素:
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的是提供一种事件驱动型的股价预测方法、装置、设备及存储介质。
本发明所采用的技术方案是:
第一方面,本发明提供一种基于跨市场影响的股价预测方法,该预测方法包括:将多个股票市场的股票的数据分别输入到特征提取神经网络,以提取该多个股票市场的股票的特征数据;将该多个市场的特征数据输入到多维长短期记忆网络,以预测该多个股票市场中的一个股票市场的股票价格波动。
其中,该多个股票市场为a股市场、港股市场及美股市场,该多维长短期记忆网络为三维长短期记忆网络,该一个股票市场为a股市场。
其中,该三维长短期记忆网络的模型具有四层隐含层,该四层隐含层分别为
其中,yt为输出层的输出向量;wah为a股的输入向量与a股lstm层间权重,waa为a股lstm层节点之间的权重;whh为港股的输入向量与港股lstm层间权重,whh为港股lstm层节点之间的权重;wdd为美股的输入向量与美股lstm层间权重,wdd为美股lstm层节点之间的权重;waa'为a股lstm层输出向量与a′层间权重,wha'为港股lstm层输出向量与a′层间权重,wda'为美股lstm层输出向量与a′层间权重,wa'a'为a′层节点之间权重,wa'为a′层与输出层间权重,wa为a层与输出层间权重。
其中,该三维长短期记忆网络的模型包括第一神经元节点和第二神经元节点,该第一神经元节点用于刻画同一天a股和港股之间的相互关系影响以及前一晚美股对a股的影响,该第一神经元节点通过在传统的lstm模型的门结构增加两个遗忘门以对应港股和美股的输入状态,该第二神经元节点用于刻画t-1时刻的a股对t时刻的美股的影响,该第二神经元节点通过在传统lstm模型的门结构上增加一个遗忘门用来处理该第一神经元节点输出的状态信息。
其中,该股票的该数据包括结构化数据和非结构化数据,该结构化数据包括股票的行情数据、基本面数据及宏观经济指标数据,该非结构化数据为该股票的文本信息数据。
其中,该将多个股票市场的股票的数据输入到特征提取神经网络,以提取该多个股票市场的股票的特征数据的步骤具体包括:获取该股票的结构化数据,将该结构化数据输入到显著卷积神经网络,以获取该结构化数据的特征数据;和获取该股票的非结构化数据,将该非结构化数据通过word2vector提取到词窗口信息,将该词窗口信息输入到卷积神经网络,以获取该非结构化数据的特征数据;将该结构化数据的特征数据和该非结构化数据的特征数据合并,以获得该股票的特征数据。
其中,该获取该股票的结构化数据,将该结构化数据输入到显著卷积神经网络,以获取该结构化数据的特征数据的步骤具体包括:通过第三方api接口或数据库接口获取该股票的该结构化数据;将该股票的该结构化数据进行预处理,获取该股票的日频的行情数据、该股票的季度频的基本面数据及部分直接影响该训练股票价格的月频的宏观数据;将该股票的日频的行情数据、该股票的季度频的基本面数据及部分直接影响该股票价格的月频的宏观数据用混频时序矩阵进行表示;通过该显著卷积神经网络对该混频时序矩阵进行特征的提取,以获取该股票的结构化数据的特征数据。
其中,该将该股票的该结构化数据进行预处理的步骤具体包括:对该行情数据进行价格数据复权、缺失值处理及z-score标准化处理;对该基本面数据进行极端值处理、缺失值处理及标准化处理;对该宏观经济数据进行z-score标准化处理。
其中,该显著卷积神经网络为多重卷积神经网络,在该显著卷积神经网络模型中,卷积核均为多维的卷积核,卷积核的大小不是固定的,最初的卷积核是一维的,在从左往右依次卷积的过程中,卷积核的大小是不断的增加直到达到固定的大小,在每一层卷积层之后都加入了relu激活函数和batchnormalization操作。
其中,该卷积神经网络为一层的卷积神经网络,在该卷积神经网络模型中,在卷积层之后添加了relu激活函数,并对该激活函数的输出结果进行了最大池化的操作。
第二方面,本发明提供一种基于跨市场影响的股价预测装置,其中,该股价预测装置包括:股票特征数据获取模块,用于将多个股票市场的股票的数据分别输入到特征提取神经网络,以提取该多个股票市场的股票的特征数据;股票市场价格预测模块,用于将该多个市场的特征数据输入到多维长短期记忆网络,以预测该多个股票市场中的一个股票市场的股票价格波动。
第三方面,本发明提供一种基于跨市场影响的股价预测设备,其中,包括至少一个处理器;以及,与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行上述的方法。
第四方面,本发明提供一种计算机可读存储介质,其中,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使计算机执行上述的方法。
本发明的有益效果是:
本发明通过将多个股票市场的股票的数据分别输入到特征提取神经网络模型中,即可获得多个股票市场的股票的特征数据,将该特征数据输入到多维长短期记忆网络模型中,即可预测某个股票市场的股价波动趋势。本发明的多维长短期记忆网络模型可以刻画多个市场之间的相互关联性,使得预测准确性高。该方法使用方便,且效率高,适应金融市场的快速变幻。
进一步地,本发明采用显著卷积神经网络对股票的结构化数据进行特征提取,由于股票的非结构化数据为频率不一致的混频时序数据,该显著卷积神经网络通过多维卷积神经网络解决了对多维混频时序数据特征提取的问题。
本发明可广泛应用于基于跨市场预测某个股票市场的股票走势。
附图说明
图1是现有技术基于跨市场影响的股价预测方法的一实施例的预测模型的结构示意图;
图2是本发明基于跨市场影响的股价预测方法的一实施例的流程示意图;
图3是图2的步骤s11的流程示意图;
图4是图3的步骤s111中显著卷积神经网络模型的结构示意图;
图5是图2的步骤s12中多维长短期记忆网络模型的结构示意图;
图6是图5的多维长短期记忆网络模型的第一神经元的结构示意图;
图7是图5的多维长短期记忆网络模型的第二神经元的结构示意图;
图8是本发明基于跨市场影响的股价预测装置的一实施例的结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例一:
请参阅图2,图2是本发明基于跨市场影响的股价预测方法的一实施例的流程示意图。图2的预测方法包括步骤:
s11:将多个股票市场的股票的数据分别输入到特征提取神经网络,以提取该多个股票市场的股票的特征数据;
在步骤s11中,一个股票市场的股票可以是从该股票市场上选出的任意多只股票或该股票市场上的所有股票。其中,股票的数据包括结构化数据和非结构化数据,该结构化数据包括股票的行情数据、基本面数据及宏观经济指标数据,该非结构化数据为该股票的文本信息数据。
具体地,如图3所示,步骤s11包括如下步骤:
s111:获取该股票的结构化数据,将该结构化数据输入到显著卷积神经网络,以获取该结构化数据的特征数据;和获取该股票的非结构化数据,将该非结构化数据通过word2vector提取到词窗口信息,将该词窗口信息输入到卷积神经网络,以获取该非结构化数据的特征数据。
在步骤s111中,该获取该股票的结构化数据,将该结构化数据输入到显著卷积神经网络,以获取该结构化数据的特征数据的步骤具体包括:
(1)通过第三方api接口或数据库接口获取该股票的结构化数据;
其中,可以采用金仕达的api接口以及wind的数据库接口。
(2)将该股票的结构化数据进行预处理,获取该股票的日频的行情数据、该股票的季度频的基本面数据及部分直接影响该股票价格的月频的宏观数据;
由于获取到的原始数据一般噪声非常大,对大部分数据需要进行格式处理。
其中,对行情数据进行价格数据复权、缺失值处理及z-score标准化处理;
其中,对该基本面数据进行极端值处理、缺失值处理及标准化处理;
其中,对该宏观经济数据进行z-score标准化处理。
(3)将该股票的日频的该行情数据、该股票的季度频的该基本面数据及部分直接影响该股票价格的月频的该宏观数据用混频时序矩阵进行表示;
其中,每个时序数据维度不需要用单独的时间和数值进行表示,只需要用0或1去表示数据维度,这样的表示方法仅仅是在原来高维的时序数据上面增加了两维数据。虽然这种方法看起来并不太直观,但对于计算机来说,识别效率更高。
(4)通过该显著卷积神经网络对该混频时序矩阵进行特征的提取,以获取该股票的结构化数据的特征数据。
其中,显著卷积神经网络的结构示意图如4所示,该显著卷积神经网络为多重卷积神经网络。在显著卷积神经网络中,卷积核均为多维的卷积核,这样可以使提取到的特征具有时序的依赖性,但为了保持时间序列长度的不变性,卷积核的大小不是固定的,即最初的卷积核是一维的,在从左往右依次卷积的过程中,卷积核的大小是不断的增加直到达到固定的大小。如图4所示,第一层卷积层的卷积核的最大维数是2,即卷积核的大小为2*4,但第一层卷积层的输出
在步骤s111中,可以通过网络爬虫的方式,例如从雪球网或新浪财经网站上爬取实时的财经新闻数据,以获得该股票的非结构化数据。该卷积神经网络为一层的卷积神经网络,在该卷积神经网络模型中,在卷积层之后添加了relu激活函数,并对该激活函数的输出结果进行了最大池化的操作。这样的好处有两个:其一是可以确保文本信息中少量的重要的关键字能够在之后的神经网络中继续传播;其二确保了提取到的非结构化数据的特征数据可以以一个固定长度的向量输入到之后的网络模型中去,方便合并结构化数据的特征数据和非结构化数据的特征数据。
s112:将该结构化数据的特征数据和该非结构化数据的特征数据合并,以获得该股票的特征数据。
在步骤s112中,将该结构化数据的特征数据和该非结构化数据的特征数据通过拼接的方式或其他方式合并,在本领域技术人员的理解范围之内,在此不进一步解释。
s12:将该多个市场的特征数据输入到多维长短期记忆网络,以获得该多个股票市场中的一个股票市场的股票价格波动。
在步骤s12中,以下以a股市场、港股市场及美股市场进行举例说明,该多个股票市场为a股市场、港股市场及美股市场,该多维长短期记忆网络为三维长短期记忆网络,该一个股票市场为a股。
在步骤s12中,请一并参阅图5、图6及图7,图5是多维长短期记忆网络模型的结构示意图,图6是图5的多维长短期记忆网络模型的第一神经元的结构示意图,图7是图5的多维长短期记忆网络模型的第二神经元的结构示意图。
如图5所示,该三维长短期记忆网络的模型具有四层隐含层,该四层隐含层分别为
其中,yt为输出层的输出向量;wah为a股的输入向量与a股lstm层间权重,waa为a股lstm层节点之间的权重;whh为港股的输入向量与港股lstm层间权重,whh为港股lstm层节点之间的权重;wdd为美股的输入向量与美股lstm层间权重,wdd为美股lstm层节点之间的权重;waa'为a股lstm层输出向量与a′层间权重,wha'为港股lstm层输出向量与a′层间权重,wda'为美股lstm层输出向量与a′层间权重,waa'为a′层节点之间权重,wa'为a′层与输出层间权重,wa为a层与输出层间权重。
如图6所示,同一天a股和港股相互关系影响以及前一晚美股对a股的影响的表示是在a′t节点上实现的,具体的实现方法是通过修改传统lstm模型的门结构,a′t节点的结构图如图6所示,在图6中增加了两个遗忘门以对应港股和美股的输入状态。因为t时刻的a股和港股受到t-1时刻的美股的影响,可以把t-1时刻的美股类似于长时期的状态c(t-1),其在输入模型时,首先会经历一个遗忘门忘掉一些状态,之后它便会加入到长时期状态中,形成c(t)。
同样的,t时刻的a股和港股会互相影响,但a股对于港股的影响会更大,所以港股的输入状态在进入模型时,会受到一个由t时刻a股状态和t-1时刻模型的短时期状态h(t-1)决定的遗忘门。但不同于美股的遗忘机制,港股与a股的联系更加紧密,所以港股的输入状态会结合模型的短时期状态信息h(t-1),之后港股的状态信息便会加入到长时期状态中,形成c(t)。最后c(t)便会通过输出门的方式形成t时刻模型的输出状态y(t)。y(t)除了a股的状态信息,也包含了受到了a股影响后港股、美股的信息。整体上来看可认为y(t)是t时刻a股受到t时刻港股和t-1时刻美股影响后的输出状态,而t时刻港股在模型内也受到了t时刻a股的影响。
修改后的lstm模型结构各状态计算公式:
其中
如图7所示,t-1时刻的a股影响着t时刻的美股信息,其具体影响的刻画是在dt节点上实现的,具体的实现方法通过修改传统的lstm模型,增加门结构,dt节点的结构图如图7所示,
此模型的各状态计算公式如下:
其中wxf,wxi,wxo,wxg分别为美股输入向量
通过上述多维长短期记忆网络模型可以得知,该模型能够刻画t时刻的a股和港股对t时刻的美股影响以及前一晚美股对a股的影响;另外,该模型也能够刻画t时刻的美股对t+1时刻的a股和港股的影响;此外,该多维长短期记忆网络模型通过神经元a′t刻画t时刻a股和港股之间的互相影响。该多维长短期记忆网络模型可以刻画多个市场之间的相互关联性,因此,能够成功预测a股市场的股票波动趋势。当然,也可以对该多维长短期记忆网络模型进行改动,以成功预测港股市场或美股市场的股票波动趋势,在本领域技术人员的理解范围之内。
综上,在本实施例中,通过将多个股票市场的股票的数据分别输入到特征提取神经网络模型中,即可获得多个股票市场的股票的特征数据,将该特征数据输入到多维长短期记忆网络模型中,即可预测某个股票市场的股价波动趋势。本实施例的预测方法使用方便,且由于该多维长短期记忆网络模型可以刻画多个市场之间的相互关联性,使得预测准确性高。
实施例二:
请参阅图8,图8的股票预测装置包括股票特征数据获取模块81和股票市场价格预测模块82,股票特征数据获取模块81用于将多个股票市场的股票的数据分别输入到特征提取神经网络,以提取该多个股票市场的股票的特征数据;股票市场价格预测模块82用于将该多个市场的特征数据输入到多维长短期记忆网络,以预测该多个股票市场中的一个股票市场的股票价格波动。
股票特征数据获取模块81获取股票的特征数据的方法和股票市场价格预测模块82预测股票市场价格波动的方法在实施例一中已进行详细阐述,在此不再赘述。
实施例三:
本发明还提供一种基于跨市场影响的股价预测设备,该股价预测设备包括:至少一个处理器;以及,与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行实施例一的方法。
实施例四:
一种计算机可读存储介质,其特征在于,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使计算机执行实施例一的方法。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。