一种基于多相似股票投票统计的股票近期预测方法与流程

文档序号:12126579阅读:360来源:国知局
一种基于多相似股票投票统计的股票近期预测方法与流程

本发明涉及股票数据挖掘技术领域,尤其是涉及一种基于多相似股票投票统计的股票近期预测方法。



背景技术:

股票投资是为了获得更大的收益,然而由于股票市场具有较大的动态特性,股票投资的收益与风险往往是成正比的,投资收益越高,存在风险则越大。有效地进行股票价格的预测,最大程度规避股票风险,增加投资收益,是股票投资者最关注的热点问题。

目前,股票预测方法主要有回归分析法、时间序列法、马尔柯夫预测等传统方法,还有就是支持向量机、神经网络等人工智能的预测方法。这些方法基本都是在单只股票上做研究,没有充分利用目前已有的所有的股票数据。

本发明针对现有技术的不足,利用大数据挖掘的优势,提供一种基于多相似股票投票统计的股票近期预测方法。



技术实现要素:

本发明公开提出了一种基于多相似股票投票统计的股票近期预测方法。其主要思想是以待预测股票的近期时间段内的涨跌幅走势对所有股票的历史数据进行逐段的匹配,搜索获得相似度最高的前几只股票对应的匹配段和匹配日期,对各匹配日期之后的各股票涨跌幅数值进行平均,计算后期可能的涨跌幅;进行正负投票统计,计算可能的涨跌概率。

本发明方法是一种基于所有股票数据的大数据挖掘方法,该方法可用于对股票近期几天的涨跌幅和涨跌概率进行预测,从而为股票短线操作提供决策支持。

本发明方法的步骤如下:

(1)获取待预测股票近期一段时间的涨跌幅数据;

(2)获取所有股票的涨跌幅数据及对应的交易日期;

(3)将待预测股票逐一与每只股票进行移动加权匹配,记录与每只股票匹配段的最小距离和相应交易日期;

(4)对与所有股票的匹配结果进行全局比较,获取最相似的T只股票及其对应的交易日期;

(5)以这T只最相似的股票为基础,对其对应交易日期后的近几天的涨跌幅数据进行统计和投票表决,从而对原待预测股票的近期几天的可能涨跌幅和可能涨跌概率做出预测。

其中,步骤(1) 获取待预测股票近期一段时间的涨跌幅数据,具体为:获取待预测股票Sm的近L个交易日的涨跌幅数据,形成一个数组,记为A,A=[a1,a2,…,ai,…aL];其中,ai代表近L-i的交易日的涨跌幅。a0代表当前交易日的涨跌幅。

其中,步骤(2) 获取所有股票的涨跌幅数据及对应的交易日期,具体为:对S中的每只股票,获取某个时间点以来(如2005年1月1日),到当前交易日的前L个交易日的数据,形成另一个数组,记为Bi, i=[1,n], Bi=[bi1,bi2,…,bij,…bik],同时记录bij的交易日期,记为另一数组Ci, i=[1,n],Ci=[ci1,ci2,…,cij,…cik]。

其中,步骤(3) 将待预测股票逐一与每只股票进行移动加权匹配,具体为:匹配过程在A和Bi展开,A的长度为L, Bi的长度为K, K>=L。以步长为1,循环从Bi中获取长度L的涨跌幅数据,记为B;之后A与B进行比较,得到匹配值。匹配时首先对位置加权,位置越靠右侧的权重越大;接下来对同向性加权,同涨或同跌的位置赋予较大的权重;最后将权重乘以相应位置涨跌幅的相减绝对值,作为最终的比较距离。最后记录所有比较的匹配值的最小值和其对应的匹配日期,作为A与Bi匹配的最终结果,记为Pi, i=[1,n], 每个Pi=[Vi,Di],其中,Vi代表A与Bi的最小匹配值,Di代表最小匹配值对应的匹配日期。

其中,步骤(4) 对与所有股票的匹配结果进行全局比较,具体为:基于对数组P的Pi数值从小到大进行排序,排序后获取数值最小的前T个Pi及其对应的Di,形成新数组Mt ,t=[1,T], Mt=[Pt,Dt]。为保证下一步骤统计的数据基础,T的取值一般>=10。

其中,步骤(5)对交易日期后的近几天的涨跌幅数据进行统计和投票表决,具体为:对于具有最小匹配值的前T只股票,每只股票获取匹配日期Dt后的R个交易日的涨跌幅数据,形成二维数组Ftr, t=[1,…T],r=[1,…R];将涨跌幅数据按维度进行前向累加,即新第2列值为原第1,2列的求和;新第3列值为原第1,2,3列的求和,以此类推,从而形成新的数组Gtr, t=[1,…T], r=[1,…R];分别对G tr的每一列进行投票统计,确定相应近期走势的可能涨跌幅及涨跌概率。可能涨跌幅的计算通过对当列的排序数值“去头去尾后取平均值”得到,如对列数值排序后,去掉前1个最大值,去掉后1个最小值,剩余的数值进行平均,该平均值将作为可能的涨跌幅。涨跌概率的计算通过对T个列的数值统计大于0(>0.2)、小于0(<-0.2)、近似等于0(-0.2到0.2区间)的个数后,计算占总数T的比例得到。

本发明的有效性在于利用了所有股票的历史涨跌幅走势数据,将当前待预测的股票与所有的历史数据进行逐一的比较,搜索距离最小的多个走势,之后利用这些最相似走势的后续近几天的涨跌幅数值进行统计和投票表决,确定原预测股票可能的涨跌幅和可能的涨跌概率。本发明方法能够对股票走势进行较好的预测。

附图说明

图1 是本发明股票近期预测方法的流程图。

图2 是基于本发明方法输出的某一股票可能涨跌幅和可能涨跌概率的预测实例。

具体实施方式

下面结合附图和实例,对本发明进行详细的描述。

近期预测一般指对股票近5个交易日以内的预测,如1日预测,2日预测,3日预测等。本发明方法的预测不仅包括涨跌的预测,还包括涨跌幅的预测。

假设股票列表为S,S=[S1, S2,…,Si,…,Sn], n为股票池中股票的数量,如中国上市股票的数量或美国上市股票的数量。对于每只股票,假设待预测的股票为Sm,m=1,…,n 具体预测步骤如下。

一、获取待预测股票近期一段时间的涨跌幅数据。

该步骤主要完成从原始股票数据库中获取待预测股票的近期交易日数据。

获取待预测股票Sm的近L个交易日的涨跌幅数据,形成一个数组,记为A,

A=[a1,a2,…,ai,…aL]

其中,ai代表近L-i的交易日的涨跌幅。a0代表当前交易日的涨跌幅。为保证匹配的准确性,L长度一般取得长一些,如30,60等。

二、获取所有股票的涨跌幅数据及对应的交易日期。

该步骤主要完成从原始股票数据库中获取待匹配的股票的历史交易日数据。

对S中的每只股票,获取某个时间点以来(如2005年1月1日),到当前交易日的前L个交易日的数据,形成另一个数组,记为Bi, i=[1,n],

Bi=[bi1,bi2,…,bij,…bik]

其中,bij代表第i只股票的j位置对应交易日的涨跌幅。每个Bi的长度k是不一定相等的,因为股票中间有停牌等因素的影响。同时记录bij的交易日期,记为另一数组Ci, i=[1,n],

Ci=[ci1,ci2,…,cij,…cik]

其中,cij代表第i只股票的j位置对应交易日期。

三、股票间移动加权匹配。

该步骤主要完成待预测股票与某只待匹配股票之间的匹配过程,并获取得到匹配最小值和对应匹配日期。

匹配过程在A和Bi展开,A的长度为L, Bi的长度为K, K>=L,具体匹配过程如下。

3.1 以步长为1,循环从Bi中获取长度L的涨跌幅数据,记为B。

3.2 A与B进行比较,得到匹配值。A、B的比较过程可以灵活进行,有如下几种方式单种或多种组合进行比较,

(1) 相应位置的涨跌幅直接相减取绝对值;

(2) 对位置加权,越靠近当前交易日权值越高;

(3) 考虑涨跌幅的同向性加权;

(4) 将A、B涨跌幅归一化到[0,1]区间后进行比较;

本发明方法首先对位置加权,位置越靠右侧的权重越大;接下来对同向性加权,同涨或同跌的位置赋予较大的权重;最后将权重乘以相应位置涨跌幅的相减绝对值,作为最终的比较距离。

3.3 记录所有比较的匹配值的最小值和其对应的匹配日期,作为A与Bi匹配的最终结果,记为Pi, i=[1,n], 每个Pi=[Vi,Di],其中,Vi代表A与Bi的最小匹配值,Di代表最小匹配值对应的匹配日期。

四、获得多只相似的股票。

该步骤基于上一步骤移动加权匹配结果数组P,获取T只最相似股票。具体过程为:对数组P的Pi数值从小到大进行排序,排序后获取数值最小的前T个Pi及其对应的Di,形成新数组Mt ,t=[1,T], Mt=[Pt,Dt]。

为保证下一步骤统计的数据基础,T的取值一般>=10。

五、以相似股票的后期走势进行统计和投票表决。

该步骤以相似股票匹配日期后的近期走势(一般为1-5个交易日)为基础,进行加权平均,投票统计,目的在于获得待预测股票近期的可能涨跌幅及概率。具体步骤如下。

5.1 对于具有最小匹配值的前T只股票,每只股票获取匹配日期Dt后的R个交易日的涨跌幅数据,形成二维数组Ftr, t=[1,…T],r=[1,…R]。

5.2 将涨跌幅数据按维度进行前向累加,即新第2列值为原第1,2列的求和;新第3列值为原第1,2,3列的求和,以此类推,从而形成新的数组Gtr, t=[1,…T],r=[1,…R]。

5.3 分别对G tr的每一列进行投票统计,确定相应近期走势的可能涨跌幅及涨跌概率。

可能涨跌幅的计算这一步骤为避免一些干扰,可对当列的排序数值“去头去尾后取平均值”,如对列数值排序后,去掉前1个最大值,去掉后1个最小值,剩余的数值进行平均,该平均值将作为可能的涨跌幅。

涨跌概率的计算通过对T个列的数值统计大于0(>0.2)、小于0(<-0.2)、近似等于0(-0.2到0.2区间)的个数后,计算占总数T的比例得到。

通过上述步骤得到了近期预测结果,即1日、2日、3日等的可能涨跌幅和涨跌概率。这里的涨跌幅是一种累积的涨跌幅。

综上所述,本发明提出了一种基于多相似股票投票统计的股票近期预测方法,充分利用了所有股票的历史数据,可以对股票的近期涨跌幅和涨跌概率做出较好预测。

本发明方法同样可应用于证券类具有时间序列特征的数据,如基金、期货等。因此,尽管为说明目的公开了本发明的具体实施例和附图,其目的在于帮助理解本发明的内容并据以实施,但是本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换、变化和修改都是不可能的。因此,本发明不应局限于最佳实施例和附图所公开的内容。当前公开的实施例在所有方面应被理解为说明性的而非对其请求保护的范围的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1