一种股票价格优化预测方法

文档序号:10687711阅读:1043来源:国知局
一种股票价格优化预测方法
【专利摘要】本发明涉及一种股票价格优化预测方法。其特征在于,采用泛化能力较强,且不容易陷入局部最优和过拟合现象的支持向量回归机模型作为股票价格预测的核心部分,克服人工神经网络算法的缺点;引入流形学习中的线性局部切空间排列算法,将股票原始数据看作嵌入在高维欧式空间中的低维流形,提取股票数据中的非线性子流形结构,使得提取的特征更加具有区分度和代表性,并同时降低股票数据噪声;最后再利用遗传算法优化支持向量回归机的训练参数,解决了单一支持向量回归机模型参数选择困难的问题,最终提高股价的预测精度。
【专利说明】
一种股票价格优化预测方法
技术领域
[0001]本发明属于金融数据分析处理领域,尤其涉及一种采用流形学习和支持向量回归机的股票价格优化预测方法。
【背景技术】
[0002]股票市场受到多方面因素的影响,导致股票价格变化多端,也正是因为这种变化,使得投资者能够通过买卖股票赚得差价收益。然而,若没有敏锐的市场直觉和丰富的金融知识是不能立足于股票交易市场并从中获利的。因此为了更加准确地识别股市动荡的规律,预测股价走势从而尽可能降低亏损的风险,前人总结了很多股票价格预测的经验和方法,大致可以分为三大类:人工经验预测法、时间序列预测法和机器学习预测法。
[0003]I)人工经验预测法
[0004]也称证券投资分析法,是一种依靠人力分析各种影响因素,从而对股票未来价格或趋势做出判断的方法。包括基本面分析和技术分析两个大的类型。基本面分析从影响股票价格的外部因素入手,如分析国家经济形势、金融政策的变化、上市公司的经营情况、内部稳定性等,通过分析这些外部影响因素,定性地判断未来股票价格的涨幅趋势或价格高低定位等,该方法一般为大型基金和机构所采用。技术分析则是利用各种图表、指标和分析工具来归纳分析市场的变化,依靠统计和归纳发现股价的波动规律,将发现的周期性规律用来指导股票交易的一种方法,也是广大股民最常用的一种方法。人工经验预测法主要依靠人力手工进行各种分析预测,在这个数据量暴增的时代,人工的方法显然耗时耗力,且人的情绪容易波动,从而直接影响到对趋势的判断造成亏损。
[0005]2)时间序列预测法
[0006]时间序列分析方法的应用对象包括所有随着时间推移变化的变量,其基本思想是依据时间序列变量与时间之间的相关性,利用统计模型对历史的时间序列对象建立数学模型,以此预测未来值。然而时间序列分析法虽然在对线性系统的处理上具有较好效果,但股票价格具有非线性的特征,不适合用时间序列分析法进行建模预测。
[0007]3)机器学习预测法
[0008]机器学习预测法是利用机器学习的算法对影响股票价格波动的各种因素和指标,与股票价格之间的非线性关系建模,将学习到的关键模式用于指导对未来股票价格的预测。机器学习预测法对人工操作的要求不高,只需要机器自动地进行学习即可预测,提高了效率且避免了人的情绪和失误所造成的损失。

【发明内容】

[0009]我们采用泛化能力较强,且不容易陷入局部最优和过拟合现象的支持向量回归机(SVR)模型作为股票价格预测的核心部分,克服人工神经网络算法的缺点;引入流形学习中的线性局部切空间排列算法(LLTSA),将股票原始数据看作嵌入在高维欧式空间中的低维流形,提取股票数据中的非线性子流形结构,使得提取的特征更加具有区分度和代表性,并同时降低股票数据噪声;最后再利用遗传算法(GA)优化SVR的训练参数,解决了单一 SVR模型参数选择困难的问题,最终提高股价的预测精度。
[0010]选取基于结构风险最小化原则的支持向量回归机作为预测模型,具有很好的泛化能力且不容易陷入局部极小,并利用遗传算法对其核参数、惩罚因子和不敏感系数进行寻优操作,解决了人工查找参数困难的问题。将线性局部切空间排列算法与经过遗传算法优化的支持向量回归机模型组合,提出了一个新的股票价格优化预测模型,即LLTSA-GA-SVR模型。
【附图说明】
[0011]图1.LLTSA-GA-SVR模型预测流程
[0012]图2.LLTSA特征提取过程
【具体实施方式】
[0013]我们提出的LLTSA-GA-SVR模型如图1所示,预测股价的流程如下:
[0014]I)数据预处理
[0015]收集股票数据后,首先需对股票数据进行预处理,将其转换为适合模型处理的形式。比如根据模型的预测形式,将原始股票数据转化为数据样本集,并划分训练集和测试集;以及对股票数据进行归一化处理,消除量纲差异。
[0016]2) LLTSA 特征提取
[0017]对原始股票数据进行预处理后,利用LLTSA算法提取数据样本集的特征,进行降维和降噪的操作,其处理过程如图2所示。LLTSA算法首先对输入的数据样本集进行PCA投影操作,即将原始数据样本集映射到PCA的主子空间,预先降低数据噪声和维度,使得后续的处理更加高效和方便。然后对样本集中所有的数据点求其邻域,通过线性逼近数据点及其邻域对应的切空间,将数据样本点投影到切空间上,得到局部坐标。通过将所有局部坐标进行全局排列,整合局部信息,构造全局排列矩阵。最后将目标函数转换为特征值的求解,求得能够将高维原始数据样本集映射到低维样本集的转换矩阵,根据该转换矩阵得到降维去噪后的低维特征集。
[0018]3)生成初始种群
[0019]本文选定二进制编码方案对三个参数进行编码,具体做法为将每个参数转化为20位二进制数然后再拼接起来,形成一个候选解。该候选解由三个参数的编码组合即60位二进制数组成。经过编码的个体称为一条染色体。
[0020]4)训练SVR评估个体适应度
[0021]将种群中的每个个体重新拆分为三个参数的二进制序列并分别转化为十进制数,则总共得到20组、和的值。将SVR模型的参数设为其中一组参数值,并对划分的训练样本集进行建模训练,得到预测值与真实值计算MSE,以此评估这组参数对应个体的适应度大小。对种群中20组参数候选值都进行同样的适应度评估,最后将个体按适应度大小排序。
[0022]5)选择、交叉和突变遗传形成新的种群
[0023]对上一步形成的种群按设定的选择概率、交叉概率和突变概率进行选择、交叉和突变三种遗传操作。进行选择操作时按一定的选择概率淘汰种群中不满足适应度要求的个体。进行交叉操作时根据一定的模式和概率对选中的个体进行其部分基因序列交换从而产生新的个体延续至下一代,两个被选择进行交叉遗传操作的个体Cl和C2,C1的高位第12位开始的序列“111”与C2的低三位“000”发生交换,产生如图所示的下一代个体Cl’和C2’。
[0024]进行突变操作时按突变概率选择种群中的个体改变其某个位置的基因符号,得到下一代的个体,其中个体Cl的高位第12位的“I”发生变异,变为“O”,形成新的下一代个体Cl,。
[0025]6)判断迭代条件
[0026]对新生成的种群用步骤4)判断其中包含个体的适应度大小,若有个体的适应度满足设定最优值或总体迭代次数达到上限,则停止迭代,适应度最优个体即为所求;若不满足以上两个条件,则转至步骤4)循环执行直到满足停止条件为止。当迭代停止后,就可以得到最优的个体,至此遗传算法对三个参数的优化完成。
[0027]7)组成最优SVR模型
[0028]将遗传算法处理得到的最优个体分解为三个参数对应的二进制序列再进行十进制转换,即可得到的最优的参数(:、0和£的值,将SVR模型的参数设置为这三个最优值,即可得到经过遗传算法优化的SVR模型。
[0029]8)预测股票价格
[0030]将步骤2)得到的经过LLTSA算法提取特征之后的特征样本集输入到遗传算法优化的SVR模型中,利用其中训练集训练模型,再将训练好的模型在测试集上进行检验,得出股票收盘价的预测值。
【主权项】
1.一种股票价格优化预测方法,其特征在于,包括以下关键步骤: 1)线性局部切空间排列算法特征提取 对原始股票数据进行预处理后,利用线性局部切空间排列提取数据样本集的特征,进行降维和降噪的操作;求得能够将高维原始数据样本集映射到低维样本集的转换矩阵,根据该转换矩阵得到降维去噪后的低维特征集; 2)支持向量回归机参数优化 具体又包括: a.生成初始种群 将每个参数转化为20位二进制数然后再拼接起来,形成一个候选解; b.训练支持向量回归机评估个体适应度 对划分的训练样本集进行建模训练,得到预测值与真实值计算MSE,以此评估这组参数对应个体的适应度大小。对种群中20组参数候选值都进行同样的适应度评估,最后将个体按适应度大小排序; c.选择、交叉和突变遗传形成新的种群 按设定的选择概率、交叉概率和突变概率进行选择、交叉和突变三种遗传操作; d.判断迭代条件 对新生成的种群判断其中包含个体的适应度大小,若有个体的适应度满足设定最优值或总体迭代次数达到上限,则停止迭代,适应度最优个体即为所求;若不满足以上两个条件,则循环执行直到满足停止条件为止;当迭代停止后,就可以得到最优的个体; 3)组成最优支持向量回归机模型 将遗传算法处理得到的最优个体分解为三个参数对应的二进制序列再进行十进制转换,即可得到的最优的参数(:、0和£的值,将支持向量回归机的参数设置为这三个最优值,gp可得到经过遗传算法优化的支持向量回归机模型; 4)预测股票价格 将前述步骤得到的经过线性局部切空间排列算法提取特征之后的特征样本集输入到遗传算法优化的支持向量回归机模型中,利用其中训练集训练模型,再将训练好的模型在测试集上进行检验,得出股票收盘价的预测值。
【文档编号】G06Q10/04GK106056244SQ201610368834
【公开日】2016年10月26日
【申请日】2016年5月30日
【发明人】陈远, 罗必辉, 蒋维琛, 陈文欣
【申请人】重庆大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1