一种基于上证50ETF的期权涨跌预测方法及装置与流程

文档序号:16251306发布日期:2018-12-12 00:03阅读:161来源:国知局
一种基于上证50ETF的期权涨跌预测方法及装置与流程

本发明属于金融量化投资技术领域,更具体地,涉及一种基于上证50etf的期权涨跌预测方法及装置。

背景技术

股市、期货市场等是一个多空双方博弈、非线性、混沌而复杂多变的系统,对其进行严谨、科学的预测非常困难。近年来,人们试图通过量化分析来探索其规律性,挖掘市场中的隐含信息,已获得良好的收益。

现有技术中有利用svm(supportvectormachine,支持向量机)模型对韩国综合股价指数kospi进行了研究预测,有基于时间序列的svm股票预测方法,有基于pca(principalcomponentanalysis,主成分分析)和svm模型对沪深300指数进行量化择时研究的方法等。这些方法一方面对个股进行预测研究,选择特定时间的个股,缺乏通用性;另一方面,由于个股的价格易受单边消息的影响,因此预测的精度较低。



技术实现要素:

为克服上述现有的预测方法通用性低,且预测精度低的问题或者至少部分地解决上述问题,本发明提供一种基于上证50etf的期权涨跌预测方法及装置。

根据本发明的第一方面,提供一种基于上证50etf的期权涨跌预测方法,包括:

基于主成分分析法将预先获取的预设历史时间段内上证50etf的指标数据结合成所述上证50etf的综合数据;

根据所述综合数据,基于训练好的svm算法对所述预设历史时间段之后预设未来时间段内上证50etf的期权涨跌进行预测。

根据本发明第二方面提供一种基于上证50etf的期权涨跌预测装置,包括:

分析模块,用于基于主成分分析法将预先获取的预设历史时间段内上证50etf的指标数据结合成所述上证50etf的综合数据;

预测模块,用于根据所述综合数据,基于训练好的svm算法对所述预设历史时间段之后预设未来时间段内上证50etf的期权涨跌进行预测。

根据本发明的第三方面,提供一种电子设备,包括:

至少一个处理器、至少一个存储器和总线;其中,

所述处理器和存储器通过所述总线完成相互间的通信;

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如前所述的方法。

根据本发明的第四方面,提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如前所述的方法。

本发明提供一种基于上证50etf的期权涨跌预测方法及装置,该方法通过根据50etf期权价格与50etf满足平价公式的特性,进而预测50etf的涨跌来判断对应期权的涨跌,通过使用主成分分析法对预设历史时间段内上证50etf的指标数据进行降维,获取综合数据,根据综合数据,使用训练好的svm算法对预设历史时间段之后预设未来时间段内上证50etf的期权涨跌进行预测,一方面,通过主成分分析方法提高了预测速度;另一方面,使用对上证50etf整体的期权涨跌预测替代单纯的股价预测,具有良好的通用性,预测精度高。

附图说明

图1为本发明实施例提供的基于上证50etf的期权涨跌预测方法整体流程示意图;

图2为本发明实施例提供的基于上证50etf的期权涨跌预测装置整体结构示意图;

图3为本发明实施例提供的电子设备整体结构示意图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

在本发明的一个实施例中提供一种基于上证50etf的期权涨跌预测方法,图1为本发明实施例提供的基于上证50etf的期权涨跌预测方法整体流程示意图,该方法包括:s101,基于主成分分析法将预先获取的预设历史时间段内上证50etf的指标数据结合成所述上证50etf的综合数据;

其中,统计50etf及对应期权的收盘价进行分析,可知上证50etf的期权价格和上证50etf满足平价公式的特性,说明可以预测上证50etf的价格走势来指导50etf的投资。预设历史时间段为预先选择的一个历史时间段。上证50etf的指标数据为描述上证50etf特征的数据。根据预设历史时间段的上证50etf的指标数据预测该预设历史时间段之后的预设未来时间段的期权涨跌。例如,根据2018年7月份上证50etf的指标数据预测2018年8月份的期权涨跌或预测2018年8月份前5天的期权涨跌。综合数据是指将多个指标转换为几个综合指标以后的数据。通过主成分分析法是一种主要用于降维的多元数学统计方法,把多个上证50etf的指标数据转化为少数几个综合指标数据。上证50etf的各指标之间存在相关性,通过主成分分析法将一组相关的指标通过线性变化转换成另一组不相关的指标,在转换过程中保存指标数据的总方差不变。将变换后的指标按照方差依次递减的顺序排列,其中,第一个变换后的指标具有最大方差,称为第一主成分,第二主成分的方差次大,且与第一主成分不相关,依次类推。从而实现对上证50etf的指标数据的降维,大大较少计算,加快期权涨跌预测的速度。

s102,根据所述综合数据,基于训练好的svm算法对所述预设历史时间段之后预设未来时间段内上证50etf的期权涨跌进行预测。

其中,其中,svm(supportvectormachine,支持向量机)算法是常见的一种判别方法。在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。svm算法是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能。svm基于结构风险最小化理论之上在特征空间中构建最优超平面,使得学习器得到全局最优化,并且在整个样本空间的期望以某个概率满足一定上界。

本实施例根据50etf期权价格与50etf满足平价公式的特性,进而预测50etf的涨跌来判断对应期权的涨跌,通过使用主成分分析法对预设历史时间段内上证50etf的指标数据进行降维,获取综合数据,根据综合数据,使用训练好的svm算法对预设历史时间段之后预设未来时间段内上证50etf的期权涨跌进行预测,一方面,通过主成分分析方法提高了预测速度;另一方面,使用对上证50etf整体的期权涨跌预测替代单纯的股价预测,具有良好的通用性,预测精度高。

在上述实施例的基础上,本实施例中基于主成分分析法将预先获取的预设历史时间段内上证50etf的指标数据结合成所述上证50etf的综合数据的步骤具体包括:对所述指标数据进行标准化,获取标准化后的所述指标数据的矩阵;根据所述矩阵的特征值获取各主成分的累积贡献率;将所述特征值大于第一预设阈值且所述累积贡献率大于第二预设阈值的主成分的值作为所述综合数据。

具体地,对指标数据进行标准化的目的是统一各指标数据的单位。根据标准化后的指标数据的矩阵获取相关系数矩阵。根据指标数据的矩阵和相关系数矩阵获取特征值。根据特征值获取各主成分的贡献率,根据贡献率获取各主成分的累积贡献率。将特征值大于第一预设阈值且所述累积贡献率大于第二预设阈值的主成分的值作为综合指标值。第一预设阈值为1,第二预设阈值的范围为85%-95%。

本实施例通过使用主成分分析法将获取的各类指标数据结合成综合数据,根据各类指标数据之间的相互关系对各类指标数据进行降维,简化了数据结构,提高了运算速度。

在上述实施例的基础上,本实施例中根据所述综合数据,基于训练好的svm算法对所述预设历史时间段之后预设未来时间段内上证50etf的期权涨跌进行预测的步骤之前还包括:将训练集中各预设历史时间段内上证50etf的指标数据作为对所述svm算法进行训练的输入;基于模糊信息粒化方法将各所述预设历史时间段之后的预设未来时间段内的收盘价作为一个信息粒进行粒化,将粒化后的收盘价的涨跌作为对所述svm算法进行训练的标签;其中,各所述预设未来时间段与对应的预设历史时间段之间的时间间隔相等,各所述预设历史时间段所包含的天数相同,各所述预设未来时间段所包含的天数相同;根据所述输入和所述输入对应的标签,对所述svm算法进行训练,获取所述预设历史时间段所包含的天数。

具体地,将预设历史时间段内上证50etf一天的指标数据作为一组特征,将预设历史时间段内连续n天的特征作为一组变量。将预设历史时间段的预设未来时间段中连续m天的行情粒化为一个标签。将变量和标签输入svm算法中进行训练。例如选择前n天的指标数据归一化处理后作为svm算法的输入,将接下来5天的收盘价当作一个信息粒进行粒化。粒化后的收盘价为其中a为信息粒,close为收盘价,a和b分别为模糊粒子的支撑下界和支撑上界,m为模糊粒子的核。每个预设历史时间段有一个对应的预设未来时间段。

在上述实施例的基础上,本实施例中所述指标数据包括所述上证50etf的开盘价、最高价、最低价、收盘价、成交量、成交额和成交次数中的一种或多种。

在上述各施例的基础上,本实施例中根据所述综合数据,基于训练好的svm算法对所述预设历史时间段之后预设未来时间段内上证50etf的期权涨跌进行预测的步骤之前还包括:基于改进的foa算法对svm算法中的惩罚系数和核函数参数进行优化;其中,基于改进的foa算法对svm算法中的惩罚系数和核函数参数进行优化的步骤具体包括:根据果蝇群体中各果蝇进行参数优化的三维坐标,计算各所述果蝇与原点之间的距离;根据各所述距离计算味道浓度判定值,根据所述味道浓度判定值对svm算法中的惩罚系数和核函数参数进行赋值;基于5折交叉验证,将所述味道浓度判定值作为适应度函数的参数进行计算,获取各所述三维坐标处的味道浓度和最大的所述味道浓度对应的三维坐标;将最大的所述味道浓度对应的三维坐标作为各所述果蝇下一次进行参数优化的三维坐标。

其中,foa(fruitflyoptimizationalgorithm,果蝇优化算法)是一种对果蝇在觅食过程中的行为进行仿真模拟从而总结得出的一种优化算法。自然界中果蝇感觉器官的特性优于其他动物,特别表现在嗅觉与视觉方面。漂浮在大气中的许多味道都能被果蝇闻到并且找寻到其位置所在,果蝇最远可以闻到比40公里更远距离的食物味道。随后,当其靠近食物所在的地方后,可以通过灵活的眼睛找到食物与伙伴汇集的地方。在非线性情况中,svm算法的分类正确度和推广能力依托于参数的选择。利用标准foa算法对svm参数进行优化,易导致局部最优,从而错过最佳参数,使得收敛精度不高。为避免陷入局部最优,本实施例中使用改进的foa算法,改进的foa算法是一种三维空间区域全局寻优的算法,这样就使果蝇搜索空间扩大,具有更好的寻优效果。

基于改进的foa算法对svm算法进行优化,设定果蝇群体的规模为k,群体最大迭代次数gmax,果蝇随机飞行搜寻范围h,随机给定果蝇开始的位置(x1,y1,z1)。果蝇个体通过嗅觉寻找食物,由于优化参数是svm的惩罚系数c和核函数参数g两个参数,所以x,y,z分别为k行2列的矩阵。

其中,i=1,2,...,k;x(i)、y(i)和z(i)均为k维的矩阵;rand为0~1之间的随机数或伪随机数。果蝇一开始不知道食物源的具体坐标,根据每个果蝇与原点的间距d(i,:)算出味道浓度判定值s(i,:),并对svm的参数(c,g)赋值。

c=cm*s(i,1);

g=gm*s(i,2);

其中,c为惩罚系数;g为核函数参数,cm是c的缩放系数,gm是g的缩放系数。例如,根据实验经验判定cm取20,gm取1。

学习样本采用5折交叉验证,将s(i,:)带入适应度函数,算出该果蝇个体位置的味道浓度smelli和此果蝇群体中味道浓度最高的果蝇。

smelli=fouction(s(i,:));

[bestsmell,bestindex]=max(smelli);

其中,function为适应度函数;bestsmell为最优味道浓度值;bestindex为最优味道浓度值对应的果蝇位置。

将果蝇群体中味道浓度最高的果蝇位置x,y,z以及最优味道浓度值记录下来,那么果蝇就会根据其知觉向该位置飞去。

smellbest=bestsmell;

反复进行迭代寻优,直到达到目标精度要求或迭代次数达到最大值时,迭代终止。

本实施例中利用改进的foa算法对svm分类器的参数进行优化,提高算法分类的性能。

在上述施例的基础上,本实施例中所述模糊信息粒化方法中的模糊粒子为三角型模糊粒子,所述三角型模糊粒子的隶属函数的公式为:

其中,a为所述三角型模糊粒子,x为所述三角型模糊粒子所包含的任一收盘价,a为所述三角型模糊粒子的支撑下界,b为所述三角型模糊粒子的支撑上界,m1和m2为所述三角型模糊粒子的核。

由于现有的模糊粒化方法得到的模糊集的支撑相对较小,造成数据信息的过多丢失,会造成所建粒子失去实际意义。造成数据大量丢失的原因是没有考虑到粒子支撑以外的数据对粒子整体的负面影响,即粒子支撑以外的数据的隶属度为0。针对这种情况,为考虑粒子支撑以外的数据对粒子整体的影响,对模糊粒子的隶属函数进行修改。

在上述施例的基础上,本实施例中m1和m2通过以下步骤获取:将所述三角型模糊粒子所包含的收盘价的个数减去预设常数后除以2的值作为第一位置,将所述三角型模糊粒子所包含的收盘价排序后所述第一位置处的收盘价作为m1;将所述三角型模糊粒子所包含的收盘价的个数加上所述预设常数后除以2的值作为第二位置,将三角型模糊粒子所包含的收盘价排序后所述第二位置处的收盘价作为m2;其中,当所述三角型模糊粒子所包含的收盘价的个数为偶数时,所述预设常数为偶数;当所述三角型模糊粒子所包含的收盘价的个数为奇数时,所述预设常数为奇数。

在本发明的另一个实施例中提供一种基于上证50etf的期权涨跌预测装置,该装置用于实现前述各实施例中的方法。因此,在前述各实施例中基于上证50etf的期权涨跌预测方法中的描述和定义,可以用于本发明实施例中各个执行模块的理解。图2为本发明实施例提供的基于上证50etf的期权涨跌预测装置整体结构示意图,该装置包括分析模块201和预测模块202;其中:

分析模块201用于基于主成分分析法将预先获取的预设历史时间段内上证50etf的指标数据结合成所述上证50etf的综合数据;预测模块202用于根据所述综合数据,基于训练好的svm算法对所述预设历史时间段之后预设未来时间段内上证50etf的期权涨跌进行预测。

在上述实施例的基础上,本实施例中分析模块具体用于:对所述指标数据进行标准化,获取标准化后的所述指标数据的矩阵;根据所述矩阵的特征值获取各主成分的累积贡献率;将所述特征值大于第一预设阈值且所述累积贡献率大于第二预设阈值的主成分的值作为所述综合数据。

在上述实施例的基础上,本实施例中还包括训练模块,用于将训练集中各预设历史时间段内上证50etf的指标数据作为对所述svm算法进行训练的输入;基于模糊信息粒化方法将各所述预设历史时间段之后的预设未来时间段内的收盘价作为一个信息粒进行粒化,将粒化后的收盘价的涨跌作为对所述svm算法进行训练的标签;其中,各所述预设未来时间段与对应的预设历史时间段之间的时间间隔相等,各所述预设历史时间段所包含的天数相同,各所述预设未来时间段所包含的天数相同;根据所述输入和所述输入对应的标签,对所述svm算法进行训练,获取所述预设历史时间段所包含的天数。

在上述实施例的基础上,本实施例中所述指标数据包括所述上证50etf的开盘价、最高价、最低价、收盘价、成交量、成交额和成交次数中的一种或多种。

在上述各实施例的基础上,本实施例中还包括优化模块,用于基于改进的foa算法对svm算法中的惩罚系数和核函数参数进行优化;其中,优化模块具体用于:根据果蝇群体中各果蝇进行参数优化的三维坐标,计算各所述果蝇与原点之间的距离;根据各所述距离计算味道浓度判定值,根据所述味道浓度判定值对svm算法中的惩罚系数和核函数参数进行赋值;基于5折交叉验证,将所述味道浓度判定值作为适应度函数的参数进行计算,获取各所述三维坐标处的味道浓度和最大的所述味道浓度对应的三维坐标;将最大的所述味道浓度对应的三维坐标作为各所述果蝇下一次进行参数优化的三维坐标。

在上述实施例的基础上,本实施例中模糊信息粒化方法中的模糊粒子为三角型模糊粒子,所述三角型模糊粒子的隶属函数的公式为:

其中,a为所述三角型模糊粒子,x为所述三角型模糊粒子所包含的任一收盘价,a为所述三角型模糊粒子的支撑下界,b为所述三角型模糊粒子的支撑上界,m1和m2为所述三角型模糊粒子的核。

在上述实施例的基础上,本实施例中训练模块具体用于:将所述三角型模糊粒子所包含的收盘价的个数减去预设常数后除以2的值作为第一位置,将所述三角型模糊粒子所包含的收盘价排序后所述第一位置处的收盘价作为m1;将所述三角型模糊粒子所包含的收盘价的个数加上所述预设常数后除以2的值作为第二位置,将所述三角型模糊粒子所包含的收盘价排序后所述第二位置处的收盘价作为m2;其中,当所述三角型模糊粒子所包含的收盘价的个数为偶数时,所述预设常数为偶数;当所述三角型模糊粒子所包含的收盘价的个数为奇数时,所述预设常数为奇数。

本实施例通过根据50etf期权价格与50etf满足平价公式的特性,进而预测50etf的涨跌来判断对应期权的涨跌,通过使用主成分分析法对预设历史时间段内上证50etf的指标数据进行降维,获取综合数据,根据综合数据,使用训练好的svm算法对预设历史时间段之后预设未来时间段内上证50etf的期权涨跌进行预测,一方面,通过主成分分析方法提高了预测速度;另一方面,使用对上证50etf整体的期权涨跌预测替代单纯的股价预测,具有良好的通用性,预测精度高。

本实施例提供一种电子设备,图3为本发明实施例提供的电子设备整体结构示意图,该设备包括:至少一个处理器301、至少一个存储器302和总线303;其中,

处理器301和存储器302通过总线303完成相互间的通信;

存储器302存储有可被处理器301执行的程序指令,处理器调用程序指令能够执行上述各方法实施例所提供的方法,例如包括:基于主成分分析法将预先获取的预设历史时间段内上证50etf的指标数据结合成所述上证50etf的综合数据;根据所述综合数据,基于训练好的svm算法对所述预设历史时间段之后预设未来时间段内上证50etf的期权涨跌进行预测。

本实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:基于主成分分析法将预先获取的预设历史时间段内上证50etf的指标数据结合成所述上证50etf的综合数据;根据所述综合数据,基于训练好的svm算法对所述预设历史时间段之后预设未来时间段内上证50etf的期权涨跌进行预测。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的电子设备实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。

最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1