股票预测方法及装置与流程

文档序号:16885223发布日期:2019-02-15 22:34阅读:179来源:国知局
股票预测方法及装置与流程

本发明涉及股票历史数据预测技术领域,尤其是涉及一种股票预测方法及装置。



背景技术:

随着上市公司数量的增加,股票交易数量巨幅增长,对于庞大的股票数据预测若依旧使用传统的方法,容易造成预测数据精度低,例如使用支持向量机模型对股票数据样本进行最优解计算,由于数据量大,且因为支持向量机模型自身的高斯核函数宽度与惩罚因子固定不变,容易造成预测过程鲁棒性差,不能更好的适用于多变场景,使得预测结果准确度低。



技术实现要素:

有鉴于此,本发明的目的在于提供一种股票预测方法及装置,以解决现有技术中由于数据量大,且因为支持向量机模型自身的高斯核函数宽度与惩罚因子固定不变,容易造成预测过程鲁棒性差,不能更好的适用于多变场景,使得预测结果准确度低的技术问题。

第一方面,本发明实施例提供了一种股票预测方法,包括:

获取训练样本,所述训练样本包括股票的若干指标;

根据所述训练样本和支持向量机模型确定含有待定系数的适应度函数;

利用鱼群算法对预设的待定系数样本进行计算得到最优待定系数;

根据所述训练样本、最优待定系数和支持向量机模型确定预测数据。

结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述待定系数,包括:惩罚因子和高斯核宽度系数。

结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中获取训练样本步骤之前,还包括:对带筛选数据进行预处理得到所述训练样本。

结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中利用鱼群算法对预设的待定系数样本进行计算得到最优待定系数的步骤,包括:

获取预设的待定系数样本;

计算待定系数样本内的适应度值,将所述待定系数样本内的个体依据适应度值按顺序排列,选取预设的最优适应度值的个体为发现样本;

根据预设的适应度阈值划分所述个体得到追随样本和探索样本;

根据所述发现样本、追随样本和探索样本进行迭代计算得到最优待定系数。

结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中对追随样本进行迭代计算的公式包括:

w1,w2,....wn分别对应相应的邻近者,适应度值距离追随者距离越近,权重越大,即发现样本不断朝最近邻内适应度更高的个体行进,通过不断最近邻选择,最后向最优解附近靠近。

结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中对发现样本进行迭代计算的公式包括:

xij(t)=vij(t)。

第二方面,本发明实施例还提供一种股票预测装置,包括:

获取模块,用于获取训练样本,所述训练样本包括股票的若干指标;

第一确定模块,用于根据所述训练样本和支持向量机模型确定含有待定系数的适应度函数;

计算模块,用于利用鱼群算法对预设的待定系数样本进行计算得到最优待定系数;

第二确定模块,用于根据所述训练样本、最优待定系数和支持向量机模型确定预测数据。

结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,还包括:

预处理模块,用于对带筛选数据进行预处理得到所述训练样本。

第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

第四方面,本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述方法。

在本发明实施例中,采用获取训练样本,所述训练样本包括股票的若干指标;根据所述训练样本和支持向量机模型确定含有待定系数的适应度函数;利用鱼群算法对预设的待定系数样本进行计算得到最优待定系数;根据所述训练样本、最优待定系数和支持向量机模型确定预测数据的方式,通过鱼群算法对支持向量机模型的待定系数进行更新,避免人为设置参数的不确定性,从而实现了即便数据量大,通过更新迭代的方式使得支持向量机模型可以实时更新,不仅适用于多变场景,并且能够实现提升预测结果准确度技术效果。

本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的股票预测方法流程图;

图2为本发明实施例提供的基于步骤s103方法流程图;

图3为本发明实施例提供的鱼群算法优化支持向量机待定系数流程图;

图4为本发明实施例提供的一种股票预测装置模块示意图;

图5为本发明实施例提供的另一种股票预测装置模块示意图。

图标:

01-获取模块;02-第一确定模块;03-计算模块;04-第二确定模块;05-预处理模块。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

根据本发明实施例,提供了一种股票预测方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行股票预测方法,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的股票预测方法,如图1所示,该方法包括如下步骤:

步骤s101,获取训练样本,所述训练样本包括股票的若干指标;

在本发明实施例中,股票的若干指标包括:开盘价,最高价,最低价,收盘价等技术指标,具体选择的训练样本可以采用不用时间段内的技术指标,具体依据实际情况而定,其次利用训练样本作为支持向量机模型的输入之前需要对数据进行预处理,例如:首先修正和去除不规则数据,然后修补缺失的数据,具体可以采用均值修补法,调取相邻数据取均值修补缺失的数据具体可以依据实际情况而定,本发明对此不做限定。

步骤s102,根据所述训练样本和支持向量机模型确定含有待定系数的适应度函数;

在本发明实施例中,支持向量机的学习问题通常可以表示为对输入变量x和输出变量y之间的未知依赖关系求解,假设有一个独立同分布的观测样本如下:

(x1,y1),(x2,y2),...(xl,yl)∈rn×r

回归问题就是寻找rn上的一组函数{f(x,w)}中的一个函数f(x),用其推断任一输入x对应的y值。支持向量回归机(svr),支持向量机应用于回归预测时,主要通过寻找一个最优分类面,使所有训练样本距离该最优分类面的误差最小。设训练样本为{(xg,yg),g=1,2,...m},其中xg是svm模型的第g个样本输入向量,yg是对应的输出向量,通过以下非线性映射函数实现回归拟合

f(x)=w*φ(x)+b

其中,φ(x)为非线性映射函数,通过引入松弛变量ξg,ξ*g,并假设训练样本都能在精度ε下无误差地用线性函数拟合,则寻找w,b问题可以转化为如下形式:

c为惩罚函数。引入largrange函数,其对偶问题为:

式中,k(xg,xq)=φ(xg)φ(xq)为核函数,回归函数为:

只要部分(μg-μ*g)参数不为0,其对应的样本xg即为支持向量。

核函数采用高斯核:

σ2核函数参数,在本发明实施例中,因为支持向量机模型自身的高斯核函数宽度与惩罚因子固定不变,容易造成预测过程鲁棒性差,不能更好的适用于多变场景,所以首先建立自适应度函数,解析出所述高斯核函数宽度与惩罚因子作为待定系数,目的在于通过优化算法实现对待定系数的更新,使其模型能够适用于更多场景,以及多次预测的过程。

步骤s103,利用鱼群算法对预设的待定系数样本进行计算得到最优待定系数;

在本发明实施例中,预设的待定系数样本是随机生成的,目的在于在更广的范围内进行计算选出最优待定系数,采用鱼群算法为了避免陷入局部最优以及过早收敛,种群中部分成员充当分为“巡逻者”的角色,其进行随机搜索,增加其比例能有效扩大种群的多样性。发现者为具有最优适应度值的个体,跟随者按照其邻域内的个体速度和方向进行更新。可以在种群规模不变的情况下,充分利用群体内部信息传递来实现寻优过程。具体实施方式如图2所示,本发明实施例还提供了一种基于步骤s103,利用鱼群算法对预设的待定系数样本进行计算得到最优待定系数的步骤,包括:

步骤s201,获取预设的待定系数样本;

在本发明实施例中,待定系数样本的准备过程可以包括准备过程:模拟鱼群准备寻找猎物的过程,主要作用为鱼群集体出发觅食做准备,用于初始寻优相关参数以及鱼群位置。目标函数与自变量的定义:定义n为鱼群中鱼的数量,向量xi=(xi1,xi2,...,xij,...xin),i=1,2,...n,j=1,2,...,n为鱼i的当前位置,n为自变量的维数,f(xi)为目标函数,yi=(yi1,yi2,...,yin)为发现者的位置,xij∈(xijmin,xijmax),明确自变量取值范围,即明确鱼群游走边界;b、初始化相关参数:初始化发现者随机扰动柯西分布参数以及溶解度浓度算子,初始化光照算子和食物分布算子的高斯分布参数,初始化鱼个体速度,确定适应度函数fmax,fmin,初始化参与发现者更新的次优值数目n1;c、初始化鱼群位置:当确定好自变量范围,明确鱼群游动范围之后,鱼群初始化位置对算法寻优收敛速度具有较大影响。鱼群分布越均匀,算法收敛性能总体趋好。对于一个多维函数,变量xij的定义域为[xdown,xup],鱼群位置按照下式进行初始化:

xij=β(xup-xdown)+xdown

β为混沌随机数,其取值范围为(0,1),其比rand随机数遍历性,随机性更强。鱼位置初始化之后,计算个体的适应度值,并按照适应度值进行排序,将鱼群体划分为发现者,追随者与探索者。发现者为拥有全局最优适应度的鱼,追随者参考最近邻个体行进,探索者则利用自身判断前进。探索者与追随者的比例由实验确定。探索者此时不再考虑群体传递给它的信息,而是利用自身特性来进行游走,追随者与探索者的比例可调,通过实验确定不同情形下相应的最佳比例分配,本实验设定为0.5,即追随者和探索者的个数相同。

步骤s202,计算待定系数样本内的适应度值,将所述待定系数样本内的个体依据适应度值按顺序排列,选取预设的最优适应度值的个体为发现样本;

在本发明实施例中,在鱼群算法中,拥有最佳适应度值的鳄鱼被选作发现者,传统寻优算法中最优解一般不再变动,但是为了增强鱼群整体的寻优能力,因此发现者及一部分次优者需要在局部范围内随机扰动,确保算法的寻优能力。发现者和距离最优者一定范围内的固定数量的次优者利用柯西扰动进行局部搜索。将适应度值从最优到最差进行排序,选取前n1个次优值进行柯西扰动。其每一维的更新方式,柯西分布随机数按照下式生成:

xg(t)=(1-c(x0,γ))xg(t-1)+c(x0,γ),n1=4

xg(t)为当前代的全局最优解或次优解,c(x0,γ)为由柯西概率分布生成的随机数,x0,γ依次为柯西分布的位置参数和尺度参数。

步骤s203,根据预设的适应度阈值划分所述个体得到追随样本和探索样本;

在本发明实施例中,需要根据预设的适应度阈值划分对样本进行划分,及按照一定的比例确定追随样本和探索样本,具体步骤如下:1、确定追随者与探索者个体:确定群体中追随者个体、探索者个体。a、确定追随者与探索者总体个数以及追随者与探索者的比例,计算追随者与探索者的个数,不足1,直接舍去。b、选取初始种群的前s比例为追随者,后面为探索者;2、确定追随者最近邻:传统的最近邻策略仅单独采用固定距离或者固定数量的策略,本算法提出结合固定距离和固定数量的最近邻策略,其适用范围更广;3、基于固定距离的最近邻策略可能无法考虑鳄鱼群体强大的感应彼此的能力,鱼群体之间的特有语言能够保证群体之间相互交流,若距离选择不恰当,可能没有最近邻个体,此时将丧失群体属性,若采用固定数量的最近邻策略,当某个体固定距离内的最近邻超过固定数量限制,则无法全面考虑追随者个体的所有邻近个体。因此采用结合两种策略的最近邻策略,确定合适的距离参数,使其既能考虑种群的密集度,又能充分利用追随者附近个体适应度值信息。若种群密集度过大,即固定数量过大,则追随者没有必要考虑所有邻近者,因此考虑固定数量n满足10≤n≤50。为固定距离,既能避免群体过于拥挤,极端情况下,聚类数目为1时,此时不考虑最近邻,也能在一般情况下折中处理群体团簇,使团簇能够合理聚集,或合理发散。

dmax=max(d)

dmin=min(d)

xi=(xi1,...,xin),xj=(xj1,...,xjn);

4、追随者更新:模拟粒子群算法中群体中其他成员的影响,量化群体间信息交流过程。通过自适应固定距离与固定数量的最近邻策略,追随者能自适应的进行位置更新,其更新方式如下:

其中,w1,w2,....wn分别对应相应的邻近者,适应度值距离追随者距离越近,权重越大,即鳄鱼不断朝最近邻内适应度更高的个体行进。通过不断最近邻选择,最后向最优解附近靠近。另外,探索样本中需要利用探索者进行全局寻优,模拟鱼利用自身导航系统进行迁移的过程。

步骤s204,根据所述发现样本、追随样本和探索样本进行迭代计算得到最优待定系数。

在本发明实施例中,提供了完整的基于鱼群算法对支持向量机待定系数更新的流程图,如图3所示,对当代的最优位置的适应度值进行判断,看其是否符合终止条件,若符合,则为全局最优值,反之返回继续迭代更新。

步骤s104,根据所述训练样本、最优待定系数和支持向量机模型确定预测数据。

在本发明实施例中,本发明使用改进鱼群算法优化支持向量机的高斯核函数宽度和惩罚因子,改进了支持向量机回归预测过程鲁棒性差的缺陷,并且通过改进鱼群算法自适应的优化支持向量机参数,避免了人为确定参数的不确定性,能够更好的适应不同场景。所获得支持向量机模型可以单独利用股票指数的预测下一时间段的股票指数,自适应依据不同历史数据确定支持向量机参数,能为投资者提供参考。

本发明实施例还提供了一种股票预测装置,该股票预测装置主要用于执行本发明实施例上述内容所提供的股票预测方法,以下对本发明实施例提供的股票预测装置做具体介绍。一种股票预测装置,如图4所示,包括:

获取模块01,用于获取训练样本,所述训练样本包括股票的若干指标;

第一确定模块02,用于根据所述训练样本和支持向量机模型确定含有待定系数的适应度函数;

计算模块03,用于利用鱼群算法对预设的待定系数样本进行计算得到最优待定系数;

第二确定模块04,用于根据所述训练样本、最优待定系数和支持向量机模型确定预测数据。

本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明的又一实施例中,如图5所示,所述股票预测装置还包括:

预处理模块05,用于对带筛选数据进行预处理得到所述训练样本。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本发明实施例还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述方法。

另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1