一种混沌时间序列预测方法及系统与流程

文档序号:16311963发布日期:2018-12-19 05:19阅读:470来源:国知局
一种混沌时间序列预测方法及系统与流程

本发明涉及计算机应用技术领域,尤其涉及一种混沌时间序列预测方法系统。

背景技术

随着非线性科学的快速发展,混沌理论的研究成为了非线科学研究的主要方向。混沌是非线性系统所特有的一种运动形式,现实物质世界中混沌现象无处不在,大至宇宙,小至基本粒子,无不受混沌理论支配,是一门新兴的学科。其中,混沌时间序列已经成为混沌预测理论的一个重要应用领域和研究热点。

针对混沌时间序列预测问题,专家和学者进行了深入研究,提出了许多有效、切实可行的预测模型,例如:线性回归分析、灰色模型和时间序列等,但这些方法基于线性建模,不能准确刻画混沌时间序列的非平稳性、突变和混沌等特点,预测精度低。近年来,出现了基于混沌理论的预测模型。其中,相空间重构用于对隐藏于数据间的信息进行深入挖掘,对原动力系统进行描述;最小二乘支持向量机(lssvm)是基于结构风险最小化原则的算法,具有很强的自学习能力和逼近任意非线性系统的能力,克服了传统机器学习算法过拟合、局部最优缺陷,泛化能力优异,成为混沌时间序列的主要预测算法。

在基于相空间重构与lssvm的预测过程中,相空间重构与lssvm的参数共同决定了预测精度。然而传统上两者常单独优化,忽略两者间的内在联系,这样难以获得全局最优预测。针对这种不足,本发明采用遗传算法(geneticalgorithm,ga)对相空间重构与lssvm参数进行联合优化,提出了基于遗传优化的相空间重构和最小二乘支持向量机预测方法。这种方法预测结果误差更小,预测精度进一步提高,能更好满足大规模混沌时间序列预测的实时性需求。



技术实现要素:

本发明要解决的技术问题目的在于提供一种混沌时间序列预测方法及系统,用以解决现有的混沌时间序列预测问题不能准确刻画混沌时间序列的非平稳性、变突和混沌等特点,预测精度低的问题。

为了实现上述目的,本发明采用的技术方案为:

一种混沌时间序列预测方法,包括步骤:

从一维混沌时间序列中重构相空间向量得到相空间重构参数并基于最小二乘支持向量机对混沌时间序列进行预测得到最小二乘支持向量机参数;

采用遗传算法将所述相空间重构参数与所述最小二乘支持向量机参数进行联合优化得到最优参数值;

采用所述最优参数值进行相空间重构和最小二乘支持向量机建模以输出预测结果。

上述方案中,所述从一维混沌时间序列中重构相空间向量得到相空间重构参数的步骤,具体为:

从一维混沌时间序列中重构一个与原动力系统在拓扑意义下等价的m维相空间矢量,所述从一维混沌时间序列中重构一个与原动力系统在拓扑意义下等价的m维相空间矢量包括步骤:

设观测到的一维混沌时间序列为{x(t)},其中,t=1,2,3,…,n,n表示样本数;根据塔肯斯定理,通过确定延迟时间τ和嵌入m维相空间矢量将数据重构;

x(t)={x(t),x(t+τ),x(t+2τ),…,x(t+(m-1)t)}。

上述方案中,所述基于最小二乘支持向量机对混沌时间序列进行预测得到最小二乘支持向量机参数的步骤,具体包括:

采用径向基核函数作为最小二乘支持向量机的核函数以构建最小二乘支持向量机模型;

根据构建的所述最小二乘支持向量机模型得到惩罚参数和径向基核数宽度。

上述方案中,所述采用径向基核函数作为最小二乘支持向量机的核函数以构建最小二乘支持向量机模型的步骤具体包括:

设获得的混沌时间序列数据集为:{(xi,yi)},i=1,2,3,…,n,非线性函数将所述混沌时间序列数据集映射到高维特征空间进行线性回归,即有:

其中,b表示偏置量,w表示权值向量,根据最小二乘支持向量机的原理将上式转化为:

其中,γ表示惩罚参数,ei表示模型预测误差;

将上式引入拉格朗日乘子转换为:

其中,αi表示拉格朗日乘子;

通过引入核函数转换成非线预测,根据mercer条件,核函数定义为:

径向基核函数定义为:

其中,σ表示径向基核数宽度。

上述方案中,所述根据构建的所述最小二乘支持向量机模型得到惩罚参数和径向基核数宽度的步骤具体包括:

所述最小二乘支持向量机模型为:

根据所述最小二乘支持向量机模型得到惩罚参数γ和径向基核数宽度σ。

上述方案中,所述采用遗传算法将所述相空间重构参数与所述最小二乘支持向量机参数进行联合优化得到最优参数值的步骤,具体包括:

对混沌时间序列的初始数据进行归一化处理,

以所述延迟时间τ、嵌入m维相空间矢量、惩罚参数γ和径向基核数宽度σ对染色体进行编码并随机生成初始种群:

通过下列公式对染色体进行编码:

其中,minp和maxp分别为参数的最小值和最大值,l为位串长度,d位二进制位串;

对染色体进行反编码以得到反编码的延迟时间τ、嵌入m维相空间矢量、惩罚参数γ和径向基核数宽度σ,并根据所述反编码的延迟时间τ和嵌入m维相空间矢量进行相空间重构,根据所述反编码的惩罚参数γ和径向基核数宽度σ对所述最小二乘支持向量机模型进行重构,从而得到每一组参数的网络流量预测精度以对个体适应度值进行计算;

判断是否达到算法的最大进化代数或者种群的最优个体所对应的适应度函数值的变化在预设范围内,若是,参数优化结束;否则,继续进行迭代。

上述方案中,所述对染色体进行反编码以得到反编码的延迟时间、嵌入m维相空间矢量、惩罚参数和径向基核数宽度,并根据所述反编码的延迟时间和嵌入m维相空间矢量进行相空间重构,根据所述反编码的惩罚参数和径向基核数宽度对所述最小而成支持向量机模型进行重构,从而得到每一组参数的网络流量预测精度以对个体适应度值进行计算的步骤,具体包括:

先对染色体进行反编码:

x=x′(xmax-xmin)+xmin;

得到参数τ、m、γ和σ的一组值,并根据τ和m进行空间重构,根据γ和σ进行最小二乘支持向量建模,由此得到每一组的预测精度,通过预测结果对个体适应度值进行计算:

将个体适应度函数定义为:

其中mse表示均方误差,其定义如下:

其中,n表示训练样本大小,yi和分别表示期望值和预测值。

上述方案中,所述判断是否达到算法的最大进化代数或者种群的最优个体所对应的适应度函数值的变化在预设范围内,若是,参数优化结束;否则,继续进行迭代的步骤,具体包括:

假定个体xi的适应度为f(xi),则该个体被选择的概率psi为:

其中,∑f(xi)表示群体中的个体适应度的综合;

在染色体的4段上分别选择4个交叉点,然后分别进行交叉,交叉完后,如果其值不在参数取值范围内,则重新交叉;

根据变异概率选择一个染色体,然后随机选择一个变异点,采用0→1,1→0的规律进行编译,变异后如果其值不在参数取值范围内,则重新变异。

上述方案中,所述采用所述最优参数值进行相空间重构和最小二乘支持向量机建模以输出预测结果的步骤,具体包括:

采用所述最优参数值进行相空间重构和最小二乘支持向量机建模输出模型预测结果;

得到最优参数τ、m、γ和σ后,采用τ和m对网络流量时间序列进行重构;γ和σ作为最小二乘支持向量机的参数进行建模,对测试集进行预测,输出预测结果;

对所述模型预测结果进行反归一化处理以恢复真实预测值:

x=x′(xmax-xmin)+xmin;

其中,x表示原始数据,xmin和xmax分别表示最小值和最大值。

一种混沌时间序列预测系统,包括步骤:

参数计算模块,用于从一维混沌时间序列中重构相空间向量得到相空间重构参数并基于最小二乘支持向量机对混沌时间序列进行预测得到最小二乘支持向量机参数;

遗传算法模块,用于采用遗传算法将所述相空间重构参数与所述最小二乘支持向量机参数进行联合优化得到最优参数值;

输出结果模块,用于采用所述最优参数值进行相空间重构和最小二乘支持向量机建模以输出预测结果。

本发明与传统的技术相比,有如下优点:

本发明采用遗传算法对相空间重构和最小二乘支持向量机进行联合优化,预测结果误差更小,预测精度进一步提高,能更好地满足大规模混沌时间序列预测地实时性需求。

附图说明

图1为本发明一实施例中混沌时间序列预测方法的流程示意图;

图2为本发明一实施例中模型拟合结果示意图;

图3为本发明一实施例中测试集的预测结果示意图;

图4为本发明一实施例中混沌时间序列预测系统的结构示意图。

具体实施方式

以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。

除非另有定义,本文所使用的所有的技术和科学术语与本发明的技术领域技术人员通常理解的含义相同。本文中在本发明说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。

本发明采用遗传算法,对相空间重构与最小二乘支持向量机的参数进行联合优化,提出了基于遗传优化的相空间重构和最小二乘支持向量机预测方法,使混沌时间序列预测结果误差更小,预测精度进一步提高,能更好地满足大规模混沌时间序列预测的实时性的需求。

请参阅图1,为本发明一实施例中混沌时间序列预测方法的流程示意图,将分别对各个步骤进行说明。

s101、从一维混沌时间序列中重构相空间向量得到相空间重构参数并基于最小二乘支持向量机对混沌时间序列进行预测得到最小二乘支持向量机参数。

该步骤包括相空间重构和构建最小二乘支持向量机模型两个步骤。相空间是一个用以表示出一系列所有可能状态的空间;系统每个可能的状态都有一相应对的相空间的点。最小二乘支持向量机是一种遵循结构风险最小化原则的核函数学习机器。

其中,步骤s101中,从一维混沌时间序列中重构相空间向量得到相空间重构参数的步骤,具体为:

从一维混沌时间序列中重构一个与原动力系统在拓扑意义下等价的m维相空间矢量;所述从一维混沌时间序列中重构一个与原动力系统在拓扑意义下等价的m维相空间矢量包括步骤:

设观测到的一维混沌时间序列为{x(t)},其中,t=1,2,3,…,n,n表示样本数;

根据塔肯斯定理,通过确定延迟时间和嵌入m维相空间矢量将数据重构;

x(t)={x(t),x(t+τ),x(t+2τ),…,x(t+(m-1)t)}。

具体的,设观测到的混沌时间序列为{x(t)},其中,t=1,2,3,…,n,n表示样本数。根据塔肯斯定理,通过确定最佳延迟时间τ和嵌入m维相空间矢量将数据重构为:

x(t)={x(t),x(t+τ),x(t+2τ),…,x(t+(m-1)t)};1)

其中,参数τ和m决定着相空间重构结果的优劣,而相空间重构质量直接影响着模型的预测结果。

步骤s101中,基于最小二乘支持向量机对混沌时间序列进行预测得到最小二乘支持向量机参数的步骤,具体包括:

采用径向基核函数作为最小二乘支持向量机的核函数以构建最小二乘支持向量机模型;

根据构建的所述最小二乘支持向量机模型得到惩罚参数和径向基核数宽度。

步骤s101中,所述采用径向基核函数作为最小二乘支持向量机的核函数以构建最小二乘支持向量机模型的步骤具体包括:

设获得的混沌时间序列数据集为:{(xi,yi)},i=1,2,3,…,n,非线性函数将所述混沌时间序列数据集映射到高维特征空间进行线性回归,即有:

其中,b表示偏置量,w表示权值向量,根据最小二乘支持向量机的原理将上式转化为:

其中,γ表示惩罚参数,ei表示模型预测误差;

将上式引入拉格朗日乘子转换为:

其中,αi表示拉格朗日乘子;

通过引入核函数转换成非线预测,根据mercer条件,核函数定义为:

径向基核函数定义为:

其中,σ表示径向基核数宽度。

具体的,设获得的混沌时间序列数据集为:{(xi,yi)},i=1,2,3,…,n,非线性函数将数据集映射到高维特征空间进行线性回归,即有:

其中,b表示偏置量,w表示权值向量。根据最小二乘支持向量机的原理,式2)问题求解可以转化为一个二次优化问题,即:

其中,γ表示惩罚参数,ei表示模型预测误差。

引入拉格朗日乘子将式3)转换为对偶优化问题,即:

其中,αi表示拉格朗日乘子。

对于非线性回归问题,通过引入核函数转换成非线预测,根据mercer条件,核函数定义为:

径向基核函数定义为:

其中,σ表示径向基核数宽度。

步骤s101中所述根据构建的所述最小二乘支持向量机模型得到惩罚参数和径向基核数宽度的步骤具体包括:

所述最小二乘支持向量机模型为:

根据所述最小二乘支持向量机模型得到惩罚参数γ和径向基核数宽度σ。

具体的,本发明实施例采用径向基核函数作为最小二乘支持向量机的核函数,所述最小二乘支持向量机模型为:

s103、采用遗传算法将相空间重构参数与最小二乘支持向量机参数进行联合优化得到最优参数值。

当前,相空间重构参数τ、m的优化方法主要有时间窗口法、c-c法和自相关联函数法等,这些方法性能各异,判断标准具有较强主观性。最小二乘支持向量机参数γ、σ优化方法主要有遗传算法、粒子群优化算法和网络搜索算法等。网络搜索算法速度慢、耗内存多、运算量大,难以获得全局最优解,容易陷入局部最优;而传统基于遗传算法和粒子群优化算法没有考虑最小二乘支持向量机参数和相空间重构间的联系,指对最小二乘支持向量机参数进行优化,不能保证找到全局最优参数。本实施例采用遗传算法对参数τ、m、γ和σ进行联合优化。

遗传算法是美国密歇根大学holland教授提出的进化算法,模拟适者生存机制,通过遗传机制对种群进行进化,找到问题的最优解。

其中,步骤s103,具体包括:

对混沌时间序列的初始数据进行归一化处理,

以所述延迟时间τ、嵌入m维相空间矢量、惩罚参数γ和径向基核数宽度σ对染色体进行编码并随机生成初始种群:

通过下列公式对染色体进行编码:

其中,minp和maxp分别为参数的最小值和最大值,l为位串长度,d位二进制位串;

对染色体进行反编码以得到反编码的延迟时间τ、嵌入m维相空间矢量、惩罚参数γ和径向基核数宽度σ,并根据所述反编码的延迟时间τ和嵌入m维相空间矢量进行相空间重构,根据所述反编码的惩罚参数γ和径向基核数宽度σ对所述最小二乘支持向量机模型进行重构,从而得到每一组参数的网络流量预测精度以对个体适应度值进行计算;

判断是否达到算法的最大进化代数或者种群的最优个体所对应的适应度函数值的变化在预设范围内,若是,参数优化结束;否则,继续进行迭代。

具体的,对混沌时间序列的初始数据,如网络流量数据进行归一化处理,以所述延迟时间、嵌入m维相空间矢量、惩罚参数和径向基核数宽度对染色进行编码并随机初始种群。

具体的,由于最小二乘支持向量机参数采用核函数,在进行训练时,会对于[0,1]的数据最为灵敏,而实际数据是具有突变性的,变化幅度较大。为了提高最小二乘支持向量机训练的效率,在建模之前需对数据进行归一化处理,具体为:

每一个染色体代表一个参数组合,本研究采用二进制编码方法对染色体进行编码,每个染色体包括四个部分:τ、m、γ和σ。

最小二乘支持向量模型通过式8)转换得到:

其中,minp和maxp分别为参数的最小值和最大值,l为位串长度,d位二进制位串。

对染色体进行反编码以得到反编码的延迟时间τ、嵌入m维相空间矢量、惩罚参数γ和径向基核数宽度σ,并根据所述反编码的延迟时间τ和嵌入m维相空间矢量进行相空间重构,根据所述反编码的惩罚参数γ和径向基核数宽度σ对所述最小二乘支持向量机模型进行重构,从而得到每一组参数的网络流量预测精度以对个体适应度值进行计算的步骤具体包括如下步骤:

先对染色体进行反编码:

x=x′(xmax-xmin)+xmin;

得到参数τ、m、γ和σ的一组值,并根据τ和m进行空间重构,根据γ和σ进行最小二乘支持向量建模,由此得到每一组的预测精度,通过预测结果对个体适应度值进行计算:

将个体适应度函数定义为:

其中mse表示均方误差,其定义如下:

其中,n表示训练样本大小,yi和分别表示期望值和预测值。

适应度用来衡量一个个体的优劣,最小二乘支持向量模型的目标是提高预测的精度,因此对染色体进行反编码然后再计算个体适应度;具体包括:

假定个体xi的适应度为f(xi),则该个体被选择的概率psi为:

其中,∑f(xi)表示群体中的个体适应度的综合;

在染色体的4段上分别选择4个交叉点,然后分别进行交叉,交叉完后,如果其值不在参数取值范围内,则重新交叉;

根据变异概率选择一个染色体,然后随机选择一个变异点,采用0→1,1→0的规律进行编译,变异后如果其值不在参数取值范围内,则重新变异。

具体的,先对染色体进行反编码,即:

x=x′(xmax-xmin)+xmin;10)

得到参数τ、m、γ和σ的一组值,并根据τ和m进行空间重构,根据γ和σ进行最小二乘支持向量建模,由此得到每一组的预测精度,通过预测结果对个体适应度值进行计算。

本发明实施例将个体适应度函数定义为:

其中mse表示均方误差,其定义如下:

其中,n表示训练样本大小,yi和分别表示期望值和预测值。

判断是否达到算法的最大进化代数或者种群的最优个体所对应的适应度函数值的变化在预设范围内,若是,参数优化结束;否则,继续进行迭代。

具体的,假定个体xi的适应度为f(xi),则该个体被选择的概率psi为:

其中,∑f(xi)表示群体中的个体适应度的综合。

再染色体的4段上分别选择4个交叉点,然后分别进行交叉,交叉完后,如果其值不在参数取值范围内,则重新交叉。

根据变异概率选择一个染色体,然后随机选择一个变异点,采用0→1,1→0的规律进行编译,变异后如果其值不在参数取值范围内,则重新变异。

如果算法的最大进化代数或者种群的最优个体所对应的适应度函数值的变化在预设范围内,则表示参数优化结束,进行输出。否则,进化代数加1,即g=g+1。根据选择、交叉和变异算子对种群进行更新,并跳转到步骤s103。

s105、采用最优参数值进行相空间重构和最小二乘支持向量机建模以输出预测结果。

其中,步骤s105,具体包括:

采用所述最优参数值进行相空间重构和最小二乘支持向量机建模输出模型预测结果;

得到最优参数τ、m、γ和σ后,采用τ和m对网络流量时间序列进行重构;γ和σ作为最小二乘支持向量机的参数进行建模,对测试集进行预测,输出预测结果;

对所述模型预测结果进行反归一化处理以恢复真实预测值:

x=x′(xmax-xmin)+xmin;

其中,x表示原始数据,xmin和xmax分别表示最小值和最大值。

具体的,得到最优参数τ、m、γ和σ后,采用τ和m对网络流量时间序列进行重构;γ和σ作为最小二乘支持向量机的参数进行建模,对测试集进行预测,输出预测结果。

对所述模型预测结果进行反归一化处理以恢复真实预测值。

具体的,对模型的预测结果进行反归一化处理,恢复真实预测值。

x=x′(xmax-xmin)+xmin;14)

其中,x表示原始数据,xmin和xmax分别表示最小值和最大值。

本发明实施例采用相空间重构和最小二乘支持向量机,能准确刻画混沌时间序列的非平稳性、突变和混沌等特点;采用遗传算法,对相空间重构和最小二乘支持向量机的参数进行联合优化,充分利用了两者的内在联系,可以提高预测模型的整体性能,更加精确刻画混沌时间序列变化趋势和变化特点,预测结果更加准确。

将本发明实施例与现有技术的经典算法进行比较,具体如下:

经典算法cc-最小二乘支持向量机法,采用c-c法重构相空间,采用遗传算法优化最小二乘支持向量机。

为了使预测结果具有可比性和说服性,模型性能的评价指标为均方差误差和平均绝对百分误差,定义如下:

将训练样本分别输入到经典算法和本发明实施例的算法模型中对训练样本进行学习,建立相应的预测模型,以网络流量预测模型为例,然后采用建立的模型对网络流量的训练样本进行你和,得到模型拟合结果如图2所示,图2为本发明一实施例提供的模型拟合结果示意图。

从图2可知,相对于经典算法,本发明实施例的算法更加吻合实际值,拟合结果更好,拟合结果初步表明本发明实施例提出的基于遗传算法的最小二乘支持向量机的参数联合优化思想是可行的。

由于平均一个预测模型性能的优劣,主要考察其预测能力而非拟合能力,因此,分别采用经典算法和本发明实施例的算法对测试集进行预测,其结果如图3所示,图3为本发明一实施例中测试集的预测结果示意图。相对于经典算法,本发明实施例的算法预测精度更高,预测误差大大降低,是一种高精度的预测方法,可以很好地对变化趋势进行捕捉。

各种模型的预测拟合和预测误差如表1所示,从表1各种评价指标可知,本发明实施例提供的算法各指标都优于经典算法。对比结果表明,对相空间重构和最小二乘支持向量机参数采用遗传算法进行联合优化,充分利用了两者的内在联系,可以提高模型的整合等细嫩那个,解决传统两者单独优化存在的缺陷,本发明实施例提供的混沌时间序列预测方法能够更加精确刻画混沌时间序列变化趋势和变化特点,预测结果更加可靠。

表1cc-lssvm和ga-lssvm性能对比

请参阅图4,图4为本发明一实施例中混沌时间序列预测系统的结构示意图。该系统包括:

参数计算模块401,用于从一维混沌时间序列中重构相空间向量得到相空间重构参数并基于最小二乘支持向量机对混沌时间序列进行预测得到最小二乘支持向量机参数;

遗传算法模块403,用于采用遗传算法将所述相空间重构参数与所述最小二乘支持向量机参数进行联合优化得到最优参数值;

输出结果模块405,用于采用所述最优参数值进行相空间重构和最小二乘支持向量机建模以输出预测结果。

本发明实施例采用相空间重构和最小二乘支持向量机,能准确刻画混沌时间序列的非平稳性、突变和混沌等特点;采用遗传算法,对相空间重构和最小二乘支持向量机的参数进行联合优化,充分利用了两者的内在联系,可以提高预测模型的整体性能,更加精确刻画混沌时间序列变化趋势和变化特点,预测结果更加准确。

以上各实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中各个技术所有可能组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1