一种新的时间序列的预测方法与流程

文档序号:18743255发布日期:2019-09-21 02:02阅读:245来源:国知局
一种新的时间序列的预测方法与流程

本发明涉及计算机技术领域,具体而言,本发明涉及一种新的时间序列的预测方法。



背景技术:

山体滑坡具有随机性、耗散性、突发性、外界干扰不确定性以及破坏性等特点,给人们的生产生活造成重大损失。因此,预测活动储层滑坡的位移对于早期预警和稳定性分析非常重要。

滑坡位移的预测模型通常包括基于物理的模型和基于数据的模型。基于数据的模型使用输入输出变量构建。它们比基于物理的模型更受欢迎,因为滑坡的地质实体是复杂的,并且因为基于物理的模型需要许多复杂的参数。在基于数据模型的基础上,混沌与分形作为分析非线性系统的重要理论方法,可以有效地得到滑坡时间序列的内部动力学特征,

而且针对监测数据量小的特点,相空间重构可以有效的扩展原始数的维数。

基于相空间重构理论,近几年国内外学者展开了一系列针对滑坡预测的方法。现有的研究方法都是将具有混沌特性的滑坡时间序列相空间重构后得到的高维时间序列再输入到所提出的预测模型中,过程比较繁琐。



技术实现要素:

本发明针对现有方式的缺点,提出一种新的时间序列的预测方法,用以解决现有技术存在的技术问题。

第一方面,本发明提供了一种新的时间序列的预测方法,包括:接收输入的原始滑坡时间序列{X(t),t=1,2,3,…,n};

判断原始滑坡时间序列是否具有混沌特征;

若原始滑坡时间序列具有混沌特征,则确定出原始滑坡时间序列的延迟时间;确定出原始滑坡时间所要嵌入的相空间的嵌入维数;

将延迟时间和嵌入维数代入到目标volterra级数模型,目标volterra级数模型迭代训练核函数的系数,当核函数的系数达到预设误差要求时,输出目标volterra级数模型的参数、核函数的系数、以及预测出的目标滑坡时间序列。

可选地,判断原始滑坡时间序列是否具有混沌特征,包括:

计算原始滑坡时间序列的最大Lyapunov指数;判断最大Lyapunov指数是否大于零,若是,则确定原始滑坡时间序列具有混沌特征。

可选地,计算原始滑坡时间序列的最大Lyapunov指数,包括:找到相空间中每个点X(t)的最近邻点并限制短暂分离,即

其中,且

对相空间中每个点X(t),计算在i个离散时间步之后相应领域点对的距离dt(i),

设相空间中的邻近点对X(t)与之间距离变化的指数发散率为λ,即dt(i)=Cteλ(i·Δt),Ct=dt(0);取对数后得到ln dt(i)=ln Ct+λ(i·Δt);

对每个i求出所有t的ln dt(i)平均x(i),即:

q为非零dt(i)的数目,在x(i)~i有线性关系的区域内用最小二乘法作回归直线,回归直线的斜率即为最大Lyapunov指数,最大Lyapunov指数用λ表征。

可选地,确定出原始滑坡时间序列的延迟时间,包括:

将原始滑坡时间序列{X(t),t=1,2,3,…,n}代入自相关函数计算公式:

rτ表示延迟时间为τ时的自相关系数,是序列均值,τ是延迟时间;先确定原始滑坡时间序列的自相关函数,然后作出自相关函数关于延迟时间τ(τ=1,2,3,…)的图像,在图像分析得出,当自相关函数下降到初始值的1-1/e时,此时的时间就是延迟时间τ。

可选地,确定出原始滑坡时间所要嵌入的相空间的嵌入维数,包括:计算出原始滑坡时间的关联维数;根据关联维数,确定出原始滑坡时间所要嵌入的相空间的嵌入维数。

可选地,确定出原始滑坡时间所要嵌入的相空间的嵌入维数,具体包括:调用G-P算法中的下述公式,

其中H(x)是Heaviside函数,且:

式中r为任意给定的实数,Yi为原始序列,Yj为重构后的序列,任意两个向量之差的绝对值记为rij=|Yi-Yj|;在r的预设范围内,获取lnC(n,r)~ln(r)的曲线,确定出该曲线的最佳拟合直线,将最佳拟合直线的斜率确定为关联维数D;增加N的值,当关联维数D达到最大值时,将此时的N确定为嵌入维数m。

可选地,将延迟时间和嵌入维数代入到目标volterra级数模型,包括:将延迟时间τ和嵌入到下述的目标volterra级数模型的公式中:

第二方面,本发明提供了一种新的时间序列的预测装置,包括:

接收模块,用于接收输入的原始滑坡时间序列{X(t),t=1,2,3,…,n};

判断模块,用于判断原始滑坡时间序列是否具有混沌特征;

延迟时间计算模块,用于若原始滑坡时间序列具有混沌特征,则确定出原始滑坡时间序列的延迟时间;

嵌入维数计算模块,用于确定出原始滑坡时间所要嵌入的相空间的嵌入维数;

分析预测模块,用于将延迟时间和嵌入维数代入到目标volterra级数模型,目标volterra级数模型迭代训练核函数的系数,当核函数的系数达到预设误差要求时,输出目标volterra级数模型的参数、核函数的系数、以及预测出的目标滑坡时间序列。

第三方面,本发明提供了一种电子设备,其包括处理器和存储器;

存储器配置用于存储机器可读指令,指令在由处理器执行时,使得处理器执行本发明第一方面提供的的时间序列的预测方法。

第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明第一方面提供的时间序列的预测方法。

本发明实施例提供的技术方案带来的有益技术效果是:

在本发明提供的时间序列的预测方法中,二阶的volterra级数综合利用了线性和非线性双重特点进行预测,将相空间重构后得到的延迟时间τ和嵌入维数m直接嵌入volterra级数的数学模型中,将传统的把滑坡时间序列相空间重构后得到的输出序列再输入到volterra级数模型中的两步直接变成了一步,提高了运算效率。

另外,相空间重构技术将原始的时间序列映射到与之动力学等效的相空间中进行混沌信号处理、预测,扩展了原始数据的维数,并引进粒子群算法对volterra级数的核函数进行求解,从而取得良好的预测效果。

本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1是本申请实施例提供的一种新的时间序列的预测方法的流程示意图;

图2是本申请实施例提供的一种新的时间序列的预测装置的模块示意图;

图3是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面详细描述本发明,本发明的实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的部件或具有相同或类似功能的部件。此外,如果已知技术的详细描述对于示出的本发明的特征是不必要的,则将其省略。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

下面以具体地实施例对本发明的技术方案以及本发明的技术方案如何解决上述技术问题进行详细说明。

本发明实施例提供了一种新的时间序列的预测方法,该方法的流程示意图如图1所示,包括:

步骤S1:接收输入的原始滑坡时间序列{X(t),t=1,2,3,…,n}。

用户输入原始滑坡时间序列为{X(t),t=1,2,3,…,n},该原始滑坡时间序列嵌入m维空间中进行相空间重构可得一序列相点Rm为:

其中在公式(1)中:τ——延迟时间;m——嵌入维数(m≥2d+1,d——原动力系统维数,即混沌吸引子的维数);N=n-(m-1)——由时间序列X构成m维后,由n个相点变成了N个相点。

步骤S2:判断原始滑坡时间序列是否具有混沌特征。

Lyapunov指数是复杂非线性系统的重要特征量,其定量刻画了初值靠近状态空间轨迹的指数发散率,是判断非线性时间序列是否具有混沌特征的参数之一。对于系统是否存在动力学混沌,只要计算表征其非线性时间序列的最大指数是否大于零即可。最大Lyapunov指数既可以判断滑坡时间序列是否具有混沌可预测性,又能确定其最佳的可预测时长。

基于上述原理,判断原始滑坡时间序列是否具有混沌特征,包括:

步骤S21:计算原始滑坡时间序列的最大Lyapunov指数。

步骤S22:判断最大Lyapunov指数是否大于零,若是,则确定原始滑坡时间序列具有混沌特征。

步骤S21具体包括:

找到相空间中每个点X(t)的最近邻点并限制短暂分离,即

其中,在公式(2)中,且

对相空间中每个点X(t),使用以下公式计算在i个离散时间步之后相应领域点对的距离dt(i),即:

设相空间中的邻近点对X(t)与之间距离变化的指数发散率为λ,有公式:

dt(i)=Cteλ(i·Δt),Ct=dt(0) (4);

其中,取对数后得到公式(5):

ln dt(i)=ln Ct+λ(i·Δt) (5);

接着,对每个i求出所有t的ln dt(i)平均x(i),即:

在公式(6)中,q为非零dt(i)的数目,在x(i)~i有线性关系的区域内用最小二乘法作回归直线,回归直线的斜率即为最大Lyapunov指数,最大Lyapunov指数用λ表征。

如果λ大于零,则表明原始滑坡时间序列具有混沌特征,执行步骤S3。

步骤S3:若原始滑坡时间序列具有混沌特征,则确定出原始滑坡时间序列的延迟时间。

延迟时间用τ表示,对于无限量的没有噪声的数据,τ的选择一般是不重要的,但若是实际的有限数据,要慎重的选取合适的τ。若是τ过小,坐标的相关性太大,若是τ过大,会导致时间序列所描述的信号失真。因此时间延迟的选择显得尤为重要,确定时间延迟的方法有自相关函数法、互信息法、C-C法等等,本实施例中采用自相关函数法。

步骤S3中确定出原始滑坡时间序列的延迟时间,具体包括:

将原始滑坡时间序列{X(t),t=1,2,3,…,n}代入自相关函数计算公式:

在公式(7)中,rτ表示延迟时间为τ时的自相关系数,是序列均值,τ是延迟时间;先确定原始滑坡时间序列的自相关函数,然后作出自相关函数关于延迟时间τ(τ=1,2,3,…)的图像,在图像分析得出,当自相关函数下降到初始值的1-1/e时,此时的时间就是延迟时间τ。

步骤S4:确定出原始滑坡时间所要嵌入的相空间的嵌入维数。

由于山体滑坡时间序列的采样数量小且数据值逐渐增加的,导致用几何不变量法、伪最邻近法、Cao法以及它们的改进方法求出的嵌入维数在图像上区分度不大,不能方便确定嵌入维数。发明人考虑采用间接的方法——GP算法,先求出滑坡时间序列的关联维数,再求出它们各自的嵌入维数。

GP算法具有仅凭借系统观测所得到的时间序列数据就能得到非线性时间序列吸引子维数的优点,根据吸引子关联维数Dm随m的增加逐渐达到饱和这一原理计算嵌入维数m及关联维数Dm,具体计算原理为:

对于嵌入维数m的选取利用Grassberger和Procaccia提出的GP算法,该方法依据吸引子关联指数Dm随着m的增加逐渐达到饱和的原理求取m。对于以计算得到的τ选择较小的m进行相空间重构,对不同领域的半径,计算相应的关联积分。

步骤S4进一步包括:计算出原始滑坡时间的关联维数;根据关联维数,确定出原始滑坡时间所要嵌入的相空间的嵌入维数。

进一步地,调用G-P算法中的下述公式,即公式(8),

其中H(x)是Heaviside函数,且:

在公式(9)中,r为任意给定的实数,Yi为原始序列,Yj为重构后的序列,任意两个向量之差的绝对值记为rij=|Yi-Yj|;

在r的预设范围内,获取lnC(n,r)~ln(r)的曲线,确定出该曲线的最佳拟合直线,将最佳拟合直线的斜率确定为关联维数D;

增加N的值,当关联维数D达到最大值时,将此时的N确定为嵌入维数m。

步骤S5:将延迟时间和嵌入维数代入到目标volterra级数模型,目标volterra级数模型迭代训练核函数的系数,当核函数的系数达到预设误差要求时,输出目标volterra级数模型的参数、核函数的系数、以及预测出的目标滑坡时间序列。

volterra滤波器是非线性滤波器中的一种,其本质就是volterra级数的数学表达式,同时具有线性和非线性双重特性,其截断的二阶模型适用于大多数工程情况。

在本发明中,二阶的Volterra级数模型为

其中,令

X(n)=[x(n),x(n-1),…,x(n-(m-1)),

x2(n),x(n)x(n-1),…,x2(n-(n-1))]T (12);

在公式(11)、公式(12)中H为1×(m2/2+3m/2)的核函数矩阵,X为(m2/2+3m/2)×1矩阵;

故,

LMS迭代公式为:

H(n)=H(n-1)+2μ·e(n)X(n) (15);

公式(10)中μ为收敛因子,通过改变收敛因子的值,让模型收敛于某个最优值。m为原始滑坡时间序列的嵌入维数,将山体滑坡的时间序列相空间重构得到的嵌入维,导入到二阶volterra模型中,利用嵌入维数得到模型的核函数个数,从而完成模型的初始化。原始的模型具有以下缺点:一、相空间重构得到的两个参数和volterra级数预测是两个分开的步骤;二、采用LMS迭代算法可能无法找到全局最优值,导致预测误差较大。

因此,发明人改进了目标volterra级数模型的公式,改进的公式如下:

将延迟时间τ和嵌入到上面改进的目标volterra级数模型的公式(16)中,原始滑坡时间序列只要确认其混沌特性就可以导入到目标volterra级数模型中完成初始化,在利用模型的迭代不断训练核函数的系数,当核函数的系数达到预设误差要求时,输出目标volterra级数模型的参数、核函数的系数、以及预测出的目标滑坡时间序列。

在本发明中,采用粒子群算法优化volterra级数的核函数,假设有n个粒子,将volterra模型的待估计参数(核矢量H)作为粒子群算法中的粒子位置,则粒子i的位置用M维向量Hi表示,粒子群的位置可以用矩阵Hn×M表示。第i个粒子在寻找最优过程中的控制辨识误差的适应度函数定义为

在上述公式中,L为数据长度,j=1,2,…,n。算法的目标是使适应度函数最小时粒子的位置,即求解核矢量H。之后执行如下步骤:

(1)初始化:给每一个粒子随机的初始位置Hi(0)和初始速度Vi(0)。每个粒子当前最佳位置Pbesti(0)=Hi(0),在所有的粒子群体中使适应度函数最小的粒子位置是全局最优位置Gbest(0)。

(2)迭代:用下式更新粒子的速度和位置:

Vid(t+1)=w·Vid(t)+c1·(r1(t)·(Pbestid(t)-Hid(t))+(1-r1(t))·Gbestd(t)-Hid(t)) (18);

Hid=Hid(t)+Vid(t+1) (19);

在上述公式中,r1(t),r2(2)∈[0,1],学习因子c1、c2取1.49618,惯性系数w取0.7298。

(3)每个粒子更新当前局部最优位置,并求出适应度。若f(Hi(t))<f(Pbesti),则Pbesti=H(ti);再所有粒子跟新全局最优位置,按照下式更新:

(4)多次迭代直至迭代步数t小于初始设置的最大迭代次T,否则终止当前程序并记录数据。经过上面详述的步步方法最终得到全局最优位置Gbest,即是volterra级数时域核向量H的最优解。

基于同一发明构思,本申请实施例还提供了一种新的时间序列的预测装置200,包括:接收模块201、判断模块202、延迟时间计算模块203、嵌入维数计算模块204和分析预测模块205。

接收模块201用于接收输入的原始滑坡时间序列{X(t),t=1,2,3,…,n};判断模块202用于判断原始滑坡时间序列是否具有混沌特征;延迟时间计算模块203用于若原始滑坡时间序列具有混沌特征,则确定出原始滑坡时间序列的延迟时间;嵌入维数计算模块204用于确定出原始滑坡时间所要嵌入的相空间的嵌入维数;分析预测模块205用于将延迟时间和嵌入维数代入到目标volterra级数模型,目标volterra级数模型迭代训练核函数的系数,当核函数的系数达到预设误差要求时,输出目标volterra级数模型的参数、核函数的系数、以及预测出的目标滑坡时间序列。

基于同一发明构思,本申请实施例还提供了一种电子设备,其包括:

处理器301和存储器302。存储器302配置用于存储机器可读指令,指令在由处理器301执行时,使得处理器301执行本发明实施例提供的时间序列的预测方法。

本申请实施例中的存储器302可以是ROM(Read-Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,可以是RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically Erasable Programmable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact Disc Read-Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。

本申请实施例中的处理器301可以是CPU(Central Processing Unit,中央处理器)、通用处理器、DSP(Digital Signal Processor,数据信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器301也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。

本技术领域技术人员可以理解,本申请实施例提供的电子设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中。

本申请实施例提供的电子设备,与前面所述的各实施例具有相同的发明构思及相同的有益效果,在此不再赘述。

基于同一发明构思,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本发明实施例提供的时间序列的预测方法。

该计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM、RAM、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。

本申请实施例提供的计算机可读存储介质,与前面所述的各实施例具有相同的发明构思及相同的有益效果,在此不再赘述。

应用本发明实施例,至少能够实现如下有益效果:

在本发明提供的时间序列的预测方法中,二阶的volterra级数综合利用了线性和非线性双重特点进行预测,将相空间重构后得到的延迟时间τ和嵌入维数m直接嵌入volterra级数的数学模型中,将传统的把滑坡时间序列相空间重构后得到的输出序列再输入到volterra级数模型中的两步直接变成了一步,提高了运算效率。

另外,相空间重构技术将原始的时间序列映射到与之动力学等效的相空间中进行混沌信号处理、预测,扩展了原始数据的维数,并引进粒子群算法对volterra级数的核函数进行求解,从而取得良好的预测效果。

本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。

在本发明的描述中,需要理解的是,术语“中心”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个及以上。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

在本说明书的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1