基于经验模态分解和支持向量机的气候时序预测方法

文档序号:6601524
专利名称:基于经验模态分解和支持向量机的气候时序预测方法
技术领域
本发明属于短期气候预测领域,涉及一种基于经验模态分解和支持向量机的气候 时序预测方法。运用经验模态分解算法进行气候时间序列的平稳化分解,再结合支持向量 机算法进行时间序列的预测,提高气候时间序列预测的准确性,适合处理逐年降水或温度 变化的气候时间序列。
背景技术
气候系统是一种耗散的高阶非线性系统,在针对气候时间序列的预测方法中,人 工神经网络等技术由于具有较强的处理非线性问题的能力,从而比一般的线性预报方法具 有更好的预测能力,目前已得到了一定的应用。例如,张迎春[1]等采用基于时间序列的BP 神经网络方法,以克拉玛依沙漠700hPa月平均气温(1958. 1 1996. 4)为例,进行气象时 间序列预测。金龙[2]等在BP神经网络算法的基础上,采用遗传算法优化神经网络的连接 权和网络结构,以广西全区4月份平均降水作为预报量及前期500hPa月平均高度场,海温 场高相关区作为预报因子,建立基于遗传算法的神经网络短期气候预测模型,并与传统的 逐步回归方法进行对比分析。陈永义[3_4]等首次将支持向量机分类和回归方法应用于到气 象预报中,利用1990 2000年4 9月ECMWF北半球500hPa高度、850hPa高度、地面气压 的00 =OOUTC分析场资料建立四川盆地分区面雨量是否大于15mm的支持向量机分类模型, 以及四川盆地内单站气温的支持向量机回归模型,证实支持向量机模型具有良好的预报能 力。同时,气候时间序列也具有典型的非平稳特征,如果借助信号处理中的方法进行 平稳化处理,可以提高预测的精度。目前,对非平稳信号的平稳化方法已经在短期气候分析 中得到了一定的应用,如邵晓梅[5]等通过小波变化对黄河流域近40年来降水的季节变化 和年际变化时间序列进行分析,揭示了黄河流域降水变化的多时间尺度的复杂结构,林振 山M等首先将经验模态分解(Empirical Mode Decomposition,EMD)[7]算法应用于气候序 列分析,并从中预测变化趋势。不过,这些研究都是通过平稳化处理进行气候的分析,尚未 涉及对气候时间序列的预测。参考文献[1]张迎春,肖东荣,赵远东.基于时间序列神经网络的气象预测研究.武汉理工 大学学报,2003,27 (2) 237-240.[2]金龙,吴建生,林开平,等.基于遗传算法的神经网络短期气候预测模型.高原 气象,2005,24 (6) 981-987.[3]陈永义,俞小鼎,高学浩,等.处理非线性分类和回归问题的一种新方法 (I)-支持向量机方法简介.应用气象学报,2004,15 (3) =345-354.[4]冯汉中,陈永义.处理非线性分类和回归问题的一种新方法(II)-支持向量机 方法在天气预报中的应用.应用气象学报,2004,15 (3) 355-365.[5]邵晓梅,许月卿,严昌荣.黄河流域降水序列变化的小波分析.北京大学学报(自然科学版),2006,1(1) 1-7.[6]林振山,汪曙光.近四百年北半球气温变化的分析EMD方法的应用.热带气 象学报,2004,24 (01) 90-96.[7]HUANG D J,ZHA0 J P,SU J L. On the end extending in the Hilbert-Huang Transform. CHIO B H. Progress in Coastal Engineering and Oceanography, Vol. 1, Coastal Oceanographyof Asian Seas. Korean Society of Coastal and Ocean Engineers,1999 :81_92.

发明内容
技术问题 本发明目的是针对现有技术存在的气候时间序列预测技术中没有考虑到时间序 列的非平稳特性,提供一种基于经验模态分解和支持向量机的气候时序预测方法,对时间 序列进行平稳化处理,再结合支持向量机回归技术进行气候时间序列预测,以提高复杂气 候时间序列的预测准确率。技术方案本发明为实现上述目的,采用如下技术方案本发明基于经验模态分解和支持向量机的气候时序预测方法,包括以下步骤1)将输入的气候时间序列,通过经验模态分解算法进行多时间尺度分解,得到η 个本征模态函数分量和一个趋势分量,其中η为大于1的自然数;2)根据时间序列预测方法,对步骤1)所述的各分量进行相空间重构,将一维的时 间序列转化成矩阵形式,构成训练样本集;3)采用步骤2)所述的各分量训练样本集,建立与之对应的支持向量机回归预测 模型;对每个模型进行时间序列预测,得到各个分量的时间序列预测结果;4)将步骤3)所述的各分量预测结果,通过线性组合的方式得到原气候时间序列 的预测结果。其中,步骤1)所述的气候时间序列,在进行多时间尺度分解之前采用Z-SCORE标 准化方法进行数据的标准化处理。其中,步骤1)所述的经验模态分解算法,在分解的筛选过程中,采用设置两个连 续的迭代结果之间的标准差SD的大小在0. 2到0. 3之间,且最大迭代次数为200作为追加 的停止条件,采用极值延拓法来拟合序列的端点极值。其中,步骤2)所述的相空间重构需要确定时间延迟量和嵌入空间的维数两个参 数,对于两个参数的选取分别采用自相关函数法和虚假近邻法。其中,步骤3)所述的支持向量机回归模型采用最小二乘支持向量机回归模型,核 函数采用径向基核函数,参数的选取通过基于网格搜索的交叉验证方法。有益效果本发明针对气候时间序列的非线性、非平稳特性,利用支持向量机算法在处理非 线性问题中的优越性和经验模态分解算法在处理非平稳信号中的优势,基于经验模态分解 和支持向量机的气候时间序列预测方法,根据气候时间序列的非线性、非平稳特性,首先利 用经验模态分解技术对时间序列进行平稳化处理,在保留时间序列本身特征的基础上减少序列间的干扰或耦合信息,再利用相空间重构和支持向量机回归技术进行时间序列预测。 相对于单一使用支持向量机回归预测的方法,可以有效提高预测准确度,特别适合处理逐 年降水或温度变化的非平稳气候时间序列。



图1是基于经验模态分解和支持向量机的气候时序预测方法的方法流程图;图2是广西全区88个气象观测站1957-2005年6_8月逐年降水量的距平百分率 序列;图3是对气候时间序列进行经验模态分解的具体处理流程;图4是对气候时间序列r68进行经验模态分解的结果图,包括4个IMF分量和一 个趋势分量;图5是使用单一支持向量机预测方法与使用经验模态分解和支持向量机结合方 法进行预测的相对误差比较;图6是使用单一支持向量机预测方法与使用经验模态分解和支持向量机结合方 法进行预测结果的比较。
具体实施例方式下面将结合附图及具体实施例对本发明所述的基于经验模态分解和支持向量机 的气候时序预测方法作进一步地详细描述。本实施例采用如图2所示的广西全区88个气象观测站1957-2005年6_8月逐年 降水量的距平百分率序列(以下简称r68),共49个数据。将经验模态分解(Empirical ModeDecomposition, EMD)算法禾口最小二乘支持向量机(Least Squares Support Vector Machines,LS-SVM)回归算法相结合进行气候时间序列的预测。如图1所示,本方法包括如 下步骤步骤10将输入的气候时间序列,通过经验模态分解算法进行多时间尺度分解,得 到若干个本征模态函数分量(Intrinsic Mode Function, IMF)和一个趋势分量。不同分量 代表了序列在不同时间周期上的波动规律,更能准确反映原序列的变化,并保留时间序列 本身特征;如图3所示,提供了对r68时间序列进行经验模态分解的处理流程,具体包括以下 步骤步骤101用序列X (t)代表气候时间序列r68,并对其进行Z-SCORE标准化处理,得 到序列S(t)。步骤IOla判断S (t)的极值数是否大于2。如果是则说明序列有平稳化的必要,执 行步骤102,否则说明序列是平稳的,无须分解或者分解已经结束,执行步骤108。步骤102令H (t) = S(t),开始在H(t)中进行提取IMF分量的迭代操作。步骤103找出序列H(t)中所有的局部极大值点和极小值点。步骤104对所有的极大值和极小值点,通过三次样条插值法形成上包络线Hmax (t) 和下包络线Hmin(t),使H(t)满足Hmin(t)彡H(t) ^ Hfflax(t)0其中对于边界点极值的拟合问 题采用端点的极值延拓法解决。
步骤105计算上下包络线的算术平均值讲⑴=^^^^,并从H(t)中减 去,即 H(t) = H(t)-m(t)。步骤105a判断H(t)是否已满足成为IMF分量的判定条件,包括以下三点①极值点数和过零点数一致或者至多相差一个;②上下包络线的算术平均值接近于0 ;③限制两次连续的处理结果之间的标准差SD的值进行约束

其中,Hari) (t)和Hk⑴是在步骤103至步骤105中连续两次的处理结果,k代表 这一过程的处理次数。SD的取值范围通常限制在0. 2 0. 3之间。若同时满足上述三个条件,执行步骤106,否则返回继续执行步骤103。步骤106成功提取一个IMF分量,即IMFi (t) = Hk (t)。步骤107从S⑴中减去提取的IMF分量,即S (t) = S (t)-IMF1⑴,并执行步骤 IOla判断S (t)的极值数。步骤108此时所有的IMF分量都被提取出,剩余的S (t)则表现为一个单调或近似 单调的趋势项,称为趋势分量Rn (t)。步骤109时间序列X (t)实现经验模态分解,即 分解的结果如图4所示,包括4个IMF分量和一个趋势分量。步骤20根据时间序列预测方法,对步骤10所述的各分量进行相空间重构,将一维 的时间序列转化成矩阵形式,构成训练样本集;为了对比结果,将X(t)时间序列的前40个进行相空间重构,选取时间延迟量为1, 嵌入空间的维数为30,构成训练样本集{(Xi,Yi) i = 1,2,... 10},包括10组训练样本 / = 1,2,...,10步骤30采用步骤20所述的训练样本集,建立与之对应的支持向量机回归预测模 型。对每个模型预测后9个时间的数值,得到各个分量的时间序列预测结果;其中,所述的支持向量机回归模型采用最小二乘支持向量机回归模型,核函数采 用径向基核函数,通过基于网格搜索的交叉验证方法分别选出合适的径向基核宽度与正则 化参数。步骤40将步骤30所述的各分量预测结果,通过线性组合的方式得到原气候时间 序列的预测结果。如图5、图6所示,预测结果与直接采用最小二乘支持向量机回归模型预 测的结果相比相对误差更小,更接近原序列。
权利要求
一种基于经验模态分解和支持向量机的气候时序预测方法,其特征在于,包括以下步骤1)将输入的气候时间序列,通过经验模态分解算法进行多时间尺度分解,得到n个本征模态函数分量和一个趋势分量,其中n为大于1的自然数;2)根据时间序列预测方法,对步骤1)所述的各分量进行相空间重构,将一维的时间序列转化成矩阵形式,构成训练样本集;3)采用步骤2)所述的各分量训练样本集,建立与之对应的支持向量机回归预测模型;对每个模型进行时间序列预测,得到各个分量的时间序列预测结果;4)将步骤3)所述的各分量预测结果,通过线性组合的方式得到原气候时间序列的预测结果。
2.根据权利要求1所述的基于经验模态分解和支持向量机的气候时序预测方法,其特 征在于,步骤1)所述的气候时间序列,在进行多时间尺度分解之前采用Z-SCORE标准化方 法进行数据的标准化处理。
3.根据权利要求1所述的基于经验模态分解和支持向量机的气候时序预测方法,其特 征在于,步骤1)所述的经验模态分解算法,在分解的筛选过程中,采用设置两个连续的迭 代结果之间的标准差SD的大小在0. 2到0. 3之间,且最大迭代次数为200作为追加的停止 条件,采用极值延拓法来拟合序列的端点极值。
4.根据权利要求1所述的基于经验模态分解和支持向量机的气候时序预测方法,其特 征在于,步骤2)所述的相空间重构需要确定时间延迟量和嵌入空间的维数两个参数,对于 两个参数的选取分别采用自相关函数法和虚假近邻法。
5.根据权利要求1所述的基于经验模态分解和支持向量机的气候时序预测方法,其特 征在于,步骤3)所述的支持向量机回归模型采用最小二乘支持向量机回归模型,核函数采 用径向基核函数,参数的选取通过基于网格搜索的交叉验证方法。
全文摘要
本发明公布了一种基于经验模态分解和支持向量机的气候时序预测方法,属于短期气候预测领域。本发明首先通过经验模态分解算法进行时间序列的预处理,分解成若干个本征模态函数分量和一个趋势分量,这些分量更能准确反映原序列的变化,并保留时间序列本身特征;接下来通过时间序列预测方法对每个分量进行相空间重构,再分别构建不同的支持向量机回归模型进行预测,将各分量预测的结果线性组合成原序列的预测结果。本发明的优点在于借助经验模态分解算法进行时间序列的平稳化处理,在保留时间序列本身特征的基础上减少序列间的干扰或耦合信息,使得预测的准确率更高,特别适合处理逐年降水或温度变化的非平稳气候时间序列。
文档编号G06N99/00GK101846753SQ201010159898
公开日2010年9月29日 申请日期2010年4月29日 优先权日2010年4月29日
发明者徐寅, 毕硕本, 王必强, 董学士, 陈譞 申请人:南京信息工程大学
再多了解一些
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1