感潮河段水文序列交互式模拟预测方法和系统的制作方法

文档序号:6525613阅读:204来源:国知局
感潮河段水文序列交互式模拟预测方法和系统的制作方法
【专利摘要】本发明公开了一种感潮河段水文序列交互式模拟预测方法和系统,通过对初始ARIMA模型配置模块、实时数据分析配置模块、感潮河段水位预测模块、预测结果分析验证模块、预测结果展出模块及再学习模块的综合调用来实现感潮河段水文序列的预测过程。该发明配备应急方案对实时数据进行监控,对异常数据实时判断、及时排除,使得ARIMA方法能正确发挥预报功能;还实现了模型实时再学习的功能,当模型预测结果验证不通过时,可以启动再学习,重新获得模型类型和新的模型参数,直到模型满足预测精度要求为止。
【专利说明】感潮河段水文序列交互式模拟预测方法和系统
【技术领域】
[0001]本发明涉及一种感潮河段水文序列交互式模拟预测方法和系统。
【背景技术】
[0002]感潮河段地处潮汐河口和内陆河流的交界处,同时受到河流动力作用(上游径流的下泄)和海洋动力(潮流运动)两方面的影响,具有双重特性,水流的运动状态复杂,其水位、流量等要素的变化规律难以掌握。与内陆河流或海洋相比,其水文系统是一个受众多因素影响的更为复杂的系统。在进行潮位预报时,常用的缓变非恒定流圣维南方程组来建立预报模型的方法对资料要求较高,需要一般不易具备的河道地形资料,不但求解繁琐,实时校正也较困难,所以使用范围有限。在感潮河段的流量等其他水文资料缺乏的情况下,直接利用潮位资料预报不乏是一种好的途径。从系统的角度看,感潮河段的水文序列也可看做一个系统。由于感潮河段的潮位较之流量来说受影响的因素更多,水流特性、河道状况等多种因素都可能对其产生复杂多变的影响,因此很难根据单一的物理原理和相应的数学关系式推演出该系统的数学模型。对于这样一种系统来说,采用时间序列模型分析不失为一种好的解决方法。
[0003]上世纪70年代由博克思(Box)和詹金斯(Jenkins)提出了一中著名时间序列预测方法:差分自回归移动平均模型(Autoregressive Integrated Moving AverageModel),简称ARIMA模型。其中ARIMA (P,d,q)称为差分自回归移动平均模型,AR是自回归,P为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。
[0004]ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。
[0005]ARIMA模型预测的基本步骤如下:
1、平稳性检验
对序列进行平稳性检验,判断其是否平稳。平稳又有宽平稳和严平稳之分,宽平稳对时间推移的不变性表现在统计平均的一、二阶矩上,严平稳对时间推移的不变性表现在统计平均的概率分布上,严平稳比宽平稳的要求要“严”,通常用的是宽平稳过程的概念。
[0006]2、正态性检验
判断序列是否服从正态分布,检验序列的三阶矩(偏态系数)与四阶矩(峰态系数)是否满足正态随机变量的特性。
[0007]3、零均值性检验
检验序列的均值是否为O。当序列均值的估计值不为O时,如果进行零化处理,会导致经处理后的时序改变了原序列的某些性质,建立的模型会不准确。
[0008]4、独立性检验
从理论上说,符合正态性的随机序列一定也具有统计独立性,但这是建立在样本数据足够多的条件上的,当样本长度有限时,具有正态性(在一定置信水平上)的序列不一定具备统计独立性的条件,所以要加以检验,采用Bartlett公式。
[0009]5、周期性检验。
[0010]用自相关系数检验。具有周期性的数据的自相关系数呈连续振荡波形,而随机性数据的自相关系数表现为单调的下降曲线。
[0011]6、模型识别
根据Box — Jenkins识别法,即根据样本自相关系数及样本偏自相关函数的截尾、拖尾性来判断序列所适合的模型类型。如果样本自相关系数在k>q后截尾,则判断为MA (q)序列;如果样本偏自相关函数在k>p后截尾,则判断为AR(p)序列;如果自相关系数及样本偏自相关函数都不截尾,而是拖尾的(按负指数衰减趋于零),则应判断为ARMA序列,阶次尚不能确定。
[0012]7、模型定阶
可以用偏相关定阶法、F-检验定阶法、FPE定阶法、AIC定阶法等多种方法来确定ARIMA模型的具体阶数。
[0013]8、模型参数估计
分为初估计和精估计两个阶段,首先进行模型参数的初步估计,然后再以初估计为基点,依据某种最优准则,进行参数的精估计。最常用的初估计方法为相关矩估计。最小二乘估计是最常用的最佳估计算法。
[0014]9、模型检验
采用残差序列的自相关检验法,检验模型的残差序列是否为白噪声序列。若残差序列是白噪声序列,模型即可用于预测。否则,应进一步改进模型。
[0015]10、模型预测
利用所建立的模型进行分析和预测。
[0016]在感潮河段的水文站点进行实时预测时,单纯的依靠一个固定参数的模型来分析预测存在这样两个问题:一是感潮河段的水位是随着时间不断改变的,这样数据的组成和分布也会不断发生改变,因此原先得到的模型不一定能继续适用;二是当模型监控到异常水位时,这样的异常值如果加入到模型里进行拟合,就不能准确预测到下一时间段的水位值。

【发明内容】

[0017]本发明所要解决的技术问题是提供一种感潮河段水文序列交互式模拟预测方法和系统,一方面对感潮河段现有的水文预测技术进行拓展,采用统计学科的方法,使得其能发扬自身的数据优势,进行自预报;另一方面,对ARIMA模型本身进行改进,使其可以对实时数据进行实时修正,通过启动应急方案,对异常数据进行实时分辨和剔除,从而准确的应用ARIMA模型对感潮河段水文序列进行预测。
[0018]本发明为解决上述技术问题采用以下技术方案: 一种感潮河段水文序列交互式模拟预测方法,包括以下步骤:
步骤I,导入历史水文数据并进行数据预处理,建立初始ARIMA模型;
步骤2,将总数为N的实时数据导入初始ARIMA模型中,判断实际水位值是否位于预测的置信区间内,若是,则进入步骤3 ;若否,进入步骤4 ;N为自然数;
步骤3,进行模型预测,判断当前时刻的预测值与前一时刻的实际值的差值是否超出允许临界区间,若不超出,即输出预测结果;若超出,则修正模型参数,重新建立ARIMA模型;步骤4,启用应急方案,判断异常值与前一刻水位差值是否位于临界区间内,若超出,则提示用户删除该数据;若不超出,则记录累计次数M ;M为自然数。
[0019]作为本发明进一步的优化方案,步骤4中所述异常值为步骤2中不位于预测的置信区间内的实际水位值,所述异常值存储在数据库中以备应急方案的调用;所述累计次数M达到N时,提示用户是否继续进行AMIRA模型预测,若是,则返回步骤I。
[0020]本发明还提出一种感潮河段水文序列交互式模拟预测系统,包括初始ARIMA模型配置模块、实时数据分析配置模块、感潮河段水位预测模块、预测结果分析验证模块、预测结果展出模块、再学习模块;其中:
所述初始ARIMA模型配置模块通过历史数据的导入及预处理、模型识别、模型定阶、参数估计和模型检验,建立初始ARIMA模型;
所述实时数据分析配置模块将实时数据导入初始ARIMA模型中,计算置信区间,判断实时数据是否位于预测的置信区间内,若是,则启动感潮河段水位预测模块进行预测;若否,则判为异常值,存入数据库中,以便应急方案调用;
所述感潮河段水位预测模块通过初始ARIMA模型对导入的实时数据进行分析,做出预
测;
所述预测结果分析验证模块对模型预测结果进行分析,判断当前时刻的预测值与前一时刻的实际值的差值是否超出允许临界区间,若超出,则启动再学习模块;若不超出,则将预测结果存入数据库,以便预测结果展出模块调用;
所述预测结果展出模块根据用户选择将预测结果以图像或表格的形式输出,并根据用户请求进行误差分析;
所述再学习模块启用再学习机制,修正模型参数,重新建立ARIMA模型。
[0021]作为本发明进一步的优化方案,所述历史数据的预处理包括平稳性检验、正态性检验、零均值性检验和趋势性检验。
[0022]作为本发明进一步的优化方案,所述临界区间是计算差分后的实时数据的均值和标准差,然后确定的发生小概率事件的临界区间,目的是根据概率统计理论来判断数据是否为小概率事件。
[0023]本发明采用以上技术方案与现有技术相比,本发明在现有感潮河段预报技术之上,引入统计科学的ARIMA方法到感潮河段,适用于感潮河段复杂水流条件下的模拟预测,使其可以根据自身的监测水文资料进行自预报;设置了应急方案来对实时数据进行监控,判断是否为异常数据,并对异常数据及时排除,使得ARIMA方法能正确发挥预报功能;设置了再学习模块,可以在模型不能满足预测精度时,自动再学习,重新获得模型类型,得到新的模型参数,直到模型满足预测精度要求为止。整个预测体系功能分配合理,同时有友好的人机交互功能,可以根据用户的需要进行不同模块的调用,或进行不同的模型再学习过程。【专利附图】

【附图说明】
[0024]图1是本发明的方法流程图。
[0025]图2是本发明的系统结构图。
[0026]图3是本发明的预测结果示意图。
【具体实施方式】
[0027]下面结合附图对本发明的技术方案做进一步的详细说明:
如图1所示,一种感潮河段水文序列交互式模拟预测方法,包括以下步骤:
1、从数据源导入感潮河 段水位资料的历史数据,可以是excel数据文件、txt文件、xml文件、SQL Sever数据库或Oracle数据库文件;对导入的数据进行预处理,包括平稳性检验、正态性检验、零均值性检验、趋势性检验,不满足的要进行差分处理,直到序列满足平稳性、零均值性和无趋势性为止;
2、模型识别及模型定阶
模型识别是根据Box — Jenkins识别法,即根据序列的自相关系数及偏自相关函数的截尾、拖尾性来判断序列所适合的模型类型。对于包含季节性或带有线性趋势项的非平稳时间序列来说,由于是非平稳序列所以无法直接用ARMA模型描述,可以采用季节差分的方法消除季节性或剔除其趋势项,然后再用ARMA模型拟合,这样得到的模型即是ARIMA模型。ARIMA (P, d,q) (P,D, Q)s模型定阶是运用最小信息准则AIC准则,为了使阶数的选择更为准确,采用AIC准则的同时也兼顾BIC准则;
3、模型参数估计和模型检验
确定了模型(P,d,q) (P, D,Q)s后,需要对其中的参数/7、d、q、P、D、Q进行估计,采用最小二乘法估计法,并计算估计参数的评价指标。对所建模型的残差序列进行检验,检验其是否为白噪声序列,如果残差是白噪声序列,就认为模型是合理的,将通过检验的参数代入通过检验的模型W?/姻(P,d,q) (P,汉?Τ中即得到初始ARIMA模型;否则,即模型检验不通过,需要返回步骤2修改模型;
4、将总数为N的实时数据导入初始ARIMA模型中,判断实际水位值是否位于预测的置信区间内,若是,则进入步骤5 ;若否,则判为异常值存在数据库中,并进入步骤6,;Ν为自然数;
5、进行模型预测,判断当前时刻的预测值与前一时刻的实际值的差值是否超出允许临界区间,若不超出,即输出预测结果;若超出,则启用再学习机制;
6、启用应急方案,判断异常值与前一刻水位差值是否位于临界区间内,若超出,则提示用户删除该数据;若不超出,则记录累计次数M,M为自然数,当M达到N时,提示用户是否继续进行AMIRA模型预测,若是,则返回步骤I。
[0028]如图2所示,一种感潮河段水文序列交互式模拟预测系统,包括初始ARIMA模型配置模块、实时数据分析配置模块、感潮河段水位预测模块、预测结果分析验证模块、预测结果展出模块、再学习模块。
[0029]初始ARIMA模型配置模块通过历史数据的导入及预处理、模型识别、模型定阶、参数估计和模型检验,建立初始ARIMA模型。[0030]实时数据分析配置模块将实时数据导入初始ARIMA模型中,判断实时数据是否位于预测的置信区间内,若是,则启动感潮河段水位预测模块进行预测;若否,则判为异常值,存入数据库中,以便应急方案调用。
[0031]感潮河段水位预测模块通过初始ARIMA模型对导入的实时数据进行分析,做出预测;预测结果分析验证模块对模型预测结果进行分析,判断当前时刻的预测值与前一时刻的实际值的差值是否超出允许临界区间,若超出,则启动再学习模块;若不超出,则将预测结果存入数据库,以便预测结果展出模块调用。
[0032]预测结果展出模块根据用户选择将预测结果以图像或表格的形式输出,如图3所示,并根据用户请求进行误差分析。
[0033]再学习模块启用再学习机制,修正模型参数,重新建立ARIMA模型。
【权利要求】
1.一种感潮河段水文序列交互式模拟预测方法,其特征在于,包括以下步骤: 步骤I,导入历史水文数据并进行数据预处理,建立初始ARIMA模型; 步骤2,将总数为N的实时数据导入初始ARIMA模型中,判断实际水位值是否位于预测的置信区间内,若是,则进入步骤3 ;若否,进入步骤4 ;N为自然数; 步骤3,进行模型预测,判断当前时刻的预测值与前一时刻的实际值的差值是否超出允许临界区间,若不超出,即输出预测结果;若超出,则修正模型参数,重新建立ARIMA模型;步骤4,启用应急方案,判断异常值与前一刻水位差值是否位于临界区间内,若超出,则提示用户删除该数据;若不超出,则记录累计次数M ;M为自然数。
2.根据权利要求1所述的一种感潮河段水文序列交互式模拟预测方法,其特征在于,步骤4中所述异常值为步骤2中不位于预测的置信区间内的实际水位值,所述异常值存储在数据库中以备应急方案的调用。
3.根据权利要求1所述的一种感潮河段水文序列交互式模拟预测方法,其特征在于,步骤4中所述累计次数M达到N时,提示用户是否继续进行AMIRA模型预测,若是,则返回步骤I。
4.一种感潮河段水文序列交互式模拟预测系统,其特征在于,包括初始ARIMA模型配置模块、实时数据分析配置模块、感潮河段水位预测模块、预测结果分析验证模块、预测结果展出模块、再学习模块;其中: 所述初始ARIMA模型配置模块通过历史数据的导入及预处理、模型识别、模型定阶、参数估计和模型检验,建立初始ARIMA模型; 所述实时数据分析配置模块将实时数据导入初始ARIMA模型中,判断实时数据是否位于预测的置信区间内,若是,则启动感潮河段水位预测模块进行预测;若否,则判为异常值,存入数据库中,以便应急方案调用; 所述感潮河段水位预测模块通过初始ARIMA模型对导入的实时数据进行分析,做出预测; 所述预测结果分析验证模块对模型预测结果进行分析,判断当前时刻的预测值与前一时刻的实际值的差值是否超出允许临界区间,若超出,则启动再学习模块;若不超出,则将预测结果存入数据库,以便预测结果展出模块调用; 所述预测结果展出模块根据用户选择将预测结果以图像或表格的形式输出,并根据用户请求进行误差分析; 所述再学习模块启用再学习机制,修正模型参数,重新建立ARIMA模型。
5.根据权利要求4所述的一种感潮河段水文序列交互式模拟预测系统,其特征在于,所述历史数据的预处理包括平稳性检验、正态性检验、零均值性检验和趋势性检验。
6.根据权利要求4所述的一种感潮河段水文序列交互式模拟预测系统,其特征在于,所述临界区间是计算差分后的实时数据的均值和标准差,然后确定的发生小概率事件的临界区间,目的是根据概率统计理论来判断数据是否为小概率事件。
【文档编号】G06F19/00GK103745094SQ201310727104
【公开日】2014年4月23日 申请日期:2013年12月25日 优先权日:2013年12月25日
【发明者】吴玲莉, 张玮, 吴腾 申请人:河海大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1