一种基于变化数据的水文模型预报不确定性分析方法

文档序号:33163768发布日期:2023-02-04 01:09阅读:43来源:国知局
一种基于变化数据的水文模型预报不确定性分析方法

1.本发明属于水利领域,具体涉及水文模型的建立与应用技术。


背景技术:

2.水文模型具有广泛用途,如用于水旱灾害防治,水资源评价和开发利用等,其预测结果的精确程度直接影响到人类社会的生产生活。然而,水文模型由于其模型结构不完美、数据噪音影响、模型参数不确定性等问题,其预测结果具有一定程度的不确定性。这种不确定性在实际工程应用中会导致模型预报结果可靠性降低,限制水文模型的应用和发展。因此,水文模型预报不确定性分析对水文工程和水资源规划等领域具有十分重要的意义。
3.目前已有许多关于水文模型的不确定性分析方法:马尔科夫链蒙特卡洛模拟方法(mcmc),广义似然不确定性估计方法(glue),递归贝叶斯估计(bare)等。然而,这些方法均存在一定缺陷,如mcmc方法所需计算量大且随机系统参数间存在相关性,glue算法主要的问题在于阈值、模拟样本数和似然函数的选择上存在主观性。
4.以上这些常见的不确定性分析方法均基于贝叶斯理论,根据中心极限定理和大数定律获得可靠的待分析变量的概率分布特征,即在模型参数的先验分布上进行大量随机抽样以期获得与实际相似的参数概率分布。然而,这种做法忽略了数据可变性造成的不确定性影响。具体而言,传统的不确定性分析方法更多侧重于对模型参数分布的获取,而用于模型校核的数据集固定不变。这一做法的后果是,模型的参数校准结果在统计上可能是不可靠的,因为无论是校核还是不确定性分析中模型都是对某一固定数据集的拟合,一旦数据集信息发生较大改变,模型的泛化性能往往会迅速下降。
5.为此,许多专家学者研究了数据对模型泛化性能的影响,并提出了许多解决办法,比如尽量延长模型校核期的时间跨度,校核数据要包含干旱和湿润周期等。其中一种合适的做法是保证模型使用的数据信息与真实水文条件的信息在统计分布上尽可能一致,基于此衍生出多种数据分配算法,如somplex、duplex、mduplex等。这些算法的目的均是将可用历史数据划分成分布特征一致的多个子集。然而,这些分配算法获得的历史数据子集仅仅只是真实水文条件的一个特殊情况,仍然无法解释水文条件本身存在的可变性。针对这一问题,一个可行的做法是通过使用大量不同的数据子集建立多组模型,用于分析模型预测不确定性。然而这种做法又会导致计算复杂度过高,效率极其低下,产生大量冗余的模型校核工作。
6.为解决以上问题,本专利发明了一种基于多次数据采样的水文模型预报不确定性高效分析方法ssce(stochastic shuffled complex evolution,随机洗牌复合形进化算法),旨在模型校核期间同时包含了不确定性分析,提高建模工作效率。该方法基于传统sce(shuffled complex evolution,洗牌复合形进化算法)发展而来,其特点是在模型各代参数寻优的同时考虑多次数据采样,最终确定参数分布函数,以该分布函数分析预报结果的不确定性。模型在校核期间已经考虑参数和数据可变性等因素的造成的不确定性,因此一次算法运行即可同时完成模型的参数校核和预测结果的不确定性分析,效率极高。相比于
传统sce方法,本发明优化方法最终收敛得到一组模型参数分布函数,而非单个最优参数值,因此收敛条件也从原来的目标函数收敛转变为参数收敛,具有一定程度的创新性。


技术实现要素:

7.本发明所要解决的技术问题:提出了一种基于变化数据的水文模型预报不确定性分析方法,通过在sce算法中各代优化时引入数据可变性,从而提高水文模型泛化能力的可靠性和高效分析模型预报不确定性。
8.本发明具体采用的技术方案如下:
9.一种基于变化数据的水文模型预报不确定性分析方法,步骤如下:
10.s1:按步骤s11-s17启动ssce算法进行水文模型参数校核
11.s11:确定可用历史数据集d,其中包含降雨、蒸散发、径流等模型所需的必要信息,确定模型待优化的参数数目n,复合形数量记为p(默认值为5),各个复合形内包含的参数成员数量m=2n+1,因此ssce算法内进化的参数成员共计s=p
×
m个,每个参数成员均包括n种参数。
12.s12:n种参数对应的参数成员分别在参数空间内以均匀概率密度进行初始化,得到初始参数集
13.s13:从算法迭代代数g=1开始,每一代中的p个复合形分别使用具有半随机性的数据抽样算法(如:基于自组织映射神经网络的抽样算法,sbss-p,sbss-n,somplex等;系统性抽样算法,systematic;这些抽样算法均能得到与样本数据特征相似的样本子集)从d中抽取60%的数据,记为dj,作为当前复合形内m个参数成员所使用的校核数据集。
14.s14:在当前这一代g内,,各个复合形独立进行参数优化,优化算法采用竞争复合形进化算法(competitive complex evolution,cce),得到更新后的参数集并计算对应的目标函数值
15.s15:计算当前这一代g的参数集与其前5代的参数集之间的相对偏差arbj,其计算公式如下:
[0016][0017]
其中,表示在第g代下,水文模型中第i个参数对应的s个参数成员的平均值,表示在第g-j代下,水文模型中第i个参数对应的s个参数成员的平均值。
[0018]
s16:若arbi均小于2%,或者当前这一代的代数达到最大设定值g
max
=500,则停止算法。
[0019]
s17:重复步骤s13-s16直至满足收敛要求。
[0020]
s2:按步骤s21-s2对模型模拟值进行不确定性分析
[0021]
s21:步骤s1最终得到s个充分优化后的参数成员,以此确定水文模型中各类参数的上下限范围,在这一范围内的模型参数均可视为是有效的。
[0022]
s22:使用这s个参数成员分别运行水文模型,即可得到s个模型,在工程应用阶段,
这些模型在各个时刻提供s组预测值并确定其上下限范围,在这一范围内的预测值表征了模型的预报不确定性。
[0023]
相对于现有技术而言,本发明具有以下优点:
[0024]
(1)相对于传统水文模型常用的sce校核算法,本发明提出的ssce算法引入了模型数据的可变性,有助于模型预报的不确定性分析。
[0025]
(2)本发明提出的ssce算法无需大量重复建模和校核,只需要一次完整运行即可对数据可变性造成的不确定性影响进行分析。
[0026]
(3)本发明提出了一种水文模型的校核与不确定性分析相融合的新思路,在模型校核阶段同时考虑了参数不确定性和数据可变性等多重不确定性因素耦合下的影响关系,计算效率和分析效率显著提升,具有广泛的应用前景。
附图说明
[0027]
图1是本发明的ssce算法流程图。
[0028]
图2是两种方法在某个流域的模型4个参数收敛后的分布对比图。
[0029]
图3是两种方法在某个流域的模型kge分布对比图。
[0030]
图4是两种方法在4个流域中的模拟值对比图。
[0031]
图5是两种方法在全部163个流域中kge分布对比图。
具体实施方式
[0032]
下面通过附图和实施例对本发明进行具体阐述,以便本领域技术人员更好地理解本发明的实质。
[0033]
参见图1,一种基于多次数据采样的水文模型预报不确定性高效分析方法,步骤如下:
[0034]
s1:按步骤s11-s17启动ssce算法进行模型参数校核
[0035]
s11:确定可用历史数据集d,其中包含降雨、蒸散发、径流等模型所需的必要信息,确定模型待优化的参数数目n,复合形数量记为p(默认值为5),各个复合形内包含的参数成员数量m=2n+1,因此ssce算法内进化的参数成员共计s=p
×
m个,每个参数成员均包括n种参数。
[0036]
s12:n种参数对应的参数成员分别在参数空间内以均匀概率密度进行初始化,得到初始参数集
[0037]
s13:从算法迭代代数g=1开始,每一代中的p个复合形分别使用具有半随机性的数据抽样算法(如:基于自组织映射神经网络的抽样算法,sbss-p,sbss-n,somplex等;系统性抽样算法,systematic;这些抽样算法均能得到与样本数据特征相似的样本子集)从d中抽取60%的数据,记为dj,作为当前复合形内m个参数成员所使用的校核数据集。
[0038]
s14:在当前这一代g内,各个复合形独立进行参数优化,优化算法采用竞争复合形进化算法(competitive complex evolution,cce),得到更新后的参数集并计算对应的目标函数值
[0039]
s15:计算当前这一代g的参数集与其前5代的参数集之间的相
对偏差arbj,其计算公式如下:
[0040][0041]
其中,表示在第g代下,水文模型中第i个参数对应的s个参数成员的平均值,表示在第g-j代下,水文模型中第i个参数对应的s个参数成员的平均值。
[0042]
s16:若arbi均小于2%,或者当前这一代的代数达到最大设定值g
max
=500,则停止算法。
[0043]
s17:重复步骤s13-s16直至满足收敛要求。
[0044]
s2:按步骤s21-s2对模型模拟值进行不确定性分析
[0045]
s21:步骤s1最终得到s个参数集,这s个参数集可以确定模型各个参数的不确定性范围,使用这些参数集来运行模型,即可得到对应的s组模型模拟值以及s个目标函数值。
[0046]
s22:分析这s组模拟值在时间序列上的上下限范围,即可确定模拟值的不确定性范围。
[0047]
下面基于该方法,将其与具体实施例结合,以展示其具体技术效果,方法的具体步骤不再赘述。
[0048]
实施例
[0049]
下面将本发明提出的ssce算法和传统的sce算法分别应用到水文模型中进行测试,对比两种方法的实际表现。
[0050]
本发明提出的ssce算法如图1的流程图所示,传统的sce算法则是将全部历史可用数据集d用于模型校核。
[0051]
gr4j模型,作为水文领域广泛使用的一种概念性降雨径流模型,用于本次测试。该模型一共有4种参数,分别定义为x1,x2,x3,x4。
[0052]
选择澳大利亚的163个水文观测站的历史观测数据作为可用历史数据集,这些流域数据均由前人分析处理,数据时间跨度均超过30年,满足gr4j模型对数据的长度要求。
[0053]
模型性能的评估指标采用kge,取值范围从负无穷至1,kge越接近1,则说明模型的拟合性能越好,反之则表示模型性能极差。
[0054]
实施例中选择的数据抽样算法为somplex,例如中国专利申请cn202111550447.2公开的somplex算法,这是一种结合了自组织映射神经网络和确定性抽样算法duplex特点的一种具有半随机性的新型数据抽样算法,该算法能够得到与待采样样本数据特征分布一致的样本子集,满足ssce算法的要求。
[0055]
当然,本发明也可以选择其他能够得到与待采样样本数据特征分布一致的样本子集的算法。
[0056]
选择第34号流域的监测站数据,用于演示本发明提出的模型校核方法的具体实施过程:
[0057]
(1)该数据集记录范围为1959/1/1至2009/12/31,精度单位为日,取开始的365天数据作为模型“启动”阶段,用于初始化模型参数。
[0058]
(2)可用数据集总长度d=18628,模型待优化参数数目n=4,复合形的数量使用默
认值p=5,则复合形内的参数成员数量为m=2n+1=9,ssce算法的父代参数成员总数s=p
×
m=45。
[0059]
(3)对这45个参数成员进行初始化,在参数空间范围内均匀分布,根据先验分布,可设定gr4j的4个参数范围x1∈[1,1200],x2∈[-5,5],x3∈[0,1000],x4∈[0.5,2.9]。
[0060]
(4)在每一代校核中,5个复合形分别通过somplex从d中获得60%的数据作为其内部9个参数成员的校核数据集dj,各个复合形单独进化。
[0061]
(5)对于每一个复合形,使用cce算法优化参数。5个复合形都结束进化后,当前这一代的进化完成。
[0062]
(6)根据收敛公式1-1判断当前这一代跟其前面的5代之间参数的平均相对偏差,如果满足收敛要求,则停止算法;否则,重复(4)~(6)直至达到收敛要求。
[0063]
(7)算法停止后,得到最终收敛的参数分布其内有45组参数,每组参数包含了x1至x4的值。这45组参数分别代入gr4j模型中运行,得到45组关于时间序列的模拟值,由此可以得到时间序列上的模拟值上下限,确定其分布范围。
[0064]
图2是本发明的方法和传统方法在第34号流域中模型得到的4个参数的分布图,从图中可见,ssce方法在校核收敛后能够得到参数的一个分布范围,而传统sce算法仅能最终收敛到单个最佳参数值。事实上,在工程应用中由于存在参数不确定性、模型结构不确定性以及数据不确定性等多方面条件的制约,单个参数值的应用价值是不足的,而本发明方法能够提供各参数的一个不确定性范围,在这一范围内的参数经过ssce算法内各类不确定性的影响后最终保留下来,其模型性能较为稳健,方便模型使用者在一定范围内适当调整模型参数而不会造成模型性能急剧恶化。
[0065]
图3则是对应的模型性能实际表现,使用图2中的参数来建模,各个模型在整个数据集d上计算kge值,本发明的ssce算法得到的是45个kge值,而传统sce算法得到的是单个kge值。从图中结果可见,ssce算法由于考虑了数据可变性以及参数的不确定性,各个参数组合下的模型kge表现与sce算法极为接近,最大的差距仅在0.01范围内。由此可见,图2中本发明方法下的参数分布范围内得到的模型性能没有显著区别,这也进一步验证了本发明的ssce算法的有效性。
[0066]
图4是另外选取的4个不同流域内本发明方法和传统方法得到的模型模拟值对比图。同图中可以明显看到,ssce算法得到的45组模拟值确实能够在时间序列上有效地包含观测值,反观传统sce算法只能得到一条模拟值的线,与观测值存在不可避免的偏差,且在实际预测中难以得知这一偏差的具体范围,降低了对模型的信心。由此可见,ssce算法能够有效地限定对于水文模型预报的模拟值不确定性范围,能够系统地确定模拟值的上下限,这对于实际工程应用极为有益。
[0067]
图5则给出了全部163个流域中两种方法得到的模型总体kge值的统计分布。从图中可见,本发明的ssce方法与传统sce方法的分布曲线极为相似,这说明在第34号流域内测试到的结果在其他流域内依然有类似的表现,从统计意义上进一步证明了本发明方法的有效性。
[0068]
从以上结果可见,本发明提出的多次数据采样的ssce方法相比于传统的sce方法能够更有效地将参数不确定性和数据可变性考虑在内,在模型校核工作完成的同时得到参数不确定性分布范围,进而得到模拟值的不确定性分布范围,能够高效分析水文模型预报
的不确定性,具有良好的实际工程应用价值。且由于“多次数据采样”的思想不仅仅局限于某个具体参数优化算法中,本发明方法还可以推广至其他著名的优化算法中去,比如遗传算法,粒子群算法等,应用前景广泛。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1