一种水文频率分析的模型选择方法与流程

文档序号:17372940发布日期:2019-04-12 22:59阅读:376来源:国知局
一种水文频率分析的模型选择方法与流程
本发明属于水文统计领域,更具体地,涉及一种水文频率分析的模型选择方法。
背景技术
:合理计算设计暴雨、设计洪水是水利水电工程规划的首要问题,其关键之一在于选择合适的频率分布线型。目前,广泛采用的分布函数包括:指数分布(exponential,exp)、weibull分布、gamma分布、gumbel分布、广义极值分布(gev)、皮尔逊iii型分布(p-iii)、对数皮尔逊iii型分布(lp-iii)及对数正态分布(ln)等。针对特定地区,通常存在多个分布函数可实现暴雨、洪水的频率分析与计算,多数研究仅选取单一分布线型拟合,使设计洪水计算值具有较大的不确定性。为解决该问题,近年来越来越多的学者将广义分布函数应用于水文频率分析中。perreault等(1999)和chen等(2017)将halphen系列分布(分布簇)引入水文领域,用于极端水文气象事件的频率分析(perreault,l.;bobée,b.;rasmussen,p.halphendistributionsystem:mathematicalandstatisticalproperties.j.hydrol.eng.1999,4,189-199;chen,l.;singh,v.p.;xiong,f.anentropy-basedgeneralizedgammadistributionforfloodfrequencyanalysis.entropy2017,19,239);papalexiou和koutsoyiannis等(2012)采用广义gamma分布和广义第二类beta分布(generalizedbetadistributionofthesecondkind,gb2)进行全球降雨频率分析,并指出gb2分布能够同时描述j型和钟型数据,因而非常适于全球的降雨频率分析(papalexiou,s.m.;koutsoyiannis,d.entropybasedderivationofprobabilitydistribution:acasestudytodailyrainfall.adv.waterresour.2012,45,51-57.)。由此可见,广义分布函数已广泛的应用于水文频率分析计算中,并表现出良好的效果。如何选择最为可靠合理的广义分布称为一个亟待解决的关键科学问题。传统的分布函数选择技术,主要是基于一些特定的选择指标,如akaikeinformationcriterion(aic),bayesianinformationcriterion(bic)和aannderson-darlingcriterion(adc)准则。研究发现此类指标确定最优分布时,对两参数的模型较为适用,但对具有多个参数的广义分布有一定的限制。在中国发明专利cn102542169a中公开了一种水文频率分析计算的线型选择方法,但该方法主要是针对常用的分布函数,基于贝叶斯理论和pome提出了一种综合的分布,并未涉及广义分布,也未涉及采用极大熵原理的方法确定广义分布的参数,更未涉及通过贝叶斯最大后验概率选择模型。由此可见,现有的水文频率分析计算中模型选择方法存在主观性强、选择结果不合理且可靠性差的技术问题。技术实现要素:针对现有技术的以上缺陷或改进需求,本发明提供了一种水文频率分析的模型选择方法,由此解决现有的水文频率分析计算中模型选择方法存在主观性强、选择结果不合理且可靠性差的技术问题。为实现上述目的,本发明提供了一种水文频率分析的模型选择方法,依次包括如下步骤:(1)对长系列水文数据进行年最大取样,得到年最大雨量或流量样本,作为水文数据集d;(2)采用多种广义分布函数拟合水文数据集d,得到每种广义分布函数对应的水文频率分析模型;(3)利用水文数据集d和长系列水文数据的站点信息i,得到水文频率分析模型的后验概率,选择后验概率最大的水文频率分析模型对应的广义分布函数作为最合理的分布函数。进一步地,广义分布函数包括:广义gamma分布函数、广义第二类beta分布函数、halphena分布函数、halphenb分布函数以及halphenib分布函数。进一步地,水文频率分析模型中广义分布函数的参数根据最大熵原理评估得到。进一步地,步骤(3)依次包括如下步骤:(3-1)利用水文数据集d和长系列水文数据的站点信息i,计算水文频率分析模型的先验概率以及似然函数;(3-2)利用水文频率分析模型的先验概率以及似然函数,计算水文频率分析模型的后验概率,选择后验概率最大的水文频率分析模型对应的广义分布函数作为最合理的分布函数。进一步地,步骤(3-1)包括:利用水文数据集d和长系列水文数据的站点信息i,计算水文频率分析模型的先验概率;利用水文数据集d、长系列水文数据的站点信息i与广义分布函数的拉格朗日乘子λ建立联合分布,得到水文频率分析模型的似然函数。进一步地,水文频率分析模型的后验概率为:其中,mi表示第i个水文频率分析模型,p(mi|d,i)为mi的后验概率,p(mi|i)是mi的先验概率,p(d|mi,i)是在mi条件下水文数据集d的似然函数,p(d|i)是正态化参数。总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:分布函数的选择在水文分析与计算中起着至关重要的作用,不合理的模型可能会高估或者低估水文风险。传统的采用各种指标优选模型的方法,往往存在几个模型指标值差别不大,且受数据长度和特点的限制,不同的指标会给出不同的结果,本发明所提方法可以更加客观的选择最优的广义分布函数,且各模型的后验概率差别明显,易于选择。从而利用本发明方法可以确定最为合理、可靠的广义分布函数,进而用于设计暴雨、设计洪水的计算以及极端事件的风险分析等。附图说明图1是本发明实施例提供的一种水文频率分析的模型选择方法的流程图;图2是本发明实施例1提供的多种广义分布函数拟合图。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。如图1所示,一种水文频率分析的模型选择方法,依次包括如下步骤:(1)对长系列水文数据进行年最大取样,得到年最大雨量或流量样本,作为水文数据集d;(2)采用多种广义分布函数拟合水文数据集d,得到每种广义分布函数对应的水文频率分析模型;(3)利用水文数据集d和长系列水文数据的站点信息i,得到水文频率分析模型的后验概率,选择后验概率最大的水文频率分析模型对应的广义分布函数作为最合理的分布函数。进一步地,广义分布函数包括:广义gamma分布函数(generalizedgammadistribution,gg)、广义第二类beta分布函数(generalizedbetadistributionofthesecondkind,gb2)、halphena分布函数(hal-a)、halphenb分布函数(hal-b)以及halphenib分布函数(hal-ib)。进一步地,水文频率分析模型中广义分布函数的参数根据最大熵原理评估得到。进一步地,步骤(3)包括:(3-1)利用水文数据集d和长系列水文数据的站点信息i,计算水文频率分析模型的先验概率以及似然函数;(3-2)利用水文频率分析模型的先验概率以及似然函数,计算水文频率分析模型的后验概率,选择后验概率最大的水文频率分析模型对应的广义分布函数作为最合理的分布函数。进一步地,步骤(3-1)包括:利用水文数据集d和长系列水文数据的站点信息i,计算水文频率分析模型的先验概率;利用水文数据集d、长系列水文数据的站点信息i与广义分布函数的拉格朗日乘子λ建立联合分布,得到水文频率分析模型的似然函数。进一步地,水文频率分析模型的后验概率为:其中,mi表示第i个水文频率分析模型,p(mi|d,i)为mi的后验概率,p(mi|i)是mi的先验概率,p(d|mi,i)是在mi条件下水文数据集d的似然函数,p(d|i)是正态化参数。式中,n是模型的个数。为了计算后验概率值,需要计算p(d|mi,i)的值,可通过与广义分布函数的参数拉格朗日乘子λ建立联合分布,求解p(d|mi,i)。因为p(λ,d|mi,i)=p(λ|mi,i)p(d|λ,mi,i)(4)式中,p(λ|mi,i)是拉格朗日乘子的先验分布;式(3)可以写成如下的形式:式中,p(d|λ,mi,i)是在给定拉格朗日乘子、模型mi和长系列水文数据的站点信息i情况下的似然函数,可用下式表示:本发明中,采用高维分布作为拉格朗日乘子的先验分布,将参数评估的λ作为朗格朗日乘子的均值;高维分布的方差采用海森矩阵计算。计算海森矩阵的公式采用下式计算。根据式(3),p(d|mi,i)可采用积分的方法计算。本发明采用马尔可夫链蒙特卡罗(markovchainmontecarlo,mcmc)随机模拟的方法计算p(d|mi,i)和后验概率。采用mcmc方法,依据分布函数p(λ,d|mi,i),生成拉格朗日乘子序列λ。p(d|mi,i)可以采用计算期望e[p(d|λ,mi,i)]的形式得到。分布函数的选择在水文分析与计算中起着至关重要的作用,不合理的模型可能会高估或者低估水文风险。传统的采用各种指标优选模型的方法,往往存在几个模型指标值差别不大,且受数据长度和特点的限制,不同的指标会给出不同的结果,本发明所提方法可以更加客观的选择最优的广义分布函数,且各模型的后验概率差别明显,易于选择。实施例1以密西西比河流域日尺度设计暴雨计算为例,检验所提模型选择技术的适用性和合理性。对长系列的日降雨量数据采用年最大方法取样,得到年最大日降雨量序列d。采用广义gamma分布,广义第二类beta分布、halphena分布、halphenb分布、halphenib分布拟合日降雨量序列,采用最大熵原理方法评估广义分布的参数,评估得到的参数值见下表1。表1站点不同分布的参数、检验值及后验概率分布参数1参数2参数3参数4rmseaicbic后验概率gg13.59990.56060.01310.0294-409.36-402.110.00gb22.1991.8379.9312.43890.0164-466.07-458.810.08hal-a0.97730.104-8.1940.0168-479.18-471.930.21hal-b-27.56114.57783.88890.0406-362.58-355.330.00hal-ib-3.89183.70763.26080.0165-457.91-450.650.71采用上述贝叶斯和熵理论相结合的模型选择技术,计算各模型的后验概率,计算结果如表1所示。由表1可知,针对实施例中的站点,halphenib分布拟合效果较优,贝叶斯方法的后验概率为0.71;其次是halphena分布,其后验概率值为0.21;再其次是gb2分布,后验概率是0.08。图2给出了多种广义分布的分布函数拟合图。设计暴雨或设计洪水计算,更加关注极值水文事件的拟合效果。由图2可知,当采用halphenib分布时,与超过概率接近1%的经验点矩拟合效果最优,不会低估设计暴雨值,当采用其它广义分布时,特别是gg、hal-b、hal-a分布会明显的低估设计值,可能导致防洪风险。本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1