一种POT洪水自动提取方法及系统与流程

文档序号:15493953发布日期:2018-09-21 21:14阅读:1145来源:国知局

本发明属于水利工程技术领域,尤其涉及一种pot洪水自动提取方法及系统。



背景技术:

目前,业内常用的现有技术是这样的:

洪水频率分析是水利工程规划、设计和运行的依据。从水文意义上讲,对于某一工程,当未来任一年内实际来水量大于或等于设计来水量时,设计目标就会遭受水文意义上的破坏。我国大多数水文站点的观测资料系列比较短缺,一般仅有几十年,在百年一遇甚至千年一遇洪水的防洪设计时误差较大。因此,从有限的水文观测资料中获得尽可能多的水文信息、增加样本系列长度,是提高设计洪水计算精度的重要途径。年最大值法(annualmaximalseries,ams)由于概念清晰、理论成熟在国内水文统计计算中得到广泛应用,这种方法往往会忽略一年中多次出现的极大流量值,而丢弃丰水年许多有价值的洪水数据,造成水文信息的极大浪费,进而影响设计洪水精度。近些年提出超阈值洪水(peaksoverthreshold,pot)模型扩充样本。该方法将超过某一洪水阈值的极值数据都作为有效样本加入到统计分析中。与年最大值模型相比,pot方法可最大程度地挖掘实测资料中有价值的数据,增加统计分析中的样本数量,从而提高设计洪水精度。有些国家已采用该方法计算工程设计洪水。

为保证pot模型取得好的效果,样本之间须满足独立性条件,并且需要选用恰当的阈值。阈值是确定pot序列样本的重要参数,阈值过低可能无法满足独立性的要求,阈值过大,则减少了入选的洪峰次数,不利于有效地统计分析,导致百年一遇甚至千年一遇洪水的水利工程防洪设计时误差较大。目前普遍认为,阈值的选择并不唯一,应根据超阈值洪水系列发生次数分布、超阈值洪水频率分布以及独立同分布假设共同确定。

常用的阈值确定方法有:

(1)年均超阈值次数法,认为年平均超阈值洪水次数大于1.65时采用指数分布能够取得较好效果。国内年平均超阈值次数多控制在2~3次。

(2)超阈值样本均值法,即是s的线性函数,是超阈值样本的均值。这种方法本质上是通过选择阈值而使得对pot模型参数估计最为稳定。

(3)分散指数法,即检验阈值以上的样本数是否符合poisson分布。

常用的独立性判别标准有:

(1)美国水资源协会(uswrc,1976)提出的θ>5+ln(a)且xmin<0.75[q1,q2]。式中:θ为两个峰间的间隔时间(天);a为流域面积(km2);qi为洪水第i日的最大日流量。若xs1为两个峰中较大的一个,xs2为两个峰中较小的一个,则xmin为两个峰间的最小流量。

(2)cunnane(1979)提出的θ>3tp或xmin<2/3xs1。式中:tp为流量过程线上前5个峰间间隔时间的平均时间,单位为天。

(3)王善序(1999)认为不同年份的洪水是相互独立的,要求年内前后两次洪峰时差必须大于流域汇流时间,而且两次洪水之间,前次洪水应已明显退落到其起涨流量之下,或者接近于平时的流量。流域汇流时间可用计算。式中:τ为流域汇流时间(分钟);l为流域汇流长度(英尺);s为流域平均坡度。

目前,不同研究对pot样本是否服务指数分布有不同的认识。有的研究认为服从指数分布,有的认为服从gamma分布,有的认为服从对数正态分布,有的认为服从weilbull分布,有的认为广义pareto分布。对于pot洪水次数是否服务泊松分布也有不同的意见,认为除了泊松分布,也可能服务二项分布、负二项分布。

现有技术中,由于没有统一的阈值确定准则和洪水样本独立性判别标准,可通过不同方法来获得pot模型。一种较简单的pot模型方法是先从长期洪水观测资料中选取洪峰值序列,然后通过试算程序不断改变阈值,使超阈值年平均洪水发生次数满足独立、同分布条件,最终确定阈值,然后进一步基于该值筛选得到超阈值洪水序列。另一种非等步长内集-外集模型方法需要绘制超定量样本均值与阈值s的关系曲线和超定量序列发生次数的分散指数图,根据所绘制图形进行阈值试算和pot次数是否服从泊松分布的判断。

综上所述,现有技术存在的问题是:

(1)这种从长期洪水观测资料中选取独立、同分布洪峰值序列带有主观性,且效率低。

(2)这种非等步长内集-外集模型方法实施过程中需要根据绘制超定量样本均值与阈值s的关系曲线、超定量洪水次数指数分布曲线确定阈值,带有主观性。

(3)这种非等步长内集-外集模型方法实施过程中对统计理论基础和计算机编程能力都具有较高要求。

(4)对pot样本服从什么分布、pot次数服务什么分布问题的验证判断都要求较高的统计理论基础和计算机编程能力。

解决上述技术问题的难度和意义:

(1)避免上述从长期洪水观测资料中选取独立、同分布洪峰值序列的低效问题,提高效率。

(2)避免上述从长期洪水观测资料中选取独立、同分布洪峰值序列方法,非等步长内集-外集模型方法实施过程主观性,保证结果的客观性。

(3)避免上述技术方法对统计理论和技术要求高的问题,无需高深的统计理论和较高计算机编程能力,有助于pot模型方法的广泛应用。



技术实现要素:

针对现有技术存在的问题,本发明提供了一种pot洪水自动提取方法及系统。

本发明是这样实现的,一种pot洪水自动提取方法包括:

逐日分析流量序列内日流量是否大于给定阈值且大于前后2天流量值,计算满足条件的流量出现次数,同时记录满足条件的流量值;

对挑选出的流量值进行升值排序,按流量从大到小依次计算各流量与前面已选洪水样本的最小时间间隔;然后从这个流量开始继续分析剩余流量与前面已选洪水样本的最小间隔时间,记录所有入选的洪水样本;

输出所挑选洪水样本数,最后一次所用阈值作为最终使用的阈值。使得依据该阈值筛选的洪水样本能够满足给定的年均超阈值洪水次数且相邻两次洪水间隔时间超过给定的流域汇流时间或峰间间隔时间。

不同流量序列、不同pot次数对应的阈值数值相差很大。最终使用的阈值根据实际确定。

进一步,所述pot洪水自动提取方法准备好日观测流量序列文件,文件内容包含年、月、日、观测流量;给定欲提取pot样本的起始年(y_begin)、终止年(y_end),年均pot洪水发生次数(y_pot)、流域汇流时间或两个洪水峰峰间隔时间(t_interval);具体包括:

1)根据给定欲提取pot样本的起始年、终止年,年均pot洪水发生次数,计算最终要得到的pot洪水次数(n_pots),n_pots=y_pot*(y_end-y_begin+1);

2)计算起始年(y_begin)、终止年(y_end)逐日流量序列的最大值(flow_max);

3)随机给定一个大流量值作为初始阈值threshold0,要求该初始阈值大于流量序列中的最大值flow_max;

4)逐日判断流量序列内日流量是否大于初始阈值threshold0且大于前后2天流量值,计算满足条件的流量出现次数n_times,同时记录满足条件的流量值;

5)如果满足条件的流量出现次数n_times大于最终要得到的pot洪水次数n_pots,则执行6);否则,以threshold0=hreshold0*0.1,返回4)重新计算;

6)对4)挑选出的流量值进行升值排序,最大流量值作为第1个洪水样本,洪水样本数为1;从第2大值开始,按流量从大到小依次计算各流量与已选洪水样本的最小时间间隔,所述最小时间间隔大于给定的间隔时间t_interval,则将该流量值挑选出来作为新的洪水样本;然后从这个流量开始继续判断剩余流量与前面已选洪水样本的最小间隔时间,如果大于给定间隔时间t_interval,则在洪水样本中加入该流量,洪水样本加1;如此循环一直到最小流量,记录下所有入选的洪水样本;

6)如果全部入选洪水样本数小于最终要得到的洪水样本n_pots,计算threshold0=threshold0*0.1返回4);如果全部入选洪水样本数大于等于最终要得到的洪水次数n_pots,执行7);

7)输出所挑选洪水样本数,如果该数值远大于最终要得到的洪水样本数,返回3)重新给一个新的初始阈值threshold0依次执行各步,直到所挑选洪水样本数等于或略大于n_pots为止;

8)输出所挑选pot样本中前n_pots个,最后一次所用阈值作为最终阈值。

本发明另一目的在于提供一种实现所述pot洪水自动提取方法的计算机程序。

本发明另一目的在于提供一种实现所述pot洪水自动提取方法的信息数据处理终端。

本发明另一目的在于提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行所述的pot洪水自动提取方法。

本发明另一目的在于提供一种pot洪水自动提取系统包括:

日观测流量序列准备模块,用于准备好日观测流量序列文件,文件内容包含年、月、日、观测流量;

阈值设定模块,用于给定欲提取pot样本的起始年、终止年,年均pot洪水发生次数、流域汇流时间或两个洪水峰峰间隔时间;

自动试错计算模块,用于运行程序通过试错方法计算不断调整阈值,确定最终阈值使pot洪水满足年均pot洪水发生次数、峰间间隔两个条件;

结果输出模块,用于根据确定阈值及年均pot洪水发生次数,筛选出起止年内pot洪水样本及各样本对应日期。

本发明另一目的在于提供一种搭载有所述pot洪水自动提取系统的信息数据处理终端。

综上所述,本发明的优点及积极效果为

本发明将解决客观提取独立、同分布洪水峰值,灵活根据给定年均pot洪水次数确定阈值提取pot洪水样本的问题。避免人为洪水峰值提取的主观性与长耗时,提高应用pot模型计算工程设计洪水的客观性与工作效率。

以某站1971-1975年pot样本提取为例,要求平均每年pot洪水次数为2,峰间间隔时间为22天。

如果应用人工方法,一般需要以下几步。(1)制作逐日流量过程曲线图,在曲线图挑选出一些峰值,标注其流量值,本例共标注12个峰值,大于所要得到的10个pot样本数;(2)在流量记录中找到各标注流量对应时间,由于曲线所标注流量不一定是相邻几天的极大值,需要根据观测流量数据找到极大值,记录下极大值对应日期或记录位置,见表1,可以看出表1中流量值与图1标注值不一定相同;(3)计算前后相邻峰值时间间隔(表1),按相邻洪峰间隔大于给定峰间间隔(或流域汇流时间)原则从中挑选出符合这一独立性原则的洪水样本,删去间隔时间小于该值的较小洪水记录,本例中删去不满足条件的流量(表1中用划线标注)后还剩9个洪峰,还需要在图1中再标注其他洪峰,本例再次补充红体字标注洪峰,该洪峰位序为1319(表1用黑体标注),与最邻近洪峰时间间隔为35天,可以入选;(4)对所选样本从大到小排序挑选出最终所要pot样本,表1中未被中划线标注。

由于涉及人工操作与判断容易出错且耗时较长。对于一个站5年的数据,借助excel的画图、标注、高级筛选、排序功能大约需要5分钟完成。如果应用本发明pot洪水自动提取方法和系统,只需要准备好逐日流量序列,提供年均pot洪水次数和峰间间隔,几秒就能得到最终结果,与上述计算结果一致。

假设预估ipcc(intergovernmentalpanelonclimatechange)第五次评估报告使用的四种典型浓度路径下某一流域出口水文站未来3个时段的pot变化,按每个时段30年,pot洪水次数次平均每年3次计算,那么完成pot样本提取至少需要9小时。因为随着序列长度增加,前2步所用时间呈指数增加。而应用本发明,不过1分钟即可得到结果。

表1基础上经过人工判断所选出的峰值流量及其位序、相邻洪峰时间间隔

附图说明

图1是本发明实施例提供的pot洪水自动提取方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明的年最大值法为:annualmaximalseries,ams。

超阈值洪水为:peaksoverthreshold,pot。

政府间气候变化委员会:intergovernmentalpanelonclimatechange,ipcc。

本发明实现独立、同分布洪水峰值客观提取,不直接利用洪水观测资料,而是利用长期观测日流量数据,灵活根据年均超阈值洪水次数的变化确定相应阈值进而提取pot洪水样本。利用长期观测的日流量数据,根据给定的年均pot洪水次数确定阈值进而提取pot洪水样本。

如图1所示,本发明实施例提供的pot洪水自动提取方法包括:

日观测流量序列准备、阈值设定,自动试错计算、结果输出,具体步骤如下:

准备好日观测流量序列文件,文件内容包含年、月、日、观测流量;

给定欲提取pot样本的起始年、终止年,年均pot洪水发生次数、流域汇流时间或两个洪峰峰间隔时间;

运行程序通过试错方法计算不断调整阈值,确定最终阈值使pot洪水满足年均pot洪水发生次数、峰间间隔两个条件;

根据确定阈值及年均pot洪水发生次数,筛选出起止年内pot洪水样本及各样本对应日期。

具体包括:

1)随机给定一个大流量值作为初始阈值;

2)逐日判断流量序列内日流量是否大于初始阈值且大于前后2天流量值,计算满足条件的流量出现次数,同时记录满足条件的流量值;

3)满足条件的流量出现次数大于最终要得到的pot洪水次数,则执行下一步;否则,以当前阈值*0.1作为新的阈值返回2)重新计算;

4)对2)挑选出的流量值进行升值排序,最大流量值作为第1个洪水样本,洪水样本数为1;从第2大值开始,按流量从大到小依次计算各流量与已选洪水样本的最小时间间隔,所述最小时间间隔大于给定的间隔时间,则将该流量值挑选出来作为新的洪水样本;然后从这个流量开始继续判断剩余流量与前面已选洪水样本的最小间隔时间,大于给定间隔时间,则在洪水样本中加入该流量;如此循环一直到最小流量,记录下所有入选的洪水样本;

5)如果全部入选洪水样本数小于最终要得到的洪水样本,以当前阈值*0.1作为新的阈值返回2)重新计算;大于等于最终要得到的洪水次数,进入下一步;

6)输出所挑选洪水样本数,如果该数值远大于最终要得到的洪水样本数,给定一个新的初始阈值返回2),直到满意为止;

7)输出所挑选pot样本,最后一次所用阈值作为最终阈值。

本发明实施例提供的pot洪水自动提取系统包括:

日观测流量序列准备模块,用于准备好日观测流量序列文件,文件内容包含年、月、日、观测流量;

阈值设定模块,用于给定欲提取pot样本的起始年、终止年,年均pot洪水发生次数、流域汇流时间或两个洪水峰峰间隔时间;

自动试错计算模块,用于运行程序通过试错方法计算不断调整阈值,确定最终阈值使pot洪水满足年均pot洪水发生次数、峰间间隔两个条件;

结果输出模块,用于根据确定阈值及年均pot洪水发生次数,筛选出起止年内pot洪水样本及各样本对应日期。

汇流时间可以通过查阅文献获得,也可以联合应用的美国水资源协会(uswrc,1976)和王善序(1999)提出的方法确定。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1