一种基于时空图卷积降雨-径流区间预测方法

文档序号:33180488发布日期:2023-02-04 04:51阅读:21来源:国知局
一种基于时空图卷积降雨-径流区间预测方法

1.本发明属于数据驱动下中小流域的降雨-径流预测领域,具体涉及一种基于时空图卷积降雨-径流区间预测方法。


背景技术:

2.随着水利进入新的发展阶段,以水利为代表的各行各业都已经构建或正在构建面向行业的大数据基础,呈现出以数据挖掘实现领域特定任务的发展趋势。国内外学者利用长期积累的水文观测与实践数据积极地进行智能降雨-径流预测研究,但由于当前多数模型建模过程为充分考虑领域知识,预报结果的低可信度和较短的预见期依旧阻碍着智能模型的性能提升与广泛应用。流域作为具有时空演变的动态系统,如何充分而合理地利用流域内下垫面,气温,风速,降雨等可获得的信息,是当前智能降雨-径流预测研究的重点和难点。因此,需要探索发明一种新的基于时空图卷积的降雨-径流区间预测方法,面向多尺度水利对象研究时空一致的数据组织机制,对降水-径流过程的水利对象,水循环过程的关联关系进行挖掘,以解决时空图卷积网络在水利领域应用的技术难题。确定性预测方法简单直接,且比较容易实现,现有的预测方法多采用确定性预测,然而降水
‑ꢀ
径流过程异常复杂以及人类对其过程认知的程度不够,使得其确定性预测的不确定性不可避免。确定性预测仅能预测变量在未来时刻的一个单点值,无法提供与这个预测相关的内在不确定程度。区间预测不仅给出了变量可能出现的一个预测区间,还提供了概率置信水平,因此有必要进行区间预测的研究。


技术实现要素:

3.发明目的:本发明的目的在于提供一种基于时空图卷积的降雨-径流区间预测方法,从而解决现有技术中存在的前述问题。
4.技术方案:本发明提供一种基于时空图卷积的降雨-径流区间预测方法,包括以下步骤:
5.(1)将预先收集的研究流域各站点的水文数据存入水文历史数据库;
6.(2)对水文历史数据进行预处理,然后把预处理后的数据根据留出法划分为训练集与测试集;
7.(3)构建时空图卷积降雨-径流区间预测模型,并采用训练集进行训练,调节预测模型参数使得预测模型收敛;构建预测模型包括同质图生成,时间注意力卷积,空间图卷积及区间预测四个过程;通过构建基于物理机理的同质图,在时空角度下根据监测的子流域特征利用时间注意力卷积与空间图卷积方法,对流域状态变化过程进行模拟,从而实现区间预测;
8.(4)使用测试集评估基于时空图卷积降雨-径流区间预测模型性能;
9.(5)将预处理后的当前水文数据作为时空图卷积降雨-径流区间预测模型输入,未来第k时刻流域出口断面流量为模型输出,即未来第k小时流量。
10.进一步地,步骤(1)所述水文数据包括历史降雨数据、河流出口断面的历史流量数据、流域历史蒸发数据、流域历史温度数据、流域历史风速数据。
11.进一步地,步骤(2)所述对水文历史数据进行预处理包括数据的缺失补全、数据异常更正及数据归一化;其中数据的缺失补全采用克里金插值法;数据异常更正指单个的异常数据采用同一站点前后时间的平均值替代,连续的异常数据采用同一时间相邻站点的平均值替代;数据归一化为min-max标准化。
12.进一步地,步骤(3)所述的时间注意力卷积是将attention机制引入到时间卷积网络tcn模型中。
13.进一步地,步骤(3)所述同质图生成根据节点的状态以及连接关系对空间图的局部或整体状态进行推断,利用先验知识约束系统的估计:
14.y=basin(a,f,v')
15.其中,y表示被估计量;a表示同质图内各个站点对象的连接关系;f表示简单对象的特征;v'表示被选中用于估计y的对象集合。
16.进一步地,步骤(3)所述空间图卷积采用了切比雪夫多项式一阶近似方法简化计算,其计算过程如下:
[0017][0018]
其中,最大的特征值λ
max
=2;其中,θ=[θ0,θ1,


k-1
]∈rk为多项式系数的向量为方便计算,取θ0=-θ1=θ;对于图中节点在某一时刻的某一特征和邻接矩阵a∈rn×n,获得拉普拉斯矩阵l=d-a,其中d为度矩阵可以通过式计算得到:
[0019][0020]
其中,取k=1;经过激活函数β处理后可以获得经过时空图卷积操作处理过的时空特征矩阵y
st

[0021]
[0022]
其中,β分别表示relu激活操作ks表示卷积操作;y
t
表示经过时间卷积操作后获得的隐藏状态;经过时空图卷积操作后,输入特征在不同维度上信息被融合到时空隐藏状态y
st
中,输出层可以利用具有较强拟合能力的全连接网络实现预测输出。
[0023]
进一步地,步骤(3)所述区间预测是量化预测结果的不确定性,并提供预测对象可能出现在预测区间内的概率置信度,其公式如下:
[0024][0025]
对区间预测法采用adam优化方法,基于adam的cwc
now
优化算法如下:
[0026]
输入高维的气象因子数据,降雨数据,流量数据,气温数据,风速数据,蒸散发数据,地理数据,初始化x,w0,b0,cwc0;使用滑动窗口和日前向链交叉验证方法将数据预处理为x;将预处理后的数据输入到模型中进行训练 tcnet(x;w0,b0)

pi(x);通过adam优化方法迭代更新网络lube全连接层的参数w0和b0.直到当下的cwci《cwc
i-1
时,取cwc
now
=cwci后结束训练;基于有效预测覆盖宽度的准则cwc
now

[0027]
进一步地,所述步骤(4)实现过程如下:
[0028]
均方根误差rmse:
[0029][0030]
绝对中位差medae:
[0031][0032]
区间预测指标cwc:
[0033][0034]
其中:表示第i个样本流量观测值,表示第i个样本流量预报值, n
samp9es
表示测试样本数量,n表示测试集第n个样本,分别表示第1 个和第n个样本的流量观测值,分别表示第1个和第n个样本的流量预报值,pinaw代表区间预测的置信区间的宽度,picp代表区间预测的置信区间覆盖观测值的概率,γ,e,η,μ为超参数。
[0035]
有益效果:与现有技术相比,本发明的有益效果:本发明使用同质图可以显示的将流域信息等水文知识显示的提取出来,并且利用了tcn具有捕获有效的长期时间特征的能力,实现了时空一致的数据组织机制,此外引入的lube区间预测的方法,提高预测精度,优于传统的支持向量机等机器模型,为后续开展的基于异质图的动态洪水预报建模及预测提供技术支撑。
附图说明
[0036]
图1是本发明的流程图;
[0037]
图2是本发明构建的时空图卷积降雨-径流区间预测模型示意图。
具体实施方式
[0038]
下面结合附图对本发明作进一步详细说明。
[0039]
本发明提供了一种基于时空图卷积的降雨-径流区间预测方法,通过根据物理机理将研究对象划分为不同的同质简单对象从而模拟流域。同时,在构建过程中要考虑流域边界以及特征对齐问题。使用普通卷积和图卷积方法在构建的分别实现时间与空间信息的提取与编码,实现对降水-径流过程的推演。其中,时间卷积操作为普通的卷积操作,而空间图卷积操作基于本方法所构建的同质图和 (谱域)图卷积方法。借助典型全连接神经网络的模拟能力与解码能力,通过解码时空信息对系统状态进行估计从而实现洪水预报。如图1所示,包括如下步骤:
[0040]
步骤1:首先收集研究流域各站点的水文数据,然后把收集到的水文数据存入水文历史数据库。
[0041]
收集目标流域(綦江流域)1979-2019年数据粒度为1条/天的水文数据,然后把以上数据存入历史数据库;水文数据包括流。历史降雨数据、河流出口断面的历史流量数据、流域历史蒸发数据、流域历史温度数据、流域历史风速数据。
[0042]
步骤2、对水文历史数据进行预处理,其中数据的缺失补全采用时间维度上线性插值处理方式;数据异常指不合常理的数据,单个的异常数据采用同一站点前后时间的平均值替代,连续的异常数据采用同一时间相邻站点的平均值替代。
[0043]
数据归一化处理方法,所述归一化处理方法为min-max标准化,公式为:max标准化,公式为:其中,x
*
为归一化处理后的数据,x为待处理的原始数据,x
min
为原始数据中的最小值,x
max
为原始数据中的最大值,归一化处理后的数据值在0到1 之间。归一化处理后的数据划分为训练集和测试集,训练集和测试集为两个互斥的两个集合,划分方法为留出法,训练集和测试集划分比例为8:2,训练集为1979-2011年的数据,测试集为2011-2019年的数据。
[0044]
步骤3:构建时空图卷积降雨-径流区间预测模型,如图2所示,并采用训练集进行训练,调节预测模型参数使得预测模型收敛;预测模型的构建包括同质图生成,时间注意力卷积,空间图卷积及区间预测四个建模操作;通过构建基于物理机理的对象连接关系(同质图),在时空角度下根据监测的子流域特征利用时间注意力卷积与空间(谱域)图卷积方法,对流域状态变化过程进行模拟,从而实现对降雨-径流的预报。
[0045]
同质图可以根据节点的状态以及连接关系对系统的局部或整体状态进行推断。同质图生成的结果采用邻接矩阵的方式存储,记为a,其维度通常与图中的节点数目n有关。
[0046]
y=basin(a,f,v')
[0047]
其中,a表示同质图内对象的连接关系;f表示简单对象的特征;y表示被估计量;v'表示被选中用于估计y的对象集合。通过显式地关系约束,基于同质图定义的建模方法可以利用先验知识约束系统的估计,在一定程度上将领域知识显式地表达到了数据挖掘模型中。
[0048]
时间注意力卷积采用时间卷积网络tcn仅在时间维度的数据进行提取特征,并在输入的时候加入了attention机制以更好的获取相关特征。tcn的具体结构如下:在单变量序列的情况下,对于给定一维序列的水文变量序列输入x和大小为k的滤波器函数ω:{0,

,k-1},在连续层上的完整扩张因果卷积运算f,在序列s上的定义表示如下:
[0049][0050]
其中,s是序列的元素,d是扩张参数,而s-d
·
i描述了过去的方向。将*d 称为扩张的卷积操作,以区分正常的卷积操作。正常的卷积操作器(*)是扩张卷积的特定版本(当d=1时)。因果网络的感受野以两种方式增加:一是增加滤波器尺寸k;二是增加扩张因子d。在本研究中,d是根据网络深度d=2i指数增加的,以确保可以有效覆盖长期历史;具体而言,d=2i用于网络的第i级。
[0051]
空间图卷积操作在时间卷积操作的结果基础之上,利用模型同质图生成的邻接矩阵a实现谱域图卷积操作,在空间图卷积模块计算过程中,采用了切比雪夫多项式一阶近似方法简化计算,其计算过程如下公式所示:
[0052][0053]
其中,最大的特征值λ
max
=2;其中,θ=[θ0,θ1,


k-1
]∈rk为多项式系数的向量为方便计算,取θ0=-θ1=θ。对于图中节点在某一时刻的某一特征和邻接矩阵a∈rn×n,可以获得拉普拉斯矩阵l=d-a,其中d 为度矩阵可以通过式计算得到:
[0054][0055]
通常,可使用k阶多项式进行计算简化,k的取值具有较为重要的作用。本发明中通常仅考虑上下游节点对单一节点的影响,综合考虑计算复杂度与可解释性,取k=1。进一步地,经过激活函数处理后可以获得经过时空图卷积操作处理过的时空特征矩阵,可以记为如下公式所示的形式:
[0056][0057]
其中,β表示relu激活,ks表示卷积操作;y
t
表示经过时间卷积操作后获得的隐藏状态。经过时空图卷积操作后,输入特征在不同维度上信息被融合到时空隐藏状态y
st
中,输出
层可以利用具有较强拟合能力的全连接网络实现预测输出。
[0058]
区间预测主要是量化预测结果的不确定性,并提供预测对象可能出现在预测区间内的概率置信水平,其公式如下:
[0059][0060]
由于上下边界区间预测方法(lower and upper bound estimation,lube) 不可使用梯度下降方法进行训练,所以采用adam优化方法,其训练如下基于adam 的cwc
now
优化算法所示:
[0061]
1)输入高维的气象因子数据,降雨数据,流量数据,气温数据,风速数据,蒸散发数据,地理数据,初始化x,w0,b0,cwc0。
[0062]
2)随机取80%的数据作为训练集,20%作为测试集。
[0063]
3)使用滑动窗口和日前向链交叉验证方法将数据预处理为x。
[0064]
4)将预处理后的数据输入到模型中进行训练tcnet(x;w0,b0)

pi(x)。
[0065]
5)通过adam优化方法迭代更新网络lube全连接层的参数w0和b0.直到当下的cwci《cwc
i-1
时,取cwc
now
=cwci后结束训练。
[0066]
6)基于有效预测覆盖宽度的准则cwc
now

[0067]
以上算法为引入上下边界区间预测方法cwc指标对模型进行区间预测的训练。
[0068]
步骤4:使用测试集评估基于时空图卷积降雨-径流区间预测模型性能。
[0069]
使用2种评估标准评估模型性能,分别为均方根误差rmse、绝对中位差medae。评估标准公式如下:
[0070]
均方根误差rmse:
[0071][0072]
绝对中位差medae:
[0073][0074]
区间预测指标cwc:
[0075][0076]
其中:表示第i个样本流量观测值,表示第i个样本流量预报值, n
samp9es
表示测试样本数量,n表示测试集第n个样本,分别表示第1 个和第n个样本的流量观测值,分别表示第1个和第n个样本的流量预报值,pinaw代表区间预测的置信区间的宽度,picp代表区间预测的置信区间覆盖观测值的概率,γ,e,η,μ为超参数。
[0077]
步骤5:将预处理后的当前水文数据作为时空图卷积降雨-径流区间预测模型输入,未来第k时刻流域出口断面流量为模型输出,即未来第k小时流量。
[0078]
在实际预测环节,新到的水文数据同样需要经过预处理,然后把处理后数据作为预报模型的输入,未来第k时刻流域出口断面流量为模型输出,即本方法可预报的未来k小时流量。
[0079]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1