一种利用时空卷积LSTM网络模拟流域径流量的方法与流程

文档序号:32337120发布日期:2022-11-26 08:25阅读:232来源:国知局
一种利用时空卷积LSTM网络模拟流域径流量的方法与流程
一种利用时空卷积lstm网络模拟流域径流量的方法
技术领域
1.本发明涉及一种模拟流域径流量的方法,特别是一种利用时空卷积lstm网络模拟流域径流量的方法。


背景技术:

2.径流是指某一流域内沿着地表或者地底流动的水流,是一种具有时序性的非线性数据。径流预测的实质是通过对历史气象数据和水文数据进行采集和分析,从而对不同时期的径流趋势进行预测。径流量作为水资源的一种,是水文学研究中必不可少的一部分由于气候和环境不断恶化、人类随意开采和工农业面源等污染,导致部分地区出现水环境质量差、水生态受损等问题,而径流量是研究水环境水质等问题研究基础,是解决水环境质量问题的关键所在,研究径流序列预测及其变化规律,可以有效的减少与预防洪水灾害,降低水资源带来的灾害损失,更好的利用水资源。精确的径流预测在水库调度、水环境质量管理等方面具有重要的指导意义。
3.长期以来,河川径流预测分为两大类:
4.一、过程驱动模型:基于数学物理方程,多以空间离散方式详细描述径流形成与转化过程,但模型需要确定的参数较多,在观测资料缺乏区域,应用存在局限性。
5.二、数据驱动方法,该方法不需要完全掌握流域产汇流机制,只建立输入的特征变量与输出的径流量之间的映射关系,该方法在资料缺乏的流域替代过程模型进行径流的模拟或预测,其精度与过程模型相似甚至更优。以数据为驱动进行径流量预测分为两大类。
6.(1)一种是以利用时间序列建模方法,依靠数据内在联系建模进行未来时间的径流量估计。该建模方法充分考虑径流随时间变化的统计规律,对径流变化趋势做出正确的分析和预测,在径流无突变的情况下预测精度较高,但很难预测出径流的突变信息。
7.(2)另一种是利用机器学习和深度学习等方法进行径流预测分析。伴随着大数据与人工智能技术的日益成熟,学术界与工业界都通过这些技术解决了许多大量的实际问题,大数据与人工智能预测技术已成功应用于能源、交通、环境、电力、灾害等多个领域,取得了显著的效果,现如今基于深度学习的端到端时间序列预测是径流测研究中的热点,例如循环神经网络。循环神经网络rnn可存储和提取时间序列的动态信息,既实现了序列信息的记忆,又可将之前记忆的信息用于之后时刻的计算,非常适合对时间序列数据进行分析和预测,但随着时间序列变长,经典的rnn在训练时容易出现梯度消失或梯度爆炸,难以获取长时间序列数据特征。
8.作为rnn模型的改进,lstm模型通过门的方式,解决了循环神经网络模型误差逆向传递的梯度消失问题和梯度爆炸的问题,在中长期历史数据建模方面具有更强的学习能力,能够更有效提取长时间序列数据中的信息进行分析。
9.机器学习算法将与输出特征有关的因子作为输入特征进行模型训练,影响径流的因子有很多,但这些因子对径流的影响程度不同,且影响因子之间也存在一定的相关性,若将所有因子作为输入特征可能会给建模带来噪声,影响建模精度。
10.降雨具有空间异质性,降水的时空分布对产流具有非常重要的作用,同时可能影响产流的植被因子、地形因子、地表覆盖类型和流域土壤类型等同样具有空间异质性,流域内降雨及产汇流因子的空间分布及变化对径流量会造成较大影响,但lstm只能学习这些产汇流因子的时间序列特征,无法获取空间分布特征。


技术实现要素:

11.针对现有技术存在的上述不足,本发明的目的是提供一种基于具有时空卷积结构的lstm层与全连接层结合的网络模型和径流估算流程,而且适用于其他流域径流量时间序列模拟的方法。
12.为了解决上述问题,本发明采用了以下的技术方案。
13.一种利用时空卷积lstm网络模拟流域径流量的方法,其特征在于,它包括以下步骤:
14.(一)收集整理研究区内2001年-2016年水文站和气象站实测径流量数据和降雨数据,以及可能影响径流量大小的遥感数据,并对数据进行预处理和分析,使其作为模型的输入数据;
15.(二)由步骤(一)得到的遥感数据驱动时空卷积神经网络模型得到2013-2016年的模拟径流数据。
16.相比现有技术,本发明具有如下有益效果:
17.传统径流模拟利用气象站观测数据,由于降雨量、植被、地表温度等参数均具有异质性,导致气象站点观测数据的代表性不足,用于径流模拟时会产生较大误差,与站点实测数据相比,本发明利用遥感可获取数据范围广,不受地面条件限制的特点,在地形复杂地区同样可以获取大量观测数据,同时获取地物波谱及空间位置信息,利用遥感观测可反演得到流域内影响产汇流的植被覆盖度、地表类型等因子的时空空间分布特征。
18.卷积神经网络提取影像空间特征具有非常好的效果,本发明利用卷积神经网络提取空间特征的优势,本发明将卷积操作与lstm相结合解决了lstm神经网络对数据空间特性挖掘不足的缺点,可更加有效提取流域内降雨等产流因子时空分布特征,实现时空特征协同作用,提高径流模拟精度。
19.本发明基于时空lstm模型,在逐步线性回归确定最佳影响因子组合的基础上,利用降雨、ndvi、地表温度和地表蒸散发影作为输入特征,利用气象站实测径流数据作为标签,对黑河上游域莺落峡站月径流量进行了模拟,旨在提出一种适用于黑河上游模拟方法,为黑河流域生态保护与高质量发展提供水资源优化配置支撑,同时该方法也适用于其他流域不同时间尺度的径流量模拟。
20.简言之,本发明算法结构简单,避免了物理模型结构复杂,参数多,计算成本高等问题;本发明将遥感数据应用于径流模拟中,考虑各影响因子的空间分布特征,实现了对径流的精准模拟。
附图说明
21.图1为循环神经网络示意图
22.图2为本发明算法示意图
具体实施方式
23.下面结合附图和实例,对本发明做进一步详细说明。
24.首先对长短期记忆神经网络模型原理进行阐述如下:
25.循环神经网络(recurrent neural network,rnn)是一类以序列(sequence)数据为输入,在序列的演进方向进行递归,循环单元按链式连接的递归神经网。如图1所示,在递归神经网络rnn中,某时刻的输入值x
t
与上一刻隐藏层的值h
t-1
共同参与该时刻的隐藏层的计算,之后正向流动,至输出层输出。结果不仅有该时刻的输入影响,上时刻的输入也对该时刻的输出产生影响。
26.长短期记忆神经网络(lstm)作为一种改进的循环神经网络,有效的解决梯度消失和梯度爆炸问题,提升了神经网络的长时间记忆能力,在很多领域得到了广泛的应用。
27.如图2所示,本发明一种利用时空lstm网络模拟流域径流量的方法,它包括以下步骤:(一)获取并处理流域内2001-2016年水文站和气象站实测径流量数据和降雨数据以及四种径流主要影响因子遥感数据;(二)将步骤(一)得到的遥感数据以及站点观测的径流数据作为输入数据,驱动时空lstm模型得到2013-2016年的模拟径流数据。
28.(一)获取并处理流域内2001-2016年水文站和气象站实测径流量数据和降雨数据以及四种径流主要影响因子遥感数据;
29.四种径流主要影响因子遥感数据是可能影响径流量大小的遥感数据,
30.当然,获取的数据进行预处理和分析后将作为模型的输入数据;
31.具体的,将分析得到的影响研究区径流量的主要因子作为训练模型的输入特征;水文站实测径流数据作为标签,并划分训练集和测试集;具体的又可以划分为以下子步骤。
32.子步骤1-1:收集研究区内水文站实测径流量历史时间序列数据(径流数据为莺落峡站点观测径流数据);
33.基于google earth engine(gee)平台,获取trmm3b43降水数据、mod11a2地表温度数据、mod16a2地表蒸散发数据、mod13a2植被归一化指数数据、era5-land月平均雪水当量和土壤含水量数据;
34.子步骤1-2:将子步骤1-1获取的四种径流主要影响因子遥感数据(mod11a2地表温度数据、mod16a2地表蒸散发数据和mod13a2植被归一化指数数据)分别在月尺度时间序列上进行逐像元平均,得到各数据产品在像元月尺度上的均值。例如将modis地表温度数据进行整理,将影像的白日温度与夜晚温度进行平均获得平均温度;
35.era5-land月平均雪水当量和土壤含水量数据均为月尺度产品,故而,此步骤不再处理。
36.子步骤1-3:将子步骤1-1获取的trmm3b43降水数据、era5-land月平均雪水当量和土壤含水量数据;以及经子步骤1-2处理后的mod11a2地表温度数据、mod16a2地表蒸散发数据和mod13a2植被归一化指数数据按研究区范围取均值;
37.进一步的,分析各参数与径流量的相关性,研究区内仅蒸散发与径流量成幂函数关系,其余均为线性关系,将蒸散发数据进行对数变换后利用多元逐步线性回归法进行因子筛选,确定出影响研究区径流量的敏感因子,分别为trmm3b43降水数据、mod13a2植被归一化指数数据、mod11a2地表温度数据和mod16a2地表蒸散发数据。
38.子步骤1-4:提取研究区内的四种因子的遥感数据,并将数据重采样至空间分辨率
为0.1
°
,利用gee平台导出遥感影像数据。
39.(二)将由步骤(一)得到的遥感数据用于驱动时空卷积神经网络模型(conv-lstm)得到2013-2016年的模拟径流数据:
40.子步骤2-1:将重采样得到的影像数据作为模型输入数据(输入数据为基于逐步线性回归后得到卫星遥感数据),站点径流数据作为标签数据输入模型;
41.子步骤2-2:将2001-2012年的数据作为训练数据输入时空lstm网络模型进行建模,利用卷积计算获取研究区各影响因子的空间特征,利用lstm神经网络获取各因子时间序列特征,建立输入数据与径流之间的时空关系。
42.简言之,将前12年(2001-2012年)的训练数据输入后通过convlstm层,从而捕获输入因子的时间与空间信息与研究区径流量之间的关系;
43.时空卷积神经网络模型的关键方程为:
44.i
t
=σ(w
xi

t
+w
hi
*h
t-1
+w
ci
oc
t-1
+bi)
45.f
t
=σ(w
xf

t
+w
hf
*h
t-1
+w
cf
oc
t-1
+bf)
46.c
t
=f
t
oc
t-1
+i
t
otanh(w
xc

t
+w
hc
*h
t-1
+bc)
47.o
t
=σ(w
xo

t
+w
ho
*h
t-1
+w
co
oc
t
+bo)
48.h
t
=o
t
otanh(c
t
)
49.其中,x
t
表示t时刻重采样得到的影像数据;
50.i
t
为输入门;
51.f
t
为遗忘门;
52.o
t
为输出门;
53.c
t-1
和c
t
分别为t-1时刻和t时刻的单元状态;
54.h
t-1
和h
t
分别为t-1时刻和t时刻的隐藏状态
55.bi为输入门中实数向量;
56.w
xi
为更新门对应t-1时刻输入值的权重;
57.w
hi
为更新门对于t-1时刻的隐藏门的权重矩阵;
58.w
ci
为更新门对应t-1时刻记忆细胞的权重矩阵;
59.w
xf
为遗忘门对应t-1时刻输入值的权重;
60.w
hf
为遗忘门对于t-1时刻的隐藏门的权重矩阵;
61.w
cf
为遗忘门对应t-1时刻记忆细胞的权重矩阵;
62.bf为遗忘门中实数向量;
63.w
xc
为记忆细胞对于t时刻输入x的权重矩阵;
64.w
hc
为记忆细胞对于t-1时刻的隐藏门的权重矩阵;
65.w
xo
为输出门的对于t时刻输入x的权重;
66.w
ho
为输出门的对于t-1时刻输入隐藏门的权重;
67.w
co
为输出门对于t时刻的记忆细胞的权重;
68.bo为输出门中实数向量;
[0069]“*”表示卷积算子;
[0070]
表示hadamard乘积;
[0071]
σ表示sigmoid函数;
[0072]
给定隐藏状态后,输出的非线性关系特征p
t
计算如下:
[0073]
p
t
=b
p
+w
hpht
[0074]whp
为t时刻隐藏状态到输出状态的权重矩阵;
[0075]bp
为输出状态的实数向量;
[0076]
将所有时刻的输出状态进行连接操作,得到输出矩阵p;
[0077]
子步骤2-3:将子步骤2-2获取的p
t
数据进行扁平化处理,使得空间二维数据转化为一维数据;
[0078]
子步骤2-4:考虑所有时刻的输出pf都会对径流产生影响,引入全连接层(fc)建立输出pf与径流y的关系y=fc(pf),完整的网络定义了由权重矩阵参数化的函数,从输入χ
t
到输出向量y
t

[0079]
也即是:在全连接层,模型的学习能力得到进一步提高,同时可以控制模拟径流的步长。
[0080]
最后需要说明的是,以上实施实例仅用以说明本发明的技术方案而非限制,尽管参照较佳实例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1