一种基于河流节点相关度的水位预测方法

文档序号:27094845发布日期:2021-10-27 16:38阅读:83来源:国知局
一种基于河流节点相关度的水位预测方法

1.本发明属于水位预测技术领域,具体涉及一种基于河流节点相关度的水位预测方法。


背景技术:

2.河流节点有着较强的整体性,可以将其看做复杂网络系统。河流流域内包含着多个不同的节点,同时节点间又存在着不同的水文联系,例如水资源的交换、水利设施的建造与维修、上下游开关闸等。
3.河流网络的开放性、自组织性以及远离平衡态的特性使得河流内的单个节点预测依托于复杂的河流节点网络,若将河流节点网络依照复杂网络节点的构建方式抽象成网络化模型,则可以有效的分析其宏观及微观的特性,为河流特定节点的水位预测提供理论方法指导。
4.目前水位预测常采用复杂网络来以完全分散的方式计算中心度指标,来分析水文要素的影响,模拟长江河流网络的统计性质,用于描述其自适应性模型。研究如何将复杂网络应用用于河流网络节点的分析,综合局部物理信息、全局位置信息、网络融合特性三个主要方面的节点相关度的分析方法。但是这些方法虽然对于各节点进行了复杂网络的构建,但仅仅是通过节点的出入度,以及边线到节点的距离来评价节点的相关度与紧密度。
5.在水文节点中使用传统的复杂网络思想虽然可以体现出河流节点之间的相互关联,但是这样的网络构建方式只是直观的按照地理距离或者节点可达性来分析网络间节点的相关度,并未考虑节点之间数据的特征相关性。
6.因此,传统的复杂网络建模方式很难应用于水位预测。


技术实现要素:

7.发明目的:针对现有技术中的不足,本发明提供了一种基于河流节点相关度的水位预测方法,综合考虑了节点间特征影响。
8.技术方案:为实现上述发明目的,本发明的一种基于河流节点相关度的水位预测方法,包括如下步骤:
9.(1)建立河流网络模型:在相邻节点之间确定数据特征间的互相关性,将其映射成特征相关矩阵表m
f
,对于新加入的节点考虑到其节点的距离以及中心性指标将节点之间的关系遍历蔓延至整个网络。通过复杂网络的原理,将原有通过物理连接的河流节点通过度中心性指标a,融合中心性指标b以及特征相关度指标i三项因素建立成河流节点网络g(v
i
,e,w);
10.(2)重要节点的选择:对于待测节点v
i
而言,此时v
i
表示某一个节点,将其暂时抽象至节点网络g(v
i
,e,w)外,此时节点集合变为v
i
‑1表示此节点集合有i

1个节点,并调整原网络g(v
i
,e,w)的结构特性,形成g(v
i
‑1,e,w),设定相关度节点数量阈值n,从节点集合v
i
‑1中取出与节点v
i
相关度最大的前n个节点;
11.(3)节点的特征选择:在步骤(2)取得重要节点集合v={v1v2,....,v
n
}之后,对于节点特征的相关度设定阈值p;步骤(2)中提到的是节点之间的相关度阈值n与此不同,这里的是节点特征的相关度阈值p,每个节点都有很多特征项,而每个特征项对节点的作用是不一样,这个阈值就是选取最重要的p个特征项,即特征相关度超过p的特征为重要特征,p∈(0,1)且特征个数大于0,将所得节点特征集合作为输入参数构建预测模型。
12.进一步地,所述的步骤(1)中,河流节点网络g(v
i
,e,w)中的v
i
代表了i个不同河流节点的集合,多个节点组成了抽象的河流节点网络。节点之间通常存在着串联、并联的关系。e边线定义了节点间水资源交换的途径,由于河流水资源的流动性,边线之间含有不同的方向。w即各个节点与边之间的相关度,相关度的定义结合了度指标、融合指标等不同参数,对于特征选择下河流节点相关度的定义。
13.进一步地,所述的步骤(1)中,建立河流网络模型操作的具体步骤包括:
14.1)构建河流网络节点,可以用邻接矩阵表示其节点之间的可达性,预测模型的算法设计如图2,对于s个节点的河流网络而言,可以映射成s
×
s的一个邻接矩阵,s是一个未知变量,表示河流节点个数。
15.2)通过复杂网络的原理,将原有通过物理连接的河流节点通过度中心性指标,融合中心性指标以及特征相关度指标三项因素建立成河流节点网络g(v
i
,e,w)。
16.v={v1,v2,v3,

,v
i
}
ꢀꢀ
(3

1)
17.e={<v
a
,v
b
>|v
a
,v
b
∈v}
ꢀꢀ
(3

2)
18.w={w
ab
|v
a
,v
b
∈v}
ꢀꢀ
(3

3)
19.v代表网络中所有节点的集合,v
i
表示第i个节点。
20.e为网络的边的集合,<v
a
,v
b
>表示从节点v
a
到节点v
b
的有向边。
21.w是各个节点之间的相关度集合,v
a
,v
b
分别是节点集合v中的两个不同的节点,w
ab
表示这两个节点之间相关度。
22.进一步地,所述的步骤(2)中,重要节点的选择操作的具体步骤包括:
23.1)对于待测节点v
i
而言,将其暂时抽象至节点网络外,并调整原网络的结构特性,形成g(v
i
‑1,e,w)。
24.2)定义网络中心节点度中心性a
i

[0025][0026]
式中,d
i
为节点v
i
的度,n
a
,n
b
分别为v
i
中属于a,b的节点数量;
[0027]
3)判别网络节点v
i
是否为融合度中心节点,定义网络节点v
i
的融合中心性b
i

[0028][0029]
其中,n
c
反映了节点v
i
的相邻融合节点数量,f
i
是节点v
i
特征项的个数。
[0030]
4)设定权重参数a,b,c∈(0,1),且a+b+c=1,通过调节权重定义网络节点的综合相关度i
i

[0031]
i
i
=α
×
a
i

×
b
i

×
n
i
ꢀꢀ
公式3
[0032]
式中:0<α<1,0<β<1,0<γ<1,且α+β+γ=1。
[0033]
5)设定节点之间的相关度阈值n,根据节点之间的相关度阈值n大小从节点集合
v
i
‑1取出相关度最大的前n个节点;
[0034]
进一步地,所述的步骤(3)中,节点的特征选择操作的具体步骤包括:
[0035]
1)在步骤(2)取得重要节点集合v={v1v2,....,v
n
}之后,对于节点特征的相关度设定阈值,即每一个节点包含的特征项的相关度超过节点特征的相关度阈值p的特征为重要特征,节点特征的相关度阈值p和节点之间的相关度阈值n不是同一个值,p∈(0,1)且特征个数大于0。
[0036]
2)根据节点特征的相关度阈值p的大小遍历特征矩阵,建立最终的输入模型。
[0037]
有益效果:与现有技术相比,本发明一种基于河流节点相关度的水位预测方法,将各节点之间的特征相关度作为考量河流节点相关度的依据,选取网络内高相关度的节点作为待预测节点的特征依据,根据阈值选取重要节点中的特征作为输入数据,以此预测节点水位数据;考虑了重要节点内特征数量对预测产生的影响,引入了特征项阈值的概念,这样的处理方法降低了预测时的静态特征工程计算量,提高了特征处理的效率。
附图说明
[0038]
图1是本发明基于河流节点相关度特征选择的概念图;
[0039]
图2是本发明节点网络构建流程;
[0040]
图3是本发明基于河流节点相关度的水位预测模型架构图;
[0041]
图4是重要节点数对不同方法预测准确率的影响(里下河流域);
[0042]
图5是重要节点数对不同方法预测准确率的影响(太湖流域);
[0043]
图6是重要节点数对不同方法预测均方根误差的影响(里下河流域);
[0044]
图7是重要节点数对不同方法预测均方根误差的影响(太湖流域)。
具体实施方式
[0045]
下面结合附图和实施例对本发明作进一步详细说明,所给出的实施例是为了说明本发明方法的技术特点和功能特点,而不是限制本发明的范围。
[0046]
一种基于河流节点相关度的水位预测方法,包括以下步骤:
[0047]
(1)建立河流网络模型:在相邻节点之间确定数据特征间的互相关性,将其映射成特征相关矩阵表m
f
,对于新加入的节点考虑到其节点的距离以及中心性指标将节点之间的关系遍历蔓延至整个网络。通过复杂网络的原理,将原有通过物理连接的河流节点通过度中心性指标a,融合中心性指标b以及特征相关度指标i三项因素建立成河流节点网络g(v
i
,e,w);
[0048]
(2)重要节点的选择:对于待测节点v
i
而言,此时v
i
表示某一个节点,将其暂时抽象至节点网络g(v
i
,e,w)外,此时节点集合变为v
i
‑1表示此节点集合有i

1个节点,并调整原网络g(v
i
,e,w)的结构特性,形成g(v
i
‑1,e,w),设定相关度节点数量阈值n,从节点集合v
i
‑1中取出与节点v
i
相关度最大的前n个节点;
[0049]
(3)节点的特征选择:在步骤(2)取得重要节点集合v={v1v2,....,v
n
}之后,对于节点特征的相关度设定阈值p;步骤(2)中提到的是节点之间的相关度阈值n与此不同,这里的是节点特征的相关度阈值p,每个节点都有很多特征项,而每个特征项对节点的作用是不一样,这个阈值就是选取最重要的p个特征项,即特征相关度超过p的特征为重要特征,p∈
(0,1)且特征个数大于0,将所得节点特征集合作为输入参数构建预测模型。
[0050]
步骤(1)中,河流节点网络g(v
i
,e,w)中的v
i
代表了i个不同河流节点的集合,多个节点组成了抽象的河流节点网络。节点之间通常存在着串联、并联的关系。e边线定义了节点间水资源交换的途径,由于河流水资源的流动性,边线之间含有不同的方向。w即各个节点与边之间的相关度,相关度的定义结合了度指标、融合指标等不同参数,对于特征选择下河流节点相关度的定义。
[0051]
步骤(1)中,建立河流网络模型操作的具体步骤包括:
[0052]
1)构建河流网络节点,可以用邻接矩阵表示其节点之间的可达性,预测模型的算法设计如图2,对于s个节点的河流网络而言,可以映射成s
×
s的一个邻接矩阵,s是一个未知变量,表示河流节点个数。
[0053]
2)通过复杂网络的原理,将原有通过物理连接的河流节点通过度中心性指标,融合中心性指标以及特征相关度指标三项因素建立成河流节点网络g(v
i
,e,w)。
[0054]
v={v1,v2,v3,

,v
i
}
ꢀꢀ
(3

1)
[0055]
e={<v
a
,v
b
>|v
a
,v
b
∈v}
ꢀꢀ
(3

2)
[0056]
w={w
ab
|v
a
,v
b
∈v}
ꢀꢀ
(3

3)
[0057]
v代表网络中所有节点的集合,v
i
表示第i个节点。
[0058]
e为网络的边的集合,<v
a
,v
b
>表示从节点v
a
到节点v
b
的有向边。
[0059]
w是各个节点之间的相关度集合,v
a
,v
b
分别是节点集合v中的两个不同的节点,w
ab
表示这两个节点之间相关度。
[0060]
步骤(2)中,重要节点的选择操作的具体步骤包括:
[0061]
1)对于待测节点v
i
而言,将其暂时抽象至节点网络外,并调整原网络的结构特性,形成g(v
i
‑1,e,w)。
[0062]
2)定义网络中心节点度中心性a
i

[0063][0064]
式中,d
i
为节点v
i
的度,n
a
,n
b
分别为v
i
中属于a,b的节点数量;
[0065]
3)判别网络节点v
i
是否为融合度中心节点,定义网络节点v
i
的融合中心性b
i

[0066][0067]
其中,n
c
反映了节点v
i
的相邻融合节点数量,f
i
是节点v
i
特征项的个数。
[0068]
4)设定权重参数a,b,c∈(0,1),且a+b+c=1,通过调节权重定义网络节点的综合相关度i
i

[0069]
i
i
=α
×
a
i

×
b
i

×
n
i
ꢀꢀ
公式3
[0070]
式中:0<α<1,0<β<1,0<γ<1,且α+β+γ=1。
[0071]
5)设定节点之间的相关度阈值n,根据节点之间的相关度阈值n大小从节点集合v
i
‑1取出相关度最大的前n个节点。
[0072]
步骤(3)中,节点的特征选择操作的具体步骤包括:
[0073]
1)在步骤(2)取得重要节点集合v={v1v2,....,v
n
}之后,对于节点特征的相关度设定阈值,即每一个节点包含的特征项的相关度超过节点特征的相关度阈值p的特征为重
要特征,节点特征的相关度阈值p和节点之间的相关度阈值n不是同一个值,p∈(0,1)且特征个数大于0。
[0074]
2)根据节点特征的相关度阈值p的大小遍历特征矩阵,建立最终的输入模型。
[0075]
实施例
[0076]
一种基于河流节点相关度的水位预测方法(river node relativity and features selection,rnr

fs)。该方法将各节点之间的特征相关度作为考量河流节点相关度的依据,选取流域中对于待预测节点而言相关度较高的节点,根据阈值选取重要节点中的特征作为输入数据,以此预测节点水位数据。
[0077]
本实验平台为pycharm2017.3 x64版本,依托在windows7所搭载的操作系统上。
[0078]
实验所使用的数据为里下河流域2016年1月1日0点至2016年12月1日0点期间32个节点的6779
×
32条共6,940,672条数据,为避免偶然性,采用了太湖流域同时段32个节点的6,940,672条数据作为对照。同时,为验证方法的有效性,在预处理时将两个流域内各32个特征项与其对应节点关联,即对于32个节点分别处理未将其中特征项拆分。
[0079]
如图3,本发明技术方案包括以下步骤:
[0080]
(1)建立河流网络模型:在相邻节点之间确定数据特征间的互相关性,将其映射成特征相关矩阵表m
f
,对于新加入的节点考虑到其节点的距离以及中心性指标将节点之间的关系遍历蔓延至整个网络。通过复杂网络的原理,将原有通过物理连接的河流节点通过度中心性指标,融合中心性指标以及特征相关度指标三项因素建立成河流节点网络g(v
i
,e,w)。
[0081]
在所有节点的特征遍历排序过后,建立节点网络特征矩阵m
f
,如下3

4所示:
[0082][0083]
式中,r
1n
代表了节点v1对节点v
n
的信息影响因子,值域为0~1之间,而节点之间的可达性也是评价河流节点相关度的依据,若某几个节点彼此之间不可达,虽然有着相似的水文特征,也无法任务其具有特征相关性。
[0084]
节点的综合影响因子r
x
如图3

5:
[0085][0086]
此处的n就是步骤2中的阈值n,r
xi
表示节点v
x
对节点v
i
的信息影响因子。
[0087]
定义特征选择下的河流节点相关度ni(x)从多个因素综合考虑了节点的特征,即包含了节点特征的权重也涵盖了节点的信息流指标。
[0088]
存在数据集32个河流节点:所述河流节点网络g(v
i
,e,w)中的v={v1,v2,v3,...,v
n
}代表了各个不同河流节点的集合,多个节点组成了抽象的河流节点网络。节点之间通常
存在着串联、并联的关系。e边线定义了节点间水资源交换的途径,由于河流水资源的流动性,边线之间含有不同的方向。w即各个节点与边之间的相关度,相关度的定义结合了度指标、融合指标等不同参数,对于特征选择下河流节点相关度的定义。
[0089]
步骤1:构建河流网络节点用邻接矩阵表示32节点之间的可达性,对于32个节点的河流网络而言,可以映射成32
×
32的一个邻接矩阵。
[0090]
步骤2:通过复杂网络的原理,将原有通过物理连接的河流节点通过度中心性指标,融合中心性指标以及特征相关度指标三项因素建立成河流节点网络g(v
i
,e,w)。
[0091]
v={v1,v2,v3,...,v
n
}
ꢀꢀ
(1)
[0092]
e={<v
m
,v
n
>|v
m
,v
n
∈v}
ꢀꢀ
(2)
[0093]
w={w
mn
|w
mn
=(l
mn
,q
mn
(t),v
m
,v
n
∈v}
ꢀꢀ
(3)
[0094]
(2)重要节点的选择:对于待测节点v
i
而言,将其暂时抽象至节点网络外,并调整原网络的结构特性,形成g(v
i
‑1,e,w),设定相关度节点数量阈值n,从设定相关度节点数量阈值中取出相关度前n个节点;
[0095]
步骤1:对于待测节点v
i
而言,将其暂时抽象至节点网络外,并调整原网络的结构特性,形成g(v
i
‑1,e,w)。
[0096]
步骤2:定义网络中心节点度中心性a
i

[0097][0098]
式中,d
i
为节点v
i
的度,n
a
,n
b
分别为v
i
中属于a,b的节点数量;
[0099]
步骤3:判别网络节点v
i
是否为融合度中心节点,定义网络节点v
i
的融合中心性b
i

[0100][0101]
其中,n
c
反映了节点v
i
的相邻融合节点数量。
[0102]
步骤4:设定权重参数a,b,c∈(0,1),且a+b+c=1,通过调节权重定义网络节点的综合相关度i
i

[0103]
i
i
=α
×
a
i

×
b
i

×
n
i
ꢀꢀ
公式3
[0104]
式中:0<α<1,0<β<1,0<γ<1,且α+β+γ=1。
[0105]
步骤5:设定相关度节点数量阈32,从设定相关度节点数量阈值中取出相关度前32个节点。
[0106]
(3)节点的特征选择。在步骤(2)取得重要节点集合v={v1v2,....,v
n
}之后,对于节点特征的相关度设定阈值为32,即相关度超过p的特征为重要特征,p∈(0,1)且特征个数大于0,将所得节点特征集合作为输入参数构建预测模型。
[0107]
步骤1:在步骤(2)取得重要节点集合v={v1v2,....,v
n
}之后,对于节点特征的相关度设定阈值,即相关度超过阈值p的特征为重要特征,p∈(0,1)且特征个数大于0。
[0108]
对于河流中的节点v
i
而言,若其特征选择下的综合影响因子为r
i
(x),其他特征相关为ci(x),则其综合相关度n
i
(x)满足,如3

6所示:
[0109]
[0110]
步骤2:根据p的大小遍历特征矩阵,建立最终的输入模型。
[0111]
综上可知,基于河流节点相关度的水位预测方法主要的实现过程是以构建河流节点网络为基础,在传统的复杂网络中加入了各节点特征影响力因子,通过特征权重的筛选构建基于特征的河流网络,并在此基础上提出了基于河流节点相关度分析的水位时间序列预测方法(rnr

fs)
[0112]
对本发明涉及的方法性能具体分析
[0113]
基于河流节点相关度分析的水位时间序列预测方法(rnr

fs),在构建网络时采用了贪心方法的思想,其优点在于能够提高中心节点向外部扩容的计算效率,从而降低了时间复杂度。假设河流存在n个节点,其中不同的节点之间共有m条边,在使用迪杰斯特拉求待预测节点到各节点网络的复杂度为o(n2),对于构建m条边的网络其复杂度为o(n2m),而加入了邻接矩阵mf后,矩阵的运算复杂度根据节点n的个数,假设节点间两两映射,则复杂度为o(n(n

1))。因此,rnr

fs方法的综合时间复杂度为o(n2+n2m+n2)。
[0114]
为对比方法rnr

fs与其他时间序列的预测效果,首先通过原有的方法(4

11)建立河流节点网络模型,将建立完成后的模型选取重要节点,通过在不同重要节点下的预测情况分析各方法的性能。以各流域中10个节点的均值为参考结果,预测结果如图4至7。
[0115]
可得出如下结论:在选取较少量重要节点时,本章提出的rnr

fs预测效果相较其他方法预测效果更佳,convlstm及geoman次之,传统的arima以及var方法热点预测效果较差;随着节点数的增多,各方法的预测性能均有所增加,当节点增加至30时,预测准确率差别较小(因为基本各方法都选出了绝大多数相关的特征项)。
[0116]
在均方根误差(rmse)方面,随着重要节点数的增加,rnr

fs方法的rmse变化不明显,convlstm及geoman在节点小于20时变化范围较大,而arima以及var方法的全程都存在显著的rmse变化。
[0117]
综上所述,在选取少量重要节点时,rnr

fs方法就能更准确的选取出与待测节点水位更相关的重要节点,对于convlstm及geoman而言,虽然考虑到了节点内部特征的互相关性,但由于其重要节点基于原有的河流网络而构建(未考虑特征相关性),因此在重要节点较少时预测准确度较低。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1