一种广流域水体环境数据集成方法及系统与流程

文档序号：26586118发布日期：2021-09-10 19:17阅读：83来源：国知局

1.本发明涉及环境监测技术领域，具体涉及一种广流域水体环境数据集成方法及系统。

背景技术：

2.水是万物之源，河湖水是人们生活用水的主要取水来源，也是生态系统重要的组成部分。随着现代工业的发展，人们日常生产生活产生大量的污染物排向河湖水域之中，造成河湖水富营养化，水域中氮、磷等营养盐类；铁、锰等微量元素以及有机化合物的含量大大增加，促进藻类生物大量繁殖造成水华现象，水华蓝藻所产的微囊藻毒素对人类健康具有很大危害性。
3.针对水华现象产生的危害，预防优于治理，对水体进行实时监控是预防的前提，水体的富营养化是产生水华的主要原因，在对河湖水的水体进行监控，目前主要利用水质在线监测的方法，通过实时采集水体环境数据以分析掌控水体环境特征，但是在线实时监测会产生数量级巨大的水体环境数据，而且在数量级巨大的水体环境数据逐一分析出存在异常的水域需要耗费大量的数据运算、传送资源，最终造成监测效率低下。

技术实现要素：

4.本发明的目的在于提供一种广流域水体环境数据集成方法及系统，以解决现有技术中实时监测会产生数量级巨大的水体环境数据，而且在数量级巨大的水体环境数据逐一分析出存在异常的水域需要耗费大量的数据运算、传送资源，最终造成监测效率低下的技术问题。
5.为解决上述技术问题，本发明具体提供下述技术方案：
6.一种广流域水体环境数据集成方法，包括以下步骤：
7.步骤s1、实时监测广流域包含的所有支流域的水体环境数据，并依据所述水体环境数据对所述支流域进行同属性聚类形成流域集群；
8.步骤s2、对所述流域集群中的所有支流域进行内相似性比对实现对支流域的异常判别，并筛选处于异常状况的支流域作为异常支流域；
9.步骤s3、将所述异常支流域的水体环境数据进行波动集成形成包含所述异常支流域的异常特征的水体环境关键数据，并基于所述水体环境关键数据进行函数拟合实现将离散的所述广流域水体环境数据集成为异常支流域的环境特征函数。
10.作为本发明的一种优选方案，所述步骤s1中，所述流域集群形成的具体方法包括：
11.步骤s101、基于所述水体环境数据将所有支流域分别量化为单个流域集群x
y
＝*a
y1
,a
y2
,
…
,a
ym
+，其中x
y
表示第y个支流域的水体环境数据的集合，a
yz
表示第y个支流域的第z类水体环境数据，z∈,1,m
‑
，y∈,1,n
‑
，m为水体环境数据的总类别数目，n为支流域的总数目；
12.步骤s102、依次比对流域集群的外相似性，并将外相似性最大的两个流域集群进
行融合归一，所述外相似性用果瓦系数进行度量：
[0013][0014]
其中，为支流域y1和支流域y2的果瓦系数，为支流域y1和支流域y2在和上的取值，为加权变量，k1∈,1,m
‑
，y1,y2∈,1,n
‑
，m为水体环境数据的总类别数目，n为支流域的总数目；
[0015]
步骤s103、重复步骤s102直至当前流域集群总数目是步骤s101中流域集群总数目的10％完成所有支流域的同属性聚类，保留当前流域集群作为最终同属性聚类结果。
[0016]
作为本发明的一种优选方案，所述步骤s2中，支流域的异常判别的具体方法包括：
[0017]
对各个流域集群中的所有支流域的水体环境数据x
yp
＝*a
y1p
,a
y2p
,
…
,a
ymp
+分别进行归一化处理为消除不同指标量纲带来的差异，所述归一化公式为：
[0018][0019]
其中，z∈,1,m
‑
，y∈,1,n2p
‑
，p∈,1,n
‑
，x
yp
表示第p个流域集群中第y个支流域的水体环境数据的集合，a
yzp
表示第p个流域集群中第y个支流域的第z类水体环境数据，m为水体环境数据的总类别数目，n2p为第p个流域集群中支流域的总数目，n为流域集群总数目，a
yzp
′
表示归一化处理后第p个流域集群中第y个支流域的第z类水体环境数据；
[0020]
量化同一流域集群中的支流域两两之间的异常距离，所述异常距离用欧式距离度量，所述欧式距离的计算公式为：
[0021][0022]
其中，y1,y2∈,1,n2p
‑
，z∈,1,m
‑
，p∈,1,n
‑
，为第p个流域集群中支流域y1和支流域y2的欧式距离，m为水体环境数据的总类别数目，n2p为第p个流域集群中支流域的总数目，n为流域集群总数目，分别表示归一化处理后第p个流域集群中第y1、y2个支流域的第z类水体环境数据；
[0023]
设置距离阈值，基于所述距离阈值判定所述流域集群中支流域的异常状况。
[0024]
作为本发明的一种优选方案，所述基于所述距离阈值判定所述流域集群中支流域的风险状况的方法包括：
[0025]
若各个流域集群p中与支流域y的距离大于距离阈值的支流域数量超过流域集群p中支流域总数目n2p的80％，则认定支流域y风险状况为异常，否则认定支流域y风险状况为正常；
[0026]
将所有风险状况为异常的支流域进行提取作为实现所述广流域水体环境数据集成的异常支流域。
[0027]
作为本发明的一种优选方案，所述步骤s3中，将所述异常支流域的水体环境数据
进行波动集成形成水体环境关键数据的具体方法包括：
[0028]
步骤s301、将所述异常支流域的实时水体环境数据依预设时序进行切割形成包含异常支流域环境整体特征的一组具有时序标签的水体环境连续数据；
[0029]
步骤s302、将一组所述水体环境连续数据进行波动分析集成为包含异常支流域环境异常特征的一组具有时序标签的水体环境关键数据。
[0030]
作为本发明的一种优选方案，所述波动分析的具体方法包括：
[0031]
依次计算一组所述水体环境连续数据在相邻时序上的波动度构成波动度数据链，所述波动度的计算公式为：
[0032][0033]
其中，x
t
＝*a
t1
,a
t2
,
…
,a
tm
+，r为一组水体环境连续数据，x
t
,x
t+1
分别为第t，t+1时序下异常支流域的水体环境连续数据，a
tz
表示第t时序的异常支流域的第z类水体环境连续数据，z∈,1,m
‑
，m为水体环境连续数据的总类别数目，p(x
t
,x
t+1
)是x
t
和x
t+1
的联合概率分布函数，而p(x
t
)和p(x
t+1
)分别是x
t
和x
t+1
的边缘概率分布函数；
[0034]
在波动度数据链上标定所有跳跃节点，并选取位于所有跳跃节点两端的水体环境连续数据作为水体环境关键数据；
[0035]
其中，跳跃节点是指波动度数据链上相邻节点数值相差超过波动阈值的数据节点。
[0036]
作为本发明的一种优选方案，所述步骤s3，基于所述水体环境关键数据进行函数拟合实现将离散的所述广流域水体环境数据集成为异常支流域的环境特征函数的具体方法包括：
[0037]
将一组所述水体环境连续数据在多维坐标系中绘制表征异常支流域的环境整体特征的整体特征曲面；
[0038]
将一组所述水体环境关键数据在多维坐标系中绘制表征异常支流域的环境异常特征的异常特征曲面；
[0039]
将所述整体特征曲面和异常特征曲面进行拟合构成既表征异常支流域的环境整体特征又表征环境异常特征的环境特性曲面；
[0040]
将所述环境特性曲面进行函数量化为环境特征函数以将离散的所述广流域水体环境数据集成为异常支流域的环境特征函数。
[0041]
作为本发明的一种优选方案，所述多维坐标系的维度由所述水体环境连续数据的类别数目决定。
[0042]
作为本发明的一种优选方案，本发明提供了一种根据所述的广流域水体环境数据集成方法的集成系统，其特征在于，包括：
[0043]
数据采集单元，用于设置在所述支流域处实时监测所述支流域的水体环境数据；
[0044]
异常判别单元，用于对所述流域集群中的所有支流域进行内相似性比对实现对支流域的异常判别，并筛选处于异常状况的支流域作为异常支流域；
[0045]
数据集成单元，用于将所述异常支流域的水体环境数据进行波动集成形成包含所
述异常支流域的异常特征的水体环境关键数据，并基于所述水体环境关键数据进行函数拟合实现将离散的所述广流域水体环境数据集成为异常支流域的环境特征函数。
[0046]
作为本发明的一种优选方案，所述数据采集单元、异常判别单元和数据集成单元之间通讯连接实现数据交。
[0047]
本发明与现有技术相比较具有如下有益效果：
[0048]
本发明利用同属性聚类将支流域归属至流域集群，并通过将同一流域集群中支流域的水体环境数据的互比较了解集群内支流域的差异性，能迅速判断支流域的风险状况，检测准确率高，同时将支流域离散的水体环境数据进行函数量化环境特征函数，整体上将广流域水体环境数据集成为表征异常流域的环境特征函数，极大程度上掌控广流域水体环境的特征，并且降低了大数量级的水体环境的运算和传输，提高水体监测效率。
附图说明
[0049]
为了更清楚地说明本发明的实施方式或现有技术中的技术方案，下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是示例性的，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图引伸获得其它的实施附图。
[0050]
图1为本发明实施例提供的广流域水体环境数据集成方法流程图；
[0051]
图2为本发明实施例提供的广流域结构示意图；
[0052]
图3为本发明实施例提供的流域集群结构示意图；
[0053]
图4为本发明实施例提供的波动度数据链示意图；
[0054]
图5为本发明实施例提供的集成系统结构框图。
[0055]
图中的标号分别表示如下：
[0056]1‑
数据采集单元；2
‑
异常判别单元；3
‑
数据集成单元；4
‑
水体环境连续数据；5
‑
波动度数据链；6
‑
水体环境关键数据。
具体实施方式
[0057]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0058]
如图1
‑
5所示，广流域水体由于区域面积大，在进行水体环境监测时划分为多个支流域进行监测，而广流域水体环境监测的核心是获取到存在环境风险的流域，因此广流域水体环境监测的关注点在于存在环境风险的环境数据，而无风险的常规环境数据，在处理广流域水体环境数据的过程中需要对存在环境风险的环境数据进行集成，以掌控出风险流域的环境特征，并降低无风险的常规环境数据占用运算空间、传输空间和存储空间，因此本发明提供了一种广流域水体环境数据集成方法。
[0059]
一种广流域水体环境数据集成方法，包括以下步骤：
[0060]
步骤s1、实时监测广流域包含的所有支流域的水体环境数据，并依据水体环境数据对支流域进行同属性聚类形成流域集群；
[0061]
步骤s1中，流域集群形成的具体方法包括：
[0062]
步骤s101、基于水体环境数据将所有支流域分别量化为单个流域集群x
y
＝*a
y1
,a
y2
,
…
,a
ym
+，其中x
y
表示第y个支流域的水体环境数据的集合，a
yz
表示第y个支流域的第z类水体环境数据，z∈,1,m
‑
，y∈,1,n
‑
，m为水体环境数据的总类别数目，n为支流域的总数目；
[0063]
步骤s102、依次比对流域集群的外相似性，并将外相似性最大的两个流域集群进行融合归一，外相似性用果瓦系数进行度量：
[0064][0065]
其中，为支流域y1和支流域y2的果瓦系数，为支流域y1和支流域y2在和上的取值，为加权变量，k1∈,1,m
‑
，y1,y2∈,1,n
‑
，m为水体环境数据的总类别数目，n为支流域的总数目；
[0066]
步骤s103、重复步骤s102直至当前流域集群总数目是步骤s101中流域集群总数目的10％完成所有支流域的同属性聚类，保留当前流域集群作为最终同属性聚类结果。
[0067]
利用层次聚类法将具有相同环境属性的支流域划分至同一流域集群，从而对同一流域集群进行统一的水体环境数据的分析，可以将离散的支流域集成为流域集群，实现广流域水体环境数据的第一次集成。
[0068]
步骤s2、对流域集群中的所有支流域进行内相似性比对实现对支流域的异常判别，并筛选处于异常状况的支流域作为异常支流域；
[0069]
步骤s2中，支流域的异常判别的具体方法包括：
[0070]
对各个流域集群中的所有支流域的水体环境数据x
yp
＝*a
y1p
,a
y2p
,
…
,a
ymp
+分别进行归一化处理为消除不同指标量纲带来的差异，归一化公式为：
[0071][0072]
其中，z∈,1,m
‑
，y∈,1,n2p
‑
，p∈,1,n
‑
，x
yp
表示第p个流域集群中第y个支流域的水体环境数据的集合，a
yzp
表示第p个流域集群中第y个支流域的第z类水体环境数据，m为水体环境数据的总类别数目，n2p为第p个流域集群中支流域的总数目，n为流域集群总数目，a
yzp
′
表示归一化处理后第p个流域集群中第y个支流域的第z类水体环境数据；
[0073]
量化同一流域集群中的支流域两两之间的异常距离，异常距离用欧式距离度量，欧式距离的计算公式为：
[0074][0075]
其中，y1,y2∈,1,n2p
‑
，z∈,1,m
‑
，p∈,1,n
‑
，为第p个流域集群中支流域y1和支流域y2的欧式距离，m为水体环境数据的总类别数目，n2p为第p个流域集群中支流域的总数目，n为流域集群总数目，分别表示归一化处理后第p个流域集群中第
y1、y2个支流域的第z类水体环境数据；
[0076]
设置距离阈值，基于距离阈值判定流域集群中支流域的异常状况。
[0077]
基于距离阈值判定流域集群中支流域的风险状况的方法包括：
[0078]
若各个流域集群p中与支流域y的距离大于距离阈值的支流域数量超过流域集群p中支流域总数目n2p的80％，则认定支流域y风险状况为异常，否则认定支流域y风险状况为正常；
[0079]
将所有风险状况为异常的支流域进行提取作为实现广流域水体环境数据集成的异常支流域。
[0080]
在同一流域集群中判别出异常支流域，并实现将流域集群的包含的所有水体环境数据集成为异常支流域的水体环境数据，实现广流域水体环境的第二次集成。
[0081]
如图2和3所示，流域集群包括3个，流域集群1中包含支流域1
‑
6，流域集群2中包含支流域7
‑
11，流域集群3中包含支流域12
‑
14，流域集群1内支流域1
‑
6的水体环境属性相似，流域集群2内支流域7
‑
11的水体环境属性相似，而流域集群1和2之间支流域1
‑
6和7
‑
11的水体环境属性差异度大，因此可对流域集群1内部的各支流域1
‑
6的在水体环境数据进行内相似性比对，并判别支流域的生态风险。
[0082]
步骤s3、将异常支流域的水体环境数据进行波动集成形成包含异常支流域的异常特征的水体环境关键数据，并基于水体环境关键数据进行函数拟合实现将离散的广流域水体环境数据集成为异常支流域的环境特征函数。
[0083]
如图4所示，步骤s3中，将异常支流域的水体环境数据进行波动集成形成水体环境关键数据的具体方法包括：
[0084]
步骤s301、将异常支流域的实时水体环境数据依预设时序进行切割形成包含异常支流域环境整体特征的一组具有时序标签的水体环境连续数据；
[0085]
步骤s302、将一组水体环境连续数据进行波动分析集成为包含异常支流域环境异常特征的一组具有时序标签的水体环境关键数据。
[0086]
波动分析的具体方法包括：
[0087]
依次计算一组水体环境连续数据在相邻时序上的波动度构成波动度数据链，波动度的计算公式为：
[0088][0089]
其中，x
t
＝*a
t1
,a
t2
,
…
,a
tm
+，r为一组水体环境连续数据，x
t
,x
t+1
分别为第t，t+1时序下异常支流域的水体环境连续数据，a
tz
表示第t时序的异常支流域的第z类水体环境连续数据，z∈,1,m
‑
，m为水体环境连续数据的总类别数目，p(x
t
,x
t+1
)是x
t
和x
t+1
的联合概率分布函数，而p(x
t
)和p(x
t+1
)分别是x
t
和x
t+1
的边缘概率分布函数；
[0090]
在波动度数据链上标定所有跳跃节点，并选取位于所有跳跃节点两端的水体环境连续数据作为水体环境关键数据；
[0091]
其中，跳跃节点是指波动度数据链上相邻节点数值相差超过波动阈值的数据节点。
[0092]
波动度表征相邻时序的水体环境连续数据之间的波动程度，数值越高则波动程度越低，即可用相邻时序的水体环境连续数据两者降维为相邻时序中任一时序的水体环境连续数据表示，因此将相邻时序的水体环境连续数据之间的波动度构成波动度节点数据链，波动度节点数据链中平缓曲线上的所有数据节点对应的相邻时序的水体环境连续数据均具有一致的波动度，可随机选取平缓曲线上的所有数据节点对应的某一时序的水体环境连续数据进行表征完成多变一的数据降维，波动度节点数据链上跳跃节点对应的相邻时序的水体环境连续数据均具有不一致的波动度，即相邻时序的水体环境连续数据变化剧烈，体现了水体环境的剧烈变化表征为环境风险的发生，因此相邻时序的水体环境连续数据作为水体环境关键数据进行保留，可作为分析获得水体环境的异常特征。
[0093]
步骤s3，基于水体环境关键数据进行函数拟合实现将离散的广流域水体环境数据集成为异常支流域的环境特征函数的具体方法包括：
[0094]
将一组水体环境连续数据在多维坐标系中绘制表征异常支流域的环境整体特征的整体特征曲面；
[0095]
将一组水体环境关键数据在多维坐标系中绘制表征异常支流域的环境异常特征的异常特征曲面；
[0096]
将整体特征曲面和异常特征曲面进行拟合构成既表征异常支流域的环境整体特征又表征环境异常特征的环境特性曲面；
[0097]
将环境特性曲面进行函数量化为环境特征函数以将离散的广流域水体环境数据集成为异常支流域的环境特征函数。
[0098]
整体特征曲面是对水体环境的整体特征的量化表征，异常特征曲面是对水体环境的异常特征的量化表征，异常特征曲面仅包含多个水体环境关键数据的数据，但仅仅根据多个水体环境关键数据的数据拟合出环境特性曲面，拟合精度差；整体特征曲面具有数量足够多的数据用于拟合出表征水体环境整体特征的环境特性曲面，但难以显示异常特征的细节，因此将整体特征曲面和异常特征曲面相结合获得数量足够多的数据的同时获得异常特征数据，用以拟合出既能表征异常支流域的整体水体环境特征又能突出关键水体环境特征的环境特性曲面。
[0099]
将环境特性曲面量化为环境特征函数，将离散的支流域水体环境数据集成为环境特征函数，实现广流域水体环境数据的第三次集成，最终实现将广域离散的广流域水体环境数据集成为异常支流域的环境特征函数，有效的降低水体环境数据的存储数量级，只需要存储为环境特征函数即可，在专业分析人员要对水体环境进行分析时，只需对环境特征函数进行绘制即可得到整个广流域的中异常支流域的环境整体特征和异常特征进行掌握。
[0100]
多维坐标系的维度由水体环境连续数据的类别数目决定。
[0101]
如图5所示，基于上述广流域水体环境数据集成方法，本发明提供了一种集成系统，其特征在于，包括：
[0102]
数据采集单元1，用于设置在支流域处实时监测支流域的水体环境数据；
[0103]
异常判别单元2，用于对流域集群中的所有支流域进行内相似性比对实现对支流域的异常判别，并筛选处于异常状况的支流域作为异常支流域；
[0104]
数据集成单元3，用于将异常支流域的水体环境数据进行波动集成形成包含异常支流域的异常特征的水体环境关键数据，并基于水体环境关键数据进行函数拟合实现将离
散的广流域水体环境数据集成为异常支流域的环境特征函数。
[0105]
数据采集单元、异常判别单元和数据集成单元之间通讯连接实现数据交。
[0106]
本发明利用同属性聚类将支流域归属至流域集群，并通过将同一流域集群中支流域的水体环境数据的互比较了解集群内支流域的差异性，能迅速判断支流域的风险状况，检测准确率高，同时将支流域离散的水体环境数据进行函数量化环境特征函数，整体上将广流域水体环境数据集成为表征异常流域的环境特征函数，极大程度上掌控广流域水体环境的特征，并且降低了大数量级的水体环境的运算和传输，提高水体监测效率。
[0107]
本发明以同一流域集群中的支流域作为基准，通过互比较判断支流域的生态风险状况，能在支流域风险发生早期识别出，对于保障广流域水体安全稳定。
[0108]
本发明将流域集群统一监测的概念引入支流域生态风险监测中，将相似的支流域归在一起形成各个流域集群，有利于支流域的长期监管。
[0109]
以上实施例仅为本技术的示例性实施例，不用于限制本技术，本技术的保护范围由权利要求书限定。本领域技术人员可以在本技术的实质和保护范围内，对本技术做出各种修改或等同替换，这种修改或等同替换也应视为落在本技术的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘利军;李春盛;王永利;李士林;苑继洲
技术所有人：中交第三公路工程局有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。