一种城市面源污染典型监测区聚类筛选方法与系统与流程

文档序号:31695684发布日期:2022-10-01 05:11阅读:80来源:国知局
一种城市面源污染典型监测区聚类筛选方法与系统与流程

1.本发明涉及污染负荷监测,具体涉及一种城市面源污染典型监测区聚类筛选方法与系统。


背景技术:

2.随着城市化的快速发展,由降雨径流冲刷所产生的城市面源污染带来的生态环境问题日益突出,已成为制约城市水环境“提质”的关键。城市面源污染具有排放随机性、间歇性、时空变化幅度大等特点,开展城市面源污染监测可为城市面源污染负荷估算提供重要的基础数据参考,对于城市面源污染防控和水环境治理具有重要意义。
3.目前开展城市面源污染监测的主要思路是根据地形、地下管网以及河流等资料分析面源污染的空间产汇流趋势,划定城市的子汇水分区,在估算各汇水分区面源污染负荷的基础上实现整个城市面源污染负荷估算。显然,对城市所有汇水分区进行面源污染监测费时费力,不具有经济可行性。人为选择典型监测区域没有定量的指标参照,具有随机性和代表性差的问题,导致城市面源污染负荷估算结果具有很大的不确定性。
4.此外,由于城市化发展过程中人口密度、下垫面、排水管网以及功能区划等不同,造成城市化发展在空间上存在显著差异。比如低城市化强度区主要是城市中的山区,具有汇水分区面积较大,建设用地占比最小,而坡度最大的特点;中城市化强度区一般兼具山区和城市建设区域,汇水分区面积、建设用地占比以及坡度适中;而高城市化强度区主要是城市建成区,开发强度高,且多处于地势平坦地区,其建设用地占比较大,而坡度较小,且由于汇水趋势被城市建设人为切割,故而其汇水面积一般较小。城市面源污染典型监测区域的选择需要考虑到这种客观存在的城市化发展差异,因而典型监测区域往往不止一个。如何在高度城市化地区科学而合理地筛选面源污染典型监测区域,已经成为城市面源污染监测中迫切需要解决的问题。


技术实现要素:

5.发明目的:本发明目的在于提供一种城市面源污染典型监测区聚类筛选方法与系统,克服人为主观选择存在的随机性和代表性差的问题,为城市面源污染科学监测提供技术支撑。
6.技术方案:为实现上述发明目的,本发明提供的一种城市面源污染典型监测区聚类筛选方法,包括:
7.(1)根据目标区域汇水分区、土地利用以及地形,计算汇水分区的面积、建设用地占比以及坡度;
8.(2)将汇水分区的面积、建设用地占比以及坡度均一化,构成空间点坐标,每个汇水分区对应空间中的一个点;统计每个汇水分区点在设定的空间距离半径范围内的汇水分区点个数n,筛选出n不低于设定阈值的汇水分区点,得到高密度汇水分区集合h;依据集合h中汇水分区点的建设用地占比排序,选择k个汇水分区点作为初始聚类中心,k为设定的监
测区数量;
9.(3)遍历所有汇水分区点到k个聚类中心点的欧式距离,将每个汇水分区点划分到距离最近的聚类簇中,更新每个聚类簇的聚类中心,重复该步骤直到新的聚类中心位置不再发生变化或收敛到设定范围,最终得到k个聚类中心;
10.(4)结合聚类得到的k个中心点,找到各聚类簇中距离聚类中心方差最小的汇水分区,作为最终筛选出的典型监测区。
11.作为优选,所述步骤(1)中,在gis中统计各汇水分区的面积、建设用地占比以及坡度,其中,建设用地占比是屋顶和道路面积之和占汇水分区面积的比例,坡度则根据地形dem数据进行坡度计算后,取汇水分区内所有网格的坡度均值。
12.作为优选,所述步骤(2)中,分别利用汇水分区的面积、建设用地占比以及坡度的最大值进行均一化,均一化后数值在0~1之间。
13.作为优选,所述步骤(2)中,初始化聚类中心的方法为:
14.首先计算任意两汇水分区点ui(a'i,c'i,s'i)和uj(a'j,c'j,s'j)的距离d(ui,uj),以及空间距离半径与阈值其中m为目标区域汇水分区总数;a'i、a'j、c'i、c'j、s'i、s'j分别表示均一化后第i和第j个汇水分区点的面积、建设用地占比以及坡度;
[0015][0016]
然后统计每个汇水分区点在空间距离半径r范围内的汇水分区个数n,筛选n≥m的汇水分区点作为高密度汇水分区集合h;
[0017]
设高密度汇水分区集合h中有h个汇水分区点,将集合h中的点按建设用地占比从大到小排序,则初始化的第1、2、3、

、k-1、k个聚类中心分别为排序等于1、h的汇水分区点;其中,floor表示向下取整。
[0018]
作为优选,所述步骤(3)具体包括:
[0019]
(3-1)遍历所有汇水分区点到k个聚类中心点的欧式距离,将每个汇水分区点划分到距离最近的聚类簇中;其中,第i个汇水分区点(a'i,c'i,s'i)到第j个聚类中心(xj,yj,zj)的欧式距离d
i,j
计算公式如下:
[0020][0021]
(3-2)更新聚类中心;设某一聚类中心(x,y,z)的聚类簇中有n个汇水分区点,则新的聚类中心位置计算公式如下:
[0022]
[0023][0024][0025]
其中,(new_x,new_y,new_z)表示新的聚类中心的空间坐标;
[0026]
(3-3)重复步骤(3-1)至(3-2)直到新的聚类中心位置不再发生变化或收敛到设定范围,最终得到k个聚类中心;其中,聚类中心收敛的判断条件如下:
[0027][0028]
其中,δ是收敛阈值。
[0029]
作为优选,所述步骤(4)中,设某一聚类簇中有n个汇水分区点,则其中第i个汇水分区点的距离方差di计算如下:
[0030][0031]
其中,di表示第i个汇水分区到其聚类中心的距离,表示聚类簇中所有汇水分区到聚类中心的距离的均值。
[0032]
基于相同的发明构思,本发明提供的一种城市面源污染典型监测区聚类筛选系统,包括:
[0033]
数据获取模块,用于根据目标区域汇水分区、土地利用以及地形,计算汇水分区的面积、建设用地占比以及坡度;
[0034]
聚类中心初始化模块,用于将汇水分区的面积、建设用地占比以及坡度均一化,构成空间点坐标,每个汇水分区对应空间中的一个点;统计每个汇水分区点在设定的空间距离半径范围内的汇水分区个数n,筛选出n不低于设定阈值的汇水分区点,得到高密度汇水分区集合h;依据集合h中汇水分区点的建设用地占比排序,选择k个汇水分区点作为初始聚类中心,k为设定的监测区数量;
[0035]
聚类模块,用于遍历所有汇水分区点到k个聚类中心点的欧式距离,将每个汇水分区点划分到距离最近的聚类簇中,更新每个聚类簇的聚类中心,重复该步骤直到新的聚类中心位置不再发生变化或收敛到设定范围,最终得到k个聚类中心;
[0036]
以及,监测区确定模块,用于结合聚类得到的k个中心点,找到各聚类簇中距离聚类中心方差最小的汇水分区,作为最终筛选出的典型监测区。
[0037]
基于相同的发明构思,本发明提供的一种计算机系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的城市面源污染典型监测区聚类筛选方法的步骤。
[0038]
基于相同的发明构思,本发明提供的一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的城市面源污染典型监测区聚类筛选方法的步骤。
[0039]
有益效果:本发明与现有技术相比,其显著优点是:
[0040]
(1)以往的相关研究中典型监测区的选择多依赖于人为主观判断,具有随机性和代表性差的问题,导致城市面源污染负荷估算结果具有很大的不确定性。本发明采用汇水分区面积、建设用地占比以及坡度来衡量不同汇水分区空间差异程度,可定量聚类筛选城市面源污染典型监测区域,提高了城市面源污染监测的代表性与针对性。
[0041]
(2)本发明改进了聚类中心初始化方法,侧重考虑了建设用地占比对城市化发展的代表性,最终筛选出的典型监测区域能够代表不同城市化发展程度。同时,本发明可以自主定义聚类的个数,在不同的聚类数量上能保持相对稳定的聚类结果,且随着聚类的个数增加,聚类得到的典型监测区域将得到更多的城市化发展差异信息。
附图说明
[0042]
图1是本发明的一个实施例的流程示意图;
[0043]
图2是本实施例的土地利用及汇水分区示意图;
[0044]
图3是本实施例的地形空间分布示意图;
[0045]
图4是统计的各汇水分区数值空间分布示意图;
[0046]
图5是k=3和k=5时对应的初始聚类中心示意图;
[0047]
图6是典型监测区域聚类算法流程图;
[0048]
图7是k=3和k=5时汇水分区聚类结果示意图;
[0049]
图8是k=3和k=5时典型监测区域空间分布示意图。
具体实施方式
[0050]
下面结合附图和具体实施例对发明的技术方案进行详细说明。
[0051]
如图1所示,本发明实施例公开的城市面源污染典型监测区聚类筛选方法,包括以下步骤:
[0052]
(1)根据目标区域汇水分区、土地利用以及地形,计算汇水分区的面积、建设用地占比以及坡度。具体包括:
[0053]
(1-1)收集目标区域汇水分区、土地利用以及地形数据,其中土地利用类型包括屋顶、道路、绿地以及水体等。
[0054]
(1-2)在gis中统计各汇水分区的面积a、建设用地占比c以及坡度s,则任意汇水分区u可用面积、建设用地占比以及坡度构成的空间点坐标(a,c,s)表示;其中,面积建设用地占比是屋顶和道路面积之和占汇水分区面积的比例,坡度则根据地形dem数据进行坡度计算后,取汇水分区内所有网格的坡度均值。
[0055]
本实施例收集得到目标区域的汇水分区、土地利用以及地形如图2和图3所示。目标区域总面积为263.83km2,共划分了59个汇水分区(m=59),其中屋顶、道路主要分布在地势平坦的区域,占比分别为28.31%、10.98%,而绿地主要分布在地势较高的山区,占比达57.83%。在gis中统计了各汇水分区的面积、建设用地占比以及坡度,并构建空间坐标系如图4所示。
[0056]
(2)汇水分区的面积、建设用地占比以及坡度均一化处理,并按照设定的监测区数量进行k个聚类中心初始化。具体包括:
[0057]
(2-1)均一化处理:为避免量纲的不同影响距离计算结果,利用每个维度的最大值
将汇水分区的3维数据均一化为0~1之间的数,计算公式如下:
[0058]
a'i=ai/a
max
[0059]
c'i=ci/c
max
[0060]
s'i=si/s
max
[0061]
其中,ai、ci、si分别表示第i个汇水分区的面积、建设用地占比以及坡度;a
max
、c
max
、s
max
分别表示第汇水分区中的面积、建设用地占比以及坡度的最大值;a'i、c'i、s'i分别表示均一化后第i个汇水分区的面积、建设用地占比以及坡度。
[0062]
(2-2)聚类中心初始化:假设有m个汇水分区需要聚类为k个类别(2≤k《m),则需要初始化k个聚类中心。为避免传统方法中随机初始化聚类中心导致聚类结果不稳定问题,改进后的聚类中心初始化思路如下:
[0063]
首先计算任意两汇水分区点ui(a'i,c'i,s'i)和uj(a'j,c'j,s'j)的距离d(ui,uj),以及空间距离半径与阈值其中m为目标区域汇水分区总数;a'i、a'j、c'i、c'j、s'i、s'j分别表示均一化后第i和第j个汇水分区点的面积、建设用地占比以及坡度;
[0064][0065]
然后统计每个汇水分区点在空间距离半径r范围内的汇水分区个数n,筛选n≥m的汇水分区点作为高密度汇水分区集合h;
[0066]
设高密度汇水分区集合h中有h个汇水分区点,将集合h中的点按建设用地占比从大到小排序,则初始化的第1、2、3、

、k-1、k个聚类中心分别为排序等于1、h的汇水分区点;其中,floor表示向下取整。
[0067]
本实施例统计了各汇水分区的面积、建设用地占比以及坡度的最大值,其中a
max
为32.55km2,c
max
为0.77,s
max
为21.81
°

[0068]
以k=3和5为例,分别初始化3个和5个聚类中心。计算得到r=0.171。初始化得到的聚类中心如图5所示。
[0069]
(3)遍历所有汇水分区到k个聚类中心点的欧式距离,将每个汇水分区划分到距离最近的聚类簇中,更新每个聚类簇的聚类中心,重复该步骤直到新的聚类中心位置不再发生变化或收敛到设定范围,最终得到k个聚类中心。具体包括:
[0070]
(3-1)遍历所有汇水分区到k个聚类中心点的欧式距离,将每个汇水分区划分到距离最小的聚类簇中;其中,第i个汇水分区到第j个聚类中心的欧式距离计算公式如下:
[0071][0072]
其中,d
i,j
表示第i个汇水分区到第j个聚类中心的欧式距离,(xj,yj,zj)表示第j个聚类中心的空间坐标;
[0073]
(3-2)计算每个簇中三个坐标轴的平均值作为新的聚类中心;其中,假设某一聚类
中心(x,y,z)的聚类簇中有n个汇水分区,则新聚类中心位置计算公式如下:
[0074][0075][0076][0077]
其中,(new_x,new_y,new_z)表示新聚类中心的空间坐标;
[0078]
(3-3)重复步骤(3-1)至(3-2)直到新聚类中心的位置不再发生变化或收敛到设定范围,最终得到k个新聚类中心;其中,新聚类中心收敛的判断条件如下:
[0079][0080]
其中,δ是可以人为定义的收敛阈值。
[0081]
本实施例聚类算法的流程如图6所示,定义的收敛阈值δ为0.0001,通过聚类算法迭代最终将59个汇水分区聚为3类和5类,如图7所示。聚类得到的三个中心点的面积、建设用地占比、坡度信息如下表1和表2所示。
[0082]
表1 k=3的聚类中心结果
[0083][0084][0085]
表2 k=5的聚类中心结果
[0086][0087]
(4)结合聚类得到的k个中心点,找到各聚类簇中距离聚类中心方差最小的汇水分区,作为最终筛选出的典型监测区域。设某一聚类簇中有n个汇水分区点,则其中第i个汇水分区点的距离方差di计算如下:
[0088][0089]
其中,di表示第i个汇水分区到其聚类中心的距离,表示聚类簇中所有汇水分区到聚类中心的距离的均值;距离方差di最小表示距离平均水平最近,选择di最小的汇水分区更具有代表性。
[0090]
本实施例结合步骤(3)得到的聚类中心,找到各聚类簇中距离聚类中心方差最小的汇水分区信息如表3和表4所示。两种情况下的典型监测区域空间分布如图8所示,后续可针对聚类筛选的典型区域进行城市面源污染监测。
[0091]
表3 k=3时典型监测区聚类筛选结果
[0092][0093]
表4 k=5时典型监测区聚类筛选结果
[0094][0095]
基于相同的发明构思,本发明实施例公开的一种城市面源污染典型监测区聚类筛选系统,包括:数据获取模块,用于根据目标区域汇水分区、土地利用以及地形,计算汇水分区的面积、建设用地占比以及坡度;聚类中心初始化模块,用于将汇水分区的面积、建设用地占比以及坡度均一化,构成空间点坐标,每个汇水分区对应空间中的一个点;统计每个汇水分区点在设定的空间距离半径范围内的汇水分区个数n,筛选出n不低于设定阈值的汇水分区点,得到高密度汇水分区集合h;依据集合h中汇水分区点的建设用地占比排序,选择k个汇水分区点作为初始聚类中心;聚类模块,用于遍历所有汇水分区点到k个聚类中心点的欧式距离,将每个汇水分区点划分到距离最近的聚类簇中,更新每个聚类簇的聚类中心,重复该步骤直到新的聚类中心位置不再发生变化或收敛到设定范围,最终得到k个聚类中心;以及,监测区确定模块,用于结合聚类得到的k个中心点,找到各聚类簇中距离聚类中心方差最小的汇水分区,作为最终筛选出的典型监测区。
[0096]
上述描述的各模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。所述模块的划分仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统。
[0097]
基于相同的发明构思,本发明实施例公开的一种计算机系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的城市面源污染典型监测区聚类筛选方法的步骤。
[0098]
基于相同的发明构思,本发明实施例公开的一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的城市面源污染典型监测区聚类筛选方法的步骤。
[0099]
本领域技术人员可以理解的是,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机系统(可以是个人计算机,服务器,或者网络设备等)执行本发明实施例所述方法的全部或部分步骤。存储介质包括:u盘、移动硬盘、只读存储器rom、随机存取存储器ram、磁碟或者光盘等各种可以存储计算机程序的介质。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1