基于综合分层聚类的湖库、流域的水质监测断面优化布设方法

文档序号:8258750阅读:266来源:国知局
基于综合分层聚类的湖库、流域的水质监测断面优化布设方法
【技术领域】
[0001] 本发明属于水环境监测与治理技术领域,涉及一种基于综合分层聚类的湖库、流 域的水质监测断面优化布设方法。
【背景技术】
[0002] 近年来,在水环境监测与治理技术领域,如何对水质监测断面进行优化布设受到 研究人员的广泛关注。传统的湖库断面监测是按照水体区域大小以平均分布的原则进行布 设,即将湖库水域平均分割为固定大小(通常为2平方公里)的网格,并在每个网格的中心 位置布测点。这种方法虽然简单易行,但往往会导致相邻断面出现水质监测结果相近,造成 监测资源浪费。由于自然环境和社会环境的变化,地表水环境的分布规律也并不是一成不 变的,因此需要对水环境检测的断面进行不断优化。水质监测的断面优化,即用最少的测点 获得最具有空间代表性的监测数据,充分说明环境质量的状况和变化。通过断面优化,可以 有效整合水环境监测资源,减少重复投资和建设,最大程度地客观反映出水环境整体质量 状况,实现更加有效的水环境监测。
[0003] 聚类分析是数理统计研究中研究"物以类聚"的一种多元分析方法,即用数理定量 地确定样品之间的亲疏关系。近年来,已有很多研究学者将这种模糊数学方法引入到水环 境灰色系统中,以更加准确地进行对不同断面的水质分型划类。1993年,王建珊等人采用 模糊数学"最大树"聚类分析法,对秦淮河水系的监测点位进行了优化调整,经检验,优化后 的监测点位不仅保留原有功能,而且能够较好反映秦淮河水质情况。梁伟臻等人于2002年 采用模糊数学中的聚类原理,以广州市某河涌为例对水质监测站点进行优化。马飞等人于 2006年采用模糊数学中的聚类原理对南运河进行了水质监测断面优化设置,经验证,该方 法不仅能够全面控制南运河水质变化动态,同时能够减少监测工作量,节约人力物力。聚类 分析在样本数量较少的情况下比较简单,无需复杂编程,逐渐被应用于国内外地表水环境 监测点位优化。
[0004] 目前广泛应用的聚类方法为分层聚类法,即通过计算距离得到数据集合中变量两 两之间的相似性和非相似性,进而再通过定义变量之间的连接,对所得聚类信息进行评价, 最终创建聚类,并实现以图形化显示聚类分析结果。但其缺点在于距离度量方法和连接方 法的选择上较单一,对于不同水域不同的数据特征,无法自适应选择最佳方法以获取效果 最好的水质监测断面优化布设。

【发明内容】

[0005] 本发明提出一种基于综合分层聚类(CHC)的湖库、流域的水质监测断面优化布设 方法。可针对不同水域,自适应地选择分层聚类法中的距离方法和连接方法,从而提高综合 分层聚类的结果准确度,以获取效果更佳的水质监测断面优化设置,实验结果表明本发明 采用的综合分层聚类方法在实际应用当中更加合理有效,可更好地对水域进行水质监控 提供合理、有效的数据支持。
[0006] 本发明提供的基于综合分层聚类的湖库、流域的水质监测断面优化布设方法,包 括如下步骤:
[0007] 步骤1:通过监测采集不同断面的水质指标,建立原始数据矩阵Z,Z为mXn的矩 阵,其中m为监测断面个数,n为每个监测断面的水质指标个数将矩阵Z标准化后得到矩阵 X;
[0008] 步骤2:将监测断面的水质指标作为变量,对应为矩阵X的列向量,采用五种距离 度量方法得出各变量之间的相似性;所述的距离度量方法包括:欧氏距离、标准欧氏距离、 马氏距离、布洛克距离以及切比雪夫距离;
[0009] 步骤3:根据变量间的亲疏关系,采用四种连接方法对变量进行聚类;所述的连接 方法包括:最短距离法、最长距离法、平均距离法和质心距离法;
[0010] 步骤4:确定连接方法与距离度量方法的相关系数,选取相关系数最大情况下的 距离度量方法与连接方法,根据相关系数最大情况下的聚类来优化水质监测断面的布设。
[0011] 设a = 1,2, 3, 4, 5分别代表五种距离度量方法,b = 1,2, 3, 4分别代表四种连接 方法。
[0012] 对于某种连接方法与距离度量方法的相关系数cab为:
[0013]
【主权项】
1. 一种基于综合分层聚类的湖库、流域的水质监测断面优化布设方法,其特征在于,包 括以下步骤: 步骤1 :通过监测采集不同断面的水质指标,建立原始数据矩阵Z,将矩阵Z标准化处理 后得到矩阵X;矩阵Z为mXn的矩阵,其中m为监测断面个数,n为每个监测断面的水质指 标个数; 步骤2 :将监测断面的水质指标作为变量,对应为矩阵X的列向量,采用五种距离度量 方法得出各变量之间的相似性;所述的距离度量方法包括:欧氏距离、标准欧氏距离、马氏 距离、布洛克距离以及切比雪夫距离; 步骤3 :根据变量间的亲疏关系,采用四种连接方法对变量进行聚类;所述的连接方法 包括:最短距离法、最长距离法、平均距离法和质心距离法; 步骤4 :确定连接方法与距离度量方法的相关系数,选取相关系数最大情况下的距离 度量方法与连接方法,根据相关系数最大情况下的聚类来优化水质监测断面的布设; 设a= 1,2, 3, 4, 5分别代表五种距离度量方法,b= 1,2, 3, 4分别代表四种连接方法; 对于某种连接方法与距离度量方法的相关系数cab为:
其中,i和j分别指代矩阵X中第i个变量与第j个变量,dau表示第a种距离度量方 法计算两个变量之间的距离,Dbu表示第b种连接方法计算的两个变量之间的距离,忑和 瓦分别是向量da。和Dbu中的平均值; a和0为权重系数,
2. 根据权利要求1所述的湖库、流域的水质监测断面优化布设方法,其特征在于,所述 的步骤1中运用平均绝对偏差进行标准化处理,具体方法为:设zlk,z2k,…,zmk为水质指标 fk的m个度量值,k= 1,2,…,n; 1) 计算水质指标fk的所有度量值的绝对偏差的平均值
其中,&为fk的m个度量值的平均值,
2) 水质指标fk的第i个度量值zik归一化得到的标准值xikS:

【专利摘要】本发明属于水环境监控与治理领域,公开了一种基于综合分层聚类的湖库、流域的水质监测断面优化布设方法,包括以下步骤:首先根据原始采集的水质监测数据建立标准化矩阵,通过5种距离算法计算监测数据变量之间的相似性以获得变量之间的亲疏关系,接着通过4种连接算法以实现对数据集合的自动聚类;然后以加权重的皮尔逊相关系数为判定准则来选择最优组合以进行分层聚类,最后通过生成的相应最优聚类树矩阵,来优化设置断面监测站点,从而可获得反映水域整体水质的监测数据,以提高水环境的监测质量。本方法方便简捷、结果直观、具有很高的可行性。
【IPC分类】G06F17-30, G06Q10-04
【公开号】CN104572878
【申请号】CN201410806392
【发明人】连晓峰, 王小艺, 彭森
【申请人】北京工商大学
【公开日】2015年4月29日
【申请日】2014年12月22日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1