本发明涉及一种聚类方法,具体涉及一种基于水华爆发的河道聚类方法。
背景技术:
随社会发展,人类活动频繁,河道生态环境发生巨大变化,不同程度的水华引起社会关注。水华爆发是水生态系统对水体富营养化的响应,水华爆发直接破坏水域生态景观,危害水域生态环境中栖息生物的生存与发展,甚至威胁人类身体健康。为研究河道水华爆发机制,环境学者从河道形态、河道水体水动力特性、水温、营养盐特性、优势种等方面进行研究,发现水华爆发主要归结为:缓慢水流流态;适宜光照、水温条件;充足氮磷营养盐。
目前,对于河道水华爆发的机制研究主要针对单条河道,对于不同区域不同特征的河道,是否存在聚类,是否具有类似的水华风险和机制甚至防控措施,缺乏研究。
为了解不同区域不同特征河道水华爆发的一般规律,本发明提出一种基于水华爆发的河道聚类新方法。
技术实现要素:
为解决现有技术的不足,本发明目的在于提供一种综合考虑河道形态、水体动力、水体理化因子、水体光学、水体营养指标,采用主客观综合赋权法赋权的方式,科学、合理地进行河道聚类的方法。
本发明采用的技术方案为:
一种基于水华爆发的河道聚类方法,包括以下步骤:
s1、建立河道水华爆发指标体系,包括一级指标层和二级指标层;
所述一级指标层由若干一级指标构成,包括河道形态指标、水体动力指标、水体理化因子指标、水体光学指标、水体营养指标;
所述二级指标层由若干二级指标构成,
河道形态指标包括长度指标、面积指标、蜿蜒度指标,
水体动力指标包括水位指标、流速指标、水体垂向稳定系数指标,
水体理化因子指标包括温度指标、ph值指标、电导率指标、氧化还原电位指标、do指标,
水体光学指标包括透明度指标、浊度指标、光衰减系数指标、真光层深度指标、混合层深度指标,
水体营养指标包括总氮(tn)指标、总磷(tp)指标、溶解性硅酸盐(d-si)指标、氮磷(tn/tp)比指标、硅氮比(d-si/tn)指标、硅磷比(d-si/tp)指标、叶绿素(chla)指标;
s2、采用主客观综合赋权法,确定各河道各二级指标权重;
s3、基于各河道各二级指标权重,采用加权求和法,确定各河道各一级指标得分;
s4、采用系统聚类法,进行河道聚类。
上述步骤s2中的主客观综合赋权法包括主观赋权法、客观赋权法;
确定体系指标权重,具体为:
假设二级指标个数为j:
wj=αaj+(1-α)bjj=1,2,…,j,0≤α≤1(1)
式(1)中,wj为第j个指标的综合权重,aj和bj分别为第j个指标的主观权重和客观权重,α为偏好系数,依据决策者对不同赋权法的偏好;
所述主观赋权法采用专家调查法,n名专家了解河道水华爆发指标体系,匿名为指标j赋权,aj取平均值;
所述客观赋权法采用熵值法,步骤如下:
a1:无量纲化处理
采用极大值法对指标体系数据进行无量纲化处理,假设有n条河道参与聚类分析,假设二级指标个数为j,构成矩阵[xij']n×j,无量纲化处理后得到矩阵[xij]n×j:
式(2)中,maxxj'为同一指标下最大值;
a2:计算指标熵值
k=(lnn)-1(4)
式(3)中,fij为第j个指标下第i条河道占该指标的比重;
式(4)中,k为常数;
式(5)中,hj为第j个指标的熵;
a3:计算指标熵权
上述步骤s3中采用加权求和法,确定各河道各个一级指标得分,具体为:
假设一级指标个数为p,
式(7)中,sip为第i条河道第p个一级指标得分,l为第p个一级指标下第1个二级指标对应的j值,m为第p个一级指标下二级指标个数。
上述步骤s4中采用系统聚类法进行河道聚类,步骤如下:
b1:距离计算
假设有n条河道参与聚类分析,建立n类,
所述距离计算的方法,包括最短距离法、最长距离法、类平均距离法;
所述最短距离法,假设n1和n2为两条河道,n1和n2最短距离为:
dn1,n2=min(du,v)(8)
式(8)中,dn1,n2为n1河道中所有一级指标和n2河道中所有一级指标之间最短距离,u为n1河道第p个一级指标得分,v为n2河道第p个一级指标得分,du,v为u和v之间的距离;
所述最长距离法,n1和n2最长距离为:
dn1,n2=max(du,v)(9)
所述类平均距离法,n1和n2类平均距离为:
式(10)中,p为一级指标个数;
b2:建立新分类
假设min0为距离矩阵d(0)最小值:
min0=min(d(0))(11)
假设min0是
b3:新分类距离计算
计算
b4:重复计算
重复步骤b2-b3,至n条河道聚类为1,则停止聚类;
b5:聚类
画聚类图,决定聚类数目。
上述蜿蜒度,为河道弯曲程度:
式(12)中,β为蜿蜒度,l1为河道中泓线长度,l2为河道上下游两点间直线距离。
上述水体垂向稳定系数:
式(13)中,χ为水体垂向稳定系数,g为重力加速度,ρh为底层水体密度,ρ0为表层水体密度,ρavg为水体垂向平均密度,h为河道水深;
所述水体密度由水温对应的水体密度和水体含沙量计算:
式(14)中,ρ为水体密度,ρt为水温对应的水体密度,ρs为泥沙容重,δ为水体含沙量;
所述水温对应的水体密度:
式(15)中,t为水温。
上述光衰减系数:
式(16)中,ε为光衰减系数,z为从河道水面至测量处深度,e(z)为利用水下光量子仪测得深度z的辐照度,e(0)为水面辐照度;
所述真光层深度:
式(17)中,zeu为真光层深度;
所述混合层深度,取河道表层水温下降0.5℃对应的水深。
本发明的有益之处在于:
本发明的一种基于水华爆发的河道聚类方法,综合考虑河道水华爆发重要指标,包括河道形态、水体动力、水体理化因子、水体光学、水体营养指标,建立河道水华爆发指标体系,并采用主客观综合赋权法确定各指标权重,最后利用系统聚类法进行河道聚类,从而将不同区域、不同特征的河道进行归类,了解河道水华爆发的一般规律,为水华风险预测及水华防控提供一种有效的技术管理工具。
附图说明
图1是本发明的一种基于水华爆发的河道聚类方法的流程图;
图2是本发明的河道水华爆发指标体系的结构示意图;
图3是本发明的河道聚类结果。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
如图1所示,本发明公开了一种基于水华爆发的河道聚类方法,包括以下步骤:
s1、建立河道水华爆发指标体系;
s2、确定体系指标权重;
s3、计算指标得分;
s4、河道聚类。
步骤s1中河道水华爆发指标体系,包括一级指标层和二级指标层;
一级指标层包括河道形态指标、水体动力指标、水体理化因子指标、水体光学指标和水体营养指标;
二级指标层由若干二级指标组成;河道形态指标包括长度指标、面积指标和蜿蜒度指标,水体动力指标包括水位指标、流速指标和水体垂向稳定系数指标,水体理化因子指标包括温度指标、ph值指标、电导率指标、氧化还原电位指标和do指标,水体光学指标包括透明度指标、浊度指标、光衰减系数指标、真光层深度指标和混合层深度指标,水体营养指标包括总氮(tn)指标、总磷(tp)指标、溶解性硅酸盐(d-si)指标、氮磷(tn/tp)比指标、硅氮比(d-si/tn)指标、硅磷比(d-si/tp)指标和叶绿素(chla)指标;
蜿蜒度为河道弯曲程度:
式(12)中,β为蜿蜒度,l1为河道中泓线长度,l2为河道上下游两点间直线距离;
水体垂向稳定系数:
式(13)中,χ为水体垂向稳定系数,g为重力加速度,ρh为底层水体密度,ρ0为表层水体密度,ρavg为水体垂向平均密度,h为河道水深;
水体密度由水温对应的水体密度和水体含沙量计算:
式(14)中,ρ为水体密度,ρt为水温对应的水体密度,ρs为泥沙容重,δ为水体含沙量;
水温对应的水体密度:
式(15)中,t为水温;
光衰减系数:
式(16)中,ε为光衰减系数,z为从河道水面至测量处深度,e(z)为利用水下光量子仪测得深度z的辐照度,e(0)为水面辐照度;
真光层深度:
式(17)中,zeu为真光层深度;
混合层深度,取河道表层水温下降0.5℃对应的水深。
步骤s2中确定体系指标权重,假设二级指标个数为j,采用主客观综合赋权法:
wj=αaj+(1-α)bjj=1,2,…,j,0≤α≤1(1)
式(1)中,wj为第j个指标的综合权重,aj和bj分别为第j个指标的主观权重和客观权重,α为偏好系数,依据决策者对不同赋权法的偏好;
主观赋权法采用专家调查法,n名专家了解河道水华爆发指标体系,匿名为指标j赋权,aj取平均值;
客观赋权法采用熵值法,步骤如下:
a1:无量纲化处理
采用极大值法对指标体系数据进行无量纲化处理,假设有n条河道参与聚类分析,假设二级指标个数为j,构成矩阵[xij']n×j,无量纲化处理后得到矩阵[xij]n×j:
式(2)中,maxxj'为同一指标下最大值;
a2:计算指标熵值
k=(lnn)-1(4)
式(3)中,fij为第j个指标下第i条河道占该指标的比重;
式(4)中,k为常数;
式(5)中,hj为第j个指标的熵;
a3:计算指标熵权
步骤s3中计算指标得分,假设一级指标个数为p,采用加权求和法确定各河道各个一级指标得分:
式(7)中,sip为第i条河道第p个一级指标得分,l为第p个一级指标下第1个二级指标对应的j值,m为第p个一级指标下二级指标个数。
步骤s4中河道聚类,采用系统聚类法进行河道聚类,步骤如下:
b1:距离计算
假设有n条河道参与聚类分析,建立n类,
最短距离法,假设n1和n2为两条河道,n1和n2最短距离为:
dn1,n2=min(du,v)(8)
式(8)中,dn1,n2为n1河道中所有一级指标和n2河道中所有一级指标之间最短距离,u为n1河道第p个一级指标得分,v为n2河道第p个一级指标得分,du,v为u和v之间的距离;
最长距离法,n1和n2最长距离为:
dn1,n2=max(du,v)(9)
类平均距离法,n1和n2类平均距离为:
式(10)中,p为一级指标个数;
b2:建立新分类
假设min0为距离矩阵d(0)最小值:
min0=min(d(0))(11)
假设min0是
b3:新分类距离计算
计算
b4:重复计算
返回步骤b2,重复计算,至n条河道聚类为1,则停止聚类;
b5:聚类
画聚类图,决定聚类数目。
实施例1:
以某一大型河道型水库众多支流为例,进行基于水华爆发的河道聚类,步骤如下:
1.建立河道水华爆发指标体系
河道水华爆发指标体系如图2所示,包括一级指标层和二级指标层;
一级指标层包括河道形态指标、水体动力指标、水体理化因子指标、水体光学指标和水体营养指标,共计5个一级指标;
二级指标层由二级指标构成,河道形态指标包括长度指标、面积指标和蜿蜒度指标,水体动力指标包括水位指标、流速指标和水体垂向稳定系数指标,水体理化因子指标包括温度指标、ph值指标、电导率指标、氧化还原电位指标和do指标,水体光学指标包括透明度指标、浊度指标、光衰减系数指标、真光层深度指标和混合层深度指标,水体营养指标包括总氮(tn)指标、总磷(tp)指标、溶解性硅酸盐(d-si)指标、氮磷(tn/tp)比指标、硅氮比(d-si/tn)指标、硅磷比(d-si/tp)指标和叶绿素(chla)指标,共计23个二级指标。
2.确定体系指标权重
共有10条河道参与聚类分析,以第1条河道为例,河道水华爆发指标数值如表1所示;
专家调查法各指标权重、熵值法各指标权重及主客观综合赋权法各指标权重如表2所示,偏好系数α取0.5。
表1河道水华爆发指标数值(以第1条河道为例)
表2指标权重
3.计算指标得分
共有10条河道参与聚类分析,23个二级指标,河道水华爆发一级指标得分如表3所示。
表3河道水华爆发一级指标得分
4.河道聚类
采用最短距离法进行距离计算,距离矩阵d(0)如表4所示。
表4距离矩阵d(0)
距离矩阵d(0)中,0.02为最小值,故将河道2、河道5和河道6合并为一类,假设为合并1,其他未发生合并的类建立新分类,距离矩阵d(1)如表5所示。
采用最短距离法进行距离计算,以河道1与合并1(河道2、河道5和河道6)为例,分别计算河道1与河道2、河道5和河道6的差值,取最小值。
表5距离矩阵d(1)
距离矩阵d(1)中,0.03为最小值,故将河道2、河道5、河道6和河道10合并为一类,假设为合并2,其他未发生合并的类建立新分类,距离矩阵d(2)如表6所示。
表6距离矩阵d(2)
距离矩阵d(2)中,0.05为最小值,故将河道2、河道5、河道6、河道7和河道10合并为一类,其他未发生合并的类建立新分类。以此类推,最终将10条河道合并为1时(聚类为1),聚类结束。
如图3所示,基于水华爆发的河道聚类结果,
当河道分为两类时,河道3、河道8为一类,其余河道为一类;
当河道分为三类时,河道1为一类,河道3、河道8为一类,其余河道为一类。