基于半监督光学分类的叶绿素a浓度反演方法

文档序号:37582292发布日期:2024-04-18 12:05阅读:6来源:国知局
基于半监督光学分类的叶绿素a浓度反演方法

本发明涉及机器学习,具体为基于半监督光学分类的叶绿素a浓度反演方法。


背景技术:

1、叶绿素a广泛存在与藻类之中,不仅反映了水体中浮游植物的光合作用水平,而且也是评估水体水质状况的重要指标。因此,进行叶绿素a浓度监测对防治水体富营养化、保证流域生态可持续开发及利用具有重要意义。

2、ⅱ类水体的光学特性非常复杂,会受到藻类、悬浮物以及有色溶解有机物等的共同影响。同时,水体的光学特性还具有明显的区域和季节特征,如果使用统一的模型反演ⅱ类水体的叶绿素a浓度,可能会无法适应不同时间及不同研究区域,导致反演结果不准确。此时,需要一种分类方法来区分水体环境,并为给定的水体环境条件选择更合适的算法,对水体进行高精度的叶绿素a浓度反演。目前,基于遥感反射率的大小和光谱特征发展出了很多水体光学分类方法,如层次聚类、k-means聚类、光谱形状分类等。但目前仍存在一定的问题,利用无监督分类方法进行水体分类,导致分类结果的解释性比较差,影响水体的主导因子不确定;利用相关特征结合阈值进行水体分类,存在确定的阈值受到人为主观因素的影响。


技术实现思路

1、本发明的目的在于提供基于半监督光学分类的叶绿素a浓度反演方法,以解决上述背景技术中提出的问题。

2、为了解决上述技术问题,本发明提供如下技术方案:

3、基于半监督光学分类的叶绿素a浓度反演方法,本方法进行ⅱ类水体chl-a遥感反演,包括如下步骤:

4、s100、数据预处理:采集研究区内的实测高光谱数据与水样,在实验室对水质参数进行测定,对实测高光谱数据做预处理,去除光谱曲线异常值后做均值计算,得到水体的光谱反射率;

5、s200、进行基于半监督的光学分类:利用若干种水体光学分类方法对样本数据进行分类;接着采用摩尔投票法,对若干种分类方法的分类结果进行统计,以确定样本的分类结果;接着,将分类结果投票数最高的样本数据作为标记样本,其他样本数据作为未标记样本;

6、最后,利用fcm聚类算法和随机森林分类器构建半监督分类模型,对标记样本和未标记样本进行分类;

7、s300、优选各类型水体chl-a反演模型:根据各类型水体的光学特性及生物组分特点,进行优化模型,分别反演chl-a;

8、s400、构建chl-a加权混合反演模型:基于半监督的样本分类结果,计算出每个类别的质心光谱,利用光谱角度距离度量实测光谱数据与分类结果的质心光谱的权重;

9、s500、对研究区水体chl-a浓度反演:将分类反演结果进行加权融合,得到最终结果,完成ⅱ类水体chl-a遥感反演产品。

10、根据步骤s100,水体光谱采样时要天气晴朗,水面平静,水体光谱采集时在同一个实验点位测量十次;同步在光谱测量点位水面下20~30cm处采集水样,使用实验室l5s紫外可见分光光度计测定样本chl-a。

11、对研究区野外实验实测光谱数据使用viewspecpro软件做数据预处理,通过观察同一个点位k组数据的稳定性,去除k组数据中波动偏离正常范围的异常值后再做均值计算,通过下式计算各点位水体反射率rrs,绘制出实测水体光谱曲线图:

12、

13、其中,lw为离水辐亮度,ed(0+)为水面总入射辐照度,lw的计算公式如下:

14、lw=lsw-r*lsky

15、其中,lsw为离水总辐射度,lsky为天空漫反射光辐亮度,r为气水界面对天空光的反射率;

16、ed(0+)的计算公式如下:

17、

18、其中,lp为标准灰板的辐亮度,ρρ为标准灰板的反射率。

19、根据步骤s200,目前光学分类方法众多,本发明选取了其中典型的几个分类方法来进行分类,综合考虑这些方法的分类结果,最终确定认同度较高的样本及其水体类型作为标记样本。选取若干个光学分类方法进行分类,步骤如下:

20、s201、利用三波段比值490nm、560nm、665nm将实测数据进行分类操作,具体公式如下:

21、br1=rrs(490)/rrs(560)

22、br2=rrs(665)/rrs(560)

23、其中,rrs(i)为波段i的遥感反射率,br1≥a为清澈水体,br1<a且br2≥b为藻类主导型水体,br1<a且br2<b为中间型水体,其中a和b是正小数;

24、s202、采用ci(672)及ci(555)指数将实测数据进行分类操作,具体公式如下:

25、ci(672)=rrs(672)-[rrs(488)+(672-488)/(751-488)×(rrs(751)-rrs(488))]

26、≈rrs(672)-[0.3rrs(488)+0.7rrs(751)]

27、ci(555)=rrs(555)-[rrs(488)+(555-488)/(751-488)×(rrs(751)-rrs(488))]

28、≈rrs(555)-[0.25rrs(488)+0.75rrs(751)]

29、其中,ci(672)<c为藻类主导型水体,ci(672)≥c且ci(555)<d且rrs(555)≥e为悬浮物主导型水体,ci(672)≥c且ci(555)≥d且rrs(555)<e为中间型水体,其中c、d、e是正小数;

30、s203、采用ntd675指标对实测高光谱数据进行分类操作,具体公式如下:

31、

32、其中,nrrs(λ)是指波长λ相较于rrs(675)归一化的rrs,根据nrrs(λ)按照不同的阈值将水域分为三种类型;ntd675>f为藻类主导型水体,0<ntd675<f为中间型水体,ntd675<0为悬浮物主导型水体,其中f是正小数;

33、s204、采用波段反射率比值的分类方法,具体公式如下:

34、s1=[rrs(g)-rrs(650)]/(g-650)

35、s2=[rrs(650)-rrs(nir)]/(650-nir)

36、其中,rrs(g)表示绿波段中反射率最大的值,rrs(nir)表示近红波段中反射率最大的值;利用s1和s2两个斜率的值和关系将分为三类;s2>0为藻类主导型水体,s1<s2≤0为中间型水体,s2≤s1<0为悬浮物主导型水体。

37、采用摩尔投票法,对步骤s201-s204的光学分类方法的分类结果进行统计,最终确定样本的分类结果;同时,将分类结果投票数最高的样本数据作为标记样本,其他样本数据作为未标记样本;本发明根据光学分类方法的分类结果结合ⅱ类水域的实际情况,确定水体分为三类,类型一为藻类主导型水体,类型二为中间型水体,类型三为悬浮物主导型水体。

38、基于标记样本和未标记样本的数据,利用fcm聚类算法和随机森林分类器实现半监督算法;

39、首先采用fcm聚类分析对标记样本和未标记样本进行聚类操作,根据样本的类别隶属度选择高隶属度的样本作为预标记样本;同时,利用标记样本进行训练随机森林分类器;然后,利用训练好的分类器对预标记样本进行分类,并根据分类的置信度进行二次选择;最后将高置信度的样本和分类结果加入到标记样本中;在后续迭代过程中,fcm聚类算法对原标记样本、新增的标记样本以及剩余的未标记样本进行聚类;接着不断重复该迭代过程,直到未标记的样本中不存在预测概率高的样本;

40、通过上述半监督的迭代过程,利用标记样本和未标记样本数据挖掘未标记样本中的信息。

41、根据步骤s300,根据各类型水体的光学特性和生物组分特点,结合chl-a反演单波段模型、蓝绿波段模型、近红-红波段模型、红绿波段模型、ndci模型以及三波段模型等多种经典算法。采用决定系数和均方根误差作为评价指标,选取适合各类型水体的chl-a反演模型,具体计算公式如下:

42、

43、其中,是样本的预测值,yi是样本的真实值,是样本真实值的平均值,n是样本数量;

44、

45、其中,m是样本数量,是样本的预测值,yi是样本的真实值。

46、根据步骤s400,水体具有渐变性、均一性。若不同类型水体使用不同的模型,会导致类别边界出现数值跳变问题,不符合其特性。根据实测高光谱数据的分类结果,计算各个类别光谱的光谱均值;利用光谱角度距离度量实测光谱数据与各类型水体的质心光谱之间相似性,计算公式如下:

47、

48、其中,xi为实测光谱数据第i波段遥感反射率,yi为质心光谱的第i波段遥感反射率。

49、根据步骤s400,光谱角度距离表征了实测光谱数据与质心光谱的相似度,相似度越高,sad越小,反之则越大;进一步将sad转换为权重,使得相似度越高,w值越大,反之则越小;计算公式如下:

50、

51、其中,i表示第i类水体,wi为第i类水体的权重,sadi为第i类水体的光谱角度距离,最终得到各类型水体在每个样本点的权重;

52、接着,利用获取到的权重以及各类型的优选模型构建加权反演模型,具体公式如下:

53、wq=wq1×w1+wq2×w2+wq3×w3

54、其中,wq1是藻类主导型水体的水质参数优化模型在同一光谱数据的反演结果,wq2是中间型水体的水质参数优化模型在同一光谱数据的反演结果,wq3是悬浮物主导型水体的水质参数优化模型在同一光谱数据的反演结果;w1是藻类主导型水体根据在同一光谱数据的权重,w2是中间型水体根据在同一光谱数据的权重,w3是悬浮物主导型水体根据在同一光谱数据的权重;接着,通过决定系数、均方根误差作为指标评价模型的预测精度,进行数据可视化展现模型效果。

55、根据步骤s500,通过分类得到的各类型水体质心光谱及经过预处理后的实测光谱数据,利用光谱角度距离计算权重,使用加权混合模型对研究区水体chl-a浓度进行反演。

56、与现有技术相比,本发明所达到的有益效果是:

57、现有的水体光学分类方法众多,分类标准不统一,对于同一个样本点确定的水体类型可能不同。本发明选取几种典型的水体分类方法综合考虑,与现有的光学分类方法相比,这种分类方法可移植性更高,分类结果认可度更高,且不受人为主观因素及噪声的影响。

58、本发明相较于其他光学分类方法,不仅只依赖于水体遥感反射率波形特征或固有光学特征,并且同时能够充分挖掘采集样本数据之间的内部信息结构。

59、本发明的chl-a浓度反演模型,能够针对不同时空的水体进行chl-a浓度反演,能够一定程度上避免了传统chl-a反演算法的季节和区域局限性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1