滨海湿地植被地上生物量GAN模型自学习遥感反演方法与流程

文档序号:29970232发布日期:2022-05-11 11:17阅读:421来源:国知局
滨海湿地植被地上生物量GAN模型自学习遥感反演方法与流程
滨海湿地植被地上生物量gan模型自学习遥感反演方法
技术领域
1.本发明涉及卫星遥感技术领域,特别是涉及滨海湿地植被地上生物量gan模型自学习遥感反演方法。


背景技术:

2.随着全球对“蓝碳”的关注度上升,滨海湿地作为海岸带“蓝碳”生态系统的主体,对碳循环的重要性也突显出来。
3.湿生植被是滨海湿地生态系统的重要组成部分,其生物量是衡量滨海湿地生态系统初级生产力的主要指标之一,其不仅是研究滨海湿地生态系统结构和功能的基础,同时也是研究滨海湿地生态系统的固碳能力、碳循环乃至预测全球变化的科学依据。
4.现有技术中,关于滨海湿地生物量的大面积估算主要有2种手段:
5.1、通过人工测量推算的方法:该方法属于传统方法,存在着明显缺陷,体现在:该方法需要基于现场采集的大量分布的各类型样方生物量样本数据,计算各类型样方地上部分干重平均值,方可得到各植被类型中单位面积地上部分生物量,进而推算出区域内的地上总生物量。该方法需要进行大量的野外调查获取各植被类型的分布信息和生物量样本,这将耗费大量的人力物力,而且通过单位面积生物量推算研究区生物量的方式精确性往往不高。
6.2、通过卫星遥感反演的方法:该方法基于地上生物量样本和卫星地物光谱特征建立模型反演植被生物量,而且可以实现对研究区域内植被信息分布的精确把控,相比于传统的估算模式有很大优势,但还存在着如下缺陷:反演模型的构建需要大量的现场样本进行训练,而滨海湿地多位于无人区,自然条件比较恶劣,调查人员难以收集到大量的生物量样本。在现场样本数量少的情况下,所构建的反演模型会出现过拟合、泛化性能低的问题,反演结果不具备参考和应用价值。
7.近年来,基于神经网络、深度学习结合卫星遥感技术,在很多领域取得了成功应用,但在样本不足情况下的滨海湿地生物量反演方面尚缺乏行之有效的解决办法,而精确、有效地测算滨海湿地生物量,对滨海湿地生态环境监测和保护都具有重要意义,因此,有必要对现有的问题提供技术解决方法。


技术实现要素:

8.本发明提供了滨海湿地植被地上生物量gan模型自学习遥感反演方法,该方法通过优选特征因子作为约束条件,搭建基于生成对抗网络的生物量样本增广模型,实现了基于联合卫星多光谱数据和现场采样数据的滨海湿地植被地上生物量样本的扩充,并分别构建了芦苇、碱蓬、柽柳和互花米草4种滨海湿地植被生物量的多元回归模型,得到了良好的生物量反演结果。
9.为了实现上述目的,本发明的技术方案为:
10.滨海湿地植被地上生物量gan模型自学习遥感反演方法,包括如下步骤:
11.步骤1、针对滨海湿地植被优选出gan网络的特征约束因子,设计受特征约束因子约束的生成对抗网络模型;
12.步骤2、利用所设计的生成对抗网络模型生成的生物量样本数据构建线性回归模型反演植被地上生物量。
13.优选的,所述的步骤1中,包括如下具体步骤:
14.s1、获取卫星多光谱遥感图像数据;
15.s2、现场测量植被冠层光谱数据,人工采集样本,利用光谱处理软件view spec pro对所测的植被冠层光谱数据分析和处理,从而得到植被的现场高光谱数据,经实验室内烘干称重处理,计算出单位面积的地上生物量值;
16.s3、进行特征提取,基于相关性分析筛选特征变量、确定特征约束因子;
17.s4、遥感多光谱数据与现场高光谱数据的波段等效转换;
18.s5、获得基于特征约束因子约束的生成对抗网络模型。
19.优选的,所述的s2中,在满足天气状况良好、光谱采集时间合适的情况下,进行现场样本采集,采集的方法为:
20.记录现场数据采集站点的植被类型,选取合适样方,以手持gps记录样方的经纬度坐标,记录样方内植被生长参数,测量植被冠层光谱,采集现场样方内植被样本;
21.对于草本植被样本,在植被生长均匀区域以0.5m
×
0.5m为样方采集植物样本,在植被生长不均匀区域,于10m
×
10m内随机获取5个0.5m
×
0.5m子样方内的植被样本;对于灌丛植被,获取植被的冠幅宽度、基直径,并采集部分地上干、枝样本;
22.将上述条件下具有代表性的植被样方内的植株齐地割下,标记站点信息;
23.所采集的植被样本装袋带回实验室,使用烘箱将植物样本在80℃恒温下烘干24小时至恒重后称其干重,并结合现场调查记录信息计算出单位面积的生物量值,单位为kg/m2。
24.优选的,所述的s3包括如下步骤:
25.s31、将现场高光谱数据模拟的多光谱数据的光谱特征和植被指数特征作为待选变量,通过相关性分析方法对这些特征进行筛选,筛选出的优选变量与光谱特征和生物量构成gan模型的特征约束因子,用于对模型生成的生物量样本进行约束。
26.优选的,所述的步骤s31中,对光谱特征中10个光谱波段进行两两组合带入6种植被指数计算得到270个植被指数特征变量,将10个光谱特征和270个植被指数特征变量共280个特征变量作为待选变量,6个植被指数指的是ndvi、dvi、rvi、savi、msavi和osavi;基于皮尔逊相关系数r的计算公式(1)计算出待选变量中的生物量特征强相关且特征内部之间弱相关的变量作为优选变量;其中r的绝对值越接近1为强相关;r的绝对值越接近0为弱相关;将优选变量作为gan生成样本的部分特征约束因子,并用于植被生物量反演模型的构建:
[0027][0028]
式中,r为皮尔逊相关系数,xi和yi为自变量和因变量在各样点i的值,n为样点个数。
[0029]
优选的,所述的s4包括如下步骤:
[0030]
通过植被的现场高光谱数据与卫星多光谱遥感图像数据之间的光谱转换模型,制作模拟卫星的光谱-生物量样本数据集,作为滨海湿地植被生物量数据扩充的基础数据;转换操作如下:
[0031]
(1)卫星波段转换:建立现场高光谱数据中的窄波段与卫星多光谱遥感图像数据中的宽波段之间的转换,采用公式(2)进行计算:
[0032][0033]
式中ρ是模拟卫星宽波段的反射率,λ
min
、λ
max
分别为卫星传感器光谱探测的起始和终止波长,s(λ)为卫星传感器在λ波长的光谱响应函数值,ρ(λ)是湿地植被冠层光谱在λ波长的反射率;
[0034]
(2)宽波段间线性转换:建立模拟卫星光谱与卫星光谱的线性转换关系,利用模拟卫星数据与卫星数据构建线性回归模型对两数据源的各对应波段进行反射率转换。
[0035]
优选的,所述的s5包括如下步骤:
[0036]
针对基于模拟卫星的光谱-生物量样本数据集,设计gan-fc模型,在生成样本的过程中加入特征约束因子,使模型在生成伪样本集的同时控制其特征的合理性;各植被类型基于gan-fc模型的样本集生成方法为:
[0037]
对真实样本数据进行预处理:
[0038]
按照规则(1)将真实样本分为s组,并将这s组样本分别输入gan-fc模型;基于输入的真实样本以及随机噪声,gan模型的生成器和判别器不断训练,生成了对应的s组新的样本;基于特征约束因子对新的样本进行筛选;
[0039]
选择满足规则(2)约束因子条件的新样本作为最终生成的样本数据,从最终生成的样本数据集中随机选择一定数量的样本作为训练样本,用于构建生物量反演模型;
[0040]
所述的规则(1)指的是:基于现有生物量数据范围0-5.29kg/m2;当生物量小于1kg/m2时,按0.1kg/m2的间隔分组;当生物量大于1kg/m2时,按0.5kg/m2的间隔分组;少于3个样本的组被合并到相邻的两组中样本数量较少的一组;
[0041]
所述的规则(2)指的是:根据真实样本的特征约束因子构建约束条件:光谱反射阈值增加ps=0.001,植被指数阈值增加pf=0.003;保留光谱和植被指数特征满足这2项特征约束条件的生成样本作为输出样本,即gan-fc生成的样本数据。
[0042]
优选的,所述的步骤2包括如下具体步骤:
[0043]
将优选变量作为自变量,将植被地上生物量作为因变量,建立多元线性回归模型:
[0044]
yi=b0+b1x
i1
+b2x
i2
+

+bkx
i3
+εi(i=1,2,3,...,n)(3)
[0045]
式中,y为植被地上生物量,x为该植被的优选变量,b为回归参数,εi为随机误差,n为样本个数;
[0046]
基于生成的生物量样本集,利用统计软件spss19.0进行回归建模,得到各植被的地上生物量估算模型;
[0047]
衡量反演模型的精度时,利用现场真实生物量与多元线性回归模型反演得到的生物量进行比较,通过计算两者的r,平均绝对误差(meanabsoluteerror,mae,公式4)和均方根误差(rootmeansquareerror,rmse,公式5)对模型进行精度评价:
[0048][0049][0050]
其中,yi和y分别为第i个样本的反演的生物量与真实的生物量,n是样本数量。
[0051]
本发明滨海湿地植被地上生物量gan模型自学习遥感反演方法的有益效果为:
[0052]
本发明将滨海湿地植被特有的光谱特征和植被指数特征提取出来,优选出多个特征作为对抗生成网络模型的约束因子,设计出一种针对于滨海湿地植被生物量样本扩充的gan-fc模型,并基于所生成的生物量样本构建反演模型进行滨海湿地植被地上生物量估算。利用部分现场数据验证了基于生成样本的生物量反演结果,并与基于真实样本的反演结果进行了比较,实验结果证明了基于该模型生成的样本能够提高滨海湿地植被生物量的反演精度,解决因现场生物量数据少导致的滨海湿地植被生物量反演模型难构建和反演精度不高的问题。
附图说明
[0053]
图1、研究区及现场调查站点分布示意图;
[0054]
图2、基于gan-fc模型的滨海湿地植被生物量样本生成模型;
[0055]
图3、黄河口湿地盐沼植被生物量结果图;
[0056]
图4、胶州湾湿地盐沼植被生物量结果图。
具体实施方式
[0057]
以下所述,是以阶梯递进的方式对本发明的实施方式详细说明,该说明仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
[0058]
本发明的描述中,需要说明的是,术语“上”“下”“左”“右”“顶”“底”“内”“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以及特定的方位构造和操作,因此不能理解为对本发明的限制。
[0059]
步骤1、针对滨海湿地植被优选出gan网络的特征约束因子,设计受特征约束因子约束的生成对抗网络模型(generative adversrial networks with feature constraint,gan-fc):
[0060]
s1、获取卫星多光谱遥感图像数据:本发明利用数据包括sentinel-2卫星于2019年9月24日覆盖山东省东营市黄河口滨海湿地和2019年10月14日覆盖山东省青岛市胶州湾湿地的多光谱遥感图像数据;
[0061]
s2、现场测量植被冠层光谱数据,人工采集样本,计算出单位面积的生物量值,利用光谱处理软件view spec pro对所测的植被冠层光谱数据分析和处理,从而得到植被的现场高光谱数据;
[0062]
本发明以2013-2019年黄河口滨海湿地和2019年胶州湾湿地的现场采样数据为人工采集样本。研究区地理位置、彩色合成图像和现场调查站点如图1所示。黄河口湿地研究
区面积为2753km
×
3072km,生长有芦苇、碱蓬、柽柳和互花米草四种盐沼植被,现场生物量采样数据统计结果为芦苇246个、碱蓬37个、柽柳混生39个和互花米草13个,共计335个生物量样本。胶州湾湿地研究区内大面积生长的有芦苇、碱蓬和互花米草三种盐沼植被,这里选取了互花米草集中分布的3个区域进行监测,现场生物量采样数据全部为互花米草,共15个样本。可以看出,除芦苇以外,植被生物量样本数据少,且大多采样于植被群落边缘地带。
[0063]
在满足天气状况良好、光谱采集时间合适的情况下,进行现场数据采集。记录站点及其附近地物类型,选取合适样方,以手持gps记录样方的经纬度坐标,记录样方内植被生长参数,测量植被冠层光谱数据,采集现场样方内植被样本。对于草本植被样本,在植被生长均匀区域以0.5m
×
0.5m为样方采集植物样本,在植被生长不均匀区域,于10m
×
10m内随机获取5个0.5m
×
0.5m子样方内的植被样本。对于灌丛植被,获取植被的冠幅宽度、基直径,并采集部分地上干、枝样本。将上述条件下具有代表性的植被样方内的植株齐地割下,标记站点信息。所采集的植被样本装袋带回实验室。使用烘箱将植物样本在80℃恒温下烘干24小时至恒重后称其干重,并结合现场调查记录信息计算出单位面积的生物量值,单位为kg/m2。利用光谱处理软件view spec pro对所测的植被冠层光谱数据分析和处理,从而得到植被的现场高光谱数据。
[0064]
表1盐沼植被地上生物量现场数据统计结果
[0065][0066]
s3、进行特征提取,将提取到的光谱特征和植被指数特征作为待选变量,并基于相关性分析筛选待选变量:
[0067]
提取多光谱遥感图像数据的光谱特征、植被指数特征作为待选变量,从中筛选出的特征变量将作为gan的部分特征约束因子,并用于滨海湿地植被生物量反演,本发明所述的反演即反向推算,在具体实施中,将280个特征变量作为待选变量,其中包括10个光谱波段、基于6种植被指数(ndvi、dvi、rvi、savi、msavi和osavi)计算出的270个植被指数特征;基于皮尔逊相关系数r(公式(1))计算出与生物量强相关(r的绝对值越接近1)且特征内部之间弱相关(r的绝对值越接近0)的待选变量作为优选变量(5-7个左右),之后将优选变量作为gan生成样本的部分特征约束因子,并用于植被生物量反演模型的构建,公式(1)如下:
[0068][0069]
式中,r为皮尔逊相关系数,xi、yi为自变量、因变量在各样点i的值,n为样点个数。
[0070]
s4、遥感多光谱数据与现场高光谱数据的波段等效转换;
[0071]
通过建立湿地植被现场冠层高光谱数据与sentinel-2卫星多光谱遥感图像数据之间的光谱转换模型,制作模拟sentinel-2卫星的光谱-生物量样本数据集,作为滨海湿地植被生物量数据扩充的基础数据;转换操作如下:
[0072]
(1)卫星波段转换:建立现场高光谱数据中窄波段与卫星多光谱遥感图像数据中宽波段之间的转换,采用公式(2)进行计算:
[0073][0074]
式中,ρ是模拟卫星宽波段的反射率,λ
min
、λ
max
分别为卫星传感器光谱探测的起始和终止波长,s(λ)为sentinel-2传感器在λ波长的光谱响应函数值,ρ(λ)是湿地植被冠层光谱在λ波长的反射率。由于现场测量光谱覆盖范围(350-1050nm)与哨兵2a卫星前10个波段(band1-band9)的覆盖范围(400-1000nm)相对应,所以我们得到的模拟卫星数据为10个波段。
[0075]
(2)宽波段间线性转换:建立模拟卫星光谱与卫星光谱的线性转换关系。理想状态下经过步骤(1)得到的模拟卫星数据与真实卫星数据的反射率是高度相近的。而在数据获取方式、获取时间、测量条件等不确定因素的影响下,模拟卫星数据与卫星数据的反射率可能会存在一定的偏差。为降低偏差对后续生物量反演工作的影响,利用模拟卫星数据与sentinel-2数据构建线性回归模型对两数据源的各对应波段进行反射率转换。
[0076]
s5、获得基于特征约束因子约束的生成对抗网络模型:
[0077]
针对基于sentinel-2的滨海湿地光谱-生物量样本数据集,设计了如图2所示的gan-fc模型,在生成样本的过程中加入了特征约束因子,使模型在生成伪样本集的同时控制其特征的合理性。
[0078]
具体来说,本发明首先对真实样本数据进行预处理,按照规则(1)将样本分为s组,并将这s组样本分别输入gan-fc模型。基于输入的真实样本和随机噪声,gan模型的生成器和判别器不断训练,生成了对应的s组新的样本。新样本虽然与真实样本具有一定的相似性,但为了使新样本更好的用于生物量估算,本发明基于特征约束因子对新的样本进行筛选。
[0079]
本发明实施中,作为gan特征约束因子有16-18个,包括光谱特征10个、生物量特征1个和植被指数特征(优选变量)5-7个。
[0080]
本发明从真实样本中提取特征作为特征约束因子来限制生成的样本。选择满足规则(2)中的约束条件的新样本作为最终生成的样本数据。从生成的数据集中随机选择一定数量的样本作为训练样本,用于构建生物量反演模型,这里选择了芦苇、碱蓬和柽柳样本各300个,互花米草样本为200个,参与反演的生成样本的统计量描述见表2。
[0081]
规则(1):本发明所用的生物量数据范围是0-5.29kg/m2。当生物量小于1kg/m2时,按0.1kg/m2的间隔分组;当生物量大于1kg/m2时,按0.5kg/m2的间隔分组。少于3个样本的组被合并到相邻两个组中样本量较少的一组。
[0082]
规则(2):根据真实样本的16-18个特征,光谱反射阈值增加ps=0.001,植被指数阈值增加pf=0.003,满足上述特征约束条件的生成样本作为输出样本,即gan-fc生成的样本数据。
[0083]
表2基于生成对抗网络生成的盐沼植被地上生物量样本数据统计结果
[0084][0085]
步骤2、利用gan-fc模型生成的生物量样本数据构建线性回归模型反演植被地上生物量。
[0086]
将优选变量作为自变量,将植被地上生物量作为因变量,建立多元线性回归模型(multiplelinearregressionmodel,mlrm,公式(3))来估算滨海湿地盐沼植被地上生物量。
[0087]
yi=b0+b1x
i1
+b2x
i2
+

+bkx
i3
+εi(i=1,2,3,...,n)(3)
[0088]
式中,y为植被地上生物量,x为该植被的优选变量,b为回归参数,εi为随机误差,n为样本个数。
[0089]
基于生成的生物量样本集,利用统计软件spss19.0进行回归建模,得到以各植被的地上生物量估算模型。衡量各模型的估算精度时,利用现场真实数据与反演得到的生物量进行比较,通过计算两者的皮尔逊相关系数r,平均绝对误差(meanabsoluteerror,mae,公式4)和均方根误差(rootmeansquareerror,rmse,公式5)对模型进行精度评价:
[0090][0091][0092]
式中,yi和y分别为第i个样本的反演的生物量与真实的生物量,n是样本数量。
[0093]
总结:滨海湿地生物量反演结果和精度评价:
[0094]
本发明在相同的实验条件下,将基于扩增样本前后的滨海湿地生物量反演效果进行了对比。扩增样本前的生物量反演模型是基于现场数据构建的样本集进行建模,并利用部分现场样本进行生物量反演结果验证。扩增样本后的生物量反演模型是基于gan-fc模型生成的样本集进行建模,并利用与扩增样本前的相同的现场样本进行生物量反演结果验证。胶州湾湿地研究区进行反演的盐沼植被为互花米草。黄河口湿地研究区进行反演的盐沼植被包括芦苇、碱蓬、柽柳混生和互花米草共4类植被,各盐沼植被的生物量反演模型对比的精度评价结果见表3。表中各类植被包含两行,上面的一行为样本扩充前的生物量反演模型精度评价,下面一行为样本扩充后的生物量反演模型精度评价。可以看出,基于生成的每类样本的生物量反演误差低于基于现场样本的生物量反演误差。黄河口湿地盐沼植被生物量估算结果如图3所示。
[0095]
表3基于gan扩充样本前后的生物量反演模型精度评价
[0096][0097]
胶州湾湿地反演结果精度评价结果见表4。可以看出,基于生成的200个互花米草样本的生物量反演误差低于基于现场有限的15个样本估算出的生物量反演误差。且在现场样本较少时,基于生成样本得到的生物量反演结果更加客观(r=0.643)。胶州湾湿地互花米草生物量估算结果如图4所示。
[0098]
表4基于gan扩充样本前后的生物量反演模型精度评价
[0099][0100]
综上所述,将本发明的gan-fc模型应用于黄河口滨海湿地和胶州湾湿地盐沼植被的地上生物量反演,反演精度相比于有限的现场生物量样本得到的反演精度有所提高。基于有限的现场生物量样本的反演结果精度评价为:芦苇rmse=0.53kg/m2,碱蓬rmse=0.15kg/m2,柽柳混生rmse=0.35kg/m2,互花米草rmse=0.46kg/m2;胶州湾湿地的互花米草rmse=0.11kg/m2。基于本发明的模型生成的样本得到的反演结果精度评价为:黄河口湿地的芦苇rmse=0.52kg/m2,碱蓬rmse=0.16kg/m2,柽柳混生rmse=0.29kg/m2,互花米草rmse=0.37kg/m2;胶州湾湿地的互花米草rmse=0.05kg/m2。因此,验证了该方法生成的样本在少样本情况下的滨海湿地植被地上生物量反演的有效性和可行性。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1