一种基于光谱新特征的反演叶片叶绿素含量的方法

文档序号:26050889发布日期:2021-07-27 15:25阅读:228来源:国知局
一种基于光谱新特征的反演叶片叶绿素含量的方法

本发明属于农作物叶片微量元素含量反演技术领域,特别是涉及一种基于套索算法与多元非线性回归算法组合反演叶片叶绿素含量的方法。



背景技术:

冬小麦等作物的长势可以通过其生理特征来表现,而其生理特征又决定了它对光吸收,透射和反射的变化。因此可以利用光谱反射率数据的差异来监测冬小麦等作物的叶绿素含量。高光谱遥感可以快速准确地反映出冬小麦等作物的生理生化参数,因此基于高光谱的光谱差异分析在植被遥感研究领域中有更广泛的应用前景。高光谱数据具有丰富的信息,但是某些相邻的波段间具有一定的相关性,这会导致光谱数据冗余度增加,造成反演结果失真,准确性降低。因此对于高光谱数据,如何将它降维而又最大限度保留有效光谱信息,成为了使用高光谱数据进行冬小麦等作物叶绿素含量反演的关键。

目前,叶片叶绿素含量反演的方法主要有三大类,基于植被指数方法、基于特征参数方法和基于机器学习的回归方法。其中,单一的植被指数舍弃了大量数据,没有很好地表征整个高光谱信息,从而可能会影响反演精度;利用红边指数及红边面积等特征参数反演叶绿素含量目前也被广泛使用,但是在模型的通用性上还存在一定的不足;近年来也有相关的学者使用神经网络等方法进行作物叶绿素含量监测,然而这些方法大多存在普遍适用性及可解释性不强等影响。目前对于高光谱数据的相关研究中使用套索算法降维后再使用多元非线性回归拟合反演叶片叶绿素含量的研究较少。



技术实现要素:

为了解决上述技术问题中的不足之处,本发明提供了一种基于光谱新特征的反演叶片叶绿素含量的方法,lasso-mnr模型可以在一定程度上降低光谱数据冗余度与噪声带来的消极影响,避免数据的多重共线性干扰,提高叶绿素含量反演的精度。

为了解决上述问题,本发明采用的技术方案是:

一种基于光谱新特征的反演叶片叶绿素含量的方法,包括以下步骤:

步骤1:求出光谱反射率与其光谱反射率平均值的差(△h)作为光谱新特征;再对该差求得绝对值,得到的数据集最终用于降维与反演;

步骤2:将光谱新特征(△h)数据集分为训练集与验证集,两个数据集之间的均值、标准差差异较小,具有很好的相似性;

步骤3:采用十折交叉验证方法对套索算法中的参数进行最优选择,确定效果达到最优的降维模型;

步骤4:将光谱新特征(△h)的训练数据集作为反演叶片叶绿素含量的自变量,基于步骤3获得的参数,利用套索算法对该部分数据进行降维处理;

步骤5:利用得到的降维数据作为最终回归模型的自变量进行多元非线性回归,建立带有套索算法约束的多元非线性回归模型,即lasso-mnr反演模型,利用lasso-mnr反演模型反演叶片叶绿素含量。

所述的方法,所述步骤4中,套索算法如下:

其中,多元线性模型表示为y=xβ+ε,β为回归系数,ε为误差;λ为非负数,用来平衡模型的方差与偏差,λ的选定依据广义交叉验证最小化的方式来确定。

所述的方法,所述步骤5中,利用上述lasso算法对新特征(△h)数据求得的降维数据作为最终回归模型的自变量进行多元非线性回归,建立带有套索算法约束的多元非线性回归模型,得到lasso-mnr反演模型;多元非线性回归的公式如下:

其中,ychlorophyll是叶绿素含量,x1,x2,…,xn是降维后的光谱新特征(△h)

数据,a1,a2,…,an,b1,b2,…,bn,c是反演系数。

所述的方法,所述步骤3中,mse取最小值15.71时,λ取最优值2.3×10-3时,lasso算法的效果最优。

所述的方法,所述步骤4中,基于套索算法将光谱新特征(△h)数据降维至59。

所述的方法,所述步骤5中,利用所述59个光谱新特征(△h)数据作为最终多元非线性回归模型的自变量进行回归拟合,最终建立带有套索算法约束的多元非线性回归模型,得到lasso-mnr反演模型。

所述的方法,还包括步骤6,利用r2、rmse作为评价指标得到模型反演精度,验证所述lasso-mnr模型的反演能力;r2越高,rmse越小,说明模型实测值和预测值之间的偏差越小,模型的拟合效果越好。

所述的方法,还包括步骤7,将所述模型的反演精度与其他反演模型相比较,验证所述lasso-mnr模型的效果更好。

本发明发展了一种以作物光谱反射率与其光谱反射率平均值的差(△h)作为光谱新特征的基于套索算法与多元非线性回归组合反演叶片叶绿素含量的方法;该光谱新特征具有以下优势:

1、该光谱新特征可以快速判断光谱反射率数据是否存在异常及其异常程度;

2、新特征数据的变化幅度可以明显表现出原光谱数据的变化,而且变化的差异更明显;

3、增加光谱曲线拐点,可以使数据在降维的过程中尽可能多的保留光谱的全部有效信息;

4、提出新的光谱曲线变换形式,降低实际测量光谱时外在噪音对光谱反射率的负面影响。

附图说明

图1为350-1330nm部分光谱反射率曲线新特征的描述(a图)与结果(b图);

图2为1481-1790nm部分光谱反射率曲线新特征的描述(a图)与结果(b图);

图3为1961-2300nm部分光谱反射率曲线新特征的描述(a图)与结果(b图);

图4为本方法提取结果精度(r2,rmse);

图5为本方法提取结果精度与其他方法结果精度对比;

具体实施方式

参考图1-5,本发明的一种基于光谱新特征的反演叶片叶绿素含量的方法(以冬小麦为例),包括以下步骤:

步骤1:利用viewspecpro软件对测量的冬小麦叶片asd光谱数据进行预处理,删除实测光谱中受水汽吸收带影响的光谱数据,对剩余三部分冬小麦光谱求出的新特征数据,即光谱反射率与该部分光谱数据的平均值的差(△h),再对差求得绝对值,得到的数据集就是最终用于降维与反演的数据。350-1330nm的结果如图1所示,1481-1790nm的结果如图2所示,1961-2300nm的结果如图3所示。该新特征数据可以充分体现光谱数据的变化,而且可以观察到光谱反射率值与均值的差异大小。

步骤2:将光谱新特征(△h)数据集分为训练集与验证集,两个数据集之间的均值、标准差差异较小,具有很好的相似性,说明数据集样本划分合理。

步骤3:将求出的光谱新特征(△h)数据集作为lasso-mnr模型反演冬小麦叶片叶绿素含量的自变量,共1630个自变量,再利用lasso算法对光谱新特征(△h)训练数据集进行降维处理,减小光谱数据的冗余度及噪声的消极影响,避免光谱数据的多重共线性的影响;套索算法的具体公式如下:

其中,多元线性模型表示为y=xβ+ε,β为回归系数,ε为误差;λ为非负数,用来平衡模型的方差与偏差,λ的选定依据广义交叉验证最小化的方式来确定。采用10折交叉验证对套索算法精度的误差进行估计,当lasso模型的mse取最小值15.71时,λ可以取到最优值2.3×10-3,此时,lasso模型的方差与偏差达到平衡,lasso模型降维效果最好。

步骤4:将光谱新特征(△h)的训练数据集作为反演叶片叶绿素含量的自变量,基于上述参数利用套索算法对该部分数据进行降维处理,用来减小光谱数据的冗余度,避免数据存在多重共线性。结果如步骤3所述,当mse最小时可以取到最优的λ,根据此时的λ值可以确定基于套索算法将光谱新特征(△h)数据集降维至59,而且所选变量基本上都分布在光谱曲线的各个拐角处,因此本次光谱新特征(△h)数据降维可以完整保留光谱信息,提高后续的叶绿素含量的反演精度。

步骤5:对lasso降维算法选取的59个光谱新特征(△h)的数据作为mnr的自变量进行回归拟合,建立带有套索算法约束的多元非线性回归模型,即lasso-mnr模型,利用lasso-mnr模型得到冬小麦叶片叶绿素含量的反演结果。

步骤6:利用r2、rmse作为评价指标得到模型反演精度,验证所述lasso-mnr模型的反演能力。r2越高,rmse越小,说明模型实测值和预测值之间的偏差越小,模型拟合效果越好,反演结果如图4所示。带有光谱新特征(△h)的lasso-mnr模型的r2=0.98,rmse=1.7,说明该模型几乎可以完全反演出冬小麦叶片叶绿素含量,且误差相对较小。

步骤7:将lasso-mnr模型的反演精度与其他反演模型相比较,验证所述lasso-mnr模型的精度更好,结果如图5所示。相较于其他模型(如bp神经网络回归,随机森林回归,多元线性回归),带有光谱新特征(△h)的lasso-mnr模型的反演精度最高,达到了0.98,均方误差最小,仅为1.7。由此可知,带有光谱新特征(△h)的lasso-mnr模型在反演冬小麦叶片叶绿素含量中可以达到很好的效果。

应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1