一种连续小波变换分析的叶片氮含量高光谱估算方法与流程

文档序号:12589562阅读:757来源:国知局
一种连续小波变换分析的叶片氮含量高光谱估算方法与流程

本发明属于农业技术领域,涉及一种连续小波变换分析的叶片氮含量高光谱估算方法。



背景技术:

小波变换分析将非平稳信号分解成各种小波的组合,在时间阈和频率域中同时进行信号分析,有效地区分信号中的突变部分和噪声,从而实现信号的去噪,在信号处理与压缩、图像处理、故障诊断、地球物理、医学生物学、环境科学等领域得到广泛应用。小波变换可以分为两类,连续小波变换和离散小波变换,在连续小波变换和离散小波变换之后,会产生一系列不同尺度下的小波系数,其实质就是小波函数与原始信号的相似性系数。连续小波变化把从负无穷到正无穷积分为零的小波函数在某个尺度下与待处理信号进行卷积,通过改变小波函数的尺度获取原始光谱信号的细写和轮廓信息。低尺度的小波系数反映了光谱信号的细节吸收特性,高尺度的小波系数对整个连续光谱曲线进行仿真。对于离散小波变换,低频近似系数反映原始光谱明显的吸收特征,决定整个光谱的形状,高频细节系数反映原始光谱的噪声及微小的吸收特征。对高光谱数据进行多尺度的离散小波变换,在每一尺度的小波分解后,特征数都将减少,因此小波分析的低频近似系数不仅保证了和原始信号较高的相似性,还起到了数据降维的作用。

逐步多元回归是多元线性回归分析中的一种常用数学方法,它通过设置变量进入和退出回归方程的显著性水平,将满足显著性水平的变量选入方程,从而达到降低数据维数,提高模型预测精度的目的。部分学者通过逐步回归分析的办法来进行作物生化参数的定量估算,虽然提高了模型的精度,但有些方程的变量之间存在高度相关性,使得模型的结果缺乏稳定性和普适性。



技术实现要素:

本发明的目的在于克服上述技术存在的缺陷,提供一种连续小波变换分析的叶片氮含量高光谱估算方法,该方法在MATLAB下,应用bior6.8、ciof5、db10、rbio6.8、sym8小波母函数对冬小麦冠层光谱信号进行一维连续小波变换,结合偏最小二乘回归算法(PLS)、随机森林回归算法(RF),构建叶片氮含量的高光谱估测模型,以期获取更为敏感的叶片氮含量特征参数,精度更高、更为普适的预测模型。

技术方案是:

一种连续小波变换分析的叶片氮含量高光谱估算方法,基于PLS和RF的叶片氮含量估算模型F值分别为294.94和8009.23,均通过了0.01水平的显著性检验,PLS预测模型的决定系数为0.78,所有的小波特征参数与叶片氮含量的关系更适合用非线性的指数模型来拟合,当采用偏最小二乘法进行叶片氮含量的线性回归时,对LNC<2%的部分拟合的非常完美。随机森林回归预测模型的精度非常高,决定系数为0.97,袋外数据均方根误差为0.09,伪复相关系数为0.85,针对预留的63个验证集的预测值与实测值拟合方程的决定系数为0.88,RMSE误差为0.08,REP误差为5.2。

与现有技术相比,本发明的有益效果:

主要体现在3个方面:能说明变量的重要性;解决了多重共线性问题;解决了非线性问题的拟合。

本发明方法基于偏最小二乘回归的变量投影重要性(VIP)可以确定在具有多重共线性的不同自变量中,对因变量最具有解释意义的自变量的重要性顺序。随机森林回归分别为从精确度的平均递减指标%IncMSE和均方误差的平均递减指数InNodePurity来衡量变量重要性。VIP、%IncMSE和InNodePurity值越大,说明变量对估算模型的解释性更强。

附图说明

图1是连续小波特征参数共线性诊断分布图(n=252);

图2是叶片氮含量预测模型检验(n=63),其中,图2A和图2B分别为基于PLS和RF的叶片氮含量预测模型检验。

具体实施方式

下面结合附图和具体实施方案对本发明的技术方案作进一步详细地说明。

本发明的整体思路是:

1.在MATLAB中应用bior6.8、ciof5、db10、rbio6.8、sym8小波母函数对冬小麦冠层光谱信号(包括原始冠层、导数光谱、对数变换光谱、连续统去除光谱)进行连续小波变换,对不同小波母函数在不同尺度上的小波系数和叶片氮含量进行线性相关分析认为,db10小波母函数在叶片氮含量估算上具有一定的优势,其中基于对数光谱和db10小波母函数的组合是叶片氮含量估算的最佳数据组合。

2.利用db10小波母函数和对数光谱数据进行连续小波变换,将所得小波系数与叶片氮含量进行相关分析,将所有尺度的决定系数进行降序排列,提取前5%的决定系数(0.73)所对应的区域为小波系数特征区域。从特征区域中共获取到4个尺度下的6个特征参数,分别为(S6,772nm)(代表第6尺度,波段为772nm处的小波系数),(S6,835nm),(S7,977nm),(S8,680nm),(S6,878nm)和(S9,888nm)。

3.基于6个特征参数的PLS和RF的叶片氮含量估算

基于冬小麦冠层的对数变换光谱,在db10小波母函数下,提取连续小波变换系数。对所筛选的不同尺度,不同波段处的小波特征参数进行相关性分析和多重共线性诊断,结果如图1所示,VIF为多重共线性诊断的方差膨胀因子,它的值越大,自变量之间共线性的可能性就越大。相关系数也是共线性的诊断指标,由图1可知,6类特征参数之间存在严重的相关性,变量间最小相关系数都在0.95以上,因此,考虑使用对变量独立性要求不高的偏最小二乘回归(PLS)和机器学习算法-随机森林回归(RF)来构建基于小波特征参数的叶片氮含量估算模型,结果如表1所示。

表1 基于小波特征参数的PLS、RF估算模型

Tab.1 LNC estimation based on wavelet features by PLS and RF regression methods

基于PLS和RF的叶片氮含量估算模型F值分别为294.94和8009.23,均通过了0.01水平的显著性检验,但是PLS预测模型的决定系数为0.78,模拟精度低于基于6个小波特征参数的一元回归模型。RMSE为0.5,说明模型的模拟效果较差,这是因为,所有的小波特征参数与叶片氮含量的关系更适合用非线性的指数模型来拟合,因此当采用偏最小二乘法进行叶片氮含量的线性回归时,对LNC<2%的部分拟合的非常完美,但是当LNC>3%后,PLS回归严重低估了叶片氮含量的实测值,从而降低了模型整体预测精度,导致RMSE误差较大。基于验证数据集的PLS模拟精度有所提高(图2),但决定系数仍然小于(S6,835nm)和(S8,680nm)的指数模型。随机森林回归预测模型的精度非常高,决定系数为0.97,袋外数据(OOB)均方根误差为0.09,伪复相关系数为0.85,针对预留的63个验证集的预测值与实测值拟合方程的决定系数为0.88,RMSE误差为0.08,REP误差为5.2,所有精度评价指标均优于单个特征参数的估算结果,因此可以认为随机森林回归方法通过多个变量之间的相互补充作用,明显提高了叶片氮含量的估算精度。基于偏最小二乘回归的变量投影重要性(VIP)可以确定在具有多重共线性的不同自变量中,对因变量最具有解释意义的自变量的重要性顺序。随机森林回归分别为从精确度的平均递减指标%IncMSE和均方误差的平均递减指数InNodePurity来衡量变量重要性。VIP、%IncMSE和InNodePurity值越大,说明变量对估算模型的解释性更强。

表2 基于小波特征参数的PLS、RF估算模型

Tab2 LNC estimation based on wavelet features by PLS and RF regression methods

以上所有的重要性指标定性的表明该变量对模型的重要性,VIP值>0.8,说明小波特征参数对冠层光谱特征具有较强的敏感性和较高程度的解释能力,其中(S6,878nm)对叶片氮含量的贡献率最强。

冠层高光谱反射率是随波长变化的连续变量,在可见光和近红外光谱的光谱分辨率达到纳米数量级,光谱通道数目的增加使得通过遥感技术获取目标物的信息量提升,敏感光谱的可选择性更为灵活和多样化,但是相邻波段之间相关性也提高。本文小波变换均充分利用了冠层光谱的丰富信息,使得信息的冗余度降低,但是小波变换系数之间仍然存在明显的多重共线性,因此传统逐步回归分析方法在高光谱数据的处理中需要谨慎使用,而偏最小二乘法和随机森林回归法不需要顾虑一般回归问题面临的多元共线性的问题,对作物冠层高光谱的分析能力得以体现,并在研究中表现不俗,既提高了预测的速度和效率,又增强了预测的机理性和准确性,基于连续小波变换特征参数的随机森林回归预测模型是叶片氮含量的最佳估算模型。

以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换均落入本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1