基于费氏线性判别和支持向量机技术的冬小麦穗赤霉病识别方法与流程

文档序号:18896159发布日期:2019-10-18 21:18阅读:305来源:国知局
基于费氏线性判别和支持向量机技术的冬小麦穗赤霉病识别方法与流程

本发明涉及冬小麦穗赤霉病识别技术领域,具体来说是基于费氏线性判别和支持向量机技术的冬小麦穗赤霉病识别方法。



背景技术:

目前高光谱遥感技术在小麦病害监测领域的研究已经比较广泛,对小麦病害的遥感监测和预测方面,研究主要集中在小麦条锈病,小麦白粉病的遥感监测和预测方法研究上。然而,相比较小麦条锈病,白粉病的研究目前利用高光谱技术对小麦镰孢菌感染的研究较少,主要研究集中在实验室条件下小麦籽粒真菌病分类上或者仅仅是对小麦穗部镰孢菌发生进行识别,对其病情的程度尚未分类区分。

经过文献调研发现,冬小麦单穗条件下,赤霉病光谱响应特征还尚未被系统的研究归纳。由于地面光谱的观测条件可控、仪器发展成熟,能够回避较多的噪声及干扰,通过对数据进行比较细致地分析和处理,可对作物病害遥感监测进行一些机理性研究。同时,这类研究也是航空/航天遥感尺度病害监测的基础。

非成像高光谱技术具有光谱分辨率高、波段数多、信息量丰富等特点,并且近地采集的非成像高光谱数据受大气和外界环境影响小、信噪比高,更接近于地物的真实光谱。因此,采用非成像光谱技术,单穗条件下,研究小麦赤霉病的病害光谱响应特征,对后续冬小麦赤霉病识别研究具有重大意义。



技术实现要素:

本发明的目的是为了解决现有技术中遥感领域尚无以单穗为载体进行小麦赤霉病研究的缺陷,提供一种基于费氏线性判别和支持向量机技术的冬小麦穗赤霉病识别方法来解决上述问题。

为了实现上述目的,本发明的技术方案如下:

一种基于费氏线性判别和支持向量机技术的冬小麦穗赤霉病识别方法,包括以下步骤:

数据获取:获取光谱仪所测定冬小麦单穗光谱数据,小麦单穗光谱数据包括每株穗正面、侧面和直立三个角度的高光谱数据;

近地高光谱数据预处理:对冬小麦单穗光谱数据进行标准化处理,并分别进行一阶微分计算、连续统去除计算以及常用植被指数计算,获得对应的微分特征、连续统去除特征以及植被指数特征;

建模特征的选择:筛选与赤霉病严重度相关性高且极显著的光谱特征以及三种严重程度类间差异显著的特征;

费氏线性判别与支持向量机相结合模型的建立:通过地面高光谱测量以及严重度调查的数据构建费氏线性判别与支持向量机相结合模型;

获得小麦穗高光谱识别结果:把近地高光谱数据的最优特征集作为输入变量,分别输入费氏线性判别与支持向量机相结合模型,得到冬小麦穗赤霉病的识别结果。

所述的近地高光谱数据预处理包括以下步骤:

高光谱数据标准化:

选取a区域的健康样本光谱数据作为标准样本,并且以病害样本光谱数据和健康样本光谱数据作为基准,分别用a区域的健康样本光谱数据的均值除以b区域和c区域健康样本光谱数据的均值,得到两条比值曲线,这两条比值曲线用于反映两组光谱测量的差异性,i波长下的比率ratioi计算公式为:

其中i表示波长,∑指区域内所有健康样本在波长i处的反射率之和,

ref表示反射率,a、b和c分别代表a区域、b区域和c区域;

将b区域和c区域获取的每一条样本的原始光谱数据与相应的比率曲线相乘,即得到标准化后的光谱数据,i波长下的标准化的计算公式为:

其中,表示b区域或c区域样本光谱在波长i处的反射率,表示标准化后的反射率;

获取一阶微分光谱数据,对标准化后的光谱采用差分方法近似计算,其计算公式如下:

ρ'(λi)=[ρ(λi+1)-ρ(λi-1)]/(2δλ),

其中,λi为每个波段波长,ρ'(λi)为波长λi一阶微分,δλ为波长λi-1到λi的间隔,再求得一阶微分特征;

获取连续统去除特征:选取光谱的550nm-750nm波段进行连续统去除获得相对光谱反射率,在此基础上分别求出波段深度、吸收峰面积、波段宽度以及吸收特征的波段位置;

获取植被指数:根据经验选择若干个常用植物胁迫研究的植被指数,根据每个植被指数对应计算公式获取相应的指数特征。

所述建模特征的选择包括以下步骤:

对数据预处理得到的一阶微分特征、连续统去除特征以及植被指数三种光谱特征分别与冬小麦赤霉病的严重度进行相关性分析,获得相关系数以及p-value值,利用阈值法筛选出与赤霉病高相关性r2>0.49且极显著相关p-value<0.001的光谱特征;

分别对健康、轻度、重度三类样本两两组合,采用独立样本t检验方法筛选出在三个类别组合中均呈现显著差异的特征;

将以上两个条件筛选的两个光谱特征集取交集,获得对赤霉病敏感且在三类不同病害严重度类间有显著差异的最优光谱特征集;

从正面、侧面以及直立三个角度重复上述步骤分别获得适合其赤霉病识别的最优光谱特征集。

所述费氏线性判别与支持向量机相结合模型的建立包括以下步骤:

设定费氏线性判别模型:利用费氏线性判别模型将高维的特征进行降维,将数据投影到一维空间,寻找一个使类内离散度最小、类间离散度最大的最佳投影方向;

设定支持向量机模型:通过非线性变换将输入空间变换到高维空间,然后在新空间中求最优分类面,从而将原空间中的非线性问题转化成新空间中的线性问题进行求解;

设定费氏线性判别与支持向量机相结合模型:利用费氏线性判别方法将数据进行降维,将其得到的一维特征特征向量作为支持向量机模型的输入变量;

将冬小麦穗赤霉病样本数据分为健康、轻度和重度三类,其中随机选取样本数据作为训练样本,训练样本作为输入,训练费氏线性判别与支持向量机相结合模型。

所述的获得小麦穗高光谱识别结果包括以下步骤:

将穗正面、侧面以及直立三个角度分别筛选出来的一阶微分特征、连续统去除特征以及植被指数相结合形成单穗尺度不同角度赤霉病的最优光谱特征集;

将每个角度获得的光谱特征集作为训练后模型的输入变量,训练后的费氏线性判别模型和训练后的支持向量机模型分别输出从正面、侧面以及直立三个角度对赤霉病严重度识别的结果。

所述的设定费氏线性判别模型包括以下步骤:

将原获取的n个单穗高光谱数据定义为集合x,x中包含n个高维样本x1、x2、...、xn,将所有样本根据赤霉病病情严重程度分为健康、轻度和重度3类,其中n1个属于w1类的样本记为子集x1,n2个属于w2类的样本记为子集x2,n3个属于w3类的样本记为子集x3,各类样本的均值向量mi:

样本类内离散度矩阵si为:

总类内离散度矩阵sw为:

sw=s1+s2+s3;

样本类间离散度矩阵sb为:

其中m是所有样本的均值向量

在投影后的一维空间y,各类的均值

样本类内离散度和总类内离散度

投影后,寻找最佳投影方向,使各类样本尽可能分开,则希望各类间均值之差越大越好,类内离散度越小越好,定义fisher准则函数:

令分母等于非零常数,即ωtswω=c≠0,定义lagrange函数为

l(ω,λ)=ωtsbω-λ(ωtswω-c)

式中λ为lagrange乘字,将fisher准则函数对ω求偏导数并且令偏导数等于零,得到:

sbω*=λswω*

其中ω*是fisher准则函数取极大值的解,也就是高维x空间到一维y空间的最优投影方式。

所述的设定支持向量机模型包括以下步骤:

原特征空间的支持向量机决策函数是

其中αi,i=1,...,n是下列二次优化问题的解;

0≤αi≤c,i=1,...,n

对原特征x进行非线性变换,记新特征为则新特征空间里构造的支持向量机决策函数是

相应的优化问题变成

原特征空间中的两个样本内积(xi.xj)变成新特征空间的新特征空间的内积也是原特征的函数,记作核函数

新空间的支持向量机决策函数写成

其中,系数α是优化问题的最优解;

0≤αi≤c,i=1,...,n

选择一个合适的核函数就可以构建非线性的支持向量机,在此选择径向基核函数来构建非线性的支持向量机。

有益效果

本发明的基于费氏线性判别和支持向量机技术的冬小麦穗赤霉病识别方法,与现有技术相比实现了针对于单穗小麦的赤霉病识别。

本发明通过非成像高光谱技术,分别从单穗小麦正面,侧面以及直立面三个角度,采用高光谱数据运算和变换方法来分析单穗小麦镰孢菌病的响应特征,并对不同方法获取的光谱特征与赤霉病的严重度的相关关系进行评价;利用相关分析和独立样本t检验提取对小麦赤霉病敏感且不同严重度类间差异显著的光谱特征集;用svm和flda方法以及两者相结合的方法分别建立一个在野外、复杂农田环境下能够对冬小麦赤霉病的发生严重程度进行分类的有效模型。

附图说明

图1为本发明的方法顺序图;

图2a为费氏线性判别(flda)、支持向量机(svm)和费氏线性判别与支持向量机相结合模型(flda+svm)所识别的总体精度对比图;

图2b为费氏线性判别(flda)、支持向量机(svm)和费氏线性判别与支持向量机相结合模型(flda+svm)所识别的kappa系数对比图。

具体实施方式

为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:

如图1所示,本发明所述的基于费氏线性判别和支持向量机技术的冬小麦穗赤霉病识别方法,包括以下步骤:

第一步,数据获取。获取光谱仪所测定冬小麦单穗光谱数据,小麦单穗光谱数据包括每株穗正面、侧面和直立三个角度的高光谱数据。

垂直测量是常规的遥感方法,但信息获取不全,而水平测量则可以比较全面地反映病害感染情况,为了更好地将赤霉病引起的病变反映在光谱信息中,以提高赤霉病的检测精度,因此采用了不同角度的光谱采集方法来评估其在赤霉病检测中的实际优劣。

利用asfieledspecprofr(350~2500nm)型光谱仪对小麦赤霉病光谱数据进行采集。光谱仪的光谱分辨率在350~1000nm范围内为3nm,在1000~2500nm范围内为10nm,光谱抽样间隔1nm。每株小麦穗分三个角度进行光谱测量,分别为正面、侧面、直立面。观测时将光谱仪探头垂直向下,高度始终保持离地面1.3m,探头视场角为25度。

第二步,近地高光谱数据预处理。对冬小麦单穗光谱数据进行标准化处理,并分别进行一阶微分计算、连续统去除计算以及常用植被指数计算,获得对应的微分特征、连续统去除特征以及植被指数特征。

光谱标准化处理,有利于提高小麦赤霉病光谱识别与区分结果的可靠性。该处理过程中用a区健康样本反射率作为标准反射率,将b区、c区的样本的反射率调整到a区样本的反射率同一水平上,这在很大程度上消除了3套数据在时间、品种以及生育期方面的差异对光谱区分的影响。由于对于b区和c区数据中的各条光谱数据使用了相同的比率曲线进行调整,因此不会改变健康样本和不同病情程度样本间的相对光谱差异。后续对于光谱数据以及光谱特征的分析均基于标准化后的光谱数据进行。其具体步骤如下:

(1)高光谱数据标准化:

选取a区域的健康样本光谱数据作为标准样本,并且以病害样本光谱数据和健康样本光谱数据作为基准,分别用a区域的健康样本光谱数据的均值除以b区域和c区域健康样本光谱数据的均值,得到两条比值曲线,这两条比值曲线用于反映两组光谱测量的差异性,i波长下的比率ratioi计算公式为:

其中i表示波长,∑指区域内所有健康样本在波长i处的反射率之和,

ref表示反射率,a、b和c分别代表a区域、b区域和c区域;

将b区域和c区域获取的每一条样本的原始光谱数据与相应的比率曲线相乘,即得到标准化后的光谱数据,i波长下的标准化的计算公式为:

其中,表示b区域或c区域样本光谱在波长i处的反射率,表示标准化后的反射率。

(2)获取一阶微分光谱数据,对标准化后的光谱采用差分方法近似计算,其计算公式如下:

ρ'(λi)=[ρ(λi+1)-ρ(λi-1)]/(2δλ),

其中,λi为每个波段波长,ρ'(λi)为波长λi一阶微分,δλ为波长λi-1到λi的间隔,再求得一阶微分特征;

获取连续统去除特征:选取光谱的550nm-750nm波段进行连续统去除获得相对光谱反射率,在此基础上分别求出波段深度、吸收峰面积、波段宽度以及吸收特征的波段位置;

获取植被指数:根据经验选择若干个常用植物胁迫研究的植被指数,根据每个植被指数对应计算公式获取相应的指数特征。

第三步,建模特征的选择。筛选与赤霉病严重度相关性高且极显著的光谱特征以及三种严重程度类间差异显著的特征。

光谱微分技术是一种基本的高光谱分析技术,对反射光谱进行不同阶数的微分计算,可以获得不同的光谱参数。一阶微分变换反应了植被反射率在各波段的变化幅度,可以减少大气效应、背景噪声的影响,更好地反映植物的本质特征。本发明将光谱数据进行一阶微分后得到的光谱与原始光谱进行比较,一阶微分后得到的光谱曲线与赤霉病严重度的相关性明显提高,相关系数r最高达到0.8以上因此,本发明采用通过一阶微分光谱变换后的高光谱参量包括位置参量、面积参量、比值参量和归一化指数参量,来尝试提取对小麦穗赤霉病病害敏感的光谱特征。

连续统去除法是把光谱曲线的吸收谷归一化到吸收谷的连续统线上,其目的是消除不相关背景信息,增强光谱数据吸收特征信息。主要吸收谷特征参数,包括吸收波长位置、深度、宽度、斜率、面积、对称度等。

植被指数法是农业遥感监测研究中基本、常用的信息提取技术。本试验尝试通过一些常用的植被指数提取小麦赤霉病病害信息。以先验知识为基础,参考各类植被指数对植物病虫害监测研究中的应用情况,初步预选了21个基于高光谱数据构建的植被指数,并探讨其在评估赤霉病严重度方面的适用性。

(1)对数据预处理得到的一阶微分特征、连续统去除特征以及植被指数三种光谱特征分别与冬小麦赤霉病的严重度进行相关性分析,获得相关系数以及p-value值,利用阈值法筛选出与赤霉病高相关性r2>0.49且极显著相关p-value<0.001的光谱特征;

(2)分别对健康、轻度、重度三类样本两两组合,采用独立样本t检验方法筛选出在三个类别组合中均呈现显著差异的特征;

(3)将以上两个条件筛选的两个光谱特征集取交集,获得对赤霉病敏感且在三类不同病害严重度类间有显著差异的最优光谱特征集;

(4)从正面、侧面以及直立三个角度重复上述步骤分别获得适合其赤霉病识别的最优光谱特征集。

第四步,费氏线性判别与支持向量机相结合模型的建立:通过地面高光谱测量以及严重度调查的数据构建费氏线性判别与支持向量机相结合模型的建立。

flda是将原高维特征向量进行降维处理,通过线性组合已有高维特征向量的每一维,剔除掉对分类没有作用的因素,完全保留下有利于类别分类的信息,使得最终的分类过程更容易高效的进行,并且同时减小特征向量的维数,有效的降低了分类过程中的计算复杂度。

svm算法的目标是在有限样本信息下寻求学习精度和学习能力的最优解,从理论上来看,能够得到全局最优解,可以避免如神经网络中常常出现的陷入局部极值问题。经过文献调研发现,svm模型在小范围病害数据分类识别中具有较高的应用价值,因此尝试将svm应用于单穗尺度的小麦赤霉病的识别。

结合flda和svm两者的优点,先将原始的高维特征利用flda方法降维过程中得到的低维的特征向量作为svm模型的输入变量,尝试提高模型的识别精度。其具体步骤如下:

(1)设定费氏线性判别模型:利用费氏线性判别模型将高维的特征进行降维,将数据投影到一维空间,寻找一个使类内离散度最小、类间离散度最大的最佳投影方向。

设定费氏线性判别模型包括以下步骤:

a1)将原获取的n个单穗高光谱数据定义为集合x,x中包含n个高维样本x1、x2、...、xn,将所有样本根据赤霉病病情严重程度分为健康、轻度和重度3类,其中n1个属于w1类的样本记为子集x1,n2个属于w2类的样本记为子集x2,n3个属于w3类的样本记为子集x3,各类样本的均值向量mi:

样本类内离散度矩阵si为:

总类内离散度矩阵sw为:

sw=s1+s2+s3;

样本类间离散度矩阵sb为:

其中m是所有样本的均值向量

在投影后的一维空间y,各类的均值

样本类内离散度和总类内离散度

a2)投影后,寻找最佳投影方向,使各类样本尽可能分开,则希望各类间均值之差越大越好,类内离散度越小越好,定义fisher准则函数:

令分母等于非零常数,即ωtswω=c≠0,定义lagrange函数为

l(ω,λ)=ωtsbω-λ(ωtswω-c)

式中λ为lagrange乘字,将fisher准则函数对ω求偏导数并且令偏导数等于零,得到:

sbω*=λswω*

其中ω*是fisher准则函数取极大值的解,也就是高维x空间到一维y空间的最优投影方式。

(2)设定支持向量机模型:通过非线性变换将输入空间变换到高维空间,然后在新空间中求最优分类面,从而将原空间中的非线性问题转化成新空间中的线性问题进行求解。

设定支持向量机模型包括以下步骤:

b1)原特征空间的支持向量机决策函数是

其中αi,i=1,...,n是下列二次优化问题的解;

0≤αi≤c,i=1,...,n

对原特征x进行非线性变换,记新特征为则新特征空间里构造的支持向量机决策函数是

相应的优化问题变成

0≤αi≤c,i=1,...,n

b2)原特征空间中的两个样本内积(xi.xj)变成新特征空间的新特征空间的内积也是原特征的函数,记作核函数

新空间的支持向量机决策函数写成

其中,系数α是优化问题的最优解;

0≤αi≤c,i=1,...,n

选择一个合适的核函数就可以构建非线性的支持向量机,在此选择径向基核函数来构建非线性的支持向量机。

(3)设定费氏线性判别与支持向量机相结合模型:利用费氏线性判别方法将数据进行降维,将其得到的一维特征特征向量作为支持向量机模型的输入变量。

(4)将冬小麦穗赤霉病样本数据分为健康、轻度和重度三类,其中随机选取样本数据作为训练样本,训练样本作为输入,分别训练费氏线性判别模型和支持向量机模型(费氏线性判别与支持向量机技术相结合的模型),分别得到训练后的费氏线性判别与支持向量机技术相结合的模型。

上述建立的支持向量机是属于两类分类器,根据发明需求要实现健康,轻度和重度三类样本分类,我们利用三个两类分类器实现三个类的分类,也就是对三类中的每两类构造一个分类器,将每个分类器对样本的分类结果进行统计,最后样本分类在某个类别得到的票数最多就把该样本判别为这一类。

第五步,获得小麦穗高光谱识别结果:把近地高光谱数据的最优特征集作为输入变量,分别输入费氏线性判别模型,分别输入费氏线性判别与支持向量机相结合模型,得到冬小麦穗赤霉病的识别结果。

(1)将穗正面、侧面以及直立三个角度分别筛选出来的一阶微分特征、连续统去除特征以及植被指数相结合形成单穗尺度不同角度赤霉病的最优光谱特征集;

(2)将每个角度获得的光谱特征集作为训练后模型的输入变量,训练后的费氏线性判别与支持向量机技术相结合模型分别输出从正面、侧面以及直立三个角度对赤霉病严重度识别的结果。

其中,费氏线性判别(flda)和支持向量机(svm)的混淆矩阵与识别结果对比表如表1所示。

表1混淆矩阵与识别结果对比表

注:u=用户者精度,oa=总体精度,p=生产者精度.

如表1所示,正面和侧面角度麦穗,基于两种不同类型模型的病害严重度识别效果总体比较理想,总体精度最低为77.1%,最高为85.7%;然而,直立穗的flda和svm模型的判别精度总体略低,分别为62.9%和65.7%。从整体来看,flda模型的总体精度略低于svm模型,支持向量机性能比flda更加稳定。

由于参与模型构建的特征变量偏多,过多的变量不仅会增加计算的难度,也会使模型的可解释性变差。因此结合两种模型的优点,利用flda方法将原始特征变量进行降维,将得到的低维的特征向量作为svm模型的输入变量,有效的提高了模型的精度。flda、svm以及flda&svm三种模型的总体精度,以及三个角度的识别效果比较如图2。如图2a所示,flda与svm相结合能有效提高模型在不同角度的总体识别精度,并且侧面精度优于正面,直立角度识别精度最低,分别为88.6%,85.7%以及68.6%,如图2b所示,其kappa系数趋势与总体精度增长趋势一致,分别为0.808、0.770以及0.506。

通过调研发现,小麦单穗尺度下对赤霉病的研究主要集中在实验室条件下,且达到了较好的识别效果。在野外条件下,前人尝试将神经网络分类算法应用于高光谱图像的像素点,来区分小麦穗部健康与疾病区域,且与rbf支持向量机模型进行比较,结果表明,深度卷积递归神经网络模型对穗部健康与疾病区域的识别效果理想,精度达到84.6%,rbf支持向量机模型精度仅为70.6%,但是神经网络模型的训练时间比支持向量机所需要的时间更长。本研究在野外田间条件下,使用非成像高光谱技术,利用flda与svm结合的方法对整株麦穗健康、轻度与重度三种类别进行分类区分,结果表明,flda与svm算法相结合建立的模型比flda和svm算法单独使用时模型的识别精度更高,在侧面穗角度最高精度达到88.6%。相比较前人研究,本次研究在野外田间条件下,增大了小麦穗赤霉病的识别尺度与分类难度,并且取得了理想的识别效果。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1