一种基于光谱分析技术的物质元素含量信息检测方法与流程

文档序号:12112375阅读:926来源:国知局
一种基于光谱分析技术的物质元素含量信息检测方法与流程

本发明属于光谱分析技术和光谱图像处理领域,具体属于光谱分析中光谱数据和物质成分模型分析领域。



背景技术:

自然界的大部分物质在外界电磁波的作用下,由于自身原子振动、电子跃迁等因素的作用,在某些特定的波长位置处会发生光谱辐射,包括反射、吸收等。

将这些光波按照波长从小到大排列即形成了光谱。因为对于一种特定的原子,当它在受到电磁波的作用时只能发出一种特定波长的光谱线。因此,该光谱中包含了物质的定性和定量信息,可以通过该光谱信息反演出物质的性质和成分含量,这就是光谱分析和检测技术的理论基础。

上世纪80年代兴起的光谱定量遥感技术,具有高分辨率遥感图像与超多波段光谱合一的特点,使得大范围快速准确地获取物质元素含量信息逐渐成为可能。光谱定量遥感的物理基础是光谱分析技术,光谱定量遥感也主要是通过其光谱信息来反演物质元素含量的。因此,目前利用地面光谱检测物质元素含量的研究是一个热点。其原理是物质元素含量与光谱在一些波长范围中的反射率值存在很高的相关性,利用这种关系去建立光谱与物质元素含量的关系模型,实现利用光谱数据间接测定土壤水分含量。遥感光谱技术具有检测速度快、无损无污染等特点,是目前很多领域最主要的获取信息的手段。

由于遥感光谱检测速度快、成本低,且精度也比较高,具有实现“实时检测”的潜力。目前,利用遥感光谱检测物质元素含量是一个热点研究,大量的学者在从事这方面的研究,学者普遍发现利用遥感光谱检测物质的定性和定量信息是一种简便、快速的方法,目前这方面有许多值得研究的内容和待解决的问题。

光谱遥感利用很多很窄的电磁波波段从感兴趣的物体中获取有关数据,因此它的基础是测谱学(Spectroscopy)。测谱学早在20世纪初就被用于识别分子和原子及其结构,20世纪80年代建立了成像光谱学(Imaging Spectroscopy)。它是在电磁波谱的紫外、可见光、近红外和中红外区域,获取许多光谱间隔非常窄且光谱近似连续的图像数据的技术。

成像光谱仪(Imaging Spectrometer)在对目标的空间特征成像的同时,对每个空间 像元经过色散形成几十个乃至几百个窄波段以进行连续的光谱覆盖,从而形成谱分辨率达到纳米数量级的遥感数据。这种数据由于谱分辨率高,通常称为高光谱数据或高光谱图像。成像光谱仪将视场中观测到的各种地物以完整的光谱曲线记录下来。这种记录的光谱数据能用于多学科的研究和应用中。

自上世纪80年代以来,成像光谱技术发展迅猛。1983年,第一幅由航空成像仪(AIS-1)获取的高光谱分辨率影像呈现在科学界面前,标志着第一代高光谱分辨率传感器面世。第一代成像光谱仪以AIS-1和AIS-2为代表,这类成像光谱仪以推帚方式的二维面阵列成像,工作原理与推帚式线阵列非常相似。AIS-1用32×32面阵列成像,而AIS-2则用64×64面阵列成像。其获取的高光谱影像宽度非常有限,从而限制了这类仪器的商业应用。但它开创了高分辨率光谱和图像合一的光谱遥感时代。

1987年美国宇航局(NASA)喷气推进实验室(JPL)研制成功航空可见光/红外成像光谱仪(AVIRIS),这标志着第二代高光谱成像仪的问世。AVIRIS首次测量全部太阳辐射覆盖的波长范围(0.4~2.5um),共有224个成像波段,光谱分辨率为0.01um,与第一代成像光谱仪的主要区别,在于AVIRIS采用扫描式线阵列成像。与AVIRIS并存的加拿大研制的小型机载成像光谱仪(CASI)有很高的光谱分辨率(1.8nm),288个波段覆盖的光谱范围包括可见光和部分近红外区域(430~870nm)。另外由美国海军研究实验室(NRL)研制的高光谱数字图像收集仪(HYDICE)于1996年开始使用,HYDICE有210个波段,宽度由3nm到20nm不等。它的探测范围与AVIRIS相同,但采用CCD推帚式技术成像。HYDICE为地质、农业、军事等领域提供了大量有价值的高光谱数据。与此同时,一些发达国家也竞相投入力量研制高光谱成像仪。例如,加拿大研制的FLI/PML、CAST高光谱成像仪;澳大利亚研制的AMSS、Hymap高光谱成像仪等。进入21世纪以后,国际上很多发达国家越来越重视成像光谱仪的发展和高光谱遥感技术的进步,其中以美国、加拿大、澳大利亚等国家的发展尤为迅速。

我国在高光谱成像仪方面的研究也有较大地进展。1991年,我国研制成功了64波段可见光/近红外模块化机载成像光谱仪(MAIS)。“九五”期间在863项目的支持下,我国还推出了实用型模块化航空成像光谱仪系统(OMIS I、OMSI II)和机载推帚式成像光谱仪(PHI),它们都是244个波段。

进入21世纪以后,我国更加重视高分辨率成像光谱仪的发展,2002年3月,我国神舟3号载中等分辨率成像光谱仪(CMODIS)上天运行。CMODIS运行在343±5km高空,地面分辨率为400~500m,重复覆盖周期为2天,测绘带宽为650-700km,有34 个波段,波长范围在0.4~12.5mm。2005年底,由中国科学院所研制的高技术产品“轻型机载高光谱分辨率成像遥感系统”交付马来西亚国家遥感中心,该系统是当今空间遥感技术中最具前沿性的先进光学遥感器,可适应国民经济不同领域的遥感需求,在光谱遥感领域发挥重大的作用。



技术实现要素:

本发明的目的在于提供一种基于光谱分析技术的物质元素含量信息检测的实时稳定有效的解决方法,该方法不仅可以对所分析、检测的物质没有损伤,而且可以通过采集一次光谱数据便能同时检测物质多个成分的含量或性质,分析和检测速度快、成本低、效率高,可广泛应用于光学遥感探测、化工制药等众多领域,测定方法简单高效,测量精度较高。

为了解决上述技术问题,本发明提供一种基于光谱分析技术的物质元素含量信息检测方法,步骤1:通过光谱仪采集原始的光谱数据,并筛选出相关波段的光谱数据;步骤2:对原始的光谱数据进行预处理,以去除光谱数据中的噪声;步骤3:将经过预处理后的光谱数据进行建模,挖掘光谱数据中的定量和定性信息;步骤4:通过评价指标对建模效果进行综合评价分析,分析模型预测的精度,评价指标包括平均残差率、相关系数、预测均方根误差、校正均方根误差、剩余预测偏差。

进一步,所述步骤2中的光谱数据预处理方法为信号平滑方法或者标准正态变化方法。

进一步,使用PLS偏最小二乘回归法、BP神经网络法、LSSVM最小二乘支持向量机法中的一种或几种方法对经过预处理后的光谱数据进行建模。

本发明与现有技术相比,其显著优点在于,(1)本发明光谱检测是一种无损的检测方式,只需要将被测物质用光谱仪照射一下,光谱分析系统就可以通过光谱信号计算出该物质定性或定量的指标;(2)光谱分析和检测的速度比较快。对于物质的成分(如土壤有机质含量),如果采用化学方法测定,则往往需要数小时的时间,而利用光谱检测手段,只需要通过短短几分钟便可计算出检测结果;(3)光谱检测费用比较低廉,而且没有污染,是一种节能环保的检测方式;(4)采集一次光谱信号,可以同时检测物质多个成分的含量或性质。由于光谱数据往往包含多个波段的数据值,这些波段的数值蕴含了不同物质成分的定量或定性信息,因此可以通过一个光谱信号建立多种物质的检测模型,从而检测多种物质的信息。可广泛应用于遥感、化工、制药、农业等众多领域。

附图说明

图1是本发明方法流程示意图。

图2是本发明仿真实验中输入的光谱曲线示意。

图3是本发明仿真实验中对原始光谱数据使用信号平滑法去噪后的效果图。

图4是本发明仿真实验中BP神经网络模型得到的物质元素含量与对应波长的光强值之间的关系曲线图。

图5是本发明仿真实验中PLS偏最小二乘回归模型得到的物质元素含量与对应波长的光强值之间的关系曲线图。

图6是本发明仿真实验中LSSVM最小二乘支持向量机模型得到的物质元素含量与对应波长的光强值之间的关系曲线图。

具体实施方式

容易理解,依据本发明的技术方案,在不变更本发明的实质精神的情况下,本领域的一般技术人员可以想象出本发明基于光谱分析技术的物质元素含量信息检测方法的多种实施方式。因此,以下具体实施方式和附图仅是对本发明的技术方案的示例性说明,而不应当视为本发明的全部或者视为对本发明技术方案的限制或限定。

如图1所示,本发明方法步骤如下:

第一步,通过光谱仪采集原始的光谱数据,并筛选出相关波段的光谱数据。如图2所示是输入的原始光谱曲线。

通过光谱仪获得了物质元素的发射光谱数据,并在实验前获得物质中元素含量值(先验信息),设变量X1,X2,…XN为物质元素发射光谱中N个光波长λ1、λ2…λN对应的光强度值,且X1~XN的光波长差是一个常数。

根据光谱理论知识的研究,可知光谱数据的筛选正确与否对数据的后续处理分析有一定的影响作用,若需要测量物质元素发射光谱波长为λ1、λ2…λN共N个波长值。根据发射光谱理论知识可得由于光谱线测量时可能会发生一定的平移,因此将X1,X2,…XN对应的N个光波长值分别与λ1、λ2…λN共N个波长值进行比较,当相差值在阈值范围内时,则认为此波长对应的谱线为物质元素的发射光谱谱线,选取对应波长的光强度值进行下一步处理,筛选得到的光谱数据包含M个光波长λ1、λ2…λM对应的 光强度值X1,X2,…XM

第二步,使用信号平滑法、标准正态变化法等光谱预处理方法对原始的光谱数据进行处理,以去除光谱数据的噪声。如图3所示是对原始光谱数据使用信号平滑法去噪后的效果图。

光谱数据在采集时往往会受到诸多因素的影响,其中内在因素有:光谱仪的稳定性、光谱仪静电噪声等;外在影响因素有:外界光线变化、温度湿度变化、光散射影响等。这些影响因素使得光谱数据中除了包含有用的信息外,还混杂有背景和仪器噪声等无关信息。在分析处理光谱数据时,这些噪声会对分析结果产生不良的影响,降低光谱分析精度,因此,对光谱原始数据进行预处理是很有必要的。

信号平滑法可用以下公式表示:

式中,Xi+j和Xi*分别为平滑前后的光强度值;Wj是移动窗口平滑中的权重因子,在移动平均平滑中Wj=-1。

第三步,使用BP神经网络法、PLS偏最小二乘回归法、LSSVM最小二乘支持向量机法将经过预处理后的光谱数据进行建模,挖掘光谱数据中的定量和定性信息。

3.1 使用BP神经网络法进行建模

BP神经网络模型由输入层、隐含层和输出层组成,隐含层的激励函数采用Sigmoid型函数,如下式所示:

BP神经网络模型的过程主要包括以下两个方面:

(a)工作信号的正向传播。信号从输入层进入BP经隐含层处理后传向输出层,如果该信号与期望输出信号的误差满足要求,则输出BP,否则进入步骤b);

(b)误差信号的反向传播。计算实际信号与期望信号的误差,并将该误差从BP的输出层反向传播,利用该误差修改BP各层的权值和阈值,使模型结构达到合理。

在BP神经网络建模时,输入为M个光波长λ1、λ2…λM对应的光强度值X1, X2,…XM光强度值,输出为物质中元素含量值。(a)、(b)两个过程反复进行,直到BP神经网络的输出误差达到允许的范围之内,则BP神经网络训练完毕,BP神经网络结构达到最优,最终得到物质元素含量与对应波长的光强值之间的关系曲线如图4所示。

3.2 使用PLS偏最小二乘回归法进行建模

设共有n个样本,q个自变量,P个因变量,构成自变量数据X=[x1,...xp]m×p,这里自变量为波长对应的光强度值。因变量数据Y=[y1,...yq]n×q,这里因变量为物质元素含量值。偏最小二乘法分别从X和Y中提取主成分t1和u1,其中t1是x1,...xp的线性组合,u1是y1,...yq的线性组合,且满足下列要求:t1和u1分别尽可能的携带自变量和因变量中的信息。t1和u1的相关性尽可能达到最大:

r(t1,u1)→max (12)

式中,r(t1,u1)是t1和u1的相关系数。

偏最小二乘回归要求t1和u1协方差最大,如下式所示:

式中,Var(t1)是自变量信息,Var(u1)是因变量信息,Cov(t1-u1)是协方差。

通过多次迭代之后使协方差最大时的自变量和因变量的曲线即为物质元素含量与对应波长的光强值之间的关系曲线,如图5所示。

3.3 使用LSSVM最小二乘支持向量机法进行建模

SVM是上世纪九十年代兴起的一种模式识别方法。它是一种监督学习方法,在处理非线性关系、小样本统计分类或回归分析中得到了广泛的应用,并且在高维数据挖掘领域拥有很强的能力。经过几十年的发展,支持向量机不管在理论方法研究还是方法应用上都取得了长足的进步,被罔于进行函数拟合等机器学习应用中,解决高效的回归拟合问题和分类判别问题。支持向量机方法是一种基于统计学习理论的VC维理论和结构风险最小的统计学习方法。

最小二乘支持向量机(Least square support vector machines,LS-SVM)是Suykens et al.(1999)提出的一种改进后的支持向量机方法。最小二乘支持向量机是普通支持向量机在二次损失函数状态下的一种改进。与普通支持向量机一样,最小二乘支持向量机同样 在进行函数拟合时将输入数据从常规空间里映射到高维空间里,但同时将不等式约束用等式约束代替,在高维空间中对最小化损失函数进行求解,获得一个线性拟合函数。可以看到最小二乘支持向量机通过损失函数,将支持向量机的二次规划问题转化为线性求解问題,这大大降低计算的复杂度和提高了计算效率。最小二乘支持向量机需要对一个等式方程组求解对偶空间中的二次规划问題,因此需要应用核函数。最小二乘支持向量机的算法原理如下:

现有一个由N个样本数据组成的建模集合其中集合中的因变量数据为xi∈Rn即n维向量,自变量数据为yi∈{-1,1}。根据支持向量机原理:

上式中,是一个非线性函数,用于将xi映射到高维空间中,b是偏置值,w是权值向量。

最小二乘支持向量机的目标函数如下式:

上式中,minJ(w,ε)是最小二乘支持向量机的目标函数。γ是惩罚系数,用于调整误差,是在模型建立之前预先设定的。具体设定规则为:当训练数据有较大的噪声,则应该适当选择较小的γ,反之选择较大值。εj是松弛变量。

本发明中LSSVM采用RBF核函数。RBF核函数是一种非线性函数,可以减少建模过程的计算复杂度,并且提高模型性能。根据RBF核函数得到的LSSVM模型为:

上式中,K(xi)是RBF核函数。ai是RBF系数。从最小二乘支持向量机的实现算法可以看到,最小二乘支持向量机模型的建立过程主要是对一个等式方程组求解对偶空间中的二次规划问题。其预测结果是通过计算各个建模样本与预测样本之间的核函数求解获得。最终模型得出物质元素含量与对应波长的光强值之间的关系曲线,如图6所示。

第四步,通过平均残差率、相关系数、预测均方根误差、校正均方根误差、剩余预测偏差等评价指标来对建模效果进行综合评价分析,分析模型预测的精度。

本发明对物质元素含量建立评价指标模型,建立的评价指标模型包括平均残差率、相关系数、预测均方根误差、校正均方根误差、剩余预测偏差这些模型,能从各方面反映出预测和真实值之间的偏差和相关性。运用各种评价指标模型来对预测效果进行综合评价分析各模型的精度。如表1所示即为评价指标表格。

表1

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1