一种利用中红外光谱技术估测土壤有机碳含量的方法

文档序号:5903598阅读:280来源:国知局
专利名称:一种利用中红外光谱技术估测土壤有机碳含量的方法
技术领域
本发明涉及光学技术与资源环境技术领域,具体涉及一种利用中红外光谱技术估测土壤有机碳含量的方法。
背景技术
精准农业作为可持续农业的基础,是当今农业发展的主要趋势。作为农业生产的基础,土壤却是一个复杂的空间变异体,因此,获取农田土壤属性实时信息及其空间分布信息对指导实施农田精准管理、农田土壤肥力评价等工作具有重要意义。
目前,常规测定土壤有机质和有机碳的化学分析方法通常周期长、成本高,并且很难在田间直接测定,不能满足快速有效监测土壤各种属性空间分布和制图的需要。地面高光谱技术监测土壤属性信息具有快速、简便、非接触、不破坏等优点,还可以仅仅用一条光谱进行多种土壤属性的预测,因此获得广泛关注。近红外光谱已经获得了广泛的研究与应用,国内外发展皆较为成熟。Krishnan等(Krishnan PiAlexander J D,Butler B J,et al. Reflectance technique for predictingsoil organic matter. Soil Sci. Soc. Am. J.,1980,44:1282 1285)发现可见光波段的623nm和564nm是有机质的敏感波段,用这两处原始反射率倒数之对数的微分值能很好的预测土壤有机质含量。Gunsaulis 等(Gunsaulis F R,Kocher M F,Griffis C L. Surfacestructure effects on close—range reflectance as a function of soil organicmatter content. American Society of Agricultural Engineer, 1991,34:641-649)对东阿肯色州三角洲地区的土样进行研究,发现土壤有机质含量与红光波段的反射率具有较强的相关性,决定系数R2达0.609。彭玉奎等(彭玉奎,张建新,何绪生,等.土壤水分、有机质和总氮量的近红外光谱分析研究.土壤学报,1998,35 (4) =554-559)用近红外光谱波段预测黄土的有机质含量,预测相关系数达到了 0. 938。何挺等(何挺,王静,林宗坚,等.土壤有机质光谱特性研究.武汉大学学报,2006,31 (11) :975-979)研究发现2187nm处的反射率对数的一阶微分与土壤有机质的相关性最大。然而,强烈的分子振动却发生在中红外的2500-25000nm波段,而近红外的750-2500nm处只存在相对来说较为微弱的倍频峰和合频峰,这就导致了中红外波段土壤物理化学属性的光谱特征较近红外波段更加明显,更易识别,用中红外波段进行土壤理化属性的预测所建立的模型更为稳健。国外已经开始了这一方向的研究,McCarty和Reeves(McCarty G W, Reeves J B III. Comparison of near infrared and mid infrareddiffuse reflectance spectroscopy for field—scale measurement of soil fertilityparameters. Soil Science, 2006,171 (2) :94-102)指出,对于一系列土壤肥力指标的预狈1|,利用中红外比近红外能建立更为稳健的模型。而对于土壤碳(McCarty G W,ReevesJ B III,Reeves V B,et al. Mid-infrared and near-infrared diffuse reflectancespectroscopy for soil carbon measurement. Soil Sci. Soc. Am. J.,2002,66:640-646)来说,中红外由优于近红外是因为土壤碳的光谱信息更多的出现在中红外波段,而国内基于中红外技术的土壤有机质或有机碳的预测研究尚未见报道。

发明内容
本发明提供了一种利用中红外光谱技术估测土壤有机碳含量的方法,分析效率和精准度均大大提高,为大面积数字农业信息获取和精确化作业提供了一种可行的方法。—种利用中红外光谱技术估测土壤有机碳含量的方法,包括如下步骤( I)采集若干个土壤样本,测量土壤样本的有机碳含量;对采集的土壤样本进行风干研磨,采用传统的测量方法测量所有土壤样本的有机碳含量,优选地,土壤样本的有机碳含量采用重铬酸钾氧化-分光光度法方法测量。(2)采集所述土壤样本的中红外光谱数据,将所述中红外光谱数据划分为建模样本集Tn和检验样本集Pm ; 对所有土壤样本采集光谱范围为SOOOOcnr1 IOcnT1的中红外光谱数据,按有机碳含量升序排列,每取若干个土壤样本选入建模样本集Tn后,取I个样本选入检验样本集Pm ;优选地,每取3个土壤样本选入建模样本集Tn后,取I个样本选入检验样本集ΡΜ,建模样本集Tn和检验样本集Pm的比例大致为3:1。假设共有(n+m)个土壤样本,建模样本集是由N个样本组成的,用Tn来表示,Tn= (S1, S2, S3,……,SJ (N=n) (I)检验样本集是由M个样本组成的,用Pm来表示,PM={Sn+1, Sn+2, Sn+3, ......,Sn+m} (M=m) (2)(3)以建模样本集Tn中各土壤样本的中红外光谱数据为输入,以土壤样本的有机碳含量为输出建立模型,用所述检验样本集Pm对所建模型进行检验;一种优选的技术方案,步骤(3)中用交叉验证法确定最优因子数,用确定的最优因子数对所述建模样本集Tn建立偏最小二乘回归模型(Partial least squaresregression, PLSR)。在进行PLSR建模时,最重要的便是确定最优的因子数,使得模型不致出现过度拟合或低度拟合。用交叉验证目的是就是为了得到更可靠稳固的模型,假定PLSR的因子数为I时,首先将η个建模样本集中的第一个样本去除,用余下的η-l个样本进行模型的拟合,用该模型估测第一个样本的预测值h与第一个样本的观察值丫工进行比较。然后将第一个样本移回建模样本集中,用同样的过程处理第二个建模样本,如此循环往复,直到所有的建模样本都被移除过一次并且仅被移除过一次。因此,在PLSR的因子数为I时,便得到了 η个预测值λ,V2,j>3,····.,计算此时的均方根误差(RMSECV :建模样本交叉验证的均方根误差) RMSliCV = V[二 (j); -V1)2 η(3 )进而可计算出Akaike信息准则(AIC):AIC=nln RMSE+2p (4)其中,η为建模样本集的样本数量,p为因子数。如此,在PLSR的因子数为N=I, 2,3,……,η时,便可得到相应的RMSECV与AIC,结合这两者随因子数的变化曲线,权衡挑选RMSECV和AIC值最小或不再变小时所对应的因子数作为PLSR的最优因子数,小于此最优因子数时,PLSR模型未充分拟合,而大于此最优因子数时,模型为过度拟合状态。同时也要结合尽量选择最小的因子数的原则,来确定最优因子数。用确定的最优因子数进行建模样本集Tn的PLSR模型的建立,用所建模型对检验样本集Pm进行预测,将预测值与观测值比较,检验所建模型的预测精度,稳定性好,预测精度高的模型即为本发明所需模型。另一种优选的技术方案,采用辅助偏最小二乘法,该法是在前面crossvalidation-PLSR (交叉验证-PLSR)的基础上,通过构建更多的平行建模样本集,来进一步增强模型的稳定性,防止过拟合现象的发生。即步骤(3)中从所述建模样本集1中重新随机选取样本组成若干个不同的辅助建模样本集,使每个辅助建模样本集的样本数与原建模样本集Tn的样本数相同,对每一个辅助建模样本集进行交叉验证-偏最小二乘回归建模,得一系列辅助偏最小二乘回归模型。 采用交叉验证目的是就是为了得到更可靠稳固的模型,作为另一种实现方案,PLSR模型的稳定性还可以通过将PLSR建模与辅助聚合相结合的方式来进一步增强,具体过程如下首先从建模样本集Tn中重新随机选取样本组成若干个不同的辅助建模样本集,使得每个辅助建模样本集的样本数与原建模样本集的样本数相同。对于建模样本集Tn,随机选取建模样本组成的若干个(设为B个)辅助建模样本集可分别表示为4,4,4,......, t|(B=b)(5)每个辅助建模样本集都是由N个随机选取的建模样本组成的,每个样本可重复选取。分别用这B个辅助建模样本集进行cross validation-PLSR建模,就得到了一系列的预测模型,即B个辅助偏最小二乘回归模型,分别用这些预测模型对检验样本集Pm进行预测,对于检验样本集Pm中的每个样本,都会得到B个预测值Yj8= (yi, yf, Yi3,……,3^}( =1,2,3’ *.....,m) (6)那么,每个样本的最终预测值为^ ΣΓ=! ELiyp(7)用每个样本的最终预测值与观测值进行比较,检验所建预测模型的预测精度。辅助偏最小二乘回归正是通过构建若干个与原建模样本集相似的辅助建模样本集,对检验样本的预测值进行不确定性分析,以达到减小预测误差和增强模型稳定性的目的。(4)采集待测土壤的中红外光谱,代入步骤(3)中所得偏最小二乘回归模型中,计算待测土壤中的有机碳含量。(5)对所建模型预测结果的精度评价对步骤(3)中两种不同建模方法的预测精度统一选用决定系数(R2)、均方根误差(RMSE :利用所建模型对检验样本预测后计算出的均方根误差)以及测定值标准偏差与标准预测误差的比值RH)作为评价参数,具体计算分别见公式(8)、(9、(10):
权利要求
1.一种利用中红外光谱技术估测土壤有机碳含量的方法,其特征在于,包括如下步骤 (1)采集若干个土壤样本,测量土壤样本的有机碳含量; (2)采集所述土壤样本的中红外光谱数据,将所述中红外光谱数据划分为建模样本集Tn和检验样本集Pm ; (3)以建模样本集Tn中各土壤样本的中红外光谱数据为输入,以土壤样本的有机碳含量为输出建立模型,用所述检验样本集Pm对所建模型进行检验; (4)采集待测土壤的中红外光谱,代入步骤(3)中所得模型中,计算待测土壤中的有机碳含量。
2.根据权利要求I所述的方法,其特征在于,步骤(3)中用交叉验证法确定最优因子数,用确定的最优因子数对所述建模样本集Tn建立偏最小二乘回归模型。
3.根据权利要求I所述的方法,其特征在于,步骤(3)中从所述建模样本集1中重新随机选取样本组成若干个不同的辅助建模样本集,使每个辅助建模样本集的样本数与原建模样本集Tn的样本数相同,对每一个辅助建模样本集进行交叉验证-偏最小二乘回归建模,得一系列辅助偏最小二乘回归模型。
4.根据权利要求I所述的方法,其特征在于,步骤(I)中所述土壤样本的有机碳含量采用重铬酸钾氧化-分光光度法方法测量。
5.根据权利要求I所述的方法,其特征在于,步骤(2)中所述中红外光谱的光谱范围为30000cm 1 IOcm 1O
6.根据权利要求I所述的方法,其特征在于,步骤(2)中按有机碳含量升序排列,每取若干个土壤样本选入建模样本集Tn后,取I个样本选入检验样本集Pm。
7.根据权利要求6所述的方法,其特征在于,步骤(2)中按有机碳含量升序排列,每取3个土壤样本选入建模样本集Tn后,取I个样本选入检验样本集PM。
全文摘要
本发明公开了一种利用中红外光谱技术估测土壤有机碳含量的方法,包括如下步骤(1)采集若干个土壤样本,测量土壤样本的有机碳含量;(2)采集所述土壤样本的中红外光谱数据,将所述中红外光谱数据划分为建模样本集TN和检验样本集PM;(3)以建模样本集TN中各土壤样本的中红外光谱数据为输入,以土壤样本的有机碳含量为输出建立模型,用所述检验样本集PM对所建模型进行检验;(4)采集待测土壤的中红外光谱,代入步骤(3)中所得模型中,计算待测土壤中的有机碳含量。本发明的方法分析效率和精准度高,为大面积数字农业信息获取和精确化作业提供了一种可行的方法。
文档编号G01N21/35GK102798607SQ20121028559
公开日2012年11月28日 申请日期2012年8月13日 优先权日2012年8月13日
发明者纪文君, 史舟, 吴宏海 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1