基于光谱引导集成学习的土壤有机碳光谱预测方法及装置

文档序号:35633795发布日期:2023-10-06 04:12阅读:43来源:国知局
基于光谱引导集成学习的土壤有机碳光谱预测方法及装置

本发明属于土壤属性预测方法,尤其涉及一种基于光谱引导集成学习的土壤有机碳光谱预测方法及装置。


背景技术:

1、土壤是地球的皮肤,提供了诸多的生态系统服务和功能,使地球上的生命得以存续。土壤有机碳(soil organic carbon,soc)是土壤有机质的关键组成部分,是衡量土壤肥力的重要指标。对土壤有机碳的估算,有利于对土地进行合理施肥,对提高农作物产量、改善土壤质量、保护土壤生态环境有着重要意义。

2、土壤有机碳库占比超过陆地生态系统碳库的70%,储存在土壤中的有机碳总量超过大气和植被碳库的加和,因此,土壤有机碳库的细微变化都会对全球碳循环带来巨大的影响。考虑到土壤有机碳对粮食安全和气候变化的重要性,需要及时地监测土壤有机碳的动态变化。

3、由于基于传统实验室理化分析的土壤有机碳测定存在周期长、成本高、可能使用环境有害试剂等缺点,传统估算土壤有机碳的方法是基于野外实地采样与实验室化学测定,野外实地采样本身需要较高的人力成本,容易受到天气和地形等因素限制,因此费时费力且难以对大面积土壤有机碳进行精确估算,采样人员甚至容易面临生命危险,而且在测定过程中常使用重铬酸钾等含有重金属的化学试剂,容易造成环境污染,或者产生试剂处理成本。

4、基于光谱技术的土壤有机碳测定方法正在不断发展。相比中红外光谱技术,土壤可见-近红外光谱技术具有低成本、高便携、外界干扰少等优点,在土壤有机碳测定使用最为广泛。

5、土壤光谱预测模型是使用土壤光谱技术预测土壤有机碳含量的最核心环节。预测模型的好坏将直接决定预测结果是否可靠。土壤光谱预测模型由从前的多元线性回归、偏最小二乘回归等线性模型往机器学习、深度学习等非线性模型不断推进。由于模型结构的不同,单一预测模型对于不同数据的适用性不一,模型稳定性差。

6、因此,亟待设计能够综合利用不同预测模型的优势,通过光谱引导表征不同预测模型的适用范围,开发基于集成学习的土壤有机碳预测模型。


技术实现思路

1、本发明提供了一种基于光谱引导集成学习的土壤有机碳光谱预测方法,该方法综合利用了不同预测模型的优势,能够较为准确的预测土壤的碳含量。

2、本发明具体实施例提供了一种基于光谱引导集成学习的土壤有机碳预测方法,包括:

3、获得多个土壤样本,从每个土壤样本获得真实有机碳含量和原始土壤光谱,将每个原始土壤光谱进行预处理得到土壤光谱样本,将土壤光谱样本进行主成分分析得到土壤光谱主成分数据,基于土壤光谱样本构建样本集,将样本集划分为第一训练集和验证集,将真实有机碳含量作为标签;

4、基于第一训练集和对应标签分别训练偏最小二乘回归模型、cubist模型和随机森林模型,将多个土壤光谱样本输入训练完成的最小二乘回归模型、cubist模型和第一随机森林模型分别得到三个模型的碳含量预测值集;

5、基于三个模型的碳含量预测值集和土壤光谱主成分数据构建第二训练集,通过第二训练集和对应标签训练第二随机森林模型得到光谱引导集成模型;

6、应用时,将土壤光谱样本输入光谱引导集成模型得到预测的土壤有机碳含量。

7、进一步的,通过第二训练集和对应标签训练第二随机森林模型得到光谱引导集成模型,包括:

8、基于第二训练集采用十折交叉验证确定第二随机森林的最优树个数、分枝变量数,基于确定的最优树个数、分枝变量数拟合得到光谱引导集成模型。

9、进一步的,获得每个土壤样本对应的真实有机碳含量和原始土壤光谱,包括:

10、将每个土壤样本进行风干、研磨、过筛得到预处理土壤,对预处理土壤进行分析得到每个土壤样本的真实有机碳含量;

11、通过可见-近红外光谱仪测定每个预处理土壤的光谱数据得到原始土壤光谱。

12、进一步的,每个原始土壤光谱进行预处理得到土壤光谱样本,包括:

13、去除原始土壤光谱中噪音较大的波段,对保留的原始土壤光谱的波段进行平滑去噪和信号增强处理,所述噪音较大的波段为400-500nm,保留的原始土壤光谱的波段为500-2450nm。

14、进一步的,基于第一样本集和对应标签训练偏最小二乘回归模型,包括:

15、基于第一样本集通过10折交叉验证确定偏最小二乘回归模型中最优潜变量个数,基于最优潜变量个数拟合得到训练完成的最小二乘回归模型。

16、进一步的,基于第一样本集和对应标签训练cubist模型,包括:

17、基于第一样本集通过10折交叉验证确定cubist模型中最优委员树个数,基于最优委员树个数拟合得到训练完成cubist模型。

18、进一步的,基于第一样本集和对应标签第一随机森林模型,包括:

19、基于第一样本集通过10折交叉验证确定第一随机森林模型中最优树个数、分枝变量数,基于最优树个数、分枝变量数拟合得到训练完成第一随机森林模型。

20、进一步的,将验证集输入光谱引导集成模型得到土壤有机碳预测值集,基于土壤有机碳预测值和对应的标签通过决定系数或均方跟误差得到预测精度,当预测精度达到精度阈值时,完成第二随机森林的验证得到最终光谱引导集成模型。

21、进一步的,基于土壤有机碳预测值和对应的标签通过决定系数得到预测精度r2为:

22、

23、其中,n为验证集中的土壤光谱样本个数,yi为第i个土壤光谱样本对应的标签,为第i个土壤光谱样本的土壤有机碳预测值;

24、或者基于土壤有机碳预测值和对应的标签通过均方跟误差得到预测精度rmse为:

25、

26、其中,n为验证集中的土壤光谱样本个数,yi为第i个土壤光谱样本对应的标签,为第i个土壤光谱样本的土壤有机碳预测值。

27、本发明还提供了一种基于光谱引导集成学习的土壤有机碳预测装置,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于,所述计算机存储器中采用所述的基于光谱引导集成学习的土壤有机碳光谱预测方法构建的光谱引导集成模型;

28、所述计算机处理器执行所述计算机程序时实现以下步骤:

29、将土壤光谱输入光谱引导集成模型得到预测的土壤有机碳含量。

30、与现有技术相比,本发明的有益效果为:

31、本发明通过构建基于土壤光谱数据和土壤真实有机碳含量训练完成的三个预测模型后,将三个预测模型输出的碳含量预测值集结合土壤光谱的主成分数据作为训练集,以拟合第二随机森林模型得到光谱引导集成学习模型,从而能够将每个预测模型中光谱主成分与土壤碳含量映射较为准确的部分进行保留,进而保留和结合了每个模型土壤碳含量预测准确的波段,从而能够更加精准的预测土壤的碳含量,与现有技术通过实验室理化方法获得土壤有机碳含量相比成本更低、效率更高,现有技术通过单一土壤光谱预测模型相比精度更高。



技术特征:

1.一种基于光谱引导集成学习的土壤有机碳预测方法,其特征在于,包括:

2.根据权利要求1所述的基于光谱引导集成学习的土壤有机碳预测方法,其特征在于,通过第二训练集和对应标签训练第二随机森林模型得到光谱引导集成模型,包括:

3.根据权利要求1所述的基于光谱引导集成学习的土壤有机碳预测方法,其特征在于,获得每个土壤样本对应的真实有机碳含量和原始土壤光谱,包括:

4.根据权利要求1所述的基于光谱引导集成学习的土壤有机碳预测方法,其特征在于,每个原始土壤光谱进行预处理得到土壤光谱样本,包括:

5.根据权利要求1所述的基于光谱引导集成学习的土壤有机碳预测方法,其特征在于,基于第一样本集和对应标签训练偏最小二乘回归模型,包括:

6.根据权利要求1所述的基于光谱引导集成学习的土壤有机碳预测方法,其特征在于,基于第一样本集和对应标签训练cubist模型,包括:

7.根据权利要求1所述的基于光谱引导集成学习的土壤有机碳预测方法,其特征在于,基于第一样本集和对应标签第一随机森林模型,包括:

8.根据权利要求1所述的基于光谱引导集成学习的土壤有机碳预测方法,其特征在于,将验证集输入光谱引导集成模型得到土壤有机碳预测值集,基于土壤有机碳预测值和对应的标签通过决定系数或均方跟误差得到预测精度,当预测精度达到精度阈值时,完成第二随机森林的验证得到最终光谱引导集成模型。

9.根据权利要求8所述的基于光谱引导集成学习的土壤有机碳预测方法,其特征在于,基于土壤有机碳预测值和对应的标签通过决定系数得到预测精度r2为:

10.一种基于光谱引导集成学习的土壤有机碳预测装置,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于,所述计算机存储器中采用权利要求1~9任一项所述的基于光谱引导集成学习的土壤有机碳光谱预测方法构建的光谱引导集成模型;


技术总结
本发明公开一种基于光谱引导集成学习的土壤有机碳预测方法及其装置,包括:获得土壤样本及其真实有机碳含量和原始土壤光谱,预处理原始土壤光谱得到土壤光谱样本,基于土壤光谱样本构建样本集,划分样本集为第一训练集和验证集,真实有机碳含量作为标签;基于第一训练集和对应标签训练偏最小二乘回归模型、Cubist模型和随机森林模型,并得到三个模型的碳含量预测值集;基于三个模型的碳含量预测值集和土壤光谱主成分数据构建第二训练集,通过第二训练集和对应标签训练第二随机森林模型得到光谱引导集成模型;该方法综合利用了不同预测模型的优势,能够较为准确的预测土壤的碳含量。

技术研发人员:陈颂超,薛杰,史舟,杨梅花
受保护的技术使用者:浙江大学杭州国际科创中心
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1