本发明涉及环境,具体涉及一种评价土壤多功能性的因果机器学习方法。
背景技术:
1、土壤作为地球上绝大多数陆地生物赖以生存的家园,在维持生物多样性以及生态系统功能方面有着不可忽视的重要意义,其中,土壤多功能性的概念被提出用于量化土壤生态系统功能的价值,土壤多功能性指的是土壤同时提供和维持多个生态功能的能力,包括:碳储存、固氮、物质分解、保水、养分循环、维持微生物活性等多方面,土壤多功能性的存在对生态系统中的动植物以及人类的生存至关重要,合理的量化土壤多功能性对土壤价值保护也有重要指导意义。
2、与此同时,土壤往往会受到外界干预的影响,如人类活动以及气候变化,其中,干旱现象所引起的生态环境问题得到广泛关注,全球气候变化背景下,干旱现象的频率与危害不断增加,为生物多样性及生态系统功能带来严重风险,目前针对干旱现象对地上生物、植物以及生态系统的影响已经得到相对充分的调研,但针对于土壤功能的具体影响以及其中的异质性因果效应还未得到细致研究,该类研究的缺失,会对准确制定保护战略,减轻干旱对生态功能服务供应的负面影响带来潜在隐患。因此,在干旱影响的背景下,对土壤多功能性异质性因果效应的研究能够为细化土壤保护区域、维护土壤多功能带来明显价值。
3、近年来,基于机器学习的因果推断方法得到了快速发展,为全球尺度背景下的数据驱动研究提供了有效支撑;目前,结合机器学习方法来研究异质性因果效应,判断对某种干预反应最大的群体有哪些特征在因果推断领域有着较多应用,机器学习驱动的因果推断方法综合了两者的优点,在估计异质性因果效应方面有着明显优势,相较于传统的计量领域因果推断方法有更强的适应性,对环境科学与生态领域研究有着较强借鉴意义。
技术实现思路
1、本发明的目的在于克服现有技术的不足与缺陷,拓展机器学习驱动的因果推断在环境科学领域应用的范围,提供一种评价土壤多功能性的因果机器学习方法,能够实现对土壤多功能性的评估,以及外界干预(干旱)对土壤多功能性异质性因果效应的准确、稳定估计。
2、为达成上述目的,本发明的技术方案如下。
3、一种评价土壤多功能性的因果机器学习方法,其特征在于,包括如下步骤:
4、s1:收集文献中不同地点土壤的包含理化性质、有机物含量在内的数据,并填补环境特征、干旱指数相关数据,建立土壤数据库,方法如下:
5、s11:在文献数据库中检索,搜集主题包括土壤多功能性、土壤干旱、土壤微生物多样性的相关文献,按照主题及相关内容进行存储,便于后续提取数据;
6、s12:提取文献中提供的包括土壤理化性质、有机物含量、微生物多样性在内的土壤特征数据;
7、s13:填补包含干旱指数在内的环境特征数据,建立起土壤数据库;
8、s2:选择合适的特征使用多功能指数量化不同土壤样本多功能性,方法如下:
9、s21:从s12所提取的土壤特征数据中选择能够反映土壤可以同时提供和维持多个生态功能的能力的特征作为反映土壤多功能性特征,用于计算多功能指数;
10、s22:根据所选择的反映土壤多功能性的特征分别计算z得分;在计算每个特征的z得分后将所有特征z得分进行加和平均,得到土壤多功能指数;
11、s3:划分特征变量、干预变量及输出变量,基于因果森林模型将处理后的数据集输入模型进行训练,调节参数,方法如下:
12、s31:建立因果森林模型,将变量划分为特征变量、干预变量及输出变量,具体如下:所述特征变量为s13所述的除干旱指数的环境特征数据,所述干预变量为干旱指数,所述输出变量为所述土壤多功能指数;
13、s32:将处理完成的数据集输入到因果森林模型中,设置初始参数,并进一步根据后续置信区间及显著性调整参数优化模型;
14、s4:根据训练完成后的因果森林模型,计算干预变量即干旱指数对输出变量即土壤多功能指数的平均因果效应;
15、s5:进一步将特征变量重要性进行排序,筛选重要变量,计算该类特征背景下干旱对输出变量的异质性因果效应。
16、进一步地,s12中所提取的土壤特征数据具体包括:土壤ph、土壤年龄、采样深度、土壤有机碳含量、总氮、总磷、含水量、土壤细菌生物量、真菌生物量、阳离子交换量、地上生物质碳密度、地下生物质碳密度。
17、进一步地,s13中所填补包含干旱指数在内的环境特征数据具体包括:土壤样本经纬度、海拔、干旱指数、年平均气温、年平均降水、包括森林、草地、沙漠、湿地、灌木林地在内的土地利用类型、土壤细粒结构。
18、进一步地,用于计算多功能指数的土壤多功能性特征具体包括:土壤有机碳含量、总氮、总磷、含水量、土壤细菌生物量、真菌生物量、阳离子交换量、地上生物质碳密度、地下生物质碳密度。
19、进一步地,s32中所设置初始参数:honesty=true,num.trees=20000。
20、进一步地,s51中排序完成后的特征如下:年平均降水、海拔、经度、纬度、年平均气温、土壤细粒结构、土壤温度、森林、草地、沙漠。
21、进一步地,s5按照下列步骤执行:
22、s51:通过衡量特征变量在因果森林中被用作分裂变量的频率,分裂准则基于最大化处置效应估计值的方差,基于因果森林模型对特征变量重要性进行排序;
23、s52:根据排序完成后的特征变量,选择重要性靠前的特征变量基于因果森林模型计算异质性因果效应,反映重要性靠前的特征变量背景下干预变量对输出变量的影响大小;
24、s53:根据计算结果进行回归曲线的拟合,进一步反映变化趋势。
25、进一步地,s53根据计算结果选择geom_smooth函数中的loess回归拟合曲线,进一步反映变化趋势。
26、本发明的主要价值及效果如下所述:
27、(1)本发明提供了一种评价土壤多功能性的因果机器学习方法,通过收集各类土壤多功能性、干旱相关文献数据,构建土壤数据库,进而计算土壤多功能指数反映土壤同时提供和维持多个生态功能的能力,利用收集到的数据作为输入,划分干预、特征及输出变量,使用基于机器学习的因果推断模型中的因果森林模型计算干旱对土壤多功能性的异质性因果效应。
28、(2)本发明提供的评估土壤生态环境多功能性的因果机器学习方法,基于大数据实现,在获得的样本量足够且数据准确的情况下,可以稳定、精确地对土壤生态环境多功能性进行评估,并估计干旱对土壤多功能性的异质性因果效应,为细化土壤保护区域、维护土壤多功能性、减轻干旱带来的负面影响提供技术基础。
1.一种评价土壤多功能性的因果机器学习方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的评价土壤多功能性的因果机器学习方法,其特征在于,s12中所提取的土壤特征数据具体包括:土壤ph、土壤年龄、采样深度、土壤有机碳含量、总氮、总磷、含水量、土壤细菌生物量、真菌生物量、阳离子交换量、地上生物质碳密度、地下生物质碳密度。
3.根据权利要求1所述的评价土壤多功能性的因果机器学习方法,其特征在于,s13中所填补包含干旱指数在内的环境特征数据具体包括:土壤样本经纬度、海拔、干旱指数、年平均气温、年平均降水、包括森林、草地、沙漠、湿地、灌木林地在内的土地利用类型、土壤细粒结构。
4.根据权利要求1所述的评价土壤多功能性的因果机器学习方法,其特征在于,用于计算多功能指数的土壤多功能性特征具体包括:土壤有机碳含量、总氮、总磷、含水量、土壤细菌生物量、真菌生物量、阳离子交换量、地上生物质碳密度、地下生物质碳密度。
5.根据权利要求1所述的评价土壤多功能性的因果机器学习方法,其特征在于,s32中所设置初始参数:honesty=true,num.trees=20000。
6.根据权利要求1所述的评价土壤多功能性的因果机器学习方法,其特征在于,s51中排序完成后的特征如下:年平均降水、海拔、经度、纬度、年平均气温、土壤细粒结构、土壤温度、森林、草地、沙漠。
7.根据权利要求1所述的评价土壤多功能性的因果机器学习方法,其特征在于,s5按照下列步骤执行:
8.根据权利要求7所述的评价土壤多功能性的因果机器学习方法,其特征在于,s53根据计算结果选择geom_smooth函数中的loess回归拟合曲线,进一步反映变化趋势。