一种预测土壤根际微生物多样性的机器学习方法

文档序号:36398098发布日期:2023-12-15 23:16阅读:22来源:国知局
一种预测土壤根际微生物多样性的机器学习方法与流程

本发明涉及环境,具体涉及一种评价土壤根际微生物多样性的机器学习方法。


背景技术:

1、土壤作为地球上绝大多数陆地生物赖以生存的家园,在维持生物多样性以及生态系统功能方面有着不可忽视的重要意义,根际微生物是指生活在根际区域微环境中的一类微生物群落,它包括细菌,放线菌,真菌,病原体及一些特异菌等,其中以细菌为主。根际环境是植物根系生长发育、营养成分吸收和新陈代谢的场所,是土壤-根系-微生物相互作用的系统。土壤的理化性质在一定程度上作为土壤的特性决定了土壤中原有微生物群落的特征,同时土壤也会对植物的类型和根系特征有着一定的影响,从而影响根际微生物群落的特征。

2、在土壤微生物的数量和种类以及代谢活动方面,根际要多于或强于非根际,根际土壤-微生物-植物互作一直是土壤微生物研究的热点方向,其复杂的互作关系对整个根际系统的稳定和发展有着至关重要的影响。通过研究对植物、土壤环境、根际微生物等在根际土壤微生态系统中所充当的角色和发挥的功能有了进一步的认识。

3、近年来,基于机器学习的一系列预测方法得到了快速发展,为全球尺度背景下的数据驱动研究提供了有效支撑;机器学习可以识别人类可能遗漏的数据趋势和模式,设置后无需人工干预即可运作,其结果会随着时间推移越来越准确,并且能够在动态、大容量和复杂的数据环境中处理各种数据格式,相较于传统的计量领域推断方法有更强的适应性,对环境科学与生态领域研究有着较强借鉴意义。


技术实现思路

1、本发明的目的在于克服现有技术的不足与缺陷,提供一种预测土壤根际微生物多样性的机器学习方法,本发明拓展机器学习在环境科学领域应用的范围,通过收集文献中现有的细菌16srrna高通量测序技术数据使用qiime2生信分析软件分析,能够实现对土壤根际微生物多样性的准确、稳定预测。为达成上述目的,本发明的技术方案如下。

2、一种预测土壤根际微生物多样性的机器学习方法,其特征在于,包括如下步骤:

3、s1:收集文献中不同地点土壤的包含植物种类、根际微生物基因测序序列号、土壤理化性质等在内的数据,并填补环境特征、气候条件相关数据,建立土壤数据库;

4、s2:根据所获取的基因测序数据序列号,下载根际微生物测序数据,得到土壤根际微生物原始数据,使用生物信息软件处理搜集到的根际土壤微生物的原始数据,计算根际微生物的不同多样性指标,选择能够反映土壤根际微生物多样性的合适指标,确定机器学习模型的输出;

5、s3:基于土壤数据库,使用机器学习特征筛选方法进行特征筛选,对筛选出的特征进行重要性分析,以重要性较高特征作为预测变量,得到筛选后的特征集,获得机器学习的模型输入;

6、s4:基于机器学习算法对所筛选出的特征进行重要性分析并排序,获得显著性信息;

7、s5:基于机器学习算法将筛选后的特征集输入到机器学习模型进行训练,并调节机器学习随机森林的参数使其达到准确性的要求,得到预测的根际土壤微生物多样性结果;

8、s6:使用十折交叉验证方法进行模型检验。

9、进一步地,步骤s1的方法如下:

10、s11:在文献数据库中检索,搜集主题包括气候地理因素对土壤根际微生物的影响、土壤理化性质对根际微生物的影响、土壤根际微生物多样性的相关文献,按照主题及相关内容进行存储,便于后续提取数据;

11、s12:提取文献中提供的包括土壤理化性质、植物种类、根际微生物基因测序序列号在内的土壤特征数据;

12、s13:填补包含年平均气温和年平均降水在内的环境特征数据,建立起土壤数据库。

13、进一步地,步骤s2的方法如下:

14、s21:根据所获取的基因测序数据序列号,下载根际微生物测序数据,得到土壤根际微生物原始数据;

15、s22:对从s21所提取的土壤根际微生物原始数据进行剪切和注释处理,并计算土壤根际微生物的α多样性指数和β多样性指数;

16、s23:从s22所计算的α多样性指数和β多样性指数中选择合适的指标表征根际微生物多样性;以所选择的合适指标作为机器学习模型的输出。

17、进一步地,s23中,以shannon指数和pielou指数分别作为代表土壤根际微生物的丰富度指标和均匀度的指标,以shannon指数和pielou指数两个指标作为机器学习模型的输出。

18、进一步地,步骤s3的方法如下:

19、s31:使用基于随机森林模型的剔除重要性为负数的迭代方法对特征进行筛选,直到不出现负的特征重要性,选取模型效果最优的特征集;所述特征的种类包括植物种类、土壤理化性质、环境特征和气候条件;

20、s32:通过特征筛选,保留的重要性较高特征为:经纬度、植物、年平均气温、年平均降水量、土壤类型、ph、硝态氮、速效钾、速效磷、全氮、全碳、土壤有机质含量,以上述特征为预测特征,得到筛选后的特征集。

21、进一步地,所述的机器学习模型为随机森林模型,步骤s4的方法如下:

22、s41:计算每个预测变量的相对重要性的得分,对预测变量根据得到的%lnmse得分排序,得分越高的变量越重要,从而确定预测变量的可靠程度;

23、s42:通过随机森林模型评估每个预测变量对响应变量的重要性,并获得显著性信息。

24、进一步地,所述的机器学习模型为随机森林模型,步骤s6包括:根据模型预测准确性验证结果对随机森林模型的参数进行调整,所调整的参数包括:树的个数ntree,节点最佳变量个数mtry。

25、本发明的主要价值及效果如下所述:

26、(1)本发明提供了一种预测土壤根际微生物多样性的机器学习方法,通过收集各类土壤根际微生物多样性、地理因素等对土壤根际微生物多样性的影响等相关文献数据,构建土壤数据库,进而计算能够反映土壤根际微生物多样性的多样性指数,使用机器学习的方法预测土壤理化性质、植物种类和气候地理因素对根际微生物多样性的影响。

27、(2)本发明提供的预测土壤根际微生物多样性的机器学习方法,基于大数据实现,在获得的样本量足够且数据准确的情况下,可以稳定、精确地对土壤生根际微生物的多样性进行预测,为快速预测环境对土壤根际微生物多样性的影响和后续研究植物和根际微生物的互作提供了技术基础。



技术特征:

1.一种预测土壤根际微生物多样性的机器学习方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的预测土壤根际微生物多样性的机器学习方法,其特征在于,步骤s1的方法如下:

3.根据权利要求1所述的预测土壤根际微生物多样性的机器学习方法,其特征在于,步骤s2的方法如下:

4.根据权利要求1至3任意一项所述的预测土壤根际微生物多样性的机器学习方法,其特征在于,s23中,以shannon指数和pielou指数分别作为代表土壤根际微生物的丰富度指标和均匀度的指标,以shannon指数和pielou指数两个指标作为机器学习模型的输出。

5.根据权利要求1所述的预测土壤根际微生物多样性的机器学习方法,其特征在于,步骤s3的方法如下:

6.根据权利要求1所述的预测土壤根际微生物多样性的机器学习方法,其特征在于,所述的机器学习模型为随机森林模型,步骤s4的方法如下:

7.根据权利要求6所述的预测土壤根际微生物多样性的机器学习方法,其特征在于,所述的机器学习模型为随机森林模型,步骤s6包括:根据模型预测准确性验证结果对随机森林模型的参数进行调整,所调整的参数包括:树的个数ntree,节点最佳变量个数mtry。


技术总结
本发明涉及一种预测土壤根际微生物多样性的机器学习方法,包括如下步骤:收集文献中不同地点土壤的包含植物种类、根际微生物基因测序序列号、土壤理化性质等在内的数据,并填补环境特征、气候条件相关数据,建立土壤数据库;根据所获取的基因测序数据序列号,下载根际微生物测序数据,得到土壤根际微生物原始数据,选择能够反映土壤根际微生物多样性的合适指标,确定机器学习模型的输出;基于土壤数据库,使用机器学习特征筛选方法进行特征筛选,得到筛选后的特征集;基于机器学习算法对所筛选出的特征进行重要性分析并排序,获得显著性信息;基于机器学习算法将筛选后的特征集输入到机器学习模型进行训练,得到预测的根际土壤微生物多样性结果。

技术研发人员:胡献刚,王安宁,穆莉,邓鹏
受保护的技术使用者:南开大学
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1