一种基于可解释机器学习的纳塑料细胞毒性预测方法

文档序号:34445494发布日期:2023-06-13 10:15阅读:71来源:国知局
一种基于可解释机器学习的纳塑料细胞毒性预测方法

本发明属于纳塑料细胞毒性预测领域,尤其涉及一种基于可解释机器学习的纳塑料细胞毒性预测方法。


背景技术:

1、纳塑料是尺寸在1-100纳米之间的塑料。据估计,每年生产的塑料中约有10%最终成为环境中的碎片,随着时间的推移,由于紫外线辐射、机械磨损和生物降解,塑料碎片进一步分解为微塑料,最终成为纳米塑料。已有研究初步表明,纳塑料可导致不同生物的健康问题。此外,纳塑料的疏水性以及复杂的表面特征使其成为其他污染物(如微污染物,重金属等)的潜在载体,进一步加重了其对环境健康的影响。但目前对纳塑料的细胞毒性机制的阐释还存在很大的科学空白,而且纳塑料细胞毒性的实验研究存在着实验周期长,实验成本高等问题。


技术实现思路

1、为解决上述背景中的技术问题,本发明提出了一种基于可解释机器学习的纳塑料细胞毒性预测方法,通过使用可解释的机器学习方法对细胞毒性进行预测,具有效率高、成本低、准确率高的优点。

2、从web of science搜索关键词”(nanoplastics or microplastics)andcytotoxicity”得到的182篇同行评议的出版物,按严格的数据提取标准从中筛选可用的文献,对预先收集的文献中的数据进行收集与整理。最终得到了有2030个数据点的关于纳塑料的细胞毒性的数据集,数据集一共引用了72篇文献。

3、为了达到上述目的,本发明的一种基于可解释机器学习的纳塑料细胞毒性预测方法,包括:

4、s1、对预先收集的文献中的数据进行收集与整理,得到数据集;

5、s2、使用train_test_split函数,把数据集划分为测试集和训练集;

6、s3、选用机器学习算法,使用训练集对模型进行训练,同时调整模型的超参数,使模型的效果提升,并满足训练集和测试集r2均在0.6以上,r2为决定系数;

7、s4、选择预测结果最好的模型,并使用模型解释方法对模型进行解释,判断哪些特征对细胞存活率的影响最大,以此来解释纳塑料的细胞毒性机制。

8、优选地,数据集包括纳塑料的物理性质特征、化学性质特征和细胞试验的理化参数与细胞存活率。

9、优选地,所使用的模型解释方法包括shapley additive explanation、permutation feature importance以及explainable boosting machine。

10、优选地,机器学习算法包括随机森林、xgboost或支持向量机。

11、与现有技术相比,本发明具备以下有益效果:

12、1、本发明提出的基于可解释机器学习的纳塑料细胞毒性预测方法,该方法首次收集并整理了一个比较全面的纳塑料细胞毒性数据集,填补了该方向的一个科学空白,并且使用机器学习方法对细胞毒性进行预测,不仅效率高,而且成本低,准确率高。

13、2、本发明采用了可解释性较高的随机森林算法,并且使用多种模型解释方法,对影响细胞毒性的特征进行比较分析,可以对纳塑料的细胞毒性预测提供一个指导作用。

14、3、本发明得到的第一个较为全面的纳塑料细胞毒性数据集,以及使用不同的机器学习方法,不同的模型解释方法来预测纳塑料的细胞毒性,分析毒性机制。本发明得到的结果具有普适性和可靠性,为后续纳塑料的相关研究提供了通用方法。



技术特征:

1.一种基于可解释机器学习的纳塑料细胞毒性预测方法,其特征在于,包括:

2.根据权利要求1所述的一种基于可解释机器学习的纳塑料细胞毒性预测方法,其特征在于,数据集包括纳塑料的物理性质特征、化学性质特征和细胞试验的理化参数与细胞存活率。

3.根据权利要求1所述的一种基于可解释机器学习的纳塑料细胞毒性预测方法,其特征在于,所使用的模型解释方法包括shapley additive explanation、permutationfeatureimportance以及explainable boosting machine。

4.根据权利要求1所述的一种基于可解释机器学习的纳塑料细胞毒性预测方法,其特征在于,机器学习算法包括随机森林、xgboost或支持向量机。


技术总结
本发明属于纳塑料细胞毒性预测领域,且公开了一种基于可解释机器学习的纳塑料细胞毒性预测方法,包括:S1、对预先收集的文献中的数据进行收集与整理;S2、把数据集划分为测试集和训练集;S3、选用机器学习算法,使用训练集对模型进行训练;S4、选择预测结果最好的模型,并使用模型解释方法对模型进行解释,判断哪些特征对细胞存活率的影响最大,以此来解释纳塑料的细胞毒性机制。本发明首次收集并整理了一个比较全面的纳塑料细胞毒性数据集,填补了该方向的一个科学空白,并且使用机器学习方法对细胞毒性进行预测,不仅效率高,而且成本低,准确率高。

技术研发人员:闫希亮,陈寒乐,刘国红,闵维翠,何英,闫兵
受保护的技术使用者:广州大学
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1