本发明属于机器学习和生物炭吸附,具体涉及一种生物炭比表面积和芳香族化合物吸附量预测方法。
背景技术:
1、芳香族化合物是环境中十分重要的一类污染物,其广泛存在于大气、水体与土壤之中,会对人体的身体健康、大气光学性质以及环境气候造成十分不利的影响。
2、生物炭作为一种有效的生物质材料在各个领域一直有着独特的优势。生物炭材料对污染物的最大吸附量和生物炭材料的比表面积作为评判生物炭对污染物去除性能和生物炭材料性能的重要指标,是诸多科研工作者研究的重点课题。
3、与传统方法相比,机器学习的高效化、复杂建模能力、成本节约能力,在生物炭制备和生物炭吸附领域具有显著优势。因此如何建立预测生物质材料性能和吸附容量模型是亟需解决的问题。
4、现有技术存在以下问题:通常情况下,研究者首先会选择多种生物质材料,在不同的条件下,制备多种生物炭。其次对生物炭进行表征,得出材料的比表面积等相关参数,根据经验选择合适的生物炭,进行批量吸附实验。最后通过实验数据绘制吸附等温线,并使用langmuir等方程对实验数据进行拟合得出最大吸附量这一数值。其中生物炭的比表面积这一关键参数,需要使用昂贵的实验仪器才能测得,而且影响这一结果的因素众多,同时选择合适的生物炭进行吸附试验,得出最大吸附量,又需要经过一系列试错实验得出,整个实验的试错成本极大,存在诸多不确定性,而且存在着返工的可能。
技术实现思路
1、为解决上述背景技术中提出的问题,本发明提供了一种生物炭比表面积和芳香族化合物吸附量预测方法,大大节约了实验成本,预测准确,为寻找最佳性能产品的最佳制备条件提供了依据。
2、为实现上述目的,本发明提供如下技术方案:
3、第一方面,本发明提供一种生物炭比表面积和芳香族化合物吸附量预测方法,包括,
4、步骤(1)获取生物炭实验数据集,所述生物炭实验数据集包括生物炭吸附芳香族化合物数据集和生物炭热解实验数据集;
5、步骤(2)对所述生物炭吸附芳香族化合物数据集、生物炭热解实验数据集,进行数据处理得到完整生物炭吸附数据和完整生物炭热解实验数据;
6、步骤(3)将所述完整生物炭吸附数据和完整生物炭热解实验数据,代入机器学习算法进行建模,得到预测模型,并对模型进行性能评估和模型可解释性分析;
7、步骤(4)根据分析目的建立待预测数据库,将所述待预测数据库代入预测模型,得出生物炭比表面积和芳香族化合物吸附量预测数据。
8、在一些实施例中,步骤(1)中,所述生物炭实验数据集,通过从已经公开的数据库中检索关键词下载对应的中英文文献和硕博学位论文得到;所述生物炭吸附芳香族化合物数据集,必须包含langmuir方程拟合的生物炭对芳香族化合物最大吸附量数据,langmuir方程拟合系数r2需大于0.95。
9、在一些实施例中,步骤(1)中,所述生物炭吸附芳香族化合物数据集包括生物炭材表征描述符、芳香族化合物溶剂化参数描述符、最大吸附量描述符。
10、在一些实施例中,步骤(1)中,所述生物炭热解实验数据集包括生物质材料表征描述符、生物炭制备条件描述符、生物炭材料比表面积描述符。
11、在一些实施例中,步骤(2)中,所述进行数据处理包括对数据缺失部分进行数据补充,使用算法为knn算法。
12、在一些实施例中,步骤(3)中,所述多种预测性能模型包括:生物炭比表面积预测模型、生物炭对芳香族化合物最大吸附量预测模型;所述生物炭比表面积预测模型和生物炭对芳香族化合物最大吸附量预测模型,使用完整生物炭热解实验数据和完整生物炭吸附数据建立;所述性能评估使用rmse、r2。计算公式如下:
13、
14、y、和分别是目标描述符的预测值、实际值和平均值,n是任何给定实例的数据点,n是数据点总数;
15、在一些实施例中,步骤(3)中,所述模型可解释性分析包括分析模型中不同特征贡献性和不同特征的夏普利值对模型的影响。
16、在一些实施例中,步骤(4)中,所述根据分析目的建立的待预测数据库,包含两种分析目的:s1得到生物炭比表面积预测和最佳制备条件;s2得到生物炭材料对芳香族化合物最大吸附量。
17、在一些实施例中,所述得到生物炭比表面积预测和最佳制备条件,所对应的比表面积待预测数据库中需包括:生物质材料表征描述符、生物炭制备条件描述符;所述得到生物炭材料对芳香族化合物最大吸附量,对应的吸附量待数据库包括:生物炭表征描述符、污染物理化参数描述符。
18、第二方面,本发明提供了一种生物炭比表面积和芳香族化合物吸附量预测装置,包括处理器及存储介质;
19、所述存储介质用于存储指令;
20、所述处理器用于根据所述指令进行操作以执行根据第一方面所述的方法。
21、第三方面,本发明提供了一种设备,包括,
22、存储器;
23、处理器;
24、以及
25、计算机程序;
26、其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现上述第一方面所述的方法。
27、第四方面,本发明提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法。
28、与现有技术相比,本发明的有益效果是:
29、(1)本发明建立了生物炭吸附芳香族化合物最大吸附量的预测模型,通过将预测数据库,输入已建立的模型中,就可得到此生物炭对此种污染物的最大吸附量,大大节约了实验成本。
30、(2)本发明建立了生物炭材料比表面积预测模型,可有效预测生物炭比表面积,同时可以将模型输出的比表面积最大值,所对应的生物炭制备条件描述符中的数据,当作此种生物炭的最佳制备条件,此方法大大减少了实验试错成本,为生物炭后续的改性和活化提供了一定的依据。
31、(3)本发明应用模型可解释性分析方法,分析了影响生物炭比表面积预测模型和芳香族化合物最大吸附量预测模型的主要因素,为生物炭的制备提供了一定的理论指导。
1.一种生物炭比表面积和芳香族化合物吸附量预测方法,其特征在于,包括:
2.根据权利要求1所述的生物炭比表面积和芳香族化合物吸附量预测方法,其特征在于,步骤(1)中,所述生物炭实验数据集,通过从已经公开的数据库中检索关键词下载对应的中英文文献和硕博学位论文得到;所述生物炭吸附芳香族化合物数据集,必须包含langmuir方程拟合的生物炭对芳香族化合物最大吸附量数据,langmuir方程拟合系数r2需大于0.95。
3.根据权利要求1所述的生物炭比表面积和芳香族化合物吸附量预测方法,其特征在于,步骤(1)中,所述生物炭吸附芳香族化合物数据集包括生物炭材表征描述符、芳香族化合物溶剂化参数描述符、最大吸附量描述符。
4.根据权利要求1所述的生物炭比表面积和芳香族化合物吸附量预测方法,其特征在于,步骤(1)中,所述生物炭热解实验数据集包括生物质材料表征描述符、生物炭制备条件描述符、生物炭材料比表面积描述符。
5.根据权利要求1所述的生物炭比表面积和芳香族化合物吸附量预测方法,其特征在于:步骤(2)中,所述进行数据处理包括对数据缺失部分进行数据补充,使用算法为knn算法。
6.根据权利要求1所述的生物炭比表面积和芳香族化合物吸附量预测方法,其特征在于:步骤(3)中,所述预测模型包括:生物炭比表面积预测模型、生物炭对芳香族化合物最大吸附量预测模型;所述生物炭比表面积预测模型和生物炭对芳香族化合物最大吸附量预测模型使用完整生物炭热解实验数据和完整生物炭吸附数据建立;所述性能评估使用均方根误差rmse、线性相关系数性r2。
7.根据权利要求1所述的生物炭比表面积和芳香族化合物吸附量预测方法,其特征在于:步骤(3)中,所述模型可解释性分析包括:分析模型中不同特征贡献性和不同特征的夏普利值对模型的影响。
8.根据权利要求1所述的生物炭比表面积和芳香族化合物吸附量预测方法,其特征在于:步骤(4)中,所述根据分析目的建立的待预测数据库包含两种分析目的:s1得到生物炭比表面积预测和最佳制备条件;s2得到生物炭材料对芳香族化合物最大吸附量。
9.根据权利要求8所述的生物炭比表面积和芳香族化合物吸附量预测方法,其特征在于:所述得到生物炭比表面积预测和最佳制备条件,所对应的比表面积待预测数据库中需包括:生物质材料表征描述符、生物炭制备条件描述符;所述得到生物炭材料对芳香族化合物最大吸附量,对应的吸附量待数据库包括:生物炭表征描述符、污染物理化参数描述符。
10.一种存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一项所述的方法。