一种针对吸附DMMP的疏水性MOF的机器学习方法

文档序号:32492717发布日期:2022-12-10 03:31阅读:47来源:国知局
一种针对吸附DMMP的疏水性MOF的机器学习方法
一种针对吸附dmmp的疏水性mof的机器学习方法
技术领域
1.本发明涉及计算化学与纳米复合催化材料领域,具体涉及一种针对吸附dmmp的疏水性mof的机器学习方法及dmmp提取系统、设备。


背景技术:

2.糜烂性毒剂,也被称为起泡剂,是相对持久的毒剂,可以以无色蒸汽和液滴两种形态使用。这类毒剂能迅速地被全身多部位吸附,引起炎症以及其他常见的组织损伤。因此,如何高效的预防和去除这类毒剂就变得尤为重要,为了较少减少实验过程中毒剂对人体的损伤,我们采用模拟剂dmmp作为研究对象。
3.目前,主流的化学毒剂吸附材料为多孔吸附剂。其中最常用的是活性炭,其他固体吸附剂材料还包括树脂、沸石等。膜分离方法始于20世纪后半期,其具有成本低、效率高、能耗低、工艺简单、占地面积小等诸多优点,气体膜分离技术根据不同气体分子在膜材料中的传质快慢不同,可以实现相对低能耗的选择性分离。
4.在过去的二十年里,金属有机框架(metal-organic framework,mof)作为一种特殊的纳米孔材料出现了。mof材料的研究不仅在于其迷人的拓扑结构,更在于其可裁剪性和多样性的特点,更易于进行设计组装和结构调控,其正受到越来越多的重视。新型mofs 多孔材料的研究及其在应用方面的开发具有重要的理论和应用价值。但是由于金属中心、有机链接以及拓扑结构的不同,导致实验和计算生成的mof数量巨大,这会产生实验成本高并且实验周期长等一系列研究问题,为此我们提出了化学模拟剂dmmp提取方法、系统以及设备。


技术实现要素:

5.(一)解决的技术问题
6.针对现有技术的不足,本发明提供一种针对吸附dmmp的疏水性mof的机器学习方法及dmmp提取系统、设备,以解决上述的问题。
7.(二)技术方案
8.为实现上述所述目的,本发明提供如下技术方案:
9.一种针对吸附dmmp的疏水性mof的机器学习方法,包括以下步骤:
10.第一步:通过巨正则蒙特卡洛模拟得到金属有机框架材料的结构描述符、能量描述符,以及mof对空气中化学模拟剂dmmp的吸附性能,基于以上参数建立数据集;
11.第二步:把数据集的70%划分为训练集,30%划分为测试集,运用五次交叉验证,并对数据进行归一化处理;
12.第三步:选择不同机器学习算法,运用训练集数据训练机器学习模型,并调整模型的超参数,评估不同机器学习模型以及回归预测效果,对比不同的机器学习模型的回归预测效果,筛选预测精度高的机器学习模型;
13.第四步:根据评估结果对筛选高性能mof。
14.优选的,所述第一步中结构参数包括材料的孔隙率、最大孔径、比表面积、亨利系数、吸附热、密度,性能参数包括吸附量、选择性和综合权衡变量;
15.性能参数的综合权衡变量是吸附量和选择性的权衡值tsn,计算公式如下:
[0016][0017]
其中x为模拟剂dmmp,y1和y2代表空气中的n2和o2,n为吸附量,s为选择性。
[0018]
优选的,所述第二步中的机器学习算法包括决策树、随机森林以及集成梯度提升树。
[0019]
优选的,所述第三步中的评估回归预测结果的准确性指标包括pearson线性相关系数 r、平均绝对误差mae、均方根误差rmse。
[0020]
优选的,所述第四步中通过对比三种性能指标的回归预测效果,最后根据tsn值的高低筛选10个最优mof用于空气中化学模拟剂dmmp的吸附分离。
[0021]
一种化学模拟剂dmmp提取系统,包括相互连接并通讯的如下模块:
[0022]
数据采集模块,用于采集mof的结构参数和mof对空气中模拟剂dmmp吸附分离性能参数,建立数据集;
[0023]
机器学习模块,选择机器学习算法,对数据集进行回归预测;
[0024]
效果预测模块,对不同机器学习算法的回归预测结果和机器模型进行评估;
[0025]
数据筛选模块,根据回归预测结果,根据tsn值的高低筛选10个mof用于空气中化学模拟剂dmmp吸附分离。
[0026]
一种化学模拟剂dmmp提取设备,包括:
[0027]
存储器,用于存储计算机程序;
[0028]
处理器,用于执行计算机程序时实现化学模拟剂dmmp提取方法。
[0029]
(三)有益效果
[0030]
与现有技术相比,本发明提供了化学模拟剂dmmp提取方法及dmmp提取系统、设备,具备以下有益效果:
[0031]
1、该化学模拟剂dmmp提取方法、系统以及设备,提供的用于筛选金属有机框架的模拟剂dmmp吸附分离性能的计算模拟方法及系统,该方法基于机器学习能够对目标材料的性能进行预测并快速高效筛选出目标性能的mofs材料。
[0032]
2、该化学模拟剂dmmp提取方法、系统以及设备,与传统的实验研究相比,显著减少了研发时间和成本的浪费,并且相对传统的实验研究安全性大大提高。
[0033]
3、该化学模拟剂dmmp提取方法、系统以及设备,能够通过理论计算加快了mof的筛选进程,从而指导实验合成。
[0034]
4、该化学模拟剂dmmp提取方法、系统以及设备,评估了不同的机器学习模型,并筛选了预测准确度高的模型,对其它化学毒剂的预测具有指导和普遍适用性。
附图说明
[0035]
图1是本发明实施例筛选目标性能的mofs材料的方法流程图;
[0036]
图2是本发明实施例随机森林算法下的吸附量回归预测结果示意图;
[0037]
图3是本发明实施例随机森林算法下的选择性(s)回归预测结果示意图;
[0038]
图4是本发明实施例随机森林算法下的权衡值tsn回归预测结果示意图;
[0039]
图5是本发明实施例决策树算法下的吸附量回归预测结果示意图;
[0040]
图6是本发明实施例决策树算法下的选择性(s)回归预测结果示意图;
[0041]
图7是本发明实施例决策树算法下的权衡值tsn回归预测结果示意图;
[0042]
图8是本发明实施例集成梯度提升树算法下的吸附量回归预测结果示意图;
[0043]
图9是本发明实施例集成梯度提升树算法下的选择性(s)回归预测结果示意图;
[0044]
图10是本发明实施例集成梯度提升树算法下的权衡值tsn回归预测结果示意图。
具体实施方式
[0045]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0046]
实施例
[0047]
请参阅图1-10,本实施例提供的化学模拟剂dmmp提取方法,包括以下步骤:
[0048]
s1、采集mof的结构参数和mof对空气中化学模拟剂dmmp吸附分离性能参数,建立数据集:
[0049]
我们的mofs的模型来自chung等人建立的6013个core-mof数据库。我们用六个描述符(最大孔径(lcd)、体积比表面积(vsa(m2/cm3))、孔隙率(hvf(φ))、孔极限直径(pld)q0st(kj/mol)和亨利系数(khx(mol/kg/pa))x表示模拟剂来描述mof的结构/能量特征。其中,我们用raspa软件包以直径为的n2作为探针计算vsa,同样的以直径为的he作为探针计算hvf(φ);用ntv-mc(n为粒子数,v 为系统体积,t为系统温度)方案在raspa软件包中模拟了q0st(kj/mol)和亨利系数(khx);用zeo++软件包计算lcd和pld。
[0050]
我们采用蒙特卡罗(gcmc)方法模拟了6013种core-mofs对空气中化学模拟剂dmmp的吸附分离性能,计算假设mof结构都是刚性的,且假设晶体中所有的自由溶剂被去除,这是使用大量吸附剂结构进行计算时常见的假设。该模拟在常温298k和常压101.325kpa状态下进行,化学模拟剂dmmp与空气(o2和n2)的摩尔分数比均为0.00001:0.22:0.78。整个模拟过程中保持化学势、体积、温度恒定。通过lorentz-berthelot规则计算mofs与吸附质分子间的相互作用,利用长程校正的球形截断半径被设定为的 lennard-jones(lj)来计算吸附物和框架原子之间的相互作用,静电相互作用使用截断半径为的ewald方法求和计算。每个模拟点由20000个mc循环组成,前10000次用于平衡模拟体系,后10000次用于计算平均值的积累,每个gcmc模拟独立进行,整个模拟在 raspa软件包下操作。在每个循环中执行平移、旋转、交换、再生和插入与删除操作,以实现平衡。模拟剂dmmp和n2、o2的力场参数均来自于trappe力场。
[0051]
最后,用上述数据组成数据集;
[0052]
基于步骤s1的数据集,划分为训练集和测试集:
[0053]
把6013个疏水性core-mof数据分为两部分,采用随机方式抽取70%数据量作为训练集(train),用于机器学习模型的构建;剩余一部分(30%)作为测试集(test),用于机器
学习模型预测准确性的评估。
[0054]
s2、通过机器学习模型,对数据集进行回归预测,测试结果如图2-7所示,其中x轴为性能的模拟值,y轴为性能的预测值:
[0055]
在本实施例中,机器学习算法包括选择决策树(dt)、随机森林(rf)、集成梯度提升树(xgboost)三种机器学习模型;
[0056]
s3、评估不同机器学习模型及其回归预测效果:
[0057]
考虑到模型的稳定性,对每个性能预测时都进行5次训练预测;
[0058]
在数据集上,利用五折交叉验证配合pearson线性相关系数r、平均绝对误差mae和均方根误差rmse,定量地描述机器学习模型预测结果的准确性,选择r值接近1,rmse和 mae接近0的算法作为最佳算法;
[0059]
训练集、测试集中各机器学习算法对吸附量(adsorption capacity)、选择性 (selectivity)和综合权衡变量(tsn)预测值的r、rmse和mae的平均值列于下表1:
[0060]
表1 r、rmse和mae的平均值
[0061]
[0062][0063]
s4、根据性能的评估结果(请参阅表1:)对mof进行筛选,实现mof对模拟剂dmmp 的吸附分离性能预测与准确性评价:
[0064]
对于s,算法dt和rf的预测效果0.83和0.82,而算法xgboost的预测效果r=0.84。对于吸附量n,算法rf预测效果r=0.92,算法dt预测效果r=0.91,而算法xgboost预测效果r=0.96远远超过了前两者。总所周知,优秀的吸附剂肯定是同时具备良好的吸附量和较高的选择性。所以我们引入了tsn这一权衡值,算法rf预测效果r=0.92,算法dt预测效果r=0.93,算法xgboost预测效果r=0.98。由此可见不管是n、s或者tsn,xgboost 算法的预测结果都要好于其他两种算法,所以算法xgboost是三种算法中最适用于该体系。
[0065]
步骤s3中,在对比了三种机器学习的回归预测效果以后,xgboost模型在回归预测效果的精度比它们高。
[0066]
步骤s4中,通过对比三种性能指标的回归预测效果,最后根据tsn值的高低筛选10 个mof用于模拟剂dmmp吸附分离。
[0067]
因此,根据步骤s1-s4为高效快速筛选目标性能的mof用于模拟剂dmmp吸附分离提供了新方向,对实验合成mof也有一定的指导意义。
[0068]
第二方面,本发明还提供一种实施上述方法的空气中化学模拟剂dmmp提取系统,包括相互连接并通讯的如下模块:
[0069]
数据采集模块,用于采集mof的结构参数和mof对空气中模拟剂dmmp吸附分离性能参数,建立数据集;
[0070]
机器学习模块,选择机器学习算法,对数据集进行回归预测;
[0071]
效果预测模块,对不同机器学习算法的回归预测结果和机器模型进行评估;
[0072]
数据筛选模块,根据回归预测结果,根据tsn值的高低筛选10个mof用于空气中化学模拟剂dmmp吸附分离。
[0073]
第三方面,本发明还提供一种模拟剂dmmp提取设备,包括:
[0074]
存储器,用于存储计算机程序;
[0075]
处理器,用于执行所述计算机程序时实现如前述所公开的一种化学模拟剂dmmp提取方法步骤。
[0076]
第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上
存储有计算机程序,所述计算机程序被处理器执行时实现如前述所公开的一种化学模拟剂dmmp 提取方法步骤。
[0077]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1