一种预测硝基芳烃化合物还原速率常数的方法与流程

文档序号:15446689发布日期:2018-09-14 23:27阅读:280来源:国知局

本发明涉及生态风险评价测试策略领域,具体涉及一种通过量子化学方法构建定量构效关系模型来预测硝基芳烃化合物还原速率常数的方法。



背景技术:

由于硝基芳烃类化合物中存在的强吸电子基团-no2对苯环上的碳原子及其它取代基有很强的电子效应;因此通过将硝基还原为对应的氨基是该类化合物在环境中转化和降解的重要方式之一。硝基芳烃化合物的还原速率常数是表征该类化合物在还原时反应强度与能力的参数,其值越大说明该类化合物在还原时反应能力越强,越容易通过还原降解而从环境中得以去除。因此,kre可被用来评估硝基芳烃的环境持久性,是硝基芳烃生态风险评估的一个基础数据。

kre可以通过对硝基芳烃化合物进行还原类的实验直接测定,也可通过相对速率方法间接测定。虽然近几十年来有许多的实验工作测定了硝基芳烃的kre值,但是由于实验方法具有耗时、昂贵,依赖于实验仪器和设备等缺点,到目前为止可获取的硝基芳烃kre数据十分有限,这意味着还有大量的硝基芳烃仍旧缺少kre数据。这些数据的缺少,将不利于该类化合物的环境持久性评估,从而无法满足对硝基芳烃化合物这类化学品风险评价和环境监管工作的数据需求。所以,研究非实验技术获取硝基芳烃化合物环境转化行为参数如kre数据,既是为环境污染的还原修复治理提供基础数据支持,也是社会发展的需要。

目前,基于分子结构预测化合物的理化性质、环境行为或毒理学参数的方法,如常见的定量结构-活性相关(qsar)方法已被广泛地应用于各种预测模型的建立。所谓的qsar模型是指定量的描述和研究有机物的结构和活性之间的相互关系,其基本原理是化合物的分子结构决定它的性质。近些来年,一些环境科学研究者通过qsar构建了很多具有预测能力的环境模型,如山东大学发明的专利“一种通过定量构效关系模型预测有机磷农药对水生生物急性毒性的方法”(中国专利申请号201410053184.8)和大连理工大学发明的专利“一种通过定量构效关系模型预测有机物液相蒸汽压的方法”(中国专利申请号201110410088.0)。这对已进入环境的污染物和尚未使用的各种新化合物的生物活性、毒性乃至环境行为进行了成功的预测、评价和筛选,展现出了qasr极为广阔的应用前景。虽然目前,也有一些研究者应用qsar方法建立了各种化学参数与硝基芳烃的kre预测模型。如文献“environ.sci.technol.2006,40:4976-4982”基于单电子还原势(eh1’)、最低空轨道能(elumo)和电子亲和势(ea)通过线性拟合建立了硝基芳烃的kre预测模型。但由于硝基芳烃的kre与很多化学参数都有着密切的联系,仅考虑单一化学参数构建的这些预测模型是不能准确预测硝基芳烃的kre,而且这些模型的稳定性也比较差。因此,有必要建立一个更准确、更稳定的qsar模型。



技术实现要素:

针对现有技术的不足和缺陷,本发明的目的是提供了一种通过构建定量构效关系模型预测硝基芳烃化合物还原速率常数的方法,该方法可以根据化合物的分子结构预测其还原速率数值,从而对其环境持久性及在环境中的归趋进行预测和评价,为硝基芳烃的风险评价和环境监管提供必要的数据支持。

本发明的原理是对已知硝基芳烃化合物,用量子化学软件gaussian09程序进行几何全优化,得到相关的分子结构参数。结合还原速率数据,通过进行偏最小二乘逐步线性回归分析,建立各种分子描述符与还原速率常数之间的定量关系。

实现本发明目的的技术解决方案是:一种通过量子化学方法构建定量构效关系模型来预测硝基芳烃化合物还原速率常数的方法,包括步骤如下:

1)收集硝基芳烃化合物还原速率常数的数据集;

2)运用量子化学软件中的gaussian09对所要研究的硝基芳烃化合物进行几何结构优化,获得这些化合物相应的量子化学参数:分子的体积vm、最高占据轨道能ehomo、最低空轨道能elumo、前线轨道能级差△e、偶极矩μ、分子极化率α、电离势ip、化合物总能量、分子的最正原子净电荷q+、分子的最负原子净电荷q-、与硝基相连苯环上碳原子上的最大净电荷qc、硝基氮原子的最大净电荷qn,并查找其对应的疏水性参数logp,将上述参数共同作为分子描述符;

3)以步骤(1)获取的还原速率数据依据数值大小排序,并按照1:4的比例拆分为验证集和训练集,其中,训练集用于建立预测模型,验证集用于验证模型建立后预测能力;

4)将步骤(2)获取的分子描述符作为自变量,以训练集中的还原速率数据为因变量,对该还原速率数据和步骤(2)中获得的分子描述符采用simca-sversion6.0软件进行偏最小二乘法逐步线性回归分析,然后建立qsar模型,得到的回归方程表达式为:

-logkre=1.35×10-2×ip-1.48×qc-1.01×10-2×ehomo+1.56×10-2×elumo+2.11×10-2×δe+6.11×10-2×μ+2.08

其中,拟合能力:r2=0.898,f=64.758;

5)预测模型的验证:把验证集数据带入回归方程表达式中,获得其预测值,然后通过外部验证来检验所得预测模型的预测能力,外部验证的结果根据外部预测相关系数的平方q2ext和外部验证结果的均方根误差rmse来评判,这两个参数分别定义为:

其中,yi为验证集实验值,为验证集预测值,为训练集实验值的平均值。

步骤1)中的硝基芳烃化合物的还原速率数据包括电化学还原速率数据、催化还原速率数据、厌氧生物还原速率数据。

步骤2)中的疏水性参数logp是从scifinder数据库查得。

步骤4)中的建模过程中,分子描述符间的多重共线性通过变量间的相关矩阵和变量膨胀因子来衡量,当两个自变量间的相关系数大于0.8,这两个变量不能同时出现在方程中;当某分子描述符的变量膨胀因子大于10时,表明自变量间存在多重共线性,剔除该描述符。

本发明提供的方法其特点为:

1.上述通过量子化学方法构建定量构效关系模型来预测硝基芳烃化合物的还原速率常数的方法中:所述硝基芳烃化合物的还原优选的是电化学还原和催化还原。

2.本发明可以简便、快捷、有效地预测不同硝基芳烃化合物(包括已经进入环境的硝基芳烃污染物和尚未投入使用的新硝基芳烃化合物)的还原速率常数。该方法不仅能为化学品的风险评价和环境污染治理提供必要的数据支持,而且其成本低廉,可节省大量的人力、物力和财力。

附图说明

图1为训练集单环硝基芳烃衍生物还原速率常数的实验值,预测值和残差值的分布图。

图2为验证集单环硝基芳烃衍生物还原速率常数的实验值,预测值和残差值的分布图。

图3为硝基芳烃化合物的还原速率常数的欧几里德距离应用域。

具体实施方式

下面结合实施例和附图对本发明作进一步详述。

一种通过量子化学方法构建定量构效关系模型预测硝基芳烃化合物还原速率常数kre的方法,包括如下步骤:

1)从已发表的文献中收集获得实验测得的硝基芳烃化合物的还原速率常数;

2)运用量子化学软件中的gaussian09对硝基芳烃化合物进行几何结构优化,获得该化合物相应的量子化学参数:分子的体积vm、最高占据轨道能ehomo、最低空轨道能elumo、前线轨道能级差△e、偶极矩μ、分子极化率α、电离势ip、化合物总能量、分子的最正原子净电荷q+、分子的最负原子净电荷q-、与硝基相连苯环上碳原子上的最大净电荷qc、硝基氮原子的最大净电荷qn,并查找其对应的疏水性参数logp,将上述参数共同作为分子描述符;

3)以步骤(1)获取的还原速率数据依据数值大小排序,并按照1:4的比例拆分为验证集和训练集,其中,训练集用于建立预测模型,如图1,验证集用于验证模型建立后预测能力,如图2;

4)将步骤(2)获取的分子描述符作为自变量,以训练集中的还原速率数据为因变量,对该还原速率数据和步骤(2)中获得的分子描述符采用simca-sversion6.0软件进行偏最小二乘法(pls)逐步线性回归分析,然后建立qsar模型。在建模过程中,分子描述符间的多重共线性通过变量间的相关矩阵和变量膨胀因子(vif)来衡量。根据两个自变量间的相关系数大于0.8,则这两个变量不能同时出现在方程中;而且对于某描述符的vif大于10时,表明自变量间存在多重共线性,该描述符应被剔除,最终本发明筛选出的最优模型共包含6个描述符,得到的回归方程表达式为:

-logkre=1.35×10-2×ip-1.48×qc-1.01×10-2×ehomo+1.56×10-2×elumo+2.11×10-2×δe+6.11×10-2×μ+2.08

其中,拟合能力:r2=0.898,f=64.758;

5)预测模型的验证把验证集数据带入回归方程表达式中,获得其预测值。然后通过外部验证来检验所得模型的预测能力。外部验证的结果可根据外部预测相关系数的平方q2ext和外部验证结果的均方根误差rmse来评判。这两个参数分别定义为:

(yi为验证集实验值,为验证集预测值,为训练集实验值的平均值)。

其中,如果q2ext大于0.7,表明建立的模型具有良好的外部预测能力,且q2ext越大,外部预测能力越好。在本发明的预测模型外部验证的过程中,验证集数据个数n=104,q2ext=0.861,rmse=0.387,表明该模型具有良好的预测能力。此外,预测模型的应用域表征采用的是欧几里得距离法,如图3,结果表明此模型可有效地预测硝基芳烃化合物的还原速率常数。

实施例1:用本发明所述预测模型预测邻硝基苯甲酸催化还原的-logkre值

以邻硝基苯甲酸的活性炭催化还原为例,首先查得对硝基苯甲酸分子的结构信息,然后运用量子化学软件gaussian09程序包对其进行几何结构优化后,得到单环硝基芳烃结构的最优构型,从而获得其模型所需的分子描述符ip、qc、ehomo、elumo、△e和μ的值分别为10.26、-0.301、-10.259、-1.139、9.120和6.334。然后通过ambitdiscovery(应用与表征软件)中的欧几里德距离法对其进行表征,发现该化合物在模型应用域内,故可以使用本模型来预测硝基苯甲酸的还原速率常数。将得到的量化参数值代入得到的回归方程式:

-logkre=1.35×10-2×ip-1.48×qc-1.01×10-2×ehomo+1.56×10-2×elumo+2.11×10-2×δe+6.11×10-2×μ+2.08

最后得到对硝基苯甲酸的-logkre的预测值为3.30,与其在文献“chemosphere.2015,119:835–840”查得的-logkre实验值为3.36,误差仅为-0.06,与实验值十分相近。

实施例2:应用所构建的预测模型预测2,4-二硝基氯苯还原的-logkre值

根据查得的2,4-二硝基氯苯的结构信息,使用gaussian09程序包对该化合物的结构优化后,可得到其分子描述符ip、qc、ehomo、elumo、△e和μ的值分别为17.80、-0.308、-10.898、-1.809、9.089和1.466。然后根据欧几里德距离法发现其在模型应用域范围内,故可以利用本模型来预测2,4-二硝基氯苯的-logkre值。将上述描述的值代入建立的qasr模型线性关系式中,得到2,4-二硝基氯苯还原的-logkre预测值为2.22,其在文献“russ.j.electrochem.2010,46(8):934-940”查得的-logkre实验值为2.08,误差值-0.14,与实验值比较接近。

实施例3:应用所构建的预测模型预测苦味酸(tnp)还原的-logkre值

根据查得的tnp的结构信息,使用gaussian09程序包对该化合物的结构进行优化,然后可得到其分子描述符ip、qc、ehomo、elumo、△e和μ的值分别为27.02、-0.382、-10.595、-1.34、9.255和1.69。然后根据欧几里德距离法得出该化合物在模型应用域范围内,故可以利用该模型来预测tnp还原的-logkre值。将上述得到的量子化学参数代入本模型中的回归方程中得到tnp还原的-logkre预测值为3.08,与从文献“appl.surf.sci.2015,331:210–218”中查得tnp还原对应的实验值为3.17,其误差为0.09,预测值与实验值很接近。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1