一种基于分子结构和环境温度预测化学物质与臭氧氧化反应速率常数的方法

文档序号:6118206阅读:770来源:国知局
专利名称:一种基于分子结构和环境温度预测化学物质与臭氧氧化反应速率常数的方法
技术领域
本发明涉及不同环境温度下臭氧与有机化学物质氧化反应速率常数(k03)的快速预测方法,属于面向环境风险评价的定量结构与活性关系OiSAR)技术领域。背景介绍大多数的工业化学品具有一定的生化稳定性,由光所引发的直接降解以及自由基反应是其在环境中转化的主要途径。在大气层中有机污染物的持久性(半衰期)可以通过与羟基自由基、硝基自由基和臭氧进行化学反应的速率常数等信息进行计算。大气对流层中的有机污染物,日间主要是通过羟基自由基和臭氧降解来去除,夜间主要是通过硝基自由基反应降解。其中,化合物与臭氧反应的降解速率常数(kj是表征化学品在环境中持久性的关键参数。目前对于化学品环境持久性评价多基于实验测试,如光解活性和活性氧物种 (ROS)氧化活性测试等,但完全依靠实验测试来获得化学品的环境持久性数据,具有巨大的财政压力。同时,新合成的日常使用有机化学品正以每年500 1000种的速度增加,对这些化学品一一进行实验测试,无法满足环境管理的要求,亟需发展成本低且快速的化学品环境持久性评估方法。基于定量结构与活性关系OiSAR),可以从化学品的分子结构出发,预测化学品与臭氧反应的速率常数,弥补基础数据的缺失,用于评估化学品的光稳定性。已报导关于的QSAR模型,但这些模型在实用性、预测能力与稳健性、应用域
Fatemi · (Fatemi, M. H. Prediction of ozone tropospheric degradation rate constant of organic compounds by using artificial neural networks. Analytica Chimica Acta. 2006,556 :355-363)建立了基于人工神经网络 (ANN)的137种化合物与臭氧反应的QSAR模型,该模型采用非线性的方法,主要用于预测^SK条件下有机化合物与臭氧反应的1^,模型的透明度不强,不能预测不同温度下的 k03。Pompe 禾口 Veber (Pompe,Μ.,Veber, Μ.,Prediction of rate constants for the reaction of O3 with different organic compounds. Atmospheric Environment. 2001, 35(22) :3781-3788)建立了基于多元线性回归(MLR)的117种不同种类化合物与臭氧反应的QSAR模型,不能预测多个温度下的kQ3。Jiang等(Jiang,J. L.,Yue, Χ. Α.,Chen, Q. F. Determination of ozonization reaction rate constants of aromatic pollutants and QSAR study. Bulletin of Environmental Contamination and Toxicology. 2010,85 568-72)建立了基于密度泛函理论(DFT)的39种芳香族化合物与臭氧反应的QSAR模型,该模型选择的化合物种类单一,应用域偏小,需扩大应用域的范围。构建实用性强且算法简单透明的温度依附性预测模型,并对其预测能力和稳健性进行评价,在此基础上对应用域范围进行表征,对有机化学品的生态风险评价与监管工作具有重要意义
发明内容
本发明要解决的技术问题是提供一种不同环境温度下有机化合物与臭氧反应速率常数的简便、快速、低成本、应用范围广的预测方法。为解决以上技术问题本发明采用的技术方案如下(1)为了保证用于建立模型的数据准确性,对从文献收集的实验测定值进行评估和分析,删除离群点。首先,对同一化合物的多个实验测定值进行统计学评估,删除偏离平均值的数据点;其次,对同一化合物在不同温度下的Iogkffi对1/T作图分析,删除偏离线性的数据点。最终得到1 种有机化合物共264个Iogkffi数据,温度范围从178K到364K。根据化合物与臭氧反应的机理分析,计算26个量子化学描述符、1481个Dragon描述符和12 个分子结构碎片,加入1/T温度描述符。化合物包括单烯烃、二烯烃及多烯烃、卤代烯烃、环状化合物、芳香族化合物、含氧化合物、含氮化合物等。以4 1的比例随机划分训练集和验证集。(2)联合应用逐步回归和PLS回归筛选训练集的描述符组合,构建预测的QSAR 模型,具体步骤如下第一步,采用逐步回归方法进行初筛变量,在多元线性回归(MLR)模型中,膨胀因子(VIF)小于10 ;第二步,基于PLS回归,筛选变量的过程如下先建立包含所有初筛得到的变量的 PLS模型,选择模型相关系数的平方(R2)和累计交叉验证系数(Q2oti)为参考值,R2和Q2am 是由Simca6. 0软件计算得出;分别去除每个描述符一次,以R2和Q2aa数值升高最大的模型为基准模型,重复上述步骤直至R2和Q2oti不再升高为止。若有几个方程的R2和Q2oti数值相近,则比较经自由度调整后的决定系数(R2adj),选择R2adj最大的模型为最优模型。最优模型的表达式Iogk03 = -12. 542-493. 3X (1/T) +0. 41722XEHOMO+0. 4443Xelectrophility+O. 66 971Xnc = c-0. 26128XqCmax+0. 74783XBELm2+4. 8412XMor32v+0. 35198XH3u+0. 38372Xn =
CHE-1. 7438Xnffl^O. 4576Xn = CK2-1. 1235XnBM+0. 28542XnCIKCLE (1)其中,1/T表示温度的倒数;Ehqmq表示最高占据分子轨道能;electrophility表示亲电性;η。=。表示碳碳双键的个数;qCmax表示碳原子最大正电荷;BELm2表示BCUT描述符; Mor32v表示3D-Morse描述符;H!3u表示Getaway描述符;η = CHE表示=CHR的个数;nra2表示氨基的个数;H = Oi2表示=CR2的个数;nBM表示苯环上甲基的个数;如_表示脂肪环的个数。经内部验证和外部验证证实kQ3预测模型的稳健性和预测能力。模型的拟合能力由R2adj和均方根误差(RMSE)来表征,R2adj = 0. 849, RMSE = 0. 562,表明模型具有较好的拟合能力。稳健性用内部验证的交叉验证系数评价,交叉验证系数Q2cum = 0. 838,表明该QSAR 模型具有较好的稳健性。模型的预测能力采用未参与建模的50个外部数据评价,由外部预测相关系数的平方(Q2rat)来表征,Q2ext = 0.878,表明模型具有较好的预测能力。其中, R2adj, RMSE, Q2ext由下列公式得出
权利要求
1.一种基于分子结构和环境温度预测化学物质与臭氧氧化反应速率常数的方法,其特征在于,(1)首先,对同一化合物的多个实验测定值进行统计学评估,删除偏离平均值的数据点;其次,对同一化合物在不同温度下的Iogkffi对1/T作图分析,删除偏离线性的数据点; 最终得到1 种有机化合物共264个Iogkra数据,温度范围从178K到364K ;根据化合物与臭氧反应的机理分析,计算26个量子化学描述符、1481个Dragon描述符和12个分子结构碎片,加入1/T温度描述符;(2)联合应用逐步回归和PLS回归筛选描述符组合,构建预测1 的QSAR模型;具体步骤如下第一步,采用逐步回归方法进行初筛变量,在多元线性回归(MLR)模型中,膨胀因子 (VIF)小于 10 ;第二步,基于PLS回归,筛选变量的过程如下先建立包含所有初筛得到的变量的PLS 模型,选择模型相关系数的平方(R2)和累计交叉验证系数(Q2cJ为参考值,分别去除每个描述符一次,以R2和Q2cm数值升高最大的模型为基准模型,重复上述步骤直至R2y和Q2oti不再升高为止;若有几个方程的R2和Q2cum数值相近,则比较训练集的经自由度调整后的决定系数(R2atu),选择R2atu最大的模型为最优模型;最优模型的表达式Iogk03 = -12. 542-493. 3X (1/T) +0. 41722XEHOMO+0. 4443Xelectrophility+O. 66971Xnc = G-0. 26128XqCmax+0. 74783XBELm2+4. 8412XMor32v+0. 35198XH3u+0. 38372Xn = CHE-1. 7438XnNH2+0. 4576Xn = CE2-l. 1235XnBM+0. 28542XnCIECLE (1)其中,1/T表示温度的倒数;Ehqmq表示最高占据分子轨道能;electrophility表示亲电性;η。=。表示碳碳双键的个数;qCmax表示碳原子最大正电荷;BELm2表示BCUT描述符; Mor32v表示3D-Morse描述符;H!3u表示Getaway描述符;η = CHE表示=CHR的个数;nra2表示氨基的个数;H = Oi2表示=CR2的个数;nBM表示苯环上甲基的个数;如_表示脂肪环的个数。
2.根据权利要求1所述的的方法,其特征在于,所述的化合物包括单烯烃、二烯烃及多烯烃、商代烯烃、环状化合物、芳香族化合物、含氧化合物、含氮化合物。
全文摘要
本发明公开了一种基于分子结构和环境温度预测化学品与臭氧反应速率常数(kO3)的方法,属面向化学品环境监管的定量结构-活性关系(QSAR)技术领域。kO3影响化学品在大气中滞留时间(半衰期),是评估化学品的环境持久性的重要参数。本发明采用了量子化学描述符、Dragon计算的描述符、分子结构碎片表征化合物的分子结构特征,构建了预测kO3的QSAR模型。所构建的不同环境温度下kO3的QSAR模型,经内部验证和外部验证证实了其有良好的稳健性和预测能力,并基于Williams图法表征了QSAR模型的应用域,明确了模型的应用范围。
文档编号G01N25/00GK102507630SQ201110392788
公开日2012年6月20日 申请日期2011年11月30日 优先权日2011年11月30日
发明者乔显亮, 姜菁秋, 李晶, 李雪花, 蔡喜运, 赵文星, 陈景文 申请人:大连理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1