基于金属定量构效关系的海水急性基准预测方法_4

文档序号:9687709阅读:来源:国知局
后,W累积百分率为纵坐标(P=(R-〇.5)/N,R物种序号,N物种数)构建物种敏感 度分布图。
[01M]步骤h4,采用非线性Sigmoidal-logistic拟合方程对曲线进行拟合(公式16),根 据拟合方程计算累积百分率为0.05,0.1和0.2时对应的危险浓度肥5,肥10和肥20。
[0196] 曲线拟合优度的判别指标包括劳,
,下和?。计算方法见方程(4)- (6)。
[0197]
[019引式中,a代表拟合曲线的振幅,Xc代表中屯、值,k代表曲线斜率。大量研究证实,非线 性Sigmoida^Logistic拟合模型对物种敏感度曲线的拟合效果最佳。故本发明采用此方法 作为推导金属海水水质基准最大浓度值的方法。
[0199] 获得金属隶的QSAR-SS化曲线拟合方程:
[0200]
[0201]评价拟合优度的各参数分别为:Adj.R2 = 0.965,RSS = 0.016,F = 267.154,P = 8.276 X ΙΟΛ根据SSDs曲线,如图5,当y等于0.05,0.10和0.20时,对应的log肥5,log肥10和 log肥20的值分别为-1.616,-1.181和-0.706。美国环保局1995年发布的水质基准指南中,基 于实验室测定推导出隶的危险浓度为-2.047,预测误差为0.431。
【主权项】
1. 基于金属定量构效关系的海水急性基准预测方法,其特征在于,根据金属离子的结 构特征与海洋生物急性毒性效应之间的定量关系预测未知金属的毒性终点,结合不同物种 的敏感度分布分析推导保护不同比例的海洋生物的危险浓度; 该具体过程为: 步骤a,建模毒性数据采集,筛选,运算和汇总; 步骤b,五门八科海洋模式生物筛选; 步骤c,构建金属离子结构描述符数据集,以各金属对应的结构参数为自变量进行线性 相关性分析,通过相关系数排序,获得最佳结构描述符; 步骤d,构建毒性预测模型及稳健性检验;建立一元线性回归方程,对参数进行估计,采 用F统计量对应的P值进行检验; 步骤e,QSAR模型的内部验证,包括交叉验证和y随机化验证,分别用e 1和e2表示; 步骤f,QSAR模型的外部验证; 步骤g,模型适用范围计算;经过校验的模型,以杠杆值h为横坐标,以各数据点的标准 残差为纵坐标,绘制Williams图; 步骤h,基于获得的毒性预测值,利用物种敏感度分布法对未知金属的海洋生物毒性和 基准最大浓度值进行快速筛选与预测。2. 根据权利要求1所述的基于金属定量构效关系的海水急性基准预测方法,其特征在 于,在所述的步骤c中,以单物种的毒性终点为因变量,各金属对应的结构参数为自变量进 行线性相关性分析,根据下述公式(1)计算相关系数r;式中,X,y分别表不各结构参数和毒性值的平均值,xi和yi分别表不第i种金属对应的 结构参数和毒性值; 相关系数r>0.8为显著相关参数; 步骤C中,构建金属离子结构描述符集合,包括软指数σρ、最大配合物稳定常数log-βη、 鲍林(Pauling)电负性Xm、共价指数Xm2r、原子电离势ΑΝ/Δ ΙΡ、第一水解常数I l〇gKQH|、电化 学势Δ Eo、原子大小AR/AW、极化力参数Z/r、Z/r2、Z2/r、似极化力参数Z/AR、Z/AR 2。3. 根据权利要求1所述的基于金属定量构效关系的海水急性基准预测方法,其特征在 于,所述的步骤d的过程为: 步骤dl,一元回归方程的构建与参数估计; 以所述的步骤c中确定的最佳结构参数为自变量X,金属活性值为因变量Y,利用一元线 性回归分析方法构建各模式生物的QICAR方程Y = XB+E,见下述公式(2),其中:η为观测值个数; 采用最小二乘法对方程中参数进行估计,f为X的转置矩阵:步骤d2,拟合优度检验和回归方程的显著性检验,采用F检验; 模型的拟合优度检验指标为:决定系数R2和自由度校正的决定系数炉,标准偏差RMSE; F检验的指标为单因子方差分析计算得到的F值和相关概率p;采用F统计量对应的P值 进行检验; 步骤d3,判别标准:根据毒性数据获取途径,体外实验R2 2 0.81,体内试验R2 2 0.64;显 著水平为α,当Ρ〈α时,回归方程显著; 步骤d3按照下述公式计算,式中,R2表示决定系数,:F表示自由度校正的决定系数,RMSE表示标准偏差。4.根据权利要求1所述的基于金属定量构效关系的海水急性基准预测方法,其特征在 于,所述的步骤e中,el的具体过程为: 步骤el_l,在给定的建模样本中,选取大部分样本进行建模型,留小部分样本用建立的 模型进行预测,并计算这小部分样本的预测误差; 步骤el_2,记录每个方程中预测误差的平方加和,直到所有的样本都被预报了一次而 且仅被预报一次; 步骤el_3,计算交叉验证相关系数Q2ct和交叉验证均方根误差RMSEV,判别依据为:Q2cv> 0.6,R2-Q2cv<0.3; 所述的步骤el_3采用的计算公式为:式中,表示第i个化合物毒性的实测值,代表第i个化合物毒性的预测值, 代表训练集毒性的平均值,η表示训练集中化合物数。5. 根据权利要求1所述的基于金属定量构效关系的海水急性基准预测方法,其特征在 于,所述的步骤e中,e2的具体过程为: 步骤e2_l,在给定的样本中,将原始的因变量,即建模海洋生物的急性毒性观测值随机 打乱顺序,同时保持自变量顺序不变,组成新的数据组; 步骤e2_2,用新样本构建QSAR模型,并计算其标准偏差RMSE和交叉验证的均方根误差 RMSECV; 步骤e2_2采用的计算公式为:式中,7严3表示新的QSAR模型中第i个化合物毒性的实测值,3;/^'代表第i个化合物毒 性的预测值,表示新的QSAR模型进行留一法交叉验证时第i个化合物毒性的预测值, η表示训练集中化合物数; 步骤e2_3,所述的步骤e2_l、e2_2重复进行50次,以RMSE为横坐标、RMSECV为纵坐标作 图,比较y随机化后的QSAR模型的RMSECV和RMSE是否显著增加。6. 根据权利要求1所述的基于金属定量构效关系的海水急性基准预测方法,其特征在 于,所述的步骤f的具体过程为: 步骤Π ,将样本划分为训练集和验证集,划分方法为:将样本按毒性从小到大顺序排 列,验证集数据均匀地分布在训练集数据范围内,且验证集数据不少于总样本的20% ; 步骤f2,用训练集数据构建QSAR模型; 步骤f3,计算验证集数据预测值与观测值之间的交互验证系数Qext2和一致性相关系数 CCC,其判别依据为:Qext2>0 · 6,CCC>0 · 85; 步骤f3采用的计算公式为:式中,yi表示观测值;;A表示预测值;?表示观测值的均值;表示训练集观测值的均 值;|表示预测值的均值;nMt表示验证集的样本数。7. 根据权利要求1所述的基于金属定量构效关系的海水急性基准预测方法,其特征在 于,在所述的步骤g中,杜杆值hi的计算公式为:hi = xiT(XTX)^xi (14) 式中,Xl代表第i个金属的结构参数组成的列向量;对于单参数模型^7表示矩阵X的转置矩阵,(χτχ广 1表示对χτχ矩阵的逆矩阵。8. 根据权利要求7所述的基于金属定量构效关系的海水急性基准预测方法,其特征在 于,在所述的步骤g中,临界值h*的计算公式为:式中,P代表模型中变量数,单参数模型中P = l,n代表模型训练集化合物的数量,根据 步骤a-f校验过后各QSAR方程中训练集金属个数决定; 在Williams图中h〈h*的坐标空间为模型的适用范围。9. 根据权利要求1所述的基于金属定量构效关系的海水急性基准预测方法,其特征在 于,所述的步骤h的具体过程为: 步骤hi,按照所述的步骤a-g所述的方法,依次获得优选五门八科海洋生物的单参数 QSAR预测方程; 步骤h2,搜集并整理待预测金属在八个方程中出现的所有结构描述符的值,代入方程 计算待预测金属对各海洋物种的急性毒性终点; 步骤h3,每种金属对应的各物种毒性数据由低到高排序后,以累积百分率为纵坐标构 建物种敏感度分布图; 步骤h4,采用非线性Sigmoidal-Logistic拟合方程对曲线进行拟合,根据拟合方程计 算累积百分率为ο. 05,0.1和0.2时对应的危险浓度HC5,HC1Q和HC20。
【专利摘要】本发明涉及一种基于金属和类金属定量构效关系的海水水质基准预测方法,根据金属离子的结构特征与海洋生物急性毒性效应的定量关系预测未知金属的毒性终点,结合不同物种的敏感度分布分析推导保护不同比例的海洋生物的危险浓度;是综合金属理化结构参数和不同海洋生物的致毒机理建立QSAR金属毒性预测模型,并将其应用于预测未知海水水质基准最大浓度的一种方法。本发明基于生态学原理,系统筛选五门八科海洋物种作为最小生物预测集,分别构建单参数的毒性预测模型,提高模型精度和预测能力。
【IPC分类】G06F17/50
【公开号】CN105447248
【申请号】CN201510824672
【发明人】陈程, 吴丰昌, 郄玉, 穆云松
【申请人】中国环境科学研究院
【公开日】2016年3月30日
【申请日】2015年11月24日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1