基于金属定量构效关系的海水急性基准预测方法

文档序号:9687709阅读:352来源:国知局
基于金属定量构效关系的海水急性基准预测方法
【技术领域】
[0001] 本发明设及海水水质基准模型领域,尤其设及基于金属定量构效关系的海水急性 基准预测方法。
【背景技术】
[0002] 人类的生存与发展都依赖于海洋,但随着沿海区域经济的快速发展,我国近岸海 域正遭遇着日益严重的陆源重金属污染,海洋生物多样性和生态系统的平衡也正经受着严 重的考验。如浙江溫州的乐清湾沿海区域,化工产业W及电子拆解行业的高速发展使得浙 江省6500公里长的海岸线上超过80%的海岸带受到污染,表层沉积物铜的超标率达到 50% ,2011年7月还出现了水生生物大规模死亡,如何建立切实可行的保护海洋生物的金属 海水水质基准已成为我国海洋环境管理中亟待解决的关键问题。
[0003] 自上世纪屯十年代初,USEPA就开展了金属污染物的海水水质基准的研究,《清洁 水法》颁布了儒,铜,隶,儀,银、儘等6种优控及非优控金属的基准值,W保护鱼和其他海洋 生物的繁殖和生存。近四十年来,美国环保局根据最新科学进展对水质基准不断进行更新, 相继颁布基准文件共6次。在最新的基准文件中,15种金属或类金属被列入优控污染物和非 优控污染物名录,其中10种(神,儒,铭,铜,铅,隶,儀,砸,银,锋)给出了海水水质基准最大 浓度值。另外一些发达国家和地区,如欧盟、加拿大、澳大利亚、新西兰等也根据其海洋水环 境污染状况,从保护水生生态系统的角度出发,结合毒理实验数据和现场环境调查资料,相 继制订了金属类污染物保护海洋生态系统的水质基准值,并且形成了较为系统的水质基准 研究体系。而我国的海洋环境质量基准研究尚处于起步阶段,正在国外水质基准研究方法 的基础上摸索前进,目前仅有一些零星的关于金属海水水质基准的研究,究其原因主要是 社会对海洋生态系统重视不够,对海洋物种的实验室培养繁殖技术、毒性测试标准方法的 研究也相对较少,海洋生物的实验数据,尤其是脊椎动物的毒性数据严重匿乏,相对于淡水 生态系统,海洋生态系统拥有更丰富的生物种类,很多种类的生物,如棘皮类,只能在海洋 环境中存活,但就目前已有的研究成果,海洋生物的毒性数据要远远少于淡水生物,运些都 给我国海水水质基准的制订带来了极大的困难。

【发明内容】

[0004] 本发明的目的在于提供一种基于金属定量构效关系的海水急性基准预测方法,用 W克服上述的技术问题。
[0005] 为实现所述的目的,本发明提供一种基于金属定量构效关系的海水急性基准预测 方法,根据金属离子的结构特征与海洋生物急性毒性效应的定量关系预测未知金属的毒性 终点,结合不同物种的敏感度分布分析推导保护不同比例的海洋生物的危险浓度;
[0006] 该具体过程为:
[0007] 步骤a,建模毒性数据采集,筛选,运算和汇总;
[000引步骤b,五口八科海洋模式生物筛选;
[0009] 步骤c,构建金属离子结构描述符数据集,w各金属对应的结构参数为自变量进行 线性相关性分析,通过相关系数排序,获得最佳的结构描述符;
[0010] 步骤d,构建毒性预测模型及稳健性检验;建立一元回归方程,对参数进行估计,采 用F统计量对应的P值进行检验;
[0011] 步骤e,QSAR模型的内部验证,包括交叉验证和y随机化验证,分别用e 1和e2表示;
[0012] 步骤f,QSAR模型的外部验证;
[0013] 步骤g,模型适用范围计算;经过校验的模型,W杠杆值h为横坐标,W各数据点的 标准残差为纵坐标,绘制Williams图;
[0014] 步骤h,基于获得的毒性预测值,利用物种敏感度分布法对未知金属的毒性和基准 预测值进行快速筛选与预测。
[0015] 进一步地,在所述的步骤C中,W单物种的毒性终点为因变量,各金属对应的结构 参数为自变量进行线性相关性分析,根据下述公式(1)计算相关系数r;
[0016]
[0017] 式中,i,歹分别表示各结构参数和毒性值的平均值,Χι和yi分别表示第i种金属 对应的结构参数和毒性值;
[0018] 相关系数r〉0.8为显著相关参数。
[0019] 进一步地,在所述的步骤C中,构建金属离子结构描述符集合,包括软指数σρ、最大 配合物稳定常数log-βη、鲍林(Pauling)电负性Xm、共价指数Xm 2r、原子电离势ΑΝ/ΔΙΡ、第一 水解常数llogKoHl、电化学势ΔΕο、原子大小AR/AW、极化力参数2作、2/^2 2/^、似极化力参 数Z/AR、Z/AR2。
[0020] 进一步地,所述的步骤d的过程为:
[0021] 步骤dl,一元回归方程的构建与参数估计;
[0022] W所述的步骤C中确定的最佳结构参数为自变量X,金属活性值为因变量Y,利用一 元线性回归分析方法构建各模式生物的QICAR方程Y = XB+E,请参阅下述公式(2),其中:
[0023]
[0024] η为观测值个数。
[0025] 采用最小二乘法对方程中参数进行估计,公为X的转置矩阵:
[0026]
[0027] 步骤d2,拟合优度检验和回归方程的显著性检验,采用F检验;
[0028] 模型的拟合优度检验指标为:决定系数R2和自由度校正的决定系数庐,标准偏差 RM沈;
[0029] F检验的指标为单因子方差分析(AN0VA)计算得到的F值和相关概率P (Significance F);采用F统计量对应的P值进行检验;
[0030] 步骤d3,判别标准:根据毒性数据获取途径,体外实验R2 > 0.81,体内试验R2 > 0.64;显著水平为α,当ρ<α时,回归方程显著。
[0031] 进一步地,所述的步骤d3按照下述公式计算,
[0036] 式中,R2表示决定系数,梦表示自由度校正的决定系数,MSE表示标准偏差。
[0037] 进一步地,所述的步骤e中,el的具体过程为:
[0038] 步骤el_l,在给定的建模样本中,选取大部分样本进行建模型,留小部分样本用建 立的模型进行预测,并计算运小部分样本的预测误差;
[0039] 步骤el_2,记录每个方程中预测误差的平方加和,直到所有的样本都被预报了一 次而且仅被预报一次;
[0040] 步骤el_3,计算交叉验证相关系数Q2ev和交叉验证均方根误差RMSECV,判别依据: Q2cv〉0.6,R2-Q2cv<0.3。
[0041] 进一步地,所述的步骤el_3采用的计算公式为:
[0044] 式中,.V严s表示第i个化合物毒性的实测值,代表第i个化合物毒性的预测 值,?""代表训练集毒性的平均值,η表示训练集中化合物数。
[0045] 进一步地,所述的步骤e中,e2的具体过程为:
[0046] 步骤e2_l,在给定的样本中,将原始的因变量(建模海洋生物的急性毒性观测值) 随机打乱顺序,同时保持自变量顺序不变,组成新的数据组;
[0047] 步骤e2_2,用新样本构建QSAR模型,并计算其标准偏差RMSE和交叉验证的均方根 误差RM沈CV;
[004引步骤e2_3,所述的步骤e2_l、e2_2重复进行50次,WRMSE为横坐标、RMSECV为纵坐 标作图,比较y随机化后的QSAR模型的RMSECV和RMSE是否显著增加。
[0049]进一步地,所述的步骤e2_2采用的计算公式为:
[0化2]式中,表示新的QSAR模型中第i个化合物毒性的实测值,y/wv代表第i个化合 物毒性的预测值,j/'"'"'表示新的QSAR模型进行留一法交叉验证时第i个化合物毒性的预 测值,η表示训练集中化合物数。
[0053] 进一步地,所述的步骤f的具体过程为:
[0054] 步骤η,将样本划分为训练集和验证集,划分方法为:将样本按毒性从小到大顺序 排列,验证集数据均匀地分布在训练集数据范围内,且验证集数据不少于总样本的20% ;
[0055] 步骤f 2,用训练集数据构建QSAR模型;
[0056] 步骤巧,计算验证集数据预测值与观测值之间的交互验证系数Qext2和一致性相关 系数 CCC,判别依据:Qext2〉0.6,CCC〉0.85。
[0057] 进一步地,所述的步骤巧采用的计算公式为:
[0061]式中,yi表示观测值;y',·表示预测值;J表示观测值的均值;方表示训练集观测值 的均值;^表示预测值的均值;next表示验证集的样本数。
[0062] 进一步地,所述的步骤g中,杠杆值hi的计算公式为:
[0063] 1π = χΛχΤχ)-?χι (14)
[0064] 式中,xi代表第i个金属的结构参数组成的列向量;对于单参数模型:

;χΤ表示矩阵X的转置矩阵,(χΤχ尸表示对χΤχ矩阵的逆矩阵。
[0065] 进一步地,所述的步骤f中,临界值h*的计算公式为:
[0066]
(15)
[
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1