基于金属定量构效关系的海水急性基准预测方法_2

文档序号:9687709阅读:来源:国知局
0067] 式中,P代表模型中变量数,单参数模型中p=l,n代表模型训练集化合物的数量, 根据步骤a-f校验过后各QSAR方程中训练集金属个数决定;
[0068] 在Williams图中h<h*的坐标空间为模型的适用范围。
[0069] 进一步地,所述的步骤h的具体过程为:
[0070] 步骤hi,按照所述的步骤a-g所述的方法,依次获得优选五口八科海洋生物的单参 数QSAR预测方程;
[0071] 步骤h2,捜集并整理待预测金属在八个方程中出现的所有结构描述符的值,代入 方程计算待预测金属对各海洋物种的急性毒性终点;
[0072] 步骤h3,每种金属对应的各物种毒性数据由低到高排序后,W累积百分率为纵坐 标构建物种敏感度分布图;
[0073] 步骤h4,采用非线性Sigmoidal-Logistic拟合方程对曲线进行拟合,根据拟合方 程计算累积百分率为0.05,0.1和0.2时对应的危险浓度肥5,肥10和肥20。
[0074] 定量结构活性相关(QSAR)方法采用统计分析手段寻找目标污染物的结构与生物 活性间的内在联系,作为毒理机制研究的有效手段已被广泛应用于各类毒性效应的预测评 价中。QSAR方法不受实验条件和测试仪器的限制,采用各种计算化学和数据挖掘技术来研 究和预测污染物的生物活性,因而在面对批量污染物和传统毒理学测试难W开展的情况 时,QSAR在毒性预测与风险评价方面展现出独特魅力。本发明提供的基于金属定量构效关 系的海水急性基准预测方法,围绕金属的海洋生物急性毒性效应和海水水质基准预测,根 据金属离子的结构特征与海洋生物急性毒性效应的定量关系预测未知金属的毒性终点,结 合不同物种的敏感度分布分析推导保护不同比例的海洋生物的危险浓度。
[0075] 与现有技术相比本发明的有益效果为:
[0076] 1、现有技术只对淡水生物的毒性进行了预测,但海洋生物和淡水生物的毒性作用 位点和毒性机理存在一定差异,而且目前用于基准推导的海洋生物数据比较缺乏。本发明 提供的方法,基于生态学原理,系统筛选五口八科海洋物种作为最小生物预测集,分别构建 单参数的海洋生物急性毒性预测模型,提高模型精度和预测能力。
[0077] 2、QSAR模型与SSD分析结合预测基准连续浓度。
[0078] 现有技术通过实验测试手段获得毒性终点值,再进行物种敏感度分析进而推导基 准值。本发明提供的方法通过QSAR模型方法预测多种金属的毒性值,快速、简单,依赖较少 的试验测试数据完成多种毒性数据缺乏的金属的基准预测。
【附图说明】
[0079] 图1为本发明的流程示意图;
[0080] 图2为实施例的模型y随机化验证结果图;
[0081] 图3为实例的模型外部验证结果图;
[0082] 图4为实施例的模型适用范围评价的Williams图;
[0083] 图5为实施例的隶毒性预测值的物种敏感度分布曲线.
【具体实施方式】
[0084] W下结合附图,对本发明所述的的和另外的技术特征和优点作更详细的说明。
[0085] 本发明提供的方法原理是根据金属离子的结构特征与海洋生物急性毒性效应的 定量关系预测未知金属的毒性终点,结合不同物种的敏感度分布分析推导保护95%、90% 和80%海洋生物的危险浓度。是综合金属理化结构参数和不同海洋生物的致毒机理建立 QSAR金属毒性预测模型,并将其应用于预测未知基准参考值的一种方法。
[0086] 如图1所示,其为本发明基于金属定量构效关系的海水急性基准预测方法的流程 示意图,该具体过程为:
[0087] 步骤a,建模毒性数据采集,筛选,运算和汇总;
[0088] 步骤日1,数据采集过程:
[0089] 步骤a2,数据筛选过程;数据筛选满足的条件为:
[0090] (1)因本发明所预测的金属海水水质基准最大浓度W美国环保局颁布的推荐值作 为比对,故遵照美国环保局推导海水水质基准的要求,仅选取栖息于北美地区物种;
[0091] (2)每个物种包含至少来自同一实验条件的5种金属的毒性数据;
[0092] (3)毒性终点数据类型均为致死率LCso;
[0093] (4)毒性测试必须严格遵守标准的毒性测试方法;
[0094] (5)生物测试暴露时间48~96小时。
[00M]步骤a3,数据运算过程;在本发明实施例中的运算方法为:
[0096] W金属自由离子浓度为数据的衡量指标,如单位为质量浓度除W分子量统一转化 为摩尔浓度,即mol/L。
[0097] 步骤a4,数据汇总过程:
[0098] 最终得到的数据集包括金属化合物分子式,毒性效应类型,终点指标,受试生物类 型。
[0099] 详细的毒性数据获取过程如下:
[0100] 建模的急性毒性数据采集自近40年SCI科学引文索引查询的有效数据(ISI Web of Knowledge)。通过文献检索引擎,输入金属名称、待测物种名称和急性毒性等关键词,导 出满足条件的毒性数据集。单一物种的毒性数据必须来自于相同的实验条件。在满足步骤 a2条件的前提下,筛选出合格的毒性数据。W金属自由离子浓度为数据的衡量指标,如果原 始数据W离子化合物质量为毒性终点指标。需除W分子量统一转化为微摩尔浓度,即μπιο?/ L。最终的物种毒性终点均为致死率LCso。在数据汇编过程中,记录金属原子或分子式,原子 或分子量,毒性效应类型,终点指标,受试生物类型等信息,整理成Excel表格作为建模依 据。
[0101 ]对砂海卿的急性毒性数据进行汇总,如表1所示
[0102] 表1.急性毒性数据筛选,运算和汇总范例
[0103]
[0104] 步骤b,五口八科水生模式生物筛选;
[0105] 海洋模式生物W美国环保局推荐的推导水质基准的Ξ 口八科生物为基础,筛选出 海洋中对重金属敏感的五口八科模式生物,包括软体动物3种,节肢动物巧巾,环节动物、棘 皮动物、脊索动物各1种。对于每一类模式生物,对应的毒性数据需严格按照数据采集和筛 选的要求,依次汇总各物种急性毒性数据。在进行模式生物筛选后,确定八种生物的科学命 名,所属口和科。
[0106] 优选五口八科北美地区敏感海洋生物的信息,如表2所示
[0107] 表2.优选重金属急性效应评价的模式生物 [010 引
[0109] 步骤C,构建金属离子结构描述符数据集;
[0110] 构建金属离子结构描述符集合,包括软指数σρ、最大配合物稳定常数log-βη、鲍林 (化uling)电负性Xm、共价指数Xm 2r、原子电离势AN/A IP、第一水解常数I logKoHl、电化学势 Δ Eo、原子大小AR/AW、极化力参数Z/r、Z/r2、zVr、似极化力参数Z/AR、Z/AR2。
[0111] 步骤cl,W单物种的毒性终点为因变量,各金属对应的结构参数为自变量进行线 性相关性分析,根据下述公式(1)计算皮尔逊相关系数r;
[0112]
[011引式中,XI和yi分别表示第i种金属对应的结构参数和实测毒性值,克y分别表示 各结构参数和实测毒性值的平均值。相关系数r〉0.8为显著相关参数。采用皮尔逊相关可W 简便,客观的度量两个因子之间的关联程度。
[0114] 步骤c2,在显著相关的前提下,通过相关系数排序,获得最优的结构描述符。该步 骤中通过相关系数r,筛选出与毒性显著相关的结构参数,避免了伪相关参数引入模型。
[0115] 步骤d,构建毒性预测模型及稳健性检验;
[0116] 步骤dl,一元回归方程的构建与参数估计;
[0117] W所述的步骤C中确定的最佳结构参数为自变量X,金属活性值为因变量Y,利用一 元线性回归分析方法构建各模式生物的QICAR方程Y = XB+E,请参阅下述公式(2),其中:
[011 引
[0119] η为观测值个数;B代表未知参数,是方程中需要通过最小二乘法进行估计的;E代 表随机误差项,反映了除X1,X2对y的线性关系之外的随机因素对y的影响。与一元线性回归 相比,方程(2)采用一元线性回归建立了两种不同结构参数与金属毒性值的关系,完整、准 确地表达预测对象与相关因素的关系。
[0120] 采用最小二乘法对方程中参数进行估计,公为X的转置矩阵:
[0121]
[0122] 最小二乘回归是从误差拟合角度对回归模型进行参数估计,是一种标准的一元建 模工具,尤其适用于预测分析。
[0123] 步骤d2,拟合优度检验和回归方程的显著性检验(F检验);
[0124] 模型的拟合优度检验指标为:决定系数(R2)和自由度校正的决定系数(及),标准 偏差(RMSE)dF检验的指标为单因子方差分析(AN0VA)计算得到的F值和相关概率P (Significance F)。通常采用F统计量对应的P值进行检验。
[0125] 步骤d3,判别标准:根据毒性数据获
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1