一种复杂组分化学品危险特性快速评估平台及评估方法与流程

文档序号:29357128发布日期:2022-03-23 00:19阅读:190来源:国知局
一种复杂组分化学品危险特性快速评估平台及评估方法与流程

1.本发明涉及化学品评估领域,具体地说,是涉及一种复杂组分化学品危险特性快速评估平台及评估方法。


背景技术:

2.随着世界经济的发展和社会的进步,化学品在人类生产和生活中发挥着越来越大的作用,同时化学品固有的危险性对人类社会、人身健康和环境生态也构成了巨大的威胁,因此国际社会越来越重视人类健康和环境保护。
3.我国对化学品危险性的基础研究十分薄弱,由于缺乏大量的基础数据。监督管理工作人员以及化学品的生产商、贸易商、使用者在确认某种化学品的分类、危险公示和了解与该种化学品相关的各国法规规定时十分困难;缺乏一套完整的涵盖混合物分类标准、数据查询采信规则。技术力量储备不足、专业人员缺乏。因此,急需设计一种复杂组分化学品危险特性快速评估平台及评估方法来解决此类问题。


技术实现要素:

4.本发明的目的在于提供一种复杂组分化学品危险特性快速评估平台及评估方法,
5.为实现上述目的,本发明采用的技术方案如下:
6.本发明包括以下步骤:
7.a采集待评估化学品在预设每个第一评估指标下的特性信息数据,以及在预设每个第二评估指标下的分类信息数据;针对分类信息,均执行:
8.b获取所述待评估化学品对应的样本数据;根据所述样本数据的特性信息数据以及所述分类信息数据,从所述第一评估指标和所述第二评估指标中筛选出关联所述当前分类信息的可用指标,并计算所述可用指标对应的权重值;
9.c根据所述可用指标以及对应的所述权重值,建立所述当前分类信息的毒理数据评估模型;针对所述待评估化学品的数据信息,将采集的所述待评估化学品的数据信息在所述可用指标下的数据代入所述毒理数据评估模型,得到所述待评估化学品在所述当前分类信息下的毒理数据分并输出评估结果。
10.具体地,在从所述第一评估指标和所述第二评估指标中筛选出关联所述当前分类信息的可用指标之后,根据所述可用指标以及对应的所述权重值通过加和公式计算待评估化学品的整体数据,建立当前分类信息的毒理数据评估模型。
11.具体地,第一评估指标,用于确定所述待测化学品物理特性的评估数据;第二评估指标,用于确定所述待测化学品健康与环境危险评估的评估数据。
12.一种复杂组分化学品危险特性快速评估平台,包括数据采集单元、样本获取单元、指标筛选单元、模型建立单元以及毒理数据分计算单元,其中,
13.所述数据采集单元,用于采集不同化学品在预设每个第一评估指标下的特性信息数据,以及在预设每个第二评估指标下的分类信息数据;
14.所述样本获取单元,用于针对化学品分类信息,获取当前分类信息对应的样本数据;
15.所述指标筛选单元,用于确定所述待评估化学品在数据准确性、完整性、一致性、可信性、时效性、可获取性和相关性七个维度指标下的指标值,从所述第一评估指标和所述第二评估指标中筛选出关联所述当前分类信息的可用指标,并计算所述可用指标对应的权重值;
16.所述模型建立单元,用于根据所述可用指标以及对应的所述权重值,建立所述当前分类信息的毒理数据评估模型;
17.所述毒理数据分计算单元,用于针对所述化学品,将采集的所述化学品在所述可用指标下的数据代入所述毒理数据评估模型,得到所述化学品在所述当前分类信息下的毒理数据分。
18.具体地,进一步包括:预估逻辑判断单元;所述预估逻辑判断单元,用于在所述指标筛选单元筛选出关联所述当前分类信息的可用指标之前,根据数据类型,匹配数据评价参数并设置对应所述待评估化学品的类别;
19.具体地,所述指标值包括:化学品特性、实验条件、给药条件以及试验结果数据;
20.划分至所述化学品特性的所述可用指标,包括:化学品的鉴定特性、化学品的纯度、化学品的来源、测试项目的理化因素中的任意一种或多种;
21.划分至所述实验条件的所述可用指标,包括:是否明确实验动物的性别、明确实验动物的物种、明确判断实验动物的血缘和种系、明确实验开始时动物的年龄和体质量、明确饲养条件(只针对重复剂量毒理学研究)的任意一种或多种;
22.划分至所述给药条件的所述可用指标,包括:是否明确给药途径、明确给药剂量或浓度、明确暴露频率和持续时间、明确有阳性或阴性对照、明确每个剂量组的实验动物数、是否明确有用来评价研究的操作细节、明确浓度或试验物质稳定的任意一种或多种;
23.划分至所述试验结果数据的所述可用指标,包括:明确实验终点以及判断终点的方法、所有实验终点研究结果完整和透明、清晰的表达数据的统计分析方法、实验设计对于获得化学品特异的实验数据恰当定量研究的任意一种或多种。
24.与现有技术相比,本发明具有以下有益效果:
25.本发明本发明在进行数据质量评估时,能够较为快速、准确的评估化学品数据,避免人为参与带来的数据主观影响,增加化学品数据数据在评估过程中的安全性。
附图说明
26.图1为复杂组分化学品危险特性快速评估平台及评估方法的流程示意图。
具体实施方式
27.下面结合附图说明和实施例对本发明作进一步说明,本发明的方式包括但不仅限于以下实施例。
28.如图1所示,本发明包括以下步骤:
29.a采集待评估化学品在预设每个第一评估指标下的特性信息数据,以及在预设每个第二评估指标下的分类信息数据;针对分类信息,均执行:
30.b获取所述待评估化学品对应的样本数据;根据所述样本数据的特性信息数据以及所述分类信息数据,从所述第一评估指标和所述第二评估指标中筛选出关联所述当前分类信息的可用指标,并计算所述可用指标对应的权重值;
31.c根据所述可用指标以及对应的所述权重值,建立所述当前分类信息的毒理数据评估模型;针对所述待评估化学品的数据信息,将采集的所述待评估化学品的数据信息在所述可用指标下的数据代入所述毒理数据评估模型,得到所述待评估化学品在所述当前分类信息下的毒理数据分并输出评估结果。
32.化学品的危险特性由各组分的危险特性及化学品的最终状态共同决定;设化学品由n个组分构成,表示为ti,其危害性表示为hi,含量百分比表示为ci,则化学品的整体危害可表示为:
[0033][0034]htotal
‑‑‑‑‑‑‑‑‑‑‑
化学品整体危险分类
[0035]hi
‑‑‑‑‑‑‑‑‑‑‑‑‑
组分i危险分类
[0036]f‑‑‑‑‑‑‑‑‑‑‑‑‑
组分危险分类累加函数
[0037]ci
‑‑‑‑‑‑‑‑‑‑‑‑‑
组分i百分比含量
[0038]b‑‑‑‑‑‑‑‑‑‑‑‑‑
增量权重系数
[0039]m‑‑‑‑‑‑‑‑‑‑‑‑‑
化学品总量
[0040]
ha‑‑‑‑‑‑‑‑‑‑‑‑‑
各组分整合状态危险性变更
[0041]hp
‑‑‑‑‑‑‑‑‑‑‑‑‑
化学品最终状态决定的危险分类
[0042]
展开组分危险分类累加部分:
[0043]
按照《全球统一化学品分类和标签制度》(ghs)危险分类框架,危险类别如下:
[0044][0045]
纯化学品或单一组分化学品的危险特性可用以下公式表示:
[0046]

[0047]
合并化学品整体危险项,则化学品的整体危险特性分类可分为组分危险分类累加部分及整体状态危险特性分类部分,为:
[0048][0049]hij
为可用化学品特定危险类别等级表示,例如致癌性类别1,易燃液体类别2,该大类数据信息世界主要国家或组织有相应的数据库可查询,经匹配、评价后可直接进行计算,如查询不到信息,可作为未知组分,调整累积方法后参与产品整体危险评估。
[0050]
mhd作为整体状态危险特性分类部分,可在进行物理试验时进行测试评估。
[0051]
模型建立重点为f
jci
项,ghs危险分类框架下,危险类别计算方法如下:
[0052]
由于目前纯物质的ghs分类和毒理学数据相对完善,在纯物质的基础上,使用一般临界值、加和公式和加和法,可以方便快捷的得到混合物的ghs分类,是混合物分类中常用
到的方法。每种健康危害和环境危害对应的分类方法见表2-1。
[0053]
表2-1 混合物健康危害和环境危害的分类方法
[0054][0055]
对混合物进行分类时,可以根据其中已知危险组分的质量百分比超过某种危险分类的一般临界值,将混合物划入该危险种类。各危险种类和危险类别所对应的一般临界值见表2-2。如:生殖细胞致突变性类别1的一般临界值是0.1%,当混合物中至少一种组分已经划为生殖细胞致突变性类别1,而且其含量大于或等于0.1%时,则该混合物应划为生殖细胞致突变性类别1。
[0056]
表2-2 各危险种类和危险类别的一般临界值
[0057][0058]
当混合物的每种组分都有可用数据,或部分组分有可用数据,其他组分可以提供推算换算值时,可以使用加和公式计算混合物整体数据。以急性毒性为例,所有组分的急性毒性数据都可用时,可用加和公式(式(1))可以计算混合物的急性毒性估计值(atemix),确定混合物的急性毒性类别。当部分组分有急性毒性数据,其他组分只有急性毒性数值范围或急性毒性类别时,通过表2-3确定换算得到的急性毒性估计值(ate),代入加和式(1),算出atemix,确定混合物的急性毒性类别。
[0059][0060]
式中:ci为成分i的质量百分比;n表示n个组分,i从1到n;atei为成分i的急性毒性估计值;atemix为混合物的急性毒性估计值。
[0061]
表2-3 不同接触途径的急性毒性数值范围及换算的急性毒性估计值
[0062][0063][0064]
如果混合物中有x%(x≥1)的成分无任何有用的信息,无法确定其急性毒性估计值。应根据已知成分对混合物进行分类,并附加说明,混合物含有x%的毒性未知的成分。当x%》10%时,需要对加和性公式进行修正,得到式(2)。
[0065][0066]
式中,c
unknown
为急性毒性未知成分的质量百分比。
[0067]
危害水生环境的加和公式与急性毒性类似,只需将环境危害数据代替ate代入式(1)或式(2)进行计算。
[0068]
加和法认为每一种组分的危险特性对混合物整体的危险特性都有贡献,其贡献程度与其质量百分比成正比。当具有某种危险特性的组分质量百分比超过临界值时,认为混合物具有该危险特性。高危险类别的组分质量百分比较低,但有助于混合物化为低危险类别时,应使用权重因子。
[0069]
以危害水生环境的分类为例(表2-4),如果划为急性危害水生环境类别1的成分质量百分比≥25%,则混合物划为急性危害水生环境类别1。如果混合物没有划为急性类别1,急性类别1成分的质量百分比之和乘以10,加上划为急性类别2成分质量百分比之和≥25%,则混合物划为急性类别2。如不能划为急性类别2,则需要按照表2-4继续考虑是否可将混合物划为急性类别3。慢性危害水生环境分类的加和法与之类似。表4中,m反映了权重因子,当急性类别1成分的急性毒性远低于1mg.l-1
,慢性类别1的慢毒性远低于0.1mg.l-1
(不能快速降解)和0.01mg.l-1
(可快速降解)的情况下,即使其质量百分比较低的情况下,仍可能影响混合物整体的毒性,因此在用加和法时给予更高的权重,将急性类别1和慢性类别1的质量百分比乘以权重因子后,再进行比较。
[0070]
表2-4根据已分类成分的质量百分比之和对混合物进行危害水生环境分类
[0071][0072]
至此,不同危险类别的在计算中的fj可确定。
[0073]
在h
ij
·fjci
的计算过程中,h
ij
是通过查询匹配获得,实际操作过程中查询到的信息条目往往较多或查询不到,需要从查询到的信息调整进行选择或对查询不到的情况进行处置(例如是作为无害组分处置还是作为未知组分处置),并且查询到的信息也参与fj的选择和是否支持数据的匹配和选择,建立化学品危险分类信息评价方法和支持数据评价方法如下:
[0074]
化学品危险分类数据是化学品风险评估的核心内容,是管理化学品制定决策的重要依据。目前我国尚未建立完整系统的危险分类数据质量评价体系和方法,因此,需要建立科学、准确、方便易行的危险分类数据评价系统,以便有效利用不同途径获取的危险分类数
据,更好的为化学品管理服务。本专利建立了一种化学品危险分类数据质量评价方法建立我国用于化学品管理决策的危险分类数据质量评价系统提供参考和思路。
[0075]
信息数据质量具有多维度结构,一般做法为在准确性,完整性,有效性和传播性等维度对数据质量进行定义和评价。本专利根据化学品危险分类数据及支持数据特点,从准确性、完整性、一致性、可信性、时效性、可获取性和相关性七个维度进行分析。
[0076]
设信息数据d中有n个对象oi,则数据可表示为:d={o1,o2,

,on},oi为对象,每个对象中共有mi个属性,可表示为ti={p1,p2,

,p
mi
},pj为该属性的值
[0077]
准确性是指数据值与已知的基准数值相比的正确程度。数据质量管理评价的一个重要维度和固有的维度,一定程度上显示出了与上下文的相关性。数据的准确性由数据应用的场景决定。
[0078]
但在度量时,并不确定基准数值是多少,因此准确性很难度量。同样地,化学品危险分类信息数据和支持数据的准确性也是难以度量的。为了验证社化学品危险分类信息数据和支持数据的准确性,就要借助附加信息对原始数据的准确性进行推断,其他数据源作为补充或佐证。化学品危险分类信息数据和支持数据的准确性是与上下文相关联的,主要取决于数据的用途,取决于希望所使用的数据达到的准确程度。数据的准确性用r1表示
[0079][0080]fij1
为对象oi的属性pj的正确性判断函数
[0081]
完整性是指被测验数据所表现或包含的数据元素的程度。主要通过以下3个方面进行衡量:数据模式的完整性、数据行列的完整性和数据元素的完整性。数据模式是指数据的结构,数据模式的完整性可以衡量所有实体及属性在总体数据框架中的表示程度。数据行列的完整性可以衡量某一特定属性值的表现程度(如果某列遗漏一个值,那么就被认为数据元素不完整)。数据元素的完整性可以衡量对数据内容的揭示程度。这些度量标准是基于数据结构的和上下文的,根据数据的用途来感知和度量数据完整性的。
[0082]f2ij
为对象oi的属性pj的完整性判断函数为对象oi的属性pj的完备特征空间量度
[0083]
相关性是度量数据与上下文的相关程度。它是一个上下文相关的维度,用户只有根据数据及数据使用情况才能确定。化学品危险分类信息数据和支持数据量在不断
[0084]
扩大,不得不对其进行过滤以获得相关的有效数据。
[0085]
综上所述,在化学品危险分类信息数据和支持数据中,质量维度的重要性有明显的不同。由于非结构化和上下文相关的特质,在一般数据质量度量中采用的方法和工具,在度量化学品危险分类信息数据和支持数据质量中不一定适合。
[0086][0087]
re(pj,pk)为属性pj和pk的相关度
[0088]
dis(pj,pk)为属性pj和pk的逻辑距离
[0089]
可信度是评价数据质量中与上下文相关非常密切的维度。数据的可信度由以下3个因素决定:数据来源的可靠性、数据的规范性、数据产生的时间。如果数据来源可靠并且很知名,那么数据的可信度较高。如果数据是在已知或者被接受值的范围内,那么数据的可信度更高。
[0090][0091]f4ij
为对象oi的属性pj的可信度判断函数
[0092]
时效性是数据质量另一个与上下文极其密切的维度。由于数据从产生到获取再到利用,可能会有一个很显著的时间差。特别是,数据被手工获取并被数字化存储再到最终被理解、
[0093]
获取和访问,这个过程的时间差更加明显,化学品危险分类信息数据和支持数据内容变化快。因此,时效性是一个非常重要的质量维度。
[0094][0095]f5i
为对象oi的时效性判断函数
[0096]
可获取性是度量数据获得的容易程度。由于受版权/安全的限制、数据敏感性的限制,一些数据可能很难获取。
[0097][0098]f6ij
为对象oi的属性pj的可获取判断函数
[0099]
一致性表示在多个数据源之间具有相同指代的不同实体之间的数据一致情况,主要通过数值一致性和格式一致性对数据质量进行度量。如果相同数据其表现形式不同(,那么就出现了格式上的不一致。多源一致性是与上下文无关并存在于数据内部的。由于数值是在一个事先定义好的域中抽取的,并且具有数据结构,因此是可以度量的。
[0100][0101]
p
jk
为不同实体间可表示为统一数据的对象
[0102]
q为相关领域数据的条目
[0103]
8原创性
[0104]
综上所述,在化学品危险分类信息数据和支持数据中,质量维度的重要性有明显
的不同。由于非结构化和上下文相关的特质,在一般数据质量度量中采用的方法和工具,在度量化学品危险分类信息数据和支持数据质量中不一定适合。
[0105][0106]f8i
为对象oi的原创性判断函数
[0107]
则多维数据质量综合评价方法可用公式表示为
[0108][0109]
wi为第i维质量评价维度的权重,根据化学品危险评估的场景进行调整
[0110]ri
为第i维质量评价维度的评价值
[0111]
i为量评价维度
[0112]
n量评价维度的数量,在本专利中为8
[0113]
各质量评价维度存在不通值域和方向,会对数据评价融合产生影响,需对各维度进行标准化,采用极差标准化
[0114]
正向极差标准化值为:
[0115][0116]
负向极差标准化值为:
[0117][0118]
以毒理数据可信度计算为例:
[0119]
参照欧洲替代方法验证中心(ecvam)体系,设定可信度的评价属性参数
[0120]
参与评价的每个参数用“是”或“否”评分,即数据获取条件是否符合获取该类型信息的标准要求分别获得(1分)或(0分),备注栏中为“必备项”为必不可少数据。提高权重项可根据不同应用场景进行调整,原则上不得小于1。则公式
[0121][0122]
中f
4ij
可略去,简化为
[0123][0124]
带入数据计算即可。
[0125]
可信度根据计算结果划分为四个等级作为用于化学品危险评估可信度的评价
[0126]
[0127][0128]
在本实施例子中,录入任一化学组分,需录入但不限于组分的化学品标识编码、中文名称、英文名称,分子式、质量/体积百分比或质量/体积含量百分比范围,其中化学品标识编码和质量/体积百分比或质量/体积含量百分比范围为必填项,如没有或者查询不到cas号,可采用其他编号进行代替,但需采用如下规则进行编号的方式进行填写,
[0129]
例如“4-硝基氯苯”的其他编码:
[0130]
unii:cvl66u249d
[0131]
inchikey:czgcekjolunify-uhfffaoysa-n可采用“#unii#:cvl66u249d”或#inchikey#:czgcekjolunify-uhfffaoysa-n标识
[0132]
化学品标识编码用于化学品身份识别和危险分类信息及支持数据查询,虽然普遍采用美国化学文摘号(cas no.)作为化学品标识编码,但是cas号并不能完全覆盖所有的化学品标识,另外比较常见的有inchikey,pubchem cid,cactvs substructure key fingerprint,einecs no.,unii等。遵照编码规则录入的编码可以进行编码解析,解析为两部分,1是编码规则,用于导向具体的查询数据库,2,是标识码,用于在查询数据库中定位到具体的化学物质。质量/体积百分比或质量/体积含量百分比范围用于危险评估时的定量计算。
[0133]
组分含量为范围时,可能含量上限范围大于100%(例如甲醇含量30-40%,乙醇含量30-40%,水含量30-40%),此时为不降低化学品的危险,采用最大风险预估组分范围采信方法,进行采信,在录入时按实际情况录入即可。含量为范围时的具体含量采信方法。
[0134]
对于分类信息和支持数据的查询,评估平台根据“化学品标识编码”进行化学品危险分类和支持数据的查询,并根据化学品组分、数据源、数据版本等索引,进行组织和排序。并根据数据类型,匹配数据评价参数。系统进行数据评价,确定数据的选择后带入评估模型计算获得评估结果。
[0135]
上述实施例仅为本发明的优选实施方式之一,不应当用于限制本发明的保护范围,但凡在本发明的主体设计思想和精神上作出的毫无实质意义的改动或润色,其所解决的技术问题仍然与本发明一致的,均应当包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1