基于光谱特征细分和分类器级联的有机化学品定性判定方法

文档序号:9350389阅读:564来源:国知局
基于光谱特征细分和分类器级联的有机化学品定性判定方法
【技术领域】
[0001] 本发明涉及一种利用化学品的光谱特征判定其类别的方法,具体地,是一种利用 波长范围从紫外光到红外光的光谱技术快速识别化学品的方法。特别是基于光谱特征细分 和分类器级联的有机化学品定性判定方法。
【背景技术】
[0002] 有机化合物是含碳的、主要由氧元素、氢元素等组成的化合物。目前,世界上已知 的有机物有几千万种之多,包括烃类化合物和其各种衍生物,如醇、酚、醚、醛、酮、酸、酯、 胺、腈等,这些有机化学品被广泛用于工业、农业、医疗卫生、生命科学、检验检疫、环境保 护、能源开发、国防军工、科学研究和国民经济的各行各业,为我们的衣、食、住、行提供了极 大方便的同时,也有力的促进了社会的发展和进步。
[0003] 有机化学品在给人类生活带来便捷的同时,也带来了一些危害甚至灾难。比如化 工厂在生产对人类有用的化学品的同时,也产生了很多有毒有害的副产品,对河流和土壤 都造成了非常严重的污染,尤其是一些运行多年化工厂旧址,被其污染过的土地在几十年 内都无法正常使用。由于这些污染的严重性,使得快速识别这些污染物进而进行有效的治 理就显得尤为紧迫和重要。而出现在化学品进出口中的瞒报与夹带,使一些有毒有害甚至 是高危剧毒的化学品在没有监管的情况下流入国内,不仅扰乱了我国正常的贸易秩序,对 国家安全也造成了严重威胁。在危险化学品筛查、废弃和未知化学品无害化处理中,如何快 速识别化学品同样具有非常重要的现实意义。
[0004] 简单的有机化学品分析方法,利用一些化学反应中的颜色、温度变化或者气体、沉 淀的生成来鉴别有机化合物,如利用其能与氯化铁能产生显色反应鉴别酚类,只能获知其 官能团信息,而对其具体的成分信息却无能为力。要获知其具体的化学成分,则需更为精密 的分析手段,如化学分析法和仪器分析法。然而,化学分析如重量分析和滴定分析,需要耗 费大量样品,分析过程繁琐且耗时,因此自上世纪50年代以后便逐渐被仪器分析法取代。 与光谱分析方法相比,仪器分析法如电化学分析、波谱分析和色谱分析等成本较高,不仅需 要经验丰富的专业人员进行操作,且难以进行现场检测。
[0005] 光谱分析法是光学分析法的一种,是基于物质与辐射能量发生作用下,由物质内 部发生量子化的能级之间的跃迀而产生的发射、吸收或散射辐射的波长和强度而进行分析 的方法,包括可见光、紫外、近红外和中红外等分析方法。其中近红外和中红外光谱可以准 确的反映各种化学键的振动情况,如C-H、C=C、〇-H、N-H、S-H等的弯曲和伸缩振动,而有机 物在紫外光或可见的作用下发生电子跃迀而产生吸收光谱。由于这些吸收光谱可以全面、 有效的反映有机化合物中各种化学键的振动情况,且具有采样方式灵活、测试速率高、对样 品无损、可设定多通道瞬间多点采集并通过与化学计量学的结合,瞬间输出分析结果等诸 多优点,因而在农副产品质鉴定、工业生产在线监测、中西药质量和真假鉴别等领域发挥着 越来越重要的作用。
[0006] 虽然有机化学品的智能识别有巨大的需求,但是由于有机化合物数量繁多,结构 复杂,因此单纯利用吸收光谱难以获得直观的信息,须结合化学计量学方法,尤其是本专利 所述的级联分类器分类法,进行逐级的识别分类,最终达到智能识别的目的。

【发明内容】

[0007] 本发明利用有机物在可见、紫外、近红外、中红外光源下的吸收光谱,结合化学计 量学的方法将这些反映在谱图上的信息有效的提取出来,进而实现对有机化学品的有效识 别。
[0008] 本发明利用级联分类器方法对有机化合物的谱图进行建模,其中单个分类器的 构建可以使用基于LDA或PCA的聚类分析方法。LDA方法,又称线性判别式分析(Linear DiscriminantAnalysis),它能将样本在矢量空间上进行最优化投影,以达到获得最佳鉴 别矢量空间、抽取分类信息、压缩特征空间维数的目的,使得模型样本在新的子空间有最大 的类间距离和最小的类内距离,即样本在该空间中有最佳的可分离性。级联分类能对同一 个训练集训练出不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强 的最终分类器(强分类器)。利用该分类器的多层分类模型,级级分类层层识别,提取不同 有机化合物的特征并逐步细化,使化合物之间的差别逐级放大,进而实现正确的分类和识 另IJ。利用该模型可以有效解决有机化学品的种类多样性、结构复杂性而导致分类和识别过 程中的易混淆的问题,如不同类别但含有部分相同官能团的化合物在分类的时候极易出现 类间的混淆的问题、而同类的有机化合物尤其是分子量相近的化合物在识别其具体成分的 时候出现识别的混淆的问题。该方法(光谱结合化学计量学)具有操作简便、快速准确等 优点,在进出口化学品检验和危险、未知化学品处理中有很好的应用前景。
[0009] 本发明是通过以下技术方案加以实现的。
[0010] -种基于光谱特征细分和分类器级联的有机化学品定性判定方法,包括以下步 骤:
[0011] 首先对有机化学品的光谱特征进行细分,然后选取不同的特征采用聚类分析方法 构建单个分类器,然后将构建的单个分类器进行级联,形成级联的分类器,实现对未知有机 化学品的层层筛选、逐级分类,最终得到判定结果;包括以下步骤:
[0012] a)光谱的采集与预处理
[0013] 采集一些已知类别和成分的化学品光谱作为训练集;采用透射或漫反射方式采集 光谱数据;光谱的预处理可采用平滑、一阶导数、二阶导数或小波变换;对待判定类别的化 学品采用与训练集一致的方法进行光谱采集与预处理;
[0014] b)光谱特征细分
[0015] 将训练集的光谱进行特征细分,将这些特征分成多组,每组分别用于不同分类器 的设计;特征分组按照从粗大到细致的原则;第一级分类器,仅实现几个化学品大类别的 准确划分;第二级实现在第一级已判定的大类别中的二级类别的划分;依次进行下去,最 终实现化学品类别的准确识别;
[0016] c)采用训练集中的光谱数据建立级联的分类器;
[0017] 对每一级分别进行分类器设计:
[0018] 1)第一级识别仅有1个分类器组成,仅实现化学品的大类别划分;在允许一定的 假阳性结果,但不允许出现假阴性结果的原则下,选择适当的类别总数,进行第一级的分类 器设计;
[0019] 2)第二级在第一级的基础上进行设计,需要设计&个分类器,分类器i= 1,2,… N1分别对应第一级划分的第i= 1,2,…叱个类别;每个分类器内部针对某一个大类别进行 第二次特征细分,分别分为\2个二级子类别,设计原则与a相同,即不允许出现假阴性结 果;
[0020] 3)第三级设计及以下各级的设计与b相同,均需要在前一级设计好的基础上,进 行进一步的特征细分;
[0021] 4)最终将所有级的分类器进行级联,前一级的输出结果,选定了后一级的分类器, 然后输入分类器进行识别,再依次输入下一级,直至最后一级,得到最终的判定结果;
[0022] d)光谱识别
[0023] 将未知类别的光谱经过与训练集相同的预处理,然后输入(3)中建立的级联分类 器,依次经过层层判定,获得最终的判定结果。
[0024] 所述的分类器的设计可以使用LDA、PCA或聚类树等聚类分析方法。
[0025] 若使用LDA方法,其步骤为:
[0026] ①选定适宜的类数,计算每类的样本均值U1和总样本均值u:
[0035] ③计算矩阵()的特征值及特征向量,取最大特征值A_对应的特征向量L 作为投影空间;
[0036] ④将样本在特征向量空间L上投影,通过样本投影值的大小关系判断其在新空间 上距离的大小和分类效果的优劣;
[0037] ⑤若分类效果不佳,可调整分类数c,重复以上步骤直到实现最佳的分类效果。
[0038] 所述的光谱选用化学品的官能团特征中的一种或者几种作为分类标准;利用化学 品在可见、紫外、近红外、中红外光源下的吸收光谱,结合化学计量学的方法将这些反映在 谱图上的信息有效的提取出来,进而实现对有化学品的有效识别。
[0039] 可选用化学品的官能团特征中的一种或者几种作为分类标准,如O-H(醇)、 O-H(酚)、O-H(酸)、C-O(醚)、C= 0(醛)、C= 0(酮)、C= 0(酸)、C= 0(酯)、C= 〇(酰卤)、N-H(酰胺)、C-N(酰胺)、C=N(腈)、C=C、-C=C-(苯环)等。当选用的官 能团特征越少时,分类器越弱,弱分类器可作为低级的分类器,比如醇类分类器、酸类分类 器等等;当选用的官能团特征越多,化学品的类别越精确。
[0040] 光谱特征进行细分,还可以选用不同的波段,当选用的波段越窄,波段数越少,光 谱特征越少,分类器越弱,弱分类器可作为低级的分类器,比如醇类分类器、酸类分类器等 等;当选用的波段越宽,波段数越多,光谱特征越多,分类器越强,化学品的类别越精确。
[0041] 本发明涉及的化学品包含有机化学品,如化工和医药行业常用化学品,尤其是在 进出口检验、危险化学品筛查和实验室废弃化学品处理中常见的化学品,如烃类及其衍生 物,经、醇、醚、醛、酮、酸、酯、胺等。
[0042] 本发明采用的光谱可以为紫外光、可见光、近红外光、中红外光,波长范围为 100nm-4000nm〇
[0043] 本发明识别的化学品可以为液态或固态的,可以为透射光谱或漫反射光谱。本发 明的方法应用于医药行业化学品,进出口检验化学品、危险化学品筛查和实验室废弃化学 品处理。
【附图说明】
[0044] 图1利用LDA方法对醇、酸、醛、酮和酯类化合物进行最优化投影的结果。
[0045] 图2利用LDA方法对醇类化合物和酸类化合物进行最优化投影
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1