一种基于ICSO‑SVM的苯并类物质的荧光光谱检测法的制作方法

文档序号:13810976阅读:331来源:国知局

本发明涉及荧光光谱分析方法领域,尤其是一种基于icso-svm的苯并类物质的荧光光谱检测法。



背景技术:

多环芳烃(pahs)一般含有多个苯环,如:萘,蒽,菲,芘,苯并芘等,具有同分异构体种类多的特点,因此不易检测。它在人类的生产生活中广泛存在,如空气、水、土壤等。雾霾近年来越来越严重,特别是2016年冬季全国大范围的雾霾,由于其中含量最多的是pahs,就易使人类患上呼吸道疾病。国内外对于芳烃类的研究很多,bressanlucasp.等提出使用盐析辅助液-液萃取结合同步荧光光谱方法对水浸出液中的低分子量多环芳烃作回归分析,回收率范围为74.3%至105.8%;mauri-aucejoadela等使用高效液相色谱法和固相萃取法分析评价多环芳烃的回收效果,得出在水槽固相萃取中替代多环芳烃痕量分析的方法;吴智慧等采用超声提取和固相萃取小柱净化结合气相色谱-质谱法,测试了含油污泥中16种多环芳烃的回收率。多数研究侧重定量分析上,通过寻找新的方法来检测物质浓度,但与如何快速准确鉴别具有相似性质物质的类别相关的文献并不是很多。

在周真,杨旭,牛訦琛和陈鑫申请的发明专利(申请号:201610176440.1)所述方法中,应用智能支持向量机对多环芳烃性质/毒性进行预测。该发明所述方法采用网格搜索法、遗传算法、粒子群算法优化svm,并未改进或者采用新的算法已达到更好的分类效果,该发明没有针对性质相似的多环芳烃进行分类。在陈锋,张云峰,刘晓立和曹张伟申请的发明专利(申请号:201510593101.9)所述方法中,应用朴素贝叶斯源方法结合非负约束因子分析方法,追溯水体中多环芳烃污染物的来源。该发明所述方法需要采集很多排放源里的多环芳烃指纹图谱,所以检测的多环芳烃范围只限于在图谱中包含的多环芳烃。



技术实现要素:

本发明目的在于提供一种通过分析bkf、bbf和bap三种溶液的两两混合溶液的荧光特性、选择主要荧光峰对应的光谱数据、利用icso优化svm来对数据进行训练和预测的基于icso-svm的苯并类物质的荧光光谱检测法。

为实现上述目的,采用了以下技术方案:本发明所述方法包括以下步骤:

步骤1,利用苯并[a]芘(bap)、苯并[k]荧蒽(bkf)混合溶液进行荧光光谱实验,利用苯并[a]芘(bap)、苯并(b)荧蒽(bbf)混合溶液进行荧光光谱实验,利用苯并(b)荧蒽(bbf)、苯并[k]荧蒽(bkf)混合溶液进行荧光光谱实验,选取荧光强度范围,构成训练集和测试集;

步骤2,对光谱数据归一化,并选取svm的评价指标;

步骤3,改进cso并用于优化支持向量机的惩罚参数c、核参数g;

步骤4,将改进的cso找到的惩罚参数c、核参数g用于svm进行预测,记录其适应度变化曲线和分类结果。

进一步的,步骤1中,根据三类混合物的荧光光谱特性,取发射波长在406nm处,激发的波长在300~330nm范围内的三类混合物溶液光谱数据各25个,编号:1-25号为bap、bkf混合溶液,标记为1类;26-50号为bap、bbf混合溶液,标记为2类;51-75号为bbf、bkf混合溶液,标记为3类;取1-18号、26-43号、51-68号组成样本个数为54的训练集,取19-25号、44-50号、69-75号组成样本个数为21的测试集。

进一步的,步骤2中,光谱数据输入svm前,首先把光谱数据进行[0,1]区间归一化;

公式如下:

式中,x,y∈rn,xmin=min(x),xmax=max(x);实验采用的svm评价指标为分类正确率,

其公式如下:

式中,ni为上述划分的测试集(训练集)中预测类别和实际样本类别一致的个数,n为测试集(训练集)样本的总个数。

进一步的,步骤3中,鸡群优化算法是一种模拟鸡群搜索行为的生物智能优化算法,算法根据每个粒子个体适应度值好坏将鸡群其分为公鸡粒子、母鸡粒子和小鸡粒子三类,公鸡粒子的适应度值最好,小鸡粒子的适应度值最差,小鸡粒子的位置受公鸡粒子和母鸡粒子影响。每一子群由公鸡粒子、母鸡粒子和小鸡粒子组成,其中母鸡粒子的数目最多,公鸡粒子仅有一个,子群中的小鸡粒子随机建立与母鸡粒子的母子关系。

子群中公鸡粒子的个体搜索能力较母鸡、小鸡粒子强,其t+1时刻的位置更新为:

xi,j(t+1)=xi,j(t)·(1+φ(0,σ2))(1)

式中,xi,j(t)为t时刻第i只公鸡在第j维空间的位置;φ(0,σ2)是服从均值为0,方差为σ2的高斯分布,公鸡粒子搜索范围的大小与方差σ2的大小成正比关系;fir、fkr分别是第i、k只公鸡的适应度值,但是k不等于i;ε是不为0的极小常数。

母鸡粒子的适应度值比公鸡粒子的差,母鸡粒子跟随公鸡粒子进行搜索,所以受到所在群的公鸡和其他群公鸡的影响,其t+1时刻的位置更新如下:

其中,分别是母鸡粒子所在群中的公鸡粒子与其他群公鸡的位置;c1、c2分别是母鸡粒子在所在搜索群和其他搜索群中的权重。

一般的鸡群算法中,小鸡粒子要跟随所在群的母亲母鸡粒子进行搜索,其位置如下式所示,

式中,xm.j(t)表示小鸡粒子跟随的母亲母鸡粒子的位置;f表示小鸡粒子跟随母亲母鸡粒子的跟随系数,为[0,2]区间内的随机常数。

改进的算法在小鸡位置基础上加入了学习因子c3、c4,意思是小鸡粒子不仅要学习所在群中公鸡粒子的位置信息,还要学习其他群公鸡粒子的位置信息,多方面的学习能够在一定程度上避免当妈妈母鸡粒子陷入局部最优时,小鸡也会陷入局部最优的情况,并且能够提高算法的收敛速度。改进后小鸡粒子的位置如式所示:

式中c3、c4是固定常数,分别表示小鸡粒子向所在群中公鸡粒子和其他群公鸡粒子学习的学习因子;分别为小鸡粒子自身所在群中的公鸡粒子的位置与其他群公鸡粒子的位置。

工作过程大致如下:

选用苯并(k)荧蒽(bkf)、苯并(b)荧蒽(bbf)、苯并(a)芘(bap)三种物质,三种物质分子结构相似,导致荧光特性相似,其两两组分混合而成的三类混合物的荧光光谱也有相似性,会使检测时不容易区分其种类。首先分析bkf、bbf和bap三种溶液的两两混合溶液的荧光特性,最大可能的选择主要荧光峰对应的光谱数据范围:发射波长为406nm处,激发波长在300~330nm范围内。通过给鸡群优化算法(chickenswarmoptimizationalgorithm,cso)中小鸡粒子的位置加入两个学习因子来优化cso,使小鸡粒子不仅要学习所在群中公鸡粒子的位置信息,还要学习其他群公鸡粒子的位置信息。然后用改进的cso(improvedcso,icso)优化支持向量机(svm)对21个预测样本进行分类。

与现有技术相比,本发明具有如下优点:采用改进的cso优化svm对光谱数据样本进行分类,icso引进了学习因子,使得小鸡位置减少了陷入局部最优的可能,改善了cso算法的收敛速度和拟合度,缩短了程序运行时间,在icso-svm、cso-svm、pso-svm、ga-svm四种优化算法中icso是最优,并且很准确的预测了三类混合物的种类,达到了准确区分相似物质的目的,可以很好的根据苯并类物质的相似荧光光谱数据鉴别其种类。

附图说明

图1是本发明检测法的流程图。

图2(a)是本发明0.04ug/mlbap和0.008ug/mlbkf混合溶液的三维光谱图和等高线图。

图2(b)是本发明0.001ug/mlbap和0.008ug/mlbbf混合溶液的三维光谱图和等高线图。

图2(c)是本发明0.008ug/mlbbf和0.004ug/mlbkf混合溶液的三维光谱图和等高线图。

图2(d)是本发明icso的分类结果图。

图2(e)是本发明icso的适应度变化曲线图。

图2(f)是本发明cso的适应度变化曲线图。

图2(g)是本发明pso的适应度变化曲线图。

图2(h)是本发明ga的适应度变化曲线图。

图2(i)是本发明icso-svm、cso-svm、pso-svm、ga-svm这四类优化算法的比较。

具体实施方式

下面结合附图对本发明做进一步说明:

如图1所示,本发明所述方法步骤如下:

步骤1,做bap、bkf混合溶液,bap、bbf混合溶液,bbf、bkf混合溶液的荧光光谱实验,选取适当的荧光强度范围,并构成训练集和测试集。

实验用bkf、bbf和bap由中国计量科学研究院提供,以色谱纯甲醇为溶剂,配置每种物质的甲醇溶液若干份,浓度为:0.00001~0.1ug/ml。通过两两混合浓度均在0.00001~0.1ug/ml的bkf、bbf和bap三种溶液,分别配置三类多环芳烃混合物溶液若干份。

fs920荧光光谱仪(英国edinburgh公司生产)的参数设置:激发波长为250~400nm,发射波长为300~500nm,步长为2nm,狭缝宽度为2.5mm,扫描积分时间为0.1s。

通过光谱实验,三类混合物的三维荧光图和等高线光谱图,分别如图2(a)、(b)、(c)所示,(已经过去除散射和噪声影响的操作),以下取的是几个特定浓度的不同种类样本,其他浓度样本的荧光峰形状、位置的和下面对应种类样本的相差不大。从图2(a)知bap、bkf混合溶液的光谱中荧光强度最大的峰在发射波长为406nm处,即最佳发射波长是406nm,在激发波长290~380nm范围内有三个突出的荧光峰。从图2(b)知bap、bbf混合溶液的最佳发射波长也在406nm处,荧光峰激发的波长位于290~390nm的范围内。从图2(c)知bbf、bkf混合溶液的最佳发射波长处在400~500nm,主要的荧光峰位于激发波长在295~330nm内。

根据三类混合物的荧光光谱特性,取发射波长在406nm处,激发的波长在300~330nm范围内的三类混合物溶液光谱数据各25个。编号:1-25号为bap、bkf混合溶液,标记为1类;26-50号为bap、bbf混合溶液,标记为2类;51-75号为bbf、bkf混合溶液,标记为3类。取1-18号、26-43号、51-68号组成样本个数为54的训练集,19-25号、44-50号、69-75号组成样本个数为21的测试集。

步骤2,对光谱数据归一化,并选取svm的评价指标。

光谱数据输入svm前,首先把光谱数据进行[0,1]区间归一化,公式如下:

式中,x,y∈rn,xmin=min(x),xmax=max(x)。实验采用的svm评价指标为分类正确率,其公式如下:

式中,ni为上述划分的测试集(训练集)中预测类别和实际样本类别一致的个数,n为测试集(训练集)样本的总个数。

步骤3,用改进的cso优化支持向量机的惩罚参数c、核参数g。

(1)设置参数:鸡群大小pop=100,迭代的最大次数m=300,种群的更新频率g=10,公鸡粒子所占比例为15%,母鸡粒子所占比例为70%,母亲母鸡粒子所占比例为50%,小鸡粒子所占比例为15%,学习因子c3=c4=0.1;svm的惩罚参数c∈[0.1,100],核参数g∈[0.01,1000],交叉验证折数v=3。

(2)适应度函数选取训练集的分类正确率这一指标,计算每鸡群个体的适应度值,找到最佳位置。

(3)当迭代次数t/g=1时,给适应度值进行排列顺序,确定粒子间的等级制度,并建立母鸡粒子与小鸡粒子的母子关系、公鸡粒子与母鸡粒子的同伴关系。

(4)按照发明内容中的式(1)(2)、(3)(4)(5)、(7)分别更新公鸡粒子、母鸡粒子、小鸡粒子的位置,并计算更新位置后各个粒子的适应度值。

(5)找到当前个体的最佳位置、全局最佳位置和个体最佳适应度、全局最佳适应度。判断是否达到结束条件,如果是,则输出最佳参数,反之,返回步骤(3)重新执行。

步骤4,用改进的cso找到的惩罚参数c、核参数g用于svm进行预测,并与cso、pso、ga优化的svm作比较。

icso对样本的预测结果如图2(d)(e)所示,图2(d)是对21个样本的预测结果,图2(e)是icso在训练样本过程中的适应度变化曲线。同时采用cso算法、粒子群优化算法(pso)和遗传算法(ga)来优化支持向量机,图2(f)(g)(h)分别是cso、pso、ga在训练过程中的适应度变化曲线。图2(d)显示,icso对样本的预测正确率为100%,从图2(i)看出icso和cso的正确率是最高的,但是icso的运行时间要比cso的短。从图2(e)(f)来看,icso的最佳适应度曲线在第6代附近收敛到最大值,cso则在第13代附近收敛到最大值,得出icso的收敛速度比cso的要好,并且icso的拟合度也优于cso的拟合度,所以icso优于cso。

从图2(g)(h)看出,pso、ga的收敛速度都不如icso和cso,pso、ga的拟合度也明显比icso和cso的差,并且其分类正确率也比icso和cso的低。总的来看,改进的cso改善了算法的收敛速度和拟合度,从而缩短了运行时间,在四种优化算法中icso是最优,并且很准确的预测了三类混合物的种类,达到了区分相似物质的目的。综上可知,本发明所述方法可以很好的根据苯并类物质的相似荧光光谱数据鉴别其种类。

以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1