一种对样品的LIBS光谱自动识别分类方法与流程

文档序号:11200123阅读:482来源:国知局
一种对样品的LIBS光谱自动识别分类方法与流程
本发明属于对材料成分光谱分析
技术领域
,具体涉及一种对样品的libs光谱自动识别分类方法,可用于对未知样品的libs光谱数据进行自动识别分类。技术背景向量空间模型最初用于文本检索,该模型是通过对文献内容进行特征文本提取后,将文献转换到文本向量空间,然后在文本向量空间中通过计算文本向量的相似度,判断文献内容的相似性。激光诱导击穿光谱探测技术是利用高能量脉冲激光器发出的脉冲激光,经过聚焦透镜聚焦到目标表面,在聚焦点上获得瞬时高功率密度的激光脉冲,可使目标表面聚焦点烧蚀、蒸发和电离形成高温、高压、高电子密度的等离子体火花,辐射出包含原子和离子特征谱线的光谱,然后通过光探测器接受等离子体在冷却过程中的发射谱线,其某些特定波长对应的强度信号包含了分析对象中所有的元素种类和浓度信息,通过这些光谱信息进行数据处理,可对目标物进行分类处理。激光诱导击穿光谱技术近年来由于其检测速度快、无需样品制备等特点在样品识别和分类方面得到了广泛应用,但在常见的libs光谱分类建模方法中需要人工选取样品光谱特定波长范围信息对样品libs光谱进行分类识别,不能使用样品全谱信息进行快速分类。技术实现要素:本发明的目的在于提供一种对样品的libs光谱自动识别分类方法,从而弥补现有技术的不足。本发明的方法,是首先通过对已知标准样品光谱数据进行特征峰信息提取,然后定义特征峰信息权值计算公式,最后通过对特征峰信息进行权值计算转化特征峰信息为特征峰向量,完成样品光谱到以特征峰信息为代表的特征峰向量空间的转换,获得已知样品的特征峰向量,进而构建已知样品特征峰向量数据库。在对未知样品光谱进行分类识别时,通过特征峰信息提取、特征峰信息权值计算完成未知样品光谱到以特征峰信息为代表的特征峰向量空间的转变,获得未知样品特征峰向量,最终通过计算向量之间余弦值获得未知样品与已知样品相似度,取值最大者为分类结果,完成对未知样品的分类。本发明的方法,其一种实施例记载的具体步骤如下:1)定义特征峰权重计算相关参数(1)谱峰峰强权重intint用于对光谱中单一谱峰在光谱中所占权重进行计算,表示了单一谱峰不同峰值强度对光谱的代表性不同,峰值强度越大在计算中所占的权重越大,对样品的代表性越强,反之越弱;(2)谱峰倒排光谱频率(inversepeakfrequency)ipfipf用于对光谱中单一谱峰在已知样品特征峰信息数据库中所具有的独特性进行计算,表示了不同波长谱峰在对光谱代表性的不同,相同波长谱峰数量越小(即n越小)在计算中所占的权重越大(即ipf越大),对样品的代表性越强,反之越弱;(3)谱峰权重ww为光谱中单一谱峰对样品代表性的权值。w越大,该特征峰对样品的代表性越强;2)建立分类算法(1)获取已知样品特征光谱每种样品共获取60个libs光谱,将60个光谱数据进行平均处理,得到一个综合了该样品的特征光谱,依次获取各已知样品的特征光谱;(2)计算寻峰阈值读取每种样品特征光谱全谱数据,计算所有光谱谱峰强度标准偏差,并以谱峰强度标准偏差设为寻峰阈值,减小噪声和较小强度谱峰对模型的影响;(3)提取已知样品光谱数据特征峰波长信息使用二阶导数寻峰法并使用寻峰阈值对已知样品特征光谱进行特征峰信息提取,获得各种已知样品所包含的特征峰信息;(4)建立各已知样品特征峰信息数据库使用所有已知样品特征光谱的特征峰信息,建立已知样品的特征峰信息数据库;(5)建立已知样品特征峰向量数据库将已知样品光谱数据中特征峰信息通过特征峰权重相关参数:int、ipf和w的计算公式,①:int=pint/∑pint,其中pint为光谱中单一谱峰的相对强度,∑pint为光谱中所有谱峰的强度和;②:ipf=lg(n/n+1),其中n为已知样品特征峰信息数据库中所有样品特征峰数量之和,n为已知样品特征峰信息数据库中相同波长谱峰数量;③:w=int×ipf,其中w为光谱中单一谱峰对样品代表性的权值,w综合了int与ipf对样品的代表性;并调用已知样品特征峰信息数据库进行权值计算,获得各已知样品光谱数据中不同特征峰所具有权值,将各已知样品特征光谱转化为以特征峰为代表的特征峰向量v。汇总各已知样品特征峰向量,构建已知样品特征峰向量数据库;(6)获取未知样品特征光谱每种未知样品共获取20个libs光谱,将20个光谱数据进行平均,得到各未知样品的特征光谱;(7)提取未知样品特征峰信息使用二阶导数寻峰法并使用寻峰阈值对未知样品特征光谱进行特征峰信息提取,获得未知样品所包含的特征峰信息;(8)获得未知样品特征峰向量将未知样品特征峰信息通过上述公式①②③并调用已知样品特征峰信息数据库进行权值计算,获得未知样品特征光谱数据中不同特征峰所具有权值,将未知样品特征光谱转化为以特征峰为代表的特征峰向量vs;(9)进行向量运算将未知样品特征峰向量vs与已知样品特征峰向量数据库中各已知样品特征峰向量v进行向量运算,运算公式为,④:cos(vsv)=<vsv>/│vs││v│,其中<vsv>为两向量卷积,获得未知样品特征峰向量与各已知样品特征峰向量的余弦值,该余弦值代表了未知样品特征峰向量在向量空间与已知样品特征峰向量的相似度,其值越大未知样品与已知样品越接近,该值为1时未知样品与已知样品完全一样,为0时未知样品与已知样品完全不同;(10)获得分类结果对未知样品特征峰向量与已知样品特征峰向量数据库中各已知样品特征峰向量运算值进行排序,获得最大值所对应的已知样品,判定该未知样品为此样,完成对未知样品的分类运算。本发明具有以下优点:1、使用本发明的光谱分析方法,在对libs光谱采集时,不需要对样品进行任何预处理。2、本发明在对光谱数据进行分类计算时,不需要对光谱进行任何平滑、去基线、选取特定波段等预处理,使用样品的原始光谱数据进行分类计算,模型建立速度快。3、本发明在进行分类识别时,使用两个一维数组进行向量运算,运算速度快,易于实施。附图说明图1为本发明工作流程图,图2为libs实验装置示意图,其中,图2中各部件为:1-激光器;2-全反射镜;3-聚焦透镜;4-样品;5-收集透镜;6-收集透镜;7-光纤耦合器;8-光纤;9-iccd;10-光谱仪。具体实施方式由于岩石样品相对于其他种类样品,例如:钢铁、塑料,个体间的表面平整度、硬度以及成分间具有较大的差异,在应用libs技术对未经预处理的未知样品进行光谱采集时,同一岩石样品的不同libs光谱数据具有较大的不稳定性。相对于其他种类样品而言,使用libs光谱技术对岩石类样品进行分类时难度较大。而本发明的方法能有效的解决上述问题。本发明的实施例中使用libs技术对25种未经任何预处理的不同岩石样品进行libs光谱采集,其中每种样品获得80个光谱数据,取其中任意60个光谱进行平均获得已知样品平均光谱,并将其转化为已知样品特征峰向量,构成包含25种已知样品的特征峰向量数据库。取剩余20个光谱平均,构成未知样品光谱数据,完成了对25个未知样品96%准确率的识别,满足对未知样品的分类识别要求。libs实验系统如图2所示,激光器使用quantel公司生产的briliantb型号的nd:yag脉冲激光器,激光波长1064nm,单脉冲能量50mj,脉宽10ns。光谱仪使用andor公司生产的mechelle5000中阶梯光栅光谱仪,波长范围220-850nm。实验样品采用25种未经任何预处理的岩石样品,对各样品分80个点采集80个libs光谱数据。样品种类如表1所示。表1:样品种类与编号样品编号样品名称样品编号样品名称1红榴石14拉长石2钾长石15菱镁矿3钠长石16蔷薇辉石4玻璃陨石整合17肾状赤铁矿5磁铁矿18透辉石6翠榴石19透明石膏7鲕状赤铁矿20硬石膏8粉红色辉石21雪花石膏9符山石22月光石10黑色赤铁矿23重晶石11黑云母24紫苏辉石12角闪石25条带状硅质岩13金色方解石下面结合附图及实施例对本发明做进一步的详细说明。实施例1下面以黑云母光谱为例详细说明本发明的工作流程(如图1所示):激光器使用quantel公司生产的briliantb型号的nd:yag脉冲激光器,激光波长1064nm,单脉冲能量50mj,脉宽10ns。光谱仪使用andor公司生产的mechelle5000中阶梯光栅光谱仪,波长范围220-850nm。启动实验装置(如图2所示),对25种样品重复进行下述过程80次:激光器产生1064nm高能脉冲激光,经激光全反镜提升光路后,通过聚焦透镜汇聚到样品表面,烧蚀样品表面产生等离子体。同时光谱仪接受激光器产生的外触发信号,对每个脉冲使样品表面产生的等离子体光谱,通过光纤采集并存储到计算机上,获得25种样品的各80个光谱。步骤(1)选取黑云母样品80个光谱中的任意60个光谱数据,并对这60个样品光谱进行平均处理,得到一个综合了黑云母样品的特征光谱。步骤(2)读取黑云母特征光谱全谱数据,计算黑云母样品特征光谱数据中的谱峰强度标准偏差,并以谱峰强度标准偏差设为寻峰阈值,减小噪声和较小强度谱峰对模型的影响。步骤(3)对黑云母特征光谱使用二阶导数寻峰法,获得黑云母特征光谱的特征峰信息(谱峰波长和谱峰相对强度)。寻峰所得黑云母的部分特征峰信息如表2所示。重复实施方式步骤(1)、(2)、(3)获得另外24种已知样品特征光谱的特征峰信息。表2:寻峰所得黑云母部分特征峰信息特征峰波长特征峰相对强度特征峰波长特征峰相对强度236.0308007260.604167238.2105008647.010500238.8677509155.017833239.57232013645.078000239.9275008250.514667240.4895509630.610833241.0667107578.011167241.1184807166.990000241.3363607188.697333243.4999307206.045667244.4599707040.269667248.3462707618.399333248.9879608034.009500249.1030808259.171667249.33379013693.268670250.71979014400.283500251.1907809574.381167251.45091014963.253330251.64059018187.607500251.93779013333.994830252.3077107285.887500252.42737011664.160500252.54719010790.420670252.6311607744.538000252.87151011407.547330252.9437409975.639000步骤(4)将由步骤(3)所获得的25种已知样品特征光谱的特征峰信息进行汇总,按照波长进行排序并录入数据库,形成25种已知样品的特征峰信息数据库,以供后续程序对各已知样品特征峰信息的调用。步骤(5)运用向量空间模型使用公式w=int×ipf对黑云母特征光谱的特征峰信息进行权值计算,所述公式w=int×ipf中,w为黑云母光谱中单一特征峰对黑云母样品代表性的权值。int为特征峰相对强度权重,代表了不同相对强度谱峰对黑云母样品的代表性。ipf为特征峰倒排光谱频率,代表了不同波长特征峰对黑云母样品的代表性。w综合了int与ipf对黑云母样品的代表性。w越大,该特征峰对黑云母样品的代表性越强。黑云母部分特征峰权值计算结果如表3。表3:黑云母部分特征峰权值计算结果特征峰波长特征峰权值特征峰波长特征峰权值236.0308000.016160238.2105000.016987238.8677500.018412239.5723200.034457239.9275000.016394240.4895500.021483241.0667100.021483241.1184800.015890241.3363600.016129243.4999300.016205244.4599700.015668248.3462700.024115248.9879600.024732249.1030800.018744249.3337900.024703250.7197900.022464251.1907800.019280251.4509100.008964251.6405900.020799251.9377900.014994252.3077100.018750252.4273700.008336252.5471900.018692252.6311600.016883252.8715100.018020252.9437400.020238int计算公式为int=pint/∑pint,其中pint为光谱中单一特征峰的相对强度,∑pint为特征光谱中所有特征峰的强度和。ipf计算公式为ipf=lg(n/n+1),其中n为已知样品特征峰信息数据库中所有特征峰数量之和,n为已知样品特征峰信息数据库中相同波长特征峰数量。步骤(6)将已知黑云母特征光谱转换到特征峰向量空间,无特征峰所对应的波长在该向量空间赋值为0,有特征峰对应的波长处在该向量空间赋值为w,得到一个与黑云母特征光谱波长数组维数相同的特征峰向量v,v{w1,w2……..,wn},w对应特征光谱中各波长对应的特征峰权值。重复实施方式步骤(5)和(6)获得另外24种已知样品的特征峰向量,汇总所有已知样品特征峰向量,构建已知样品特征峰向量数据库。步骤(7)对黑云母样品80个光谱中剩余的20光谱进行平均,获得待测黑云母样品特征光谱。步骤(8)读取步骤7所得的待测黑云母样品特征光谱全谱数据,计算特征光谱数据中的谱峰强度标准偏差,并以谱峰强度标准偏差设为寻峰阈值。步骤(9)对待测黑云母样品特征光谱使用二阶导数法寻峰,寻峰阈值设为步骤(8)所得的阈值,获得待测黑云母样品特征光谱的特征峰信息,包含谱峰波长和谱峰相对强度。步骤(10)运用向量空间模型使用公式w=int×ipf对待测黑云母样品特征光谱的特征峰信息进行权值计算,所用公式及相关参数定义与实施方式步骤(5)相同。步骤(11)将待测黑云母样品特征光谱转换到特征峰向量空间,实施方式步骤(10)计算所得的无特征峰所对应的波长在该向量空间赋值为0,有特征峰对应的波长处在该向量空间赋值为该特征峰权值w,得到待测黑云母样品的特征峰向量vs。步骤(12)将待测黑云母样品的特征峰向量分别与已知样品特征峰向量数据库中25种特征峰向量分别进行向量运算。所用向量运算公式为cos(vsv)=<vsv>/│vs││v│,其中<vsv>为两向量卷积,分别获得待测黑云母样品的特征峰向量与25种已知样品特征峰向量的余弦值。该余弦值代表了待测样品特征峰向量在特征峰向量空间与已知样品特征峰向量的相似度,余弦值为1时待测样品与该已知样品完全一样,余弦值为0时待测样品与该已知样品完全不同。步骤(13)将待测黑云母样品特征峰向量与已知样品特征峰向量数据库中各已知样品特征峰向量的运算值进行排序,如表4所示。从表4中数据可见,待测黑云母样品特征峰向量与已知黑云母样品特征峰向量的余弦值为0.962,表示待测样品与黑云母样品的相似度最高,说明本发明所述的向量空间模型结合libs光谱的分类方法对待测样品识别正确。表4:待测黑云母样品特征峰向量与各已知样品特征峰向量运算结果排序表序号对应标准向量余弦值序号对应标准向量余弦值1黑云母0.96214月光石0.1632符山石0.51515磁铁矿0.0933角闪石0.47616拉长石0.0874黑色赤铁矿0.41917透辉石0.0785肾状赤铁矿0.39418重晶石0.0696鲕状赤铁矿0.35219透明石膏0.0617玻璃陨石0.33120纳长石0.0568紫苏辉石0.23721翠榴石0.0489菱镁矿0.22822雪花石膏0.03110钾长石0.20123硬石膏0.03111条带状硅质岩0.20024金色方解石0.02312蔷薇辉石0.16525红榴石0.01813粉红色辉石0.163步骤(14)重复实施方式步骤(7)、(8)、(9)、(10)、(11)、(12)和(13),完成对其他24种未知样品的分类识别,分类结果如表5所示。表5中第一列为光谱实际来源样品,第二列是经过模型计算之后的分类结果,如果第一列和第二列为相同的样品则分类正确,不同则为错误,通过对光谱数据的分类识别正确率为96%。表5中斜体部分为分类错误样品。表5:向量空间模型结合libs光谱的分类结果上述结果表明,本发明能够准确对未经预处理的岩石样品libs光谱进行分类处理,方法具有较高的分类准确率,能够实现使用libs技术对样品的快速分类,满足libs技术实时在线分析的要求。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1