一种基于半监督学习的激光诱导击穿光谱分类识别方法与流程

文档序号:17127192发布日期:2019-03-16 00:37阅读:391来源:国知局
一种基于半监督学习的激光诱导击穿光谱分类识别方法与流程

本发明涉及一种基于半监督学习的激光诱导击穿光谱分类识别方法,属于光谱检测技术领域。



背景技术:

激光诱导击穿光谱(laser-inducedbreakdownspectroscopy,libs)作为一种新兴的物质元素检测技术,目前已经在爆炸物检测、临床医学样本检测、文化遗产鉴定、合金加工过程、太空探索和农业与食品分析等领域得到广泛研究和应用。根据获得的libs光谱,可以对物质进行判别分析或分类识别。对于元素组成相似度极高的不同物质,获得的libs光谱差异可能较细微。随着近年来机器学习和人工智能算法的发展,libs结合机器学习算法为高相似度物质的鉴别分类提供了新方法。由于libs技术具有快速实时、便捷准确和可在线原位检测的优势,将在分类识别领域发挥越来越重要的作用。

基于libs对物质进行判别分析中,常用的的机器学习算法主要有监督学习分类方法和非监督聚类方法。监督学习是在有先验类别标签知识的情况下,学习从输入到输出的映射关系,然后使用学习到的映射基于贝叶斯统计预测每个测试数据的标签,使得分类识别准确率最大化。虽然监督学习方法已经在相关领域表现出良好预测结果,但其需要足够的已知标签类别的数据进行建模训练,以学习输入到输出间的映射关系,缺乏足够的训练样本可能导致低识别率。在实际应用,往往很难获得涵盖所有情况的训练数据。非监督学习不需要训练数据进行建模,直接对输入数据进行分析,发现输入数据中的规律,进行分类估计。在libs光谱分类识别领域应用最为广泛的是非监督聚类方法,发现输入数据的簇或分组,按特征将输入数据分组,如hierarchical聚类分析、k-means聚类分析和isodata方法等。但是在实际应用场合,检测技术的应用往往是为了探测某一类物质或监测某一类物质,非监督聚类只能完成分组,而不能确定每一组分别是哪类物质。

这些都给实际应用场合采用libs进行物质识别分类带来了很大的困难,迫切需要一种能够基于少量带标签的训练数据,对大量未知输入光谱数据进行分类识别的方法。



技术实现要素:

本发明的目的是为了解决激光诱导击穿光谱分类识别应用中,难以为传统监督学习提供足够训练样本,非监督学习无法提供分类标签结果的难题,提供一种基于半监督学习的激光诱导击穿光谱分类方法。该方法根据少量已知类别的训练数据,自动区分大量未知光谱数据,解决了激光诱导击穿光谱识别检测的实际应用问题。

本发明的技术方案如下:

一种基于半监督学习的激光诱导击穿光谱分类方法,其特征是该方法包括如下步骤:

1.进行光谱数据采集。

采用激光诱导击穿光谱实验系统,分别获取少量带标签类别的光谱数据和大量待测未知的光谱数据。

2.进行标签扩散。

1)设置标签扩散参数l;

2)计算每个标记已知类别的光谱数据和各个未知类别的光谱数据间距离,采用如下距离计算公式:

其中d为两个光谱数据间的距离,x、y分别为两个光谱数据,n为光谱数据维数,i为从1到n的索引,xi和yi为x、y在当前索引维数下的光谱峰值;

3)对每个已知类别的光谱数据,根据距离值计算结果,从小到大对所有未知类别的光谱数据进行排序;

4)将距离值最小的l个未知类别的光谱数据,标记成与这个已知数据相同的类别标签。

3.对经过标签扩散后的光谱数据进行分类识别。

1)设置分类参数k;

2)计算每个未知类别的光谱数据和各个已知类别的光谱数据间的距离,所采用的计算公式与步骤2中相同;

3)对每个未知类别的光谱数据,根据距离值计算结果,从小到大对所有已知类别的光谱数据进行排序;

4)将距离值最小的k个已知类别的光谱数据中,出现频率最高的类别标签作为该未知数据的标签。

有益效果

激光诱导击穿光谱技术是目前物质识别与检测中具有潜力的分析方法之一,结合机器学习算法对没有显著区别的光谱数据也可达到较好分类识别效果。但是在很多实际应用场合,会面临传统监督学习难以获得足够训练样本,而非监督学习又无法提供分类标签结果的问题。本发明所提出的一种基于半监督学习的激光诱导击穿光谱分类方法,根据少量已知类别的光谱数据,自动区分大量未知光谱数据。相对于传统的监督分析方法,该方法明显提高了分类识别效果,具有较好的稳定性,且不必获取大量训练数据,节省了人力物力,解决了只有少量已知样本情况下激光诱导击穿光谱识别检测的难题,为推广激光诱导击穿光谱识别检测方法的实际应用提供了基础。

附图说明

图1为本发明方法流程示意图;

图2为一种激光诱导击穿光谱测量系统构成示意图;

图3为实施例中的分类结果示意图。

具体实施方式

为了更好地说明本发明的目的和优点,下面结合附图和实施例对本发明内容作进一步说明。

实施例

以反恐防暴检测领域典型危险品炸药rdx、hmx、cl-20,以及化学组成与炸药类似且常作为运输箱等容器材质,可能沾染痕量炸药的四种塑料样品(3240、fr-4、abs和nylon)的分类识别为例,说明基于半监督学习的激光诱导击穿光谱分类方法在libs光谱对未知物质判别区分中的应用。

1.进行光谱数据采集。

搭建如图2所示的激光诱导击穿光谱实验装置,其中1为激光器,2为反射镜,3为聚焦透镜,4为激光诱导等离子体,5为光电探测器,6为三维样品台,7为光纤,8为延时器,9为光谱仪,10为计算机。

将爆炸物粉末用双面胶粘附于铝板表面,放置于样品台6上,采集libs光谱,激光器采用nd:yag激光器基频1064nm输出波长,频率1hz,单脉冲能量70mj。调整三维样品台,使每发光谱的采集点位于样本上不同位置,以避免表面爆炸物样本烧蚀殆尽,激发铝板的光谱。每10发激光脉冲的激发光谱平均作为一个平均光谱。

对于塑料样本,采用相同系统设置,在样本上每个位置点测量12发激发光谱数据,前两发激光脉冲作用为清除样本表面杂质,后10发激发光谱平均作为一个平均光谱。

对于每一个样本,获得30个平均光谱,对每个平均光谱采用全谱所有波长点峰值强度总和进行归一化。

2.对7类样本中每类取一个数据作为已知类别的监督数据,进行标签扩散。

1)设置标签扩散参数l=15;

2)计算每个标记已知类别的光谱数据和各个未知类别的光谱数据间距离,距离计算公式如下:

其中d为两个光谱数据间的距离,x、y分别为两个光谱数据,n为光谱数据维数,i为从1到n的索引,xi和yi为x、y在当前索引维数下的光谱峰值。

3)对每个已知类别的光谱数据,根据距离值计算结果,从小到大对所有未知类别的光谱数据进行排序;

4)将距离值最小的15个未知类别的光谱数据,标记成与这个已知数据相同的类别标签。

3.对经过标签扩散后的光谱数据进行分类识别。

1)设置分类参数k=3;

2)计算每个标记未知类别的光谱数据和各个已知类别的光谱数据间距离,所采用计算公式与步骤2中相同;

3)对每个未知类别的光谱数据,根据距离值计算结果,从小到大对所有已知类别的光谱数据进行排序;

4)将距离值最小的3个已知类别的光谱数据中,出现频率最高的类别标签作为该未知数据的标签。

分类结果如图3所示,其中,爆炸物rdx、hmx和cl-20被标记为1类,塑料3240、fr-4、abs和nylon被标记为0类,两类样本的识别率均达到100%。

k取不同值时,分别采用传统knn分类模型和本方法,对相同样本进行分类判别的结果见表1。

表1半监督学习方法与传统knn分类方法对爆炸物和对比物识别结果比较

分类结果表明所提出的半监督学习方法可以在只获得少量已知类别的光谱数据情况下,对大量未知类别光谱数据进行识别分类,分类效果优于传统knn分类算法。本方法不必获取大量训练数据,节省了人力物力,解决了只有少量已知样本情况下激光诱导击穿光谱识别检测的难题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1