基于太赫兹光谱的物质识别方法与流程

文档序号:11107124阅读:1605来源:国知局
基于太赫兹光谱的物质识别方法与制造工艺

本发明涉及一种物质识别方法,具体涉及一种基于太赫兹光谱的物质识别方法。



背景技术:

太赫兹波是频率在0.1THz到10THz范围的电磁波,其波段位于微波与红外之间,具有丰富的科学意义和广阔的应用前景。太赫兹光子的能量只有毫电子伏特,不会因为电离而破坏被测物质,而且大多数极性分子在THz波段内能够产生共振、吸收能量并且被检测得到相应的光谱,因此太赫兹波谱为无损检测及物质识别提供了一种新的有效途径。

近年来,国内外多个研究机构对太赫兹光谱及基于太赫兹光谱的识别进行了研究。由于太赫兹光谱具有指纹谱的特性,物质的不同化学组成与光谱中的波峰位置具有一一对应的关系,因此太赫兹光谱能够用于进行物质种类的识别。

但是,实际应用过程中,由于太赫兹时域光谱系统的机器参数通常不相同,操作人员之间也存在主观差异,使得不同的太赫兹时域光谱系统对同一种样品的检测结果均存在一定差异。因此,现有的基于太赫兹光谱的识别方法往往需要将数据的来源范围限定在同一参数的仪器、甚至是同一台仪器中。这样的识别方法不具有鲁棒性,结果的准确度难以保障,也难以得到广泛的应用。



技术实现要素:

为解决上述问题,提供一种具有鲁棒性的基于太赫兹光谱的识别方法,本发明采用了如下技术方案:

本发明提供了一种基于太赫兹光谱的物质识别方法,用于对待测样品进行识别,其特征在于,包括如下步骤:

步骤1,用太赫兹时域光谱系统扫描预定数量的已知样品,其中每个已知样品扫描预定次数,得到对应的预定数量的时域信号图谱;

步骤2,对每个时域信号图谱进行预处理,得到每个时域信号图谱的归一化频谱;

步骤3,将步骤2中得到的归一化频谱的时间采样频率映射到预定频率得到统一光谱;

步骤4,将步骤3得到的全部统一光谱作为特征向量,对SVM分类器进行训练,使其按照已知样品对统一光谱中的波谱数据进行分类,得到训练后的SVM分类器;

步骤5,采用任意一台太赫兹时域光谱系统对待测样品进行扫描得到待测样品的时域信号图谱,对该时域信号图谱进行步骤2的预处理得到待测样品的归一化频谱,再将该归一化频谱映射至预定频率得到待测样品的统一光谱;

步骤6,用步骤4得到的训练后的SVM分类器对步骤5得到的统一光谱进行分类,得到待测样品的名称。

本发明提供的基于太赫兹光谱的物质识别方法,还可以具有如下技术特征:

其中,步骤2包括如下子步骤:

步骤2.1,根据已知样品的时域参考信号和时域实际信号的反射峰位置差异,去掉时域信号图谱中的反射峰,得到去反射峰的时域信号图谱;

步骤2.2,将步骤2.1中得到的去反射峰的时域信号图谱进行快速傅里叶变换,然后根据布朗-博朗定律计算已知样品的相对吸收系数,使时域信号图谱转换为吸收系数频谱;

步骤2.3,截取吸收系数频谱有效频域范围内的相对吸收系数,得到反映已知样品特征信息的有效频谱;

步骤2.4,采用正交小波变换法去除步骤2.3中得到的有效频谱中的低频基线及高频噪声,得到去噪频谱;

步骤2.5,将步骤2.4中得到的去噪频谱进行归一化处理,得到归一化频谱。

本发明提供的基于太赫兹光谱的物质识别方法,还可以具有如下技术特征:其中,步骤1所采用的太赫兹时域光谱系统与步骤3所采用的太赫兹时域光谱系统的采样频率不同,预定频率与其中的最低采样频率相同。

本发明提供的基于太赫兹光谱的物质识别方法,还可以具有如下技术特征:其中,步骤1所采用的太赫兹时域光谱系统与步骤3所采用的太赫兹时域光谱系统的采样频率不同,预定频率低于其中的最低采样频率。

本发明提供的基于太赫兹光谱的物质识别方法,还可以具有如下技术特征:其中,步骤3中的映射采用样条函数曲线插值法。

发明作用与效果

本发明提供的基于太赫兹光谱的物质识别方法,将预处理后的归一化频谱映射至统一的预定频率,消除了仪器间参数及设置不同所产生的差异;利用SVM分类器进行光谱分类训练,并利用训练完成后的SVM分类器对待测样品光谱进行待测样品的识别,消除了操作人员之间的主观差异。由此,本发明提供的方法消除了仪器差异及主观差异,因而具有鲁棒性,能够广泛应用。

附图说明

图1为本发明的基于太赫兹光谱的物质识别方法的流程图;

图2为正交小波变换前后的太赫兹波谱图;

图3为不同系统测得的同一种样品在预处理后得到的波谱图;

图4为SVM分类器识别测试数据的分类结果图。

具体实施方式

以下结合附图及实施例来说明本发明的具体实施方式。

<实施例>

图1为本发明的基于太赫兹光谱的物质识别方法的流程图。

如图1所示,本实施例中,基于太赫兹光谱的物质识别方法包括如下步骤:

步骤1,采用太赫兹时域光谱系统扫描已知样品,获得每个已知样品在不同采样频率下的时域信号图谱。

在本实施例中,采用来自上海现代光学系统重点实验室(以下简称实验室)的太赫兹时域光谱系统(以下简称THz-TDS)对已知样品进行扫描,采用来自和上海高晶影像科技有限公司(以下简称高晶公司)的THz-TDS对待测样品进行扫描。其中,实验室THz-TDS的采样频率为0.009THz,高晶公司THz-TDS的采样频率为0.01THz。

本实施例中,选择的已知样品为如下13种:4-氨基苯甲酸,A2(1-苯基-2-吡咯烷-1-基乙酮),A3(2-氨基-1-苯基乙醇),C5(一种混合物炸药),D(+)-乳糖水合物,L(+)-酒石酸,TNT,阿莫西林,苯丙氨酸,苯甲酸,对甲基苯甲酸,谷氨酸,维生素B2;每种样品分别用两台THz-TDS各扫描10次,即、每种已知样品得到采样频率0.009THz时域信号图谱10个,扫描结束后,总共得到130张时域信号图谱。

步骤2,对步骤1得到的每个时域信号图谱进行预处理,具体包括如下子步骤:

步骤2.1,以只经过空气的THz信号作为时域参考信号,根据该时域参考信号和时域实际信号的反射峰位置差异,去掉时域信号图谱中的反射峰,得到去反射峰的时域信号图谱。

步骤2.2,将步骤2.1中得到的去反射峰的时域信号图谱进行快速傅里叶变换,然后根据布朗-博朗定律计算已知样品的相对吸收系数,对时域信号图谱进行转换,得到吸收系数频谱。该吸收系数频谱中,纵坐标为吸收系数,横坐标为频率。

步骤2.3,截取0.2THz~1.5THz有效频域范围内的相对吸收系数,得到反映已知样品特征信息的有效频谱。因为在这段频域范围内,物质的吸收峰明显,物质容易简单的被区分;而在1.5THz后有大量的噪声信息,因此不采用。

步骤2.4,采用正交小波变换法去除步骤2.3中得到的有效频谱中的低频基线及高频噪声,得到去噪频谱。

图2为正交小波变换前后的太赫兹波谱图。

图2示出了其中一个图谱在正交小波变换前后的变化。如图2所示,在进行正交小波变换前的波谱(即、图中的原波谱)的吸收系数纵坐标在3~4.5之间,经过变换后变为-0.5~0.5之间。原波谱中,1.2THz~1.5THz区间内的曲线上扬并且具有一些小的波峰,说明此处出现了基线漂移现象和噪声;经过正交小波变换后,该区间的曲线整体波形平缓延伸,并且整体更加平滑,说明正交小波变换消除了基线漂移现象以及噪声。

步骤2.5,将步骤2.4中得到的去噪频谱进行归一化处理,得到归一化频谱。

图3为不同系统测得的同一种样品在预处理后得到的波谱图。

图3示出了样品A2在两种THz-TDS中测得的图谱经过预处理得到的归一化图谱。如图3所示,经过预处理,归一化图谱中的吸收系数纵坐标范围均在0~1之间,并且两个图谱中的特征峰基本一致。

步骤3,将步骤2中得到的归一化频谱的时间采样频率映射到预定频率得到统一光谱,使全部统一光谱的采样频率一致。

在本实施例中,该预定频率采用两台THz-TDS所具有的两个采样频率中最小的频率,即0.009THz。由于采用实验室THz-TDS得到的图谱中,采样频率已经是0.009THz了,因此不进行采样频率映射处理,直接将其归一化图谱作为统一光谱即可。

步骤4,将步骤3得到的各个统一光谱作为特征向量,对SVM分类器进行训练,使其按照已知样品中的波谱数据对统一光谱进行分类,得到训练后的SVM分类器。

本实施例中,采用的SVM分类器为Libsvm工具箱。将步骤3得到的统一光谱在0.2THz~1.5THz的范围内进行等间隔采样,每个统一光谱得到143个波谱数据,将这些波谱数据作为特征值,对SVM分类器进行训练,该130个统一光谱及每个统一光谱对应的143个波谱数据可以看成是一个二维向量。为使分类准确率更高,SVM分类器的训练策略是:采用基于网格搜索法选取最佳惩罚参数和核函数参数的参数寻优算法,利用最佳参数来进行训练。

步骤5,采用任意一台太赫兹时域光谱系统对待测样品进行扫描得到待测样品的时域信号图谱,对该时域信号图谱进行步骤2的预处理得到待测样品的归一化频谱,再将该归一化频谱映射至预定频率得到待测样品的统一光谱。

在本实施例中,采用来自上海高晶影像科技有限公司(以下简称高晶公司)的THz-TDS对待测样品进行扫描,该待测样品选用了与已知样品相同的13种。对每种待测样品进行10次扫描,总共得到130个时域信号图谱。对该130个时域信号图谱进行步骤2及步骤3的处理,由于高晶公司THz-TDS的采样频率与预定频率不同,因此对高晶公司THz-TDS得到的图谱进行采用频率映射处理,将其中的采样频率0.01THz映射到0.009THz得到对应的统一光谱。

步骤6,用步骤4得到的训练后的SVM分类器对步骤5得到的统一光谱进行分类,得到待测样品的名称。

图4为SVM分类器识别测试数据的分类结果图。

将高晶公司THz-TDS得到的130个统一光谱作为测试集,将0.2THz~1.5THz的范围内的全部143维波谱向量作为SVM分类器的特征向量,对训练后的SVM分类器进行分类测试。结果如图4所示,用该训练后的SVM分类器对高晶公司的波谱数据进行分类,其预测测试集分类绝大部分能够落入实际测试集分类,分类的准确率是93.07%。即、对13种待测样品的识别准确率为93.07%。

实施例作用与效果

本实施例提供的基于太赫兹光谱的物质识别方法,将预处理后的归一化频谱映射至统一的预定频率,消除了仪器间参数及设置不同所产生的差异;利用SVM分类器进行光谱分类训练,并利用训练完成后的SVM分类器对待测样品光谱进行待测样品的识别,消除了操作人员之间的主观差异。由此,本发明提供的方法消除了仪器差异及主观差异,因而具有鲁棒性以及广泛应用的潜力。

此外,在本实施例中,已知样品与待测样品各用一台THz-TDS进行扫描,并且这两台THz-TDS的采样频率不同,采样频率映射(即步骤3)所采用的预定频率与其中的最小频率一致,因此可以不用对最小采样频率的图谱进行采用频率映射操作,使得图谱处理过程能够快速完成。

上述实施例仅用于说明本发明的具体实施方式,本发明的方法并不局限于上述实施例的范围。

例如,在实施例中,已知样品与待测样品各用一台THz-TDS进行扫描,并且这两台THz-TDS的采样频率不同,但在本发明中,已知样品的扫描与待测样品的扫描均可以采用任意数量、频率相同或不同的THz-TDS来进行,只要将预定频率设定得不高于所采用的THz-TDS中的最低采样频率即可,如此即可将所有统一光谱中的采样频率统一,使得后续的SVM分类器训练以及SVM识别能够实现。

在实施例中,已知样品及待测样品均为13种,但本发明中,已知样品的数量可以不为13种,待测样品也可以不为13种,只要待测样品属于已知样品中的一种或几种,则本发明的方法均能够实现待测样品的识别。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1