用于光谱校正的水干扰估计的制作方法

文档序号:12070947阅读:246来源:国知局
用于光谱校正的水干扰估计的制作方法与工艺

一般来说,红外(IR)光谱(这是广义的定义,包括但不限于:近红外(NIR)、中红外(MIR)、和远红外(FIR))是基于分子振动及转动模式,以及组合和泛音频段。因为摩尔吸光系数在电磁频谱的近红外(NIR)区可以非常小,近红外辐射通常可以穿透很远的样本(例如,相比于中红外(MIR)辐射)。因此,红外光谱技术(如漫反射NIR光谱和傅立叶变换红外光谱(FTIR))对于探测散装材料(bulk material)而言是非常有用的。此外,NIR光谱通常需要有限的样本制备或不需要的样本制备。近红外光谱(NIRS)可用于材料表征和分子分析应用,诸如制药、医疗诊断、神经病学、神经影像学、新生儿研究、泌尿学、食品和化学品的质量控制、燃烧产物分析、运动医学、体育科学、体育训练、人体工程学、康复,等等。



技术实现要素:

描述了一种使用例如傅立叶变换红外光谱(FTIR)系统进行样本检测的系统和技术。例如,一种方法包括分解训练集以获得具有多个主成分向量的主成分矩阵。该方法还包括通过递增地执行以下操作而可变地拒绝与所选的所述多个主成分向量之一不对应的部分样本光谱向量:选择子区域的所述样本光谱向量和相应子区域的所选主成分向量;以及将所选子区域的所述样本光谱向量与相应子区域的所选主成分向量相乘,以提供指示所选主成分向量对于所选子区域的权重的系数。该方法还包括基于所述递增地提供的系数,排除子区域的所述样本光谱向量和相应的主成分向量;将所述样本光谱向量与针对非排除的子区域的主成分矩阵相乘,以提供表示所述主成分矩阵的贡献的权重向量;将所述权重向量主乘以所述主成分矩阵,以提供预测干扰向量;以及从所述样本光谱向量减去所述预测干扰向量,以提供校正的光谱向量。

本发明内容还以一种简化的形式提供了选择理念,而该选理念将在在下面的详细描述进行进一步详细描述。本发明内容不旨在定义所要求保护的主题的关键特征或必要特征,也不打算作为帮助确定所要求保护的主题的范围。

附图说明

将参考附图进行详细描述。

图1是水蒸气的傅立叶变换红外光谱(FTIR)汽相谱图。

图2是含有水的样本混合物的光谱图以及针对一定量的水蒸气进行了校正的校正光谱图。

图3是根据本公开示例性实施的第一主成分的滑动窗口估计图。

图4是根据本公开示例性实施的含有水的样本混合物的光谱图以及针对一定量的水蒸气进行了校正的校正光谱图。

图5是用于估计FTIR光谱的水干扰和校正样本混合物中水存在的过程的流程图。

具体实施方式

包括诸如傅里叶变换红外光谱等(FTIR)的红外光谱的光学光谱技术可以在用于用来验证样本中分析物的存在的检测工具中实施,所述分析物包括但不限于危险或违禁品(如炸药、毒品、生物毒素、化学战剂等)。存在或不存在某些分析物(例如,通过光谱分析表示)可能会由于样本混合物中的干扰物质的存在而被掩盖。例如,水蒸汽可以是FTIR汽相光谱的干扰源。图1示出了水蒸气的FTIR汽相谱图。环境因素(如水蒸汽)可以存在于定量分析工具(例如,光谱仪)的气囊(gas cell)中,可以在样本的吸收光谱中呈现正面和负面的频带(bands)。这些因素可能会负面影响识别和量化库化合物(library compounds)的能力的。对这些环境因素进行过度补偿或较低补偿同样会提供有用的置信区间以外的数据。

描述了通过可变的选择来获得FTIR汽相样本光谱中水吸光度的估算方法。可使用数据训练集来获得的主成分矩阵,它可以用来描述与水干扰相关的光谱图案。在窄谱区域的各种范围内确定第一主成分,在感兴趣的光谱范围内提供第一主成分的多个值。假设第一主成分的多个值处于目标光谱范围上,则可在多个窄光谱区域上确定该第一主成分。提供显著区别于其他光谱区域的该第一主成分的值的光谱区域可指示一外围值(outlier value),该外围值可表示除水之外的化学物质存在于那些光谱区域内。移除这些外围区域可提供对分配给每一主成分的系数或评分(score)的更为精确的估计,而这些系数或评分在被应用至整个光谱时,可用于估计水蒸气在整个光谱上的吸光度。

主成分分析(PCA)是用来识别数据集主要趋势的建模技术。当施加到样本(如水蒸汽)光谱分析的所提供的光谱数据时,该数据的因素/趋势可以被确定以应用到构成其他样本的存在/不存在的因素/趋势。在一个实施例中,可以使用在不同温度及浓度下测量的水蒸气光谱的训练集来创建主成分模型:

Xtrain=TPT (1)

其中Xtrain代表水汽吸收光谱训练集,T代表针对每一因素的系数或评分,且PT表示描述与水干扰相关的光谱图案的因素(例如,主成分载荷向量)。训练集可以包括在不同温度及浓度下测量的水蒸气光谱,以捕捉可在其中寻找到样本混合物的各种各样的环境条件。因此,训练集可以对于使用在此所描述的技术的检测工具所面临的特定场景而言是具有很强鲁棒性的。

将模型应用于样本数据集,可计算每个因素的系数或评分:

Xunknown*P=Tunknown (2)

其中Xunknown代表样本光谱数据集,P代表描述样本数据集的光谱图案的因素,并Tunknown代表所计算的每个因素的系数或评分。这些值可用于通过移除特定水平的水蒸气干扰而校正样本光谱:

Xcorrected=Xunknown-Tunknown*PT (3)

其中Xcorrected表示已通过移除特定水平的水蒸气干扰而被调整的校正后的样本光谱。图2提供了含有水的样本混合物的光谱图以及针对一定量的水蒸气进行了校正的校正光谱图。样本光谱包括存在于水蒸气区域内的其他化学峰值(即,非水峰值)(例如,如图1所示),校正后的数据集可以例如通过指示负峰值而提供对所存在的水量的过估计或误差。图2提供的图形显示了具有负峰的至少两个区域(如在200和202)。剩下的(正的)峰值也可能受到水蒸气量的过估计或误差的影响。

在本公开的实施中,可使用滑动窗口方法来识别除水蒸气之外的特征的光谱区域。这种方法可以用来避免过估计或不能准确提供所存在的水蒸气的量,特别是在样本包括存在于水蒸气区域内的化学峰值(即,非水峰值)的情况下。类似于在此所述的PCA方法,可在窄光谱区域内计算第一主成分(例如,主要为水蒸气的光谱)的系数(T)。该系数可通过使用例如水蒸气光谱训练集(例如,在多种不同浓度及温度下采集的多个光谱)而被导出为评分矩阵。在实施中,可以以10cm-1的步长使用45cm-1(波数)的窗口,从而覆盖约1300cm-1至约2000cm-1的范围,并形成可对应于水蒸气光谱的主峰值区域的约3400cm-1至约4000cm-1的范围(如图1所示)。参见图3,示出了根据本公开示例性实施的第一主成分的滑动窗口估计图,其中包含了针对主成分评分的八十(80)个估计。

评分的阈值可以被确定,其在超过该阈值的评分可以指示包含除水蒸气之外的化学特征的光谱区域。在实施中,评分的中间值(median value)可用作阈值,其中包含显著不同于所述中间值的评分的光谱区域可被标记或归档作为可能包含来自存在于样本混合物内除水蒸气之外的化学物质的特征。

如图3中的示例实施中所示,示出了具有显著不同于评分中间值的值的两个区域的光谱区域(标记为300和302)。这些区域对应于与水以外的化学物质相关的峰值。区域300位于约1300cm-1至约1400cm-1的(对应于窗口1-5)的光谱范围内。区域302位于约1700cm-1至约17750cm-1的(对应于窗口27-30)的光谱范围内。这些区域对应于图2中感兴趣的第一光谱区域内的两个最强峰值(标记为204和206)。由于这些区域对应于非水化学物质,它们可以被从模型因素移除,以提供样本中由于水的贡献的估计。在实施例中,包含显著不同于阈值的评分的区域被从样本混合物光谱及原始模型因素(P)移除,以获取更新的评分估计(例如,更为精确的),类似的方程(2)所述。之后可将更新的评分估计用于(整个光谱范围)原始因素,以估计整个光谱上由于水蒸气所导致的吸光度。然后,从样本混合物光谱中减去由于水蒸汽所导致的吸光度,从而提供无来自水蒸气的实质性干扰的样本光谱。例如,图4显示了样本混合物的光谱图(标记为400),由于水蒸气的存在,该光谱有干扰。图4还包括校正光谱(标记为402),其已根据本公开一示例性实施根据滑动窗口法修改PCA模型而对水汽量进行了校正。在图4中可以看到,相比于根据PCA方法在图2中的区域200及202所发现的对水蒸气量的过估计/误差,校正后的光谱402提供了相同水平的对水蒸气量的过估计/误差。

现参考图5,其示出了根据本公开一示例性实施的用于估计FTIR光谱的水干扰及校正样本混合物内的水存在的过程500的流程图。本文所述的过程的各个方面可以被实施为硬件、软件或其组合。该过程被示为一组方框,该组方框指定了由一个或多个设备(例如,IR光谱仪器仪表、计算机系统控制的IR光谱仪器或红外光谱组件)执行的操作且并不一定限于所显示的执行各个方框的操作的顺序。在实施中,本文所描述的过程的各个方面可通过固定或移动化学检测系统(如汽相检测系统)来实施。

过程500包括分解训练集以获得具有多个主成分向量的主成分矩阵(方框502)。例如,将水蒸气光谱的训练集分解以获得具有多个主成分向量的主成分矩阵。在实施中,训练集包括在各种不同的温度和浓度下测量的水蒸气光谱。

过程500还包括可变地拒绝与多个主成分向量的所选一者(PT)不对应的部分样本光谱向量(X)。方框504包括以下递增的过程:选择子区域的样本光谱向量以及对应区域的所选主成分向量(方框506),以及将所选子区域的该样本光谱向量与对应子区域的所选主成分向量相乘以提供指示所选主成分向量对应所选子区域的权重的系数(方框508)。例如,图3中示出了指示该所选主成分向量的权重的系数的实施,其中示出了主成分向量的滑动窗口估计,其中包含了针对主成分评分的八十(80)个估计。

过程500还包括根据递增提供的系数,排除子区域的样本光谱向量和相应的主成分向量(方框510)。例如,可以确定评分的阈值,其中超过阈值的评分可以指示包括除水蒸气以外的化学特征的光谱区域。在实施中,指示所选主成分向量的权重的系数的中间值可用作所述阈值,其中包含显著不同于所述中间值的评分的光谱子区域可从样本光谱向量及对应的主成分向量中被排除。

过程500进一步包括将样本光谱向量与对于非排除子区域的主成分矩阵相乘,以提供表示主成分矩阵贡献的权重向量(方框512)。例如,在实施中,权重向量(T)被提供如下:

T=X*P

其中X表示样本光谱向量,其中P表示非排除子区域的主成分矩阵。在实施中,T由以下提供:

T=X*P*(PT*P)-1

其中X表示样本光谱向量,P表示非排除子区域的主成分矩阵,PT表示主成分矩阵。

步骤500进一步包括将主成分矩阵乘以权重向量以提供预测干扰向量(方框514)。例如,在实施中,预测干扰向量(X’)可被提供如下:

X′=T*PT

其中T表示权重向量,PT表示主成分矩阵。

步骤500进一步包括从样本光谱向量减去预测干扰向量以提供校正的光谱向量(方框516)。例如,在实施中,根据以下内容提供校正的频谱向量(E):

E=X-X′

其中X表示样本光谱向量,X’表示预测干扰向量。

在实施中,过程500包括分析校正的光谱向量。例如,校正后的光谱可以与感兴趣的各种化学物质的已知光谱库进行比较,以确定校正后的光谱是否与某些感兴趣的化学物质相关联。在分析之后,当校正后的光谱代表感兴趣的化学物质时,过程500可以包括激活一个或多个视觉或听觉标记。例如,当确定校正的频谱对应或与感兴趣的化学物质相关联时,化学检测系统可以激活声音或可见的警报,向用户界面产生可视输出等等。

需要注意的是,对于计算机领域的技术人员而言很显然的是,上述描述的实施例和实施可以使用传统的通用数字计算机按照本说明书的教示来方便地实施。对于软件领域的技术人员而言很显然的是,适当的软件编码可以很容易地由程序员基于本公开的教示而被编写。

可以理解,本文所描述的实施例和实施可以以软件包的形式方便地实施。该软件包可以是具有计算机可执行指令或计算机程序产品的计算机可读存储介质,其采用非短暂的计算机可读存储介质,该存储介质包含存储的计算机代码,该计算机代码可使得计算机执行所公开的功能及在此所公开的过程。计算机可读存储介质可能包括但不限于任何类型的传统软盘、光盘、CD-ROM、磁盘、硬盘、磁光盘、ROM、RAM、EPROM、EEPROM、磁性或光学卡、或任何其他合适的用于存储电子指令的媒介。

此处所使用的术语“约”指的是关于所指定的值或范围的大概值和/或精确值。虽然已通过特定的结构特征和/或方法动作的语言对主题进了描述,但应该理解的是,所附权利要求书中所限定的主题并不限于所述的特定特征或动作。虽然描述了各种不同的配置,但是可在不背离本公开的情况下以各种方式来构建设备、系统、系统组件等。相反,所公开的特定特征及动作均仅作为实施权利要求的示例性形式。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1