通过多项式拟合估计光谱数据中的背景辐射的制作方法

文档序号:6165351阅读:897来源:国知局
通过多项式拟合估计光谱数据中的背景辐射的制作方法
【专利摘要】本发明涉及一种估计光谱数据中的背景辐射的方法。该方法可以迭代地包括:针对参考数据拟合多项式;确定所述参考数据与所述多项式的容许偏差;以及裁剪所述参考数据或所述光谱数据的相比所述多项式超出所述容许偏差的数据点,以为下一次迭代提供所述参考数据,直到满足终止准则。所述参考数据初始基于所述光谱数据。该方法可以包括:产生所述光谱数据的背景辐射的估计,每个估计都基于针对所述光谱数据拟合不同阶数的多项式;以及选择多项式的阶数以用来估计背景辐射和/或所述背景辐射的其中一个估计基于适合于不同阶数多项式的拟合的拟合准则。所述方法可以进一步包括从所述参考数据估计所述光谱数据中的噪声。
【专利说明】通过多项式拟合估计光谱数据中的背景辐射
【技术领域】
[0001]本发明涉及光谱设备和方法。本发明在拉曼光谱中特别有用,不过本发明也可以用在其他形式的光谱中,例如窄线光致发光、荧光、阴极发光、UV可见光(UV可见光谱)、核磁共振(NMR)、中红外(MIR)或近红外(NIR)。
【背景技术】
[0002]拉曼效应是由样本引起的光的非弹性散射。在拉曼光谱学中,例如在单色仪中用单色激光照射样本,然后通过诸如衍射光栅之类的色散装置将散射光色散,以产生被称为拉曼光谱的光谱。拉曼光谱由诸如电荷耦合器件(CCD)之类的检测器来检测。从美国专利N0.5,442,438和N0.5,510, 894可知拉曼光谱设备的示例,通过参考将这两个专利结合于此。
[0003]不同的化学化合物具有不同的特征拉曼光谱。因而,可以利用拉曼效应来分析样本中存在的化学化合物。
[0004]所检测到的光谱包括和背景信号在一起的拉曼光谱,该背景信号的强度比拉曼光谱大几个数量级,特别是对于生物样本来说尤其如此。除了其他因素之外,这种背景信号通常是由于支撑样本的基板、荧光以及拉曼设备的物镜引起的。为了分析拉曼光谱,经常首先必须将所检测到的光谱的可能由于背景源产生的比例识别出来。
[0005]皇家化学学会的B.D Beier 和 A.J.Berger (2009,134,1198 — 1202)公开了一种使用多项式拟合技术和已知光谱污染物的参考光谱从拉曼信号自动去除背景的方法。在所描述的示例中,显微镜载物片的玻璃作为已知的污染物。
[0006]该方法包括迭代算法,其中首先将背景成分的估计设定为所检测到的光谱。初始估计由已知污染物的浓度构成,并且针对所估计的背景与由已知污染物构成的所估计的贡献之间的残数进行拟合多项式。该多项式和所估计的已知污染物的贡献一起形成了背景的当前估计。用于下一次迭代的背景的新估计通过比较当前估计与之前的背景估计并且在每个波数处都保留最小值来确定。
[0007]期望有一种不需要知道对背景作出贡献的光谱成分的技术来自动地估计背景。

【发明内容】

[0008]根据本发明的第一方面,提供了一种估计光谱数据中的背景辐射的方法,该方法迭代地包括:针对参考数据拟合多项式;确定所述参考数据与所述多项式的容许偏差;以及裁剪所述参考数据或所述光谱数据的相比所述多项式超出所述容许偏差的数据点,以为下一次迭代提供所述参考数据,直到满足终止准则,其中所述参考数据初始基于所述光谱数据。
[0009]相比于样本的拉曼光谱的巨大波动,多项式往往更紧密接近背景的缓慢变化光谱来拟合。因而,裁剪所述参考数据或光谱数据的相比所述多项式超出所述容许偏差的数据点可以将尖锐拉曼光谱从所述参考数据中去除,同时保持更缓慢变化的背景成分。这样,可以不必为了估计背景而进行关于污染物的假设。
[0010]所述容许偏差可以基于所述参考数据或光谱数据与所述多项式的平均偏差的测量。例如,偏差的测量可以是所述参考数据与所述多项式的平均偏差,并且所述容许偏差可以是所述平均偏差的倍数M。优选地,测量可以是所述参考数据与所述多项式的均方根RMS0然而,将理解的是,所述容许偏差可以基于其他适当的测量,诸如标准偏差、仅正平均偏差或仅负平均偏差。
[0011]在另一个实施方式中,所述容许偏差基于所述参考数据中的噪声的估计。噪声是在光谱数据中的波动,其与背景的其他特征(诸如基板和物镜和荧光的光谱特征以及样本的拉曼光谱)相比相对较小。除了其他之外,这种噪声可以由光电检测器和处理电路中的电子噪声产生。噪声可以从所述光谱数据的每个点与其最近的相邻数据点之间的RMS变化或所述光谱数据的每个局部最小值与其最近相邻数据点(在该点小于其相邻两个点的意义下的局部最小点)之间的RMS变化来估计。
[0012]裁剪可以包括从所述参考数据或光谱数据抽掉即去除数据点。另选地,裁剪可以包括将数据点设定为超出所述多项式的具体值,优选为超出所述多项式的MX平均偏差的值。
[0013]所述终止准则可以在迭代中没有发生裁剪时满足。另选地或附加地,所述终止准则可以包括迭代的最大数量。
[0014]在一个实施方式中,所述参考数据可以初始地被设定成等于所述光谱数据。然而,在其他实施方式中,可以对所述光谱数据进行一定程度的预处理。
[0015]该方法可以包括确定多项式的阶数以针对所述参考数据进行拟合。
[0016]因而,根据本发明的第二方面,提供了一种估计光谱数据中的背景辐射的方法,该方法包括:产生所述光谱数据的背景辐射的估计,每个估计都基于针对所述光谱数据拟合不同阶数的多项式;以及选择多项式的阶数以用来估计背景辐射和/或所述背景辐射的其中一个估计基于适合于不同阶数多项式的拟合的拟合准则。
[0017]所述方法根据拟合准则自动地搜索用来产生背景辐射的估计的最合适阶数的多项式。这样,使用根据该拟合准则的“最佳”阶数多项式来估计所述背景。
[0018]该方法可以包括针对与所裁剪的光谱数据对应的参考数据拟合多项式以去除所关注的光谱成分,所述拟合准则对应于针对所述参考数据的多项式的拟合的测量。
[0019]所述方法可以包括产生所述背景辐射的估计直到满足或不满足所述拟合准则。所述多项式的阶数和/或所选择的估计可以基于导致估计的产生终止的多项式的阶数。
[0020]另选地,终止估计的产生可以基于与所述拟合准则不同的准则,然后基于所述拟合准则搜索所产生的估计以选择多项式阶数来估计背景辐射和/或背景辐射的其中一个估计。
[0021]多项式的阶数和/或估计可以基于产生其拟合满足所述拟合准则的估计所用的最高阶多项式来选择。
[0022]在一个实施方式中,产生每个估计的方法是迭代方法,诸如根据本发明的第一方面的方法。
[0023]所述拟合准则可以是所述迭代方法终止之前所需的迭代数量,典型地为最大数量。例如,可以针对光谱数据拟合不同阶数的多项式,以便发现能够在设定迭代次数内对所述光谱数据进行拟合的最高阶多项式。也可以用作拟合稳定性的测量。
[0024]所述拟合准则可以包括所拟合的多项式的最高阶多项式系数的统计显著性。该方法可以包括确定产生估计所用的最高阶多项式系数的统计显著性和使用基于所确定的统计显著性使用更高或更低阶的多项式来产生估计。例如,可以通过针对所述光谱数据拟合η阶多项式,将所拟合的多项式中的最高阶项删除并确定在具有该最高阶项和不具有该最高阶项的情况下针对该估计的多项式拟合之间是否具有统计上的显著差别来产生估计。如果存在统计上的显著差别,则使用更高阶多项式例如η+1阶多项式产生估计。然而,如果没有统计上的显著差别,则使用更低阶多项式例如η -1阶多项式产生估计。这些步骤则可以重复,直到多项式的阶数的增加序列或减少序列结束(因为在增加多项式阶数的序列的情况下最高阶项在统计上不再显著,或者因为在减少多项式阶数的序列的情况下最高阶项在统计上显著)。最高阶项的统计显著性可以基于所述光谱数据中的噪声的估计来确定。例如,由最高阶项引起的幅度变化在光谱数据中的所估计的噪声内。
[0025]所述拟合准则可以是相对于所拟合的多项式的估计的所需分布。例如,所述拟合准则可以涉及所述估计和所拟合的多项式之间的局部变化与所述估计和所拟合的多项式的全局变化的比较。这可以是针对所有数据点在每个点处的估计与所拟合的多项式之间的差与平均变化的比较,并且确定该比较是否落入可接收阈值内。如果有一个区域,即有两个或更多个连续点,其中变化大大大于该平均,则可以使用更高阶多项式产生估计。
[0026]根据本发明的第三方面,提供了一种设备,该设备包括处理器,该处理器被布置成执行本发明的第一和/或第二方面的方法。
[0027]根据本发明的第四方面,提供了一种数据载体,该数据载体上存储有指令,该指令在由处理器执行时致使该处理器执行本发明的第一和/或第二方面的方法。
[0028]所述数据载体可以是非暂时性数据载体,诸如易失性存储器诸如RAM,非易失性存储器例如R0M,闪存和数据存储装置,诸如硬盘,光盘,或暂时性数据载体,诸如电子和光学信号。
【专利附图】

【附图说明】
[0029]现在将参照所附附图仅以示例方式描述本发明的实施方式,其中:
[0030]图1示出了根据本发明的一个实施方式的设备。
[0031]图2是示出了根据本发明的一个实施方式的估计背景辐射的方法的流程图;以及
[0032]图3是示出了根据本发明的一个实施方式的识别供估计背景辐射之用的多项式阶数的方法的流程图。
【具体实施方式】
[0033]参照图1,根据本发明的设备包括连接至能够存取存储器29的计算机25的拉曼光谱仪。
[0034]该拉曼光谱仪包括输入激光束10,该输入激光束10由相对于光路以45度放置的二向色滤光器12反射90度。另选地,可以以低入射角(诸如10度)放置全息二向色滤光器。激光束然后传送到物镜16,物镜16将该激光束聚焦至在样本18上位于其焦点处的斑点。光在该被照射的斑点处被样本散射,并由物镜16收集而被准直成向回传送到二向色滤光器12的平行光束。滤光器12拒绝频率与输入激光束10相同的瑞利散射光,但是透射拉曼散射光。拉曼散射光然后传送至拉曼分析仪20。
[0035]拉曼分析仪20包括诸如衍射光栅之类的色散元件。来自分析仪20的光由透镜22聚焦在适当的光电检测器上。光电检测器阵列是优选的。在当前实施方式中,检测器24是电荷耦合器件(CCD),该电荷耦合器件由二维像素阵列构成,并且连接至计算机25,计算机25从每个像素获取数据并按照需要对其进行分析。分析仪20产生如虚线28所示的具有各种波段的光谱,该光谱在沿着CCD24的线上扩展。
[0036]样本18可以安装在X-Y台上,从而可以例如在计算机的控制下使焦点19在X和Y方向上穿越样本18进行扫描。然后针对每个样本收集一个光谱。
[0037]计算机25利用包括指令的软件代码在诸如存储器29之类的适当介质上编程,该软件代码在由计算机25的处理器执行时致使计算机25进行以下描述的分析例程。另选地,可以将所获得的拉曼光谱/多个拉曼光谱的数据传输到具有这种用于该分析的软件的单独计算机。在任一种情况下,在该分析进行时,都将所确定的值存储在相关的计算机中,并且可以被进一步处理和输出或显示以示出样本/多个样本中的成分的浓度。在该分析由计算机25进行的情况下,存储器29在其上存储用于该分析之用的成分参考光谱数据库。每个成分参考光谱都是用于不同化学成分或不同组化学成分的典型拉曼光谱(指纹图谱)。
[0038]为了处理光谱数据以确定样本中存在的拉曼光谱/多个拉曼光谱并因此确定样本中存在的化学成分,首先识别出和去除背景(样本的不是拉曼光谱的光谱成分)或将背景包含在分析中。
[0039]参照图2,利用迭代过程自动地进行光谱数据中的背景辐射的估计。在接收到光谱数据(101)之后,将参考数据初始设定成等于光谱数据(102 )。针对该参考数据,拟合η阶多项式(103)。将使用的多项式的阶数可以预先设定,例如,可以将该过程预先设定为五阶多项式,或者另选地如以下参照图3所描述的,可以通过适当的过程确定用于估计背景所用的多项式的阶数。
[0040]在步骤104中,确定所述参考数据的每个基准点与所述多项式的偏差,并针对这些偏差计算均方根(RMS)。然后修改该参考数据,在该实施方式中,通过抽掉相比多项式超出容许偏差的点来进行该修改。在该实施方式中,容许偏差为MXRMS,其中M为正实数。M可以由用户基于光谱数据中的噪声来设定。
[0041]在步骤106中,确定是否满足终止标准,在该实施方式中,确定在步骤105中是否有任何点被抽掉。如果点被从参考数据去除,则该方法继续到下一次迭代,其中针对修改的参考数据拟合多项式。该迭代过程继续,直到没有点在步骤105中被抽掉。在步骤108中,将最终迭代的参考数据作为背景辐射的估计输出。
[0042]背景辐射的估计可以在用于分析拉曼光谱的诸如DCLS之类的技术中使用。
[0043]在另一个实施方式中,在步骤105中,不是抽掉参考数据,而是抽掉光谱数据以去除相比多项式超出MX RMS的数据点,以便形成第i+Ι个参考数据,在下一次迭代的步骤103中针对该第i+Ι个参考数据拟合多项式。这样,可以再次引入在之前的迭代中被去除的光谱数据的点。为了实现这种方法,可能必须引入终止准则以避免无限循环,诸如相同的点连续地被去除,然后又再次引入的情况。在一个实施方式中,步骤106中的终止准则是迭代过程在设定(最大)迭代次数之后终止。[0044]参照图3,可以自动地设定要使用的多项式阶数,而不是预先设定在估计背景时使用的多项式阶数。
[0045]在步骤201中,通过针对光谱数据拟合η阶多项式来确定光谱数据中的背景辐射的估计。这种估计可以以参照图2描述的方式产生,或者在另选方式中,如现有技术中描述的那样产生。在步骤202中,对于多项式拟合是否满足拟合准则进行确定。下面更详细地描述了三个拟合准则。如果拟合满足拟合准则,则使用η+1阶多项式产生进一步估计。如果拟合不满足拟合准则,则使用η-1阶多项是产生估计。该过程反复进行,以便使用不断增加或不断减小的阶数的多项式来产生估计序列,直到拟合使得确定的结果逆转。例如,对于使用增加阶数多项式产生估计来说,当通过拟合没能满足拟合准则的多项式产生估计时该过程终止。对于使用减小阶数多项式来产生估计来说,当通过拟合满足拟合准则的多项式产生估计时该过程终止。
[0046]在步骤205中,使用拟合满足拟合准则的最高阶多项式产生的估计被选择作为背景辐射的估计。在另选布置中,图3的方法仅用于光谱数据的第一次(first instance),然后使用产生所选估计所用的多项式阶数产生用于其他光谱数据的估计。这在如下情形中可能是合适的,即:期望背景辐射的性质对于不同样本来说类似,例如当样本由相同基板支撑,并且使用相同的拉曼光谱设备获得拉曼光谱时。使用相同阶数多项式来估计一组光谱数据的背景对于给出一批光谱数据(诸如用于映射样本的一批光谱数据或随着时间从样本获取的一批光谱数据)的一致分析可能是有用的,或者在同时适合于所有数据、其中仅能够使用背景的一个估计的多元技术中是有用的。
[0047]在一个实施方式中,拟合准则是生成估计所需的迭代的最大数量。这可以作为拟合稳定性的一个测量。
[0048]在另一个实施方式中,拟合准则是所拟合的多项式的最高阶系数的统计显著性。使用η阶多项式产生估计,在最终迭代中拟合的多项式的最高阶数项被删除,并且确定针对估计(例如步骤108中的输出)的该修改的多项式的拟合相对于未修改的多项式之间的是否具有统计上的显著差别。如果存在统计上的显著差别,则使用更高阶多项式例如η+1阶多项式产生估计。然而,如果没有统计上的显著差别,则使用更低阶多项式例如η — I阶多项式产生估计。如果产生的估计相对于之前产生的估计在拟合准则方面导致了不同的结果,则终止估计的产生。使用具有统计上显著的最高阶系数的最高阶多项式产生的估计用来估计背景辐射。
[0049]在另一个实施方式中,拟合准则是所拟合的多项式相对于估计的所需分布。对分解的多项式与估计之间的局部变化和分解的多项式与估计的全局变化进行比较。这可以是针对所有数据点在每个点相对于平均变化之间的差的比较。关于该比较是否落入可接收阈值内进行确定。如果有一个区域,即有两个或更多个连续点,其中该变化落在阈值之外,则可以使用更高阶多项式产生估计。
【权利要求】
1.一种估计光谱数据中的背景辐射的方法,该方法迭代地包括:针对参考数据拟合多项式;确定所述参考数据与所述多项式的容许偏差;以及裁剪所述参考数据或所述光谱数据的相比所述多项式超出所述容许偏差的数据点,以为下一次迭代提供所述参考数据,直到满足终止准则,其中所述参考数据初始基于所述光谱数据。
2.根据权利要求1所述的方法,其中所述容许偏差基于所述参考数据与所述多项式的平均偏差,并且其中所述容许偏差可以基于所述参考数据与所述多项式的均方根RMS。
3.根据权利要求2所述的方法,其中所述容许偏差是所述平均偏差的倍数M。
4.根据权利要求1所述的方法,其中所述容许偏差基于噪声的估计。
5.根据权利要求1至4中任一项所述的方法,该方法包括从所述参考数据估计所述光谱数据中的噪声。
6.根据权利要求5所述的方法,其中所述噪声的估计基于所述参考数据的每个点之间的平均变化。
7.根据权利要求5所述的方法,其中所述噪声的估计基于所述参考数据与所述多项式的偏差/背景辐射的估计。
8.根据权利要求5至7中任一项所述的方法,该方法包括利用由最终迭代提供的参考数据进行噪声的估计。
9.根据权利要求1至8中任一项所述的方法,其中裁剪包括从所述参考数据或所述光谱数据抽掉相比所述多项 式超出容许偏差的数据点。
10.根据权利要求1至8中任一项所述的方法,其中裁剪包括将所述数据点设定为超出所述多项式的具体值。
11.根据权利要求1至10中任一项所述的方法,其中当在迭代中没有任何裁剪发生时满足所述终止准则;并且/或者其中当执行了设定次数的迭代时满足所述终止准则。
12.根据权利要求1至11中任一项所述的方法,该方法包括确定多项式的阶数以针对所述参考数据进行拟合。
13.一种估计光谱数据中的背景辐射的方法,该方法包括:产生所述光谱数据的背景辐射的估计,每个估计都基于针对所述光谱数据拟合不同阶数的多项式;以及选择多项式的阶数以用来估计背景辐射和/或所述背景辐射的其中一个估计基于适合于不同阶数多项式的拟合的拟合准则。
14.根据权利要求13所述的方法,该方法包括针对与所裁剪的光谱数据对应的参考数据拟合多项式以去除所关注的光谱成分,所述拟合准则对应于针对所述参考数据的多项式的拟合的测量;并且/或者所述多项式的阶数和/或估计基于产生其拟合满足所述拟合准则的估计所用的最高阶多项式来选择。
15.根据权利要求13或14所述的方法,其中所述方法包括产生背景辐射的估计直到满足或不满足所述拟合准则。
16.根据权利要求13至15中任一项所述的方法,其中每个估计都是利用根据权利要求1至12中任一项所述的迭代方法产生的,并且其中所述拟合准则可以包括在所述迭代方法终止之前所需的迭代数量。
17.根据权利要求13至16中任一项所述的方法,其中所述拟合准则包括所拟合的多项式的最高阶多项式系数的统计显著性;并且/或者所述拟合准则包括所述估计相对于所拟合的多项式的所需分布;并且/或者其中产生估计包括基于所述拟合准则在用于之前产生的估计的多项式拟合的应用而使用比之前产生估计更高或更低的多项式阶数来产生估计。
18.一种估计光谱数据中的噪声的方法,该方法包括从该光谱数据中去除被识别为与拉曼峰值对应的数据点以及从剩余数据点估计所述光谱数据中的噪声。
19.一种设备,该设备包括处理器,该处理器被布置成执行根据前述权利要求中任一项所述的方法。
20.一种数据载体,该数据载体上具有指令,所述指令在由处理器执行时致使该处理器执行根据权利要求1至18中任 一项所述的方法。
【文档编号】G01J3/44GK103534565SQ201280021495
【公开日】2014年1月22日 申请日期:2012年5月3日 优先权日:2011年5月5日
【发明者】布赖恩·约翰·爱德华·史密斯 申请人:瑞尼斯豪公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1