基于非对称加权最小二乘的拉曼光谱检测基线校正方法与流程

文档序号:15995078发布日期:2018-11-20 18:44阅读:1251来源:国知局

本发明属于拉曼散射技术领域,尤其涉及一种基于非对称加权最小二乘的拉曼光谱检测基线校正方法。



背景技术:

目前,业内常用的现有技术是这样的:拉曼光谱是一种基于拉曼散射效应的分子振动光谱,其特征峰的位置、强度和峰宽度等信息能够反映出分子的结构特征,因而可以实现对物质成分的检测。然而,在光谱数据的采集过程中,由于有机分子、环境或样品中污染物的荧光影响,测得的光谱常常会发生基线漂移的现象。某些情况下,荧光信号的强度远大于拉曼信号,构成了拉曼光谱检测分析的一个主要障碍。因此,基线校正是拉曼光谱检测的一个必要步骤。传统的基线校正大多是利用最小二乘多项式拟合方法对光谱信号手动选点进行曲线拟合,该人工方法虽然简单,但需要定义合适的多项式拟合阶数,且操作繁琐,具有较大的主观性。基于小波变换的基线校正方法,依赖于分解函数和分解尺度的选取,且所要求的信号和背景在变换域中能够良好分离的假设条件,在实际中并不一定满足。惩罚最小二乘法是一种运算快速的信号平滑方法,不仅考虑了最小二乘拟合信号对原始信号的保真度,同时也兼顾了拟合信号的平滑度。然而,当光谱叠加噪声时,惩罚最小二乘方法校正后的光谱可能会抬升,影响基线校正结果的准确性。人工多项式基线拟合,需要人为地在光谱信号上选取一系列位于光谱背景的数据点,确定合适的多项式阶数,然后进行基线拟合。此方法由于背景点需要人工选取,操作较为繁琐费时;且不同的人选取的基线背景点可能不同,拟合结果往往具有较大主观性,准确度主要依赖操作者的经验。基于小波变换的基线校正方法是将拉曼信号分解为一系列正弦波的叠加,从而将信号的高频和低频分开;但是当光谱信号的频率成分与噪声特征不易区分时,滤波会有残留,基线校正易失真或不充分,对于不同的实际问题难以达到最佳处理效果。惩罚最小二乘法是一种快速的信号平滑方法,不仅考虑了最小二乘拟合信号对原始信号的保真度,同时也兼顾了拟合信号的平滑度。其在迭代过程中,若光谱信号低于拟合基线,则置权重为一较大值;若光谱信号高于拟合基线,则置权重为零或较小值。当光谱叠加噪声时,对于低于拟合基线的噪声部分赋值了较大权重,使得最终的拟合基线比实际位置偏低,基线校正后的光谱会被抬升,从而影响了基线校正结果的准确性。

综上所述,现有技术存在的问题是:

(1)传统的基线校正需要定义合适的多项式拟合阶数,且操作繁琐,具有较大的主观性。实际中光谱的基线形态复杂多变,对于大量的、高维的光谱数据,人工多项式基线拟合的方法难以满足准确快速的批处理基线校正要求。

(2)基于小波变换的基线校正方法,依赖于分解函数和分解尺度的选取,其所要求的信号和背景在变换域中能够良好分离的假设条件,在实际中并不一定满足。实际中光谱信号难免会有噪声存在,当光谱信号的频率成分与噪声特征不易区分时,小波滤波会有残留,从而造成基线校正失真或不充分。

(3)惩罚最小二乘法当光谱叠加噪声时,惩罚最小二乘方法校正后的光谱可能会抬升,影响基线校正结果的准确性。

解决上述技术问题的难度和意义:

拉曼光谱可以提供物质的详细化学信息,拉曼光谱检测具有快速、无损、低成本等许多现有的标准方法所没有的优势,现已在食品、制药、生物医学等领域得到广泛应用。然而,实际中所获得的光谱数据,由于有机分子或样品中污染物的荧光影响,常会使拉曼光谱产生“基线漂移”的现象,有时还会有较强的噪声干扰,影响拉曼光谱数据的进一步分析处理。因此,如何通过基线校正算法,在不丢失有用光谱信息的前提下,将拉曼光谱中的基线信号进行有效去除,是拉曼应用领域的难题。同时,随着拉曼光谱在在线检测中的应用逐渐扩大,除了基线校正结果的准确度,对基线校正算法的速度也提出较高要求。



技术实现要素:

针对现有技术存在的问题,本发明提供了一种基于非对称加权最小二乘的拉曼光谱检测基线校正方法。

本发明是这样实现的,一种基于非对称加权最小二乘的拉曼光谱检测基线校正方法,所述基于非对称加权最小二乘的拉曼光谱检测基线校正方法基于非对称惩罚最小二乘和局部对称加权的思想,通过迭代求取加权最小二乘的方式得到拟合基线。当达到最大迭代次数或者终止条件时,迭代停止。原始光谱减去拟合基线,实现基线校正。

进一步,所述基于非对称加权最小二乘的拉曼光谱检测基线校正方法包括以下步骤:

步骤一,建立拉曼光谱模型s=[s1,s2,...,sN]=r+b+n,N为光谱数据点个数,r为拉曼信号,b为荧光背景,n为噪声信号;待基线拟合的拉曼光谱为y;设置平滑参数λ;

步骤二,对权重进行初始化w0=[1,1,...,1],权重矩阵W是一个稀疏对角阵,W=diag(w1,w2,...,wN),N为光谱数据点个数;

步骤三,最小化惩罚最小二乘代价函数转化为求解方程(W+λDTD)z=Wy,其中z是拟合基线,D是差分矩阵:Dz=Δnz,初始权重w0代入方程,计算初始基线:z0=(W0+λDTD)-1W0y;

步骤四,判断是否满足迭代终止条件,若不满足转步骤五,否则转步骤七;

步骤五,计算拉曼光谱与拟合基线之间的残差信号d=y-z,取残差信号的负值部分d-并计算其均值m和标准差s;

步骤六,使用softsign函数和迭代次数t对权重进行迭代更新得Wt,计算第t次迭代的拟合基线:zt=(Wt+λDTD)-1Wty;转步骤四;

步骤七,迭代终止,用原始光谱减去最终的拟合基线,实现拉曼光谱的基线校正。

进一步,所述λ的取值101~108

进一步,所述步骤三中,最小化惩罚最小二乘代价函数转化为求解方程(W+λDTD)z=Wy,其中z是拟合基线,D是差分矩阵:Dz=Δnz,差分矩阵D使用的是二阶差分矩阵:

将差分矩阵和初始权重w0代入方程,计算初始基线:z0=(W0+λDTD)-1W0y。

进一步,所述步骤五中,计算拉曼光谱与拟合基线之间的残差信号d=y-z,取残差信号的负值部分d-并计算其均值m和标准差s。

进一步,所述步骤六中迭代更新权重为:

其中,yi是第t次迭代中待基线拟合的信号,zi是第t次迭代中的拟合基线,残差信号di=yi-zi,和分别是残差信号负值部分的均值和标准差,i∈(1,2,...,N),N为光谱数据长度。

本发明的另一目的在于提供一种应用所述基于非对称加权最小二乘的拉曼光谱检测基线校正方法的拉曼光谱预处理和分析系统。

本发明的另一目的在于提供一种应用所述基于非对称加权最小二乘的拉曼光谱检测基线校正方法的近红外光谱预处理和分析系统。

综上所述,本发明的优点及积极效果为:利用本发明中的基线校正方法,对原始拉曼光谱进行校正,使基线校正后的光谱更接近于真实的拉曼信号,提高拉曼光谱检测的准确度,对于拉曼光谱的定量分析及应用具有重要实际意义。该方法的优点具体如下:

1)本发明结合惩罚最小二乘和非对称加权,在进行基线校正时,使用平滑参数对拟合基线的平滑度进行连续控制;无需峰形和基线的先验信息,与窗口移动多项式最小二乘基线拟合相比,具有稳定、快速运算的优点,且能够适应边界点的处理。

2)本发明在自适应迭代算法中引入迭代次数和上一次迭代的拟合结果与原始光谱信号之间的残差信号,对非对称加权的权重进行更新,不仅加速了算法的收敛过程;同时softsign函数形式的权重与阶跃函数相比,可看作是一个局部平等加权,避免了噪声情况下普通非对称加权惩罚最小二乘法在基线校正后光谱抬升的问题,使其对于无谱峰区域的基线估计更准确,校正后的峰值高度也更准确。

3)本发明利用了稀疏矩阵技术,能够快速完成大量的高维光谱信号的基线校正。

4)本发明拥有较少的参数设置,且参数具有明确意义,易于调节。

附图说明

图1是本发明实施例提供的基于非对称加权最小二乘的拉曼光谱检测基线校正方法流程图。

图2是本发明实施例提供的基于非对称加权最小二乘的拉曼光谱检测基线校正方法实现流程图。

图3是本发明实施例提供的softsign权重函数示意图。

图4是本发明实施例提供的模拟示意图;

图中:(a)Lorentzian模拟谱峰信号;(b)五种类型的模拟基线;(c)模拟拉曼光谱基线校正前后的对比示意图。

图5是本发明实施例提供的罗丹明6G拉曼光谱基线校正前后的对比示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明基于非对称惩罚最小二乘和局部对称加权的思想,通过迭代求取加权最小二乘的方式得到拟合基线。当达到最大迭代次数或者终止条件时,迭代停止。原始光谱减去拟合基线,实现基线校正,从而提高定量分析检测准确度。

如图1所示,本发明实施例提供的基于非对称加权最小二乘的拉曼光谱检测基线校正方法包括以下步骤:

S101:对于待基线拟合的拉曼光谱,设置平滑参数和迭代终止条件,第一次迭代时将权重初始化为单位矩阵,通过最小化惩罚最小二乘得初始拟合基线;

S102:然后根据原始光谱与拟合基线之间的差值信号,通过softsign函数对权重进行更新,使用更新后的权重计算新的拟合基线,该过程不断重复,直至满足终止条件。

下面结合附图对本发明的应用原理作进一步的描述。

如图2所示,本发明实施例提供的基于非对称加权最小二乘的拉曼光谱检测基线校正方法包括以下步骤:

模拟拉曼光谱由三部分构成:谱峰信号、模拟基线和随机噪声。其中,谱峰信号用Lorentzian函数进行描述:

式中,r为拉曼位移(波数);roi为拉曼谱峰的中心拉曼位移;Aoi为拉曼谱峰面积;ωoi为谱峰半高宽(FWHM);N为谱峰的总个数。这里用包含5个Lorentzian峰的3000个数据点来模拟谱峰信号,其参数列表见表1。Lorentzian模拟谱峰信号如图4(a)所示。

表1 Lorentzian模拟谱峰信号的参数

模拟基线设置了四种不同的形式,分别为线性函数、正弦曲线、指数函数和高斯曲线;将这四种基线叠加得到一个组合基线,以模拟实际中复杂的荧光背景。其波数范围均设置为1至3000,五种类型的模拟基线如图4(b)所示。随机噪声为高斯白噪声(信号整体信噪比SNR=15)。

步骤1,将上述Lorentzian谱峰、模拟基线与噪声进行叠加,得模拟拉曼光谱,即为待拟合基线的拉曼光谱y;设置平滑参数λ=106,来平衡拟合基线相对于真实基线的保真度和平滑度,平滑参数λ越大,拟合出的基线越平滑;设置迭代终止条件:ratio=10-6,或最大迭代次数10次。

步骤2,对权重进行初始化w0=[1,1,...,1],权重矩阵W是一个稀疏对角阵,W=diag(w1,w2,...,wN),N为光谱数据点个数3000。

步骤3,最小化惩罚最小二乘代价函数转化为求解方程(W+λDTD)z=Wy,其中z是拟合基线,D是差分矩阵:Dz=Δnz,这里使用二阶差分矩阵:

将初始权重w0代入方程,计算初始基线:z0=(W0+λDTD)-1W0y。

步骤4,判断是否满足迭代终止条件,若不满足转步骤5,否则转步骤7。本实施例中的终止条件设置为:最大迭代次数10;或者连续两次迭代过程中权重改变量小于10-6,即|wt+1-wt|/wt<10-6

步骤5,计算拉曼光谱与拟合基线之间的残差信号d=y-z,取残差信号的负值部分d-并计算其均值m和标准差s。

步骤6,使用softsign函数和迭代次数t对权重进行迭代更新得Wt,计算第t次迭代的拟合基线:zt=(Wt+λDTD)-1Wty;转步骤4。

迭代更新权重为:

给定均值和方差,softsign函数权重函数如图3所示。从图中可以看出,在拉曼光谱与拟合基线之间的差值信号d<0的部分,仅使用softsign函数便可以表示非对称加权的分段形式。当拉曼光谱与拟合基线之间的差值信号小于估计噪声的均值时,softsign函数能够对低于或高于基线的光谱给予相等的权重;且权重值随着信号强度值的增加而逐渐减小。在高斯噪声假设下,信号小于3倍噪声标准差减去噪声均值的部分,能够覆盖99.7%的噪声,此时softsign函数权重值为一较小值。当光谱信号远大于拟合基线时,可认为该部分为谱峰,因此权重值置为0。图3中还可以看出,随着迭代次数的增加,softsign函数逐渐趋向于一个经过平移和反转的单位阶跃函数的形式。

步骤7,迭代终止,用原始光谱减去最终的拟合基线,实现拉曼光谱的基线校正。

基线校正后的光谱与理论拉曼光谱的复相关系数R2=0.99681;拟合基线与真实基线之间的均方根误差RMSE=6.9694。拉曼光谱、拟合基线以及基线校正后的拉曼光谱如图4(c)所示。从图中可以看出在噪声环境下,拟合基线平滑地穿过噪声带中间,并且与模拟基线良好符合,表明该算法得到的拟合基线是可靠的,并具有良好的噪声适应性。

下面结合仿真对本发明的应用效果作详细的描述。

将本发明应用于由强荧光背景引起基线漂移的罗丹明6G的拉曼光谱处理中。

样本的原始拉曼光谱由532nm激光器激发,使用卓立汉光微区激光拉曼光谱仪find one型光纤光谱仪测量得到。光谱仪的物镜倍数为40X,测量范围为600~2000nm,数据采集积分时间根据光谱信噪比设置为0.5s。

设定的实验条件:积分时间0.5s,每次采集10条光谱数据,时间间隔为0s。

设置平滑参数λ=106,ratio=10-5,最大迭代次数20次。罗丹明6G拉曼光谱、拟合基线以及基线校正后结果如图5所示。从图中可以看出,本发明能够自适应的进行基线校正,有效降低荧光背景干扰,同时校正后的结果使拉曼光谱的峰形和谱峰位置都得到了保持。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1