光谱标准化方法与流程

文档序号:13573832阅读:2156来源:国知局
本发明涉及光谱处理领域,更具体涉及一种光谱标准化方法。
背景技术
::近红外光谱分析技术是一种具有高效、无损、无污染、可同时进行多组分定性或定量分析的快检技术,在各个行业得到了广泛应用,例如农产品、石油、饲料、烟草、医药等领域。近红外光谱分析作为一种检测分析技术手段依据的是近红外光谱中包含了样品特征的重要光谱信息,通过化学计量学的偏最小二乘多变量校正方法(partialleastsquares,pls)可以建立样本光谱信息和其成分含量之间的关系模型,用于预测未知待测样本成分含量。但是,近红外光谱分析技术是一种间接的分析方法,在建立光谱校正模型时,往往需要测定分析大量样品的化学值或基础性质数据作为建立光谱校正模型的基础,这个过程不仅费时费力,且投入较大,所以对所建立的光谱校正模型在动态适应性方面提出了较高的要求,不仅要求光谱校正模型的预测范围广,而且要求在一台仪器上建立的光谱校正模型能够在其它仪器上应用,方便大范围应用和网络化集成,即要求进行光谱校正模型的转移。激光波束漂移、吸光度漂移、峰行畸变是光谱校正模型不能通用的主要原因,而光谱标准化也根据这些特征具有相应的分类,例如基于模型预测结果调整的sbc,基于模型参数调整的算法。其中应用最广,算法最多的一类是光谱标准化算法,通过对主机和子机光谱进行计算,得到一个转换矩阵,通过该矩阵对待测子机光谱进行标准化。最著名的光谱标准化算法是pds(piecewisedirectstandardization),其算法以稳定性和广泛的实用性著称,通常作为考察新算法的标杆。另外近年来提出的典型相关性分析方法(canonicalcorrelationanalysis,cca,analyticachimicaacta2008年637期22~29页)和目标因子分析方法(ttfa,光谱学与光谱分析2005年25卷第3期398~401页),分别以典型相关分析和主成分分析作为基础,进行光谱标准化。技术实现要素:本发明的目的是提供一种高通用性和准确度的光谱标准化算法。为了解决上述技术问题,本发明提供了一种光谱标准化方法,所述方法包括以下步骤:s1、选取主光谱仪以及子光谱仪,其中所述主光谱仪与所述子光谱仪的光谱存在差异;s2、分别利用所述主光谱仪和子光谱仪对预定物质进行照射,获取所述主光谱仪的主机标准光谱以及所述子光谱仪的子机标准光谱;s3、利用所述主机标准光谱以及所述子机标准光谱构建目标函数;s4、根据所述目标函数确定对应主光谱仪和子光谱仪同时代表最大相关和最大方差的主机特征向量、子机特征向量;s5、根据所述主机标准光谱、子机标准光谱、主机特征向量、子机特征向量确定具有最大方差同时具有最大相关性的主机子成分和子机子成分;s6、确定利用所述主机标准光谱以及所述子机标准光谱的列空间线性组合成所述主机子成分以及子机子成分的主机权重系数和子机权重系数;s7、在所述主机标准光谱以及所述子机标准光谱中分别剔除所述主机子成分和子机子成分,形成主机光谱残差矩阵以及子机光谱残差矩阵,并以所述主机光谱残差矩阵代替所述主机标准光谱,以所述子机光谱残差矩阵代替所述子机标准光谱执行步骤s3-s6,以此类推重复执行若干次,得到多组主机子成分、子机子成分、主机权重系数和子机权重系数;s8、多组主机子成分、子机子成分、主机权重系数和子机权重系数分别形成主机子成分矩阵、子机子成分矩阵、主机权重系数矩阵和子机权重系数矩阵,确定主机子成分矩阵和子机子成分矩阵的最小二乘解;s9、利用所述主机子成分矩阵和子机子成分矩阵的最小二乘解、主机权重系数和子机权重系数确定光谱标准化转换矩阵,利用所述光谱标准化转换矩阵对待测光谱仪的光谱进行标准化处理。优选地,所述主机光谱仪为近红外光谱仪。优选地,所述预定物质的浓度分别均匀,并且在具有预定数量的波段吸收峰。优选地,所述目标函数为:式中,ai为子机特征向量,ti为子机子成分,bi为主机特征向量,ui为主机子成分,xm为主机标准光谱或主机光谱残差矩阵;xs为子机标准光谱或子机光谱残差矩阵。优选地,所述步骤s4包括以下步骤:s41、通过拉格朗日算法求解下面公式:λ1和λ2为拉格朗日常数;s42、对ai、bi求导得到:λ1=λ2s43、解上述方程得到所述主机特征向量以及所述子机特征向量。优选地,所述步骤s5中所述主机子成分利用如下公式计算:ui=xmbi所述子机子成分利用如下公式计算:ti=xsai优选地,所述步骤s5中所述主机权重系数qi利用如下公式计算:所述子机权重系数pi利用如下公式计算:优选地,所述步骤s7中利用如下公式剔除所述主机子成分和子机子成分:式中,xsi+1为剔除之后的子机光谱,xmi+1为剔除之后的主机光谱,xsi为剔除之前的子机光谱,xmi为剔除之前的主机光谱。优选地,所述步骤s8中利用如下公式确定主机子成分矩阵和子机子成分矩阵的最小二乘解b:式中,t为所述子机子成分矩阵,p为所述子机权重系数矩阵,u为所述主机子成分矩阵,q为所述主机权重系数矩阵,e为所述子机标准光谱,f为所述主机标准光谱。优选地,所述步骤s9中利用如下公式确定光谱标准化转换矩阵f:f=pbqt利用如下公式对待测光谱仪的光谱进行标准化处理:xs_standardized=xs_test*f式中,xs_standardized为标准化处理后的光谱,xs_test为待测光谱仪的光谱。优选地、上述计算过程可以通过迭代的nipals或simpls等方法简化,达到与本方案同样的效果。本发明提供了一种光谱标准化方法,本发明对主机标准光谱和子机标准谱进行求导、平滑和降噪等处理操作形成光谱标准化转换矩阵,之后利用光谱标准化转换矩阵对待测光谱仪的光谱进行标准化处理。利用本发明的标准化方法对待测光谱仪测定的光谱进行标准化处理,标准化后的光谱适用于主光谱仪上建立的光谱校正模型,从而使得不同仪器扫描的光谱经过转移后可以用一个通用模型分析。本方法在光谱标准化中具有重复性好,对标准样品光谱扰动小的优点,适用于大范围推广和网络客户端光谱仪器的标准化,同时本发明的方法具有原理清晰,方法简单,等优势。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明的光谱标准化方法的流程图;图2为spls光谱标准化示意图;图3为不同标准光谱的数量对光谱标准化结果的影响图4a、4b为不同标准光谱的数量对光谱标准化结果的影响;图5a、5b为spls光谱标准化前后总糖预测情况。具体实施方式下面结合附图和实施例对本发明作进一步详细描述。以下实施例用于说明本发明,但不能用来限制本发明的范围。一种光谱标准化方法,如图1所示,所述方法包括以下步骤:s1、选取主光谱仪以及子光谱仪,其中所述主光谱仪与所述子光谱仪的光谱存在差异;s2、分别利用所述主光谱仪和子光谱仪对预定物质进行照射,获取所述主光谱仪的主机标准光谱以及所述子光谱仪的子机标准光谱;s3、利用所述主机标准光谱以及所述子机标准光谱构建目标函数;其中,目标函数为:式中,ai为子机特征向量,ti为子机子成分,bi为主机特征向量,ui为主机子成分,xm为主机标准光谱或主机光谱残差矩阵;xs为子机标准光谱或子机光谱残差矩阵;其中xm和xs均为m*n的矩阵,m为离散的波数点,n为标准样品个数;s4、根据所述目标函数确定对应主光谱仪和子光谱仪同时代表最大相关和最大方差的主机特征向量、子机特征向量;此步骤具体为:s41、通过拉格朗日算法求解下面公式:λ1和λ2为拉格朗日常数;s42、对ai、bi求导得到:λ1=λ2s43、解上述方程得到所述主机特征向量以及所述子机特征向量;s5、根据所述主机标准光谱、子机标准光谱、主机特征向量、子机特征向量确定具有最大方差同时具有最大相关性的主机子成分和子机子成分;此步骤中,所述主机子成分利用如下公式计算:ui=xmbi所述子机子成分利用如下公式计算:ti=xsai从步骤中,所述主机权重系数qi利用如下公式计算:所述子机权重系数pi利用如下公式计算:s6、确定利用所述主机标准光谱以及所述子机标准光谱的列空间线性组合成所述主机子成分以及子机子成分的主机权重系数和子机权重系数;s7、在所述主机标准光谱以及所述子机标准光谱中分别剔除所述主机子成分和子机子成分,形成主机光谱残差矩阵以及子机光谱残差矩阵,并以所述主机光谱残差矩阵代替所述主机标准光谱,以所述子机光谱残差矩阵代替所述子机标准光谱执行步骤s3-s6,以此类推重复执行若干次,得到多组主机子成分、子机子成分、主机权重系数和子机权重系数;此步骤中,分别求出从子机光谱和主机光谱中剔除ti、ui所代表的光谱信息后得到光谱残差矩阵和直到前j次所求t和u足够保证光谱标准化要求,具体地利用如下公式剔除所述主机子成分和子机子成分:式中,xsi+1为剔除之后的子机光谱,xmi+1为剔除之后的主机光谱,xsi为剔除之前的子机光谱,xmi为剔除之前的主机光谱;s8、多组主机子成分、子机子成分、主机权重系数和子机权重系数分别形成主机子成分矩阵、子机子成分矩阵、主机权重系数矩阵和子机权重系数矩阵,确定主机子成分矩阵和子机子成分矩阵的最小二乘解;此步骤中,利用如下公式确定主机子成分矩阵和子机子成分矩阵的最小二乘解b:式中,t为所述子机子成分矩阵,p为所述子机权重系数矩阵,u为所述主机子成分矩阵,q为所述主机权重系数矩阵,e为所述子机标准光谱,f为所述主机标准光谱;s9、利用所述主机子成分矩阵和子机子成分矩阵的最小二乘解、主机权重系数和子机权重系数确定光谱标准化转换矩阵,利用所述光谱标准化转换矩阵对待测光谱仪的光谱进行标准化处理;此步骤中,利用如下公式确定光谱标准化转换矩阵f:f=pbqt利用如下公式对待测光谱仪的光谱进行标准化处理:xs_standardized=xs_test*f式中,xs_standardized为标准化处理后的光谱,xs_test为待测光谱仪的光谱。上述方法在吸光度校正时充分考虑到光谱采集时能量变化导致的吸光度变化,采用求导、降噪和平滑的方法充分利用了光谱细节差异,更有利于对应光谱点识别的成功率。利用主机模型对子机标准化后光谱进行预测,求rmsep有助于选择出最有代表性的标准化矩阵的阶数。具体地,rmsecp:yi为真实值,本发明对主机标准光谱和子机标准谱进行求导、平滑和降噪等处理操作形成光谱标准化转换矩阵,之后利用光谱标准化转换矩阵对待测光谱仪的光谱进行标准化处理。利用本发明的标准化方法对待测光谱仪测定的光谱进行标准化处理,标准化后的光谱适用于主光谱仪上建立的光谱校正模型,从而使得不同仪器扫描的光谱经过转移后可以用一个通用模型分析。本方法在光谱标准化中具有重复性好,对标准样品光谱扰动小的优点,适用于大范围推广和网络客户端光谱仪器的标准化,同时本发明的方法具有原理清晰,方法简单,等优势上述步骤s1中,主光谱仪仪选择一台通过仪器自检(吸光度、信噪比、特征峰等符合标准)的近红外仪器master,子光谱选择一台与主机光谱有差异的待用仪器slave。上述步骤s2中,选择一批在尽量多的波数有吸收峰、待测物浓度分布均匀的物质作为预定物质。上述步骤s2之后,还包括如下步骤:e0=xsf0=xm用e0、f0来存储主机标准光谱和子机标准光谱。上述方法基于偏最小二乘原理的光谱标准化方法,该方法操作简单,具有稳定,标准化后的光谱平滑,光谱预测效果准确等特点,适用于大范围适用和网络化应用。通过下表1对pca、cca和pls在光谱标准化中的区和联系表1不同优化方法的目标函数对比下面通过实验对上述方法以及现有方法进行参数优化试验实验设备与平台平台:windows10企业版、inter6300u(双核四线程,64位),matlab2015b;数据:两台仪器(instrument1作为主机,instrument2作为子机)检测的一组光谱标准化通用药片数据(655个近红外光谱数据和化学值),其中155个校正数据,40个验证数据和460个测试数据,其中剔除一样样本(校正集合第19122126127137147150个,测试集合第591576788293145294313341342343385386388389395397426429)后选择600~1676nm作为建模波长。该数据来自网络,通常作为光谱标准化方法的验证数据。网址:http://www.eigenvector.com/data/tablets/index.html软件开发与使用其中近红外光谱建模通过pls_toolbox8.1.1,光谱标准化算法通过自己编写程序实现。pds参照(陆婉珍(2007).现代近红外光谱分析技术.北京,中国石化出版社.);sst参照(du,w.,etal.(2011)."maintainingthepredictiveabilitiesofmultivariatecalibrationmodelsbyspectralspacetransformation."analyticachimicaacta690(1):64-70.);spls参照本发明编写;kennard-stonesamplingalgorithm自己编写。实验方案1).以instrument1作为主机,对该仪器的剔除奇异样品后的光谱进行建模,使用pls1方法对其中的assay值进行建模优化,以10%的样品进行交叉验证,最终r2和rmsecv分别为:0.971547,3.32087mg;2).以instrument1作为主机,instrument2作为子机,将剔除异常样品后药片的校正数据作为光谱标准化的标准光谱,通过pds、sst和spls对各种方法参数进行优化,以标准化后的instrument2的光谱的rmsep作为方法优化的目标值;图4a、4b为经spls标准化前后instrument2与instrument1的差异光谱对比。3).pds参数优化分别包括窗口宽度和主成分回归所用的著称分数,sst和spls优化参数为其各自使用的成分数;4).通过kennard-stonesamplingalgorithm对instrument1采集的校正集进行不同个数的选样,;5).pds参数优化分别包括窗口宽度和主成分回归所用的著称分数,sst和spls优化参数为其各自使用的成分数;结果与讨论pds、sst和spls参数优化结果:表2窗口宽度和主成分数对pds标准化光谱rmsep影响最终pds选择成分数为2,窗口宽度为23。表3sst和spls不同成分数对标准化后光谱rmsep影响根据表3结果,不同方法选择成分数不同,sst第一个极小值点出现在4,spls极小值点出现在5。以此参数作为该实验不同算法的最优参数。具体实施方式实施例一:标准光谱数量对光谱标准化结果的影响数据:同参数优化试验(剔除奇异值得药片数据)模型:同参数优化试验一致光谱标准化方法:pds(23窗口,2主成分)、sst(4成分)、spls(5成分)通过kennard-stonesamplingalgorithm对instrument1的188个校正样品进行选样,以选出的6~188个光谱作为标准光谱对instrument2的光谱进行标准化,结果如图2所示。如图3所示,spls,即本发明的方法是一种对标准样品数量比较敏感的方法,但是当标准光谱数量超过77以后,标准化后光谱rmsep趋于稳定,且远小于pds和sst标准化的光谱rmsep。实施例二:标准化光谱的随机化对不同方法抗扰动性的研究数据:同参数优化试验一致模型:同参数优化试验光谱标准化方法:pds(23窗口,2主成分)、sst(4成分)、spls(5成分)通过matlab随机生成3000组80个从1~188之间的随机整数,根据每组随机数在校正集中挑选序号对应的光谱作为标准光谱,用不同方法对此标准光谱计算转换矩阵,对instrument2的测试集光谱进行标准化,计算3000个标准化光谱的rmsep的平均值和标准差,结果如表3。表3各种方法3000此随机取标准光谱的rmsep均值和方差表2明显看出未经标准化的instrument2的光谱rmsep远大于instrument1的rmsep,经过标准化以后,instrument2的光谱rmsep均有减小趋势,其中经不同方法标注化后光谱的平均rmsep从小到大分别是spls<pds<sst,平均rmsep的标注差从小打大分别是sst>pds>spls。其中pds和sst被广泛认为是可靠的光谱标准化方法,通过多项数据对比发现spls在光谱标准化上与pds和sst对比具有优势。实施例三:成品烟烟末光谱标准化数据:贵州中烟提供242个成品烟烟末近红外光谱(两台antarisⅱ、一台quasir3000)和总糖化学值,以其中一台antarisⅱ-1为主机,另一台antarisⅱ-2和quasir3000为子机进行光谱标准化;模型:光谱进行中心化处理,一阶导数,13点平滑,选择波长范围为7506cm-1~4000cm-1;通过ks选样方法从242个光谱中选出194个作为建模光谱,其他作为测试光谱。使用pls建模,因子数通过交叉验证选择为4,rmsec为0.49%,rmsecv为0.53%,主机测试样品rmsep为0.77%。方法:spls最终结果如表4和图5a、5b所示,spls光谱标准化前后总糖预测情况(图5a为光谱标准化之前,图5b为标准化之后)。可以看出不同品牌间仪器模型很难直接使用,经过spls标准化以后光谱可以直接使用主机所建模型进行预测。表4:spls光谱标准化预测结果统计模型光谱r2rmsepantarisⅱ-1antarisⅱ-10.9330.77antarisⅱ-1antarisⅱ-20.9250.81antarisⅱ-1quasir3000-2.1445.28antarisⅱ-1antarisⅱ-2(标准化)0.9380.73antarisⅱ-1quasir3000(标准化)0.9390.73根据表4和图5所知,同一型号antaris光谱预测偏差非常小,不同型号间预测偏差较大,经过spls对子机光谱进行标准化,两台子机预测决定系数r2均有提高,rmsep均有降低,其中不同品牌间转光谱标准化达到了和主机预测几乎一致的结果。以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1