用于原子发射光谱分析的特征谱线快速选择方法与流程

文档序号:11249372阅读:3820来源:国知局
用于原子发射光谱分析的特征谱线快速选择方法与流程

本发明属于光谱分析领域,特别是一种用于原子发射光谱分析的特征谱线快速选择方法。



背景技术:

原子发射光谱分析是光谱分析的重要应用技术,在工业、农业、医学等领域实现特定元素或成分的定性、定量分析。典型的原子发射光谱技术根据激发光源不同,如激光诱导击穿光谱技术(libs)、电感耦合等离子体发射光谱技术(icp-aes)、火花放电发射光谱技术(spark-aes)等,是现代分析化学极具前景、发展迅速的研究方向。发射光谱分析是根据自由原子或离子外层电子辐射跃迁得到的发射光谱来研究物质的组成和含量,其过程一般分为激发、分光、检测三步,由光谱谱线的波长进行定性分析,由光谱谱线的强度进行定量分析。

随着电子技术、材料科学、仪器科学的发展,用于原子光谱分析的各类光谱仪更新升级迅速,仪器性能不断提高,特别如中阶梯光谱仪,其分辨率可达pm量级。更高的光谱分辨率表现了更加精细的光谱细节,同时也带来更庞大的光谱数据。对于特定元素或成分定量分析,使用单一谱线往往不能建立稳健、准确的分析模型,越来越多的研究者选择采用多元分析法(如主成分分析法pca、偏最小二乘法pls等)解决这一问题。多元分析法即利用多条谱线强度,考虑谱线之间相互关系,按照相应的权重系数,建立多元数学模型,开展定量分析。对于原子发射光谱,应用多元分析法时,须在大量光谱数据中选择有用的特征谱线建立模型,传统的特征谱线选择方法如间隔偏最小二乘法、遗传算法、迭代预测权重法等,大多被用于红外光谱分析而很少用于原子光谱分析,原因是在密集的原子谱线中,谱线选择效果不理想(甚至出现选择错误),且耗时漫长,需大量借助人力,效率低下。



技术实现要素:

为克服现有技术的不足,

(1)本发明的目的是提供一种用于原子发射光谱分析的特征谱线快速选择方法,可在大量光谱数据中快速选出与特定元素含量相关的多个特征谱线,大大提升选择效率,有效减少参与建模的特征谱线数量,简化计算过程,提升定量预测模型的稳健型和准确性;

(2)本发明的另一目的是提供一种利用(1)中所述方法,对土壤样品中的金属元素cu、ba、cr、mg、ga进行定量分析的典型案例,实现各元素特征谱线的快速、准确选取,通过分析结果验证本发明所提方法的可行性、适用性、优越性。

本发明采用的技术方案是,用于原子发射光谱分析的特征谱线快速选择方法,步骤如下:

第1步:对光谱原始数据x做光谱预处理,包括光谱标准化和小波阈值去噪两部分,以提高光谱数据质量;

第2步:将全部光谱变量谱线x等间隔地分为若干组xi,对每一间隔的变量谱线xi实施间隔偏最小二乘分析,并利用每一间隔得到的偏最小二乘权重矩阵bi计算得到间隔校正因子矩阵ki,对相应每个间隔的变量进行校正;

第3步:对第2步校正后的全部变量xˊ实施整体偏最小二乘分析,并利用整体得到的偏最小二乘权重矩阵计算得到整体校正因子矩阵kˊ,对相应整体的变量进行校正;

第4步:对现有的全部变量x″进行偏最小二乘分析,并利用现有每个变量的标准偏差值s以及偏最小二乘权重值b″计算得到每个变量的重要性,构成变量的重要性矩阵z;

第5步:利用现有变量整体的标准偏差s和现有变量个数n计算得到当前迭代循环的阈值thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值thr,则该变量被排除;

第6步:对第5步选择后的现有变量进行偏最小二乘分析,采用留一法交叉验证,并计算交叉验证的均方根误差值rmsecv,综合考虑当前的变量个数和rmsecv值,如满足定量分析要求,则停止迭代过程,否则回到第4步。

对光谱原始数据x做光谱预处理,光谱标准化具体是谱线强度除以光谱均值强度,小波阈值去噪具体采用symlet小波,分解层数为4层,采用软阈值。

一个实例中,第2步:

第3步:对第2步校正后的全部变量xˊ实施整体偏最小二乘分析,并利用整体得到的偏最小二乘权重矩阵计算得到整体校正因子矩阵kˊ,

第4步:对现有的全部变量x″进行偏最小二乘分析,并利用现有每个变量的标准偏差值s以及偏最小二乘权重值b″计算得到每个变量的重要性,构成变量的重要性矩阵z

第5步:利用现有变量整体的标准偏差s和现有变量个数n计算得到当前迭代循环的阈值thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值thr,则该变量被排除:

本发明的特点及有益效果是:

(1)该方法能够快速选择分析元素的特征谱线,相比传统选择方法(如人工选择法、间隔偏最小二乘法、遗传算法等)效率极大提高,计算过程简化,预测模型稳健且准确。

(2)该方法结合了间隔偏最小二乘法和迭代预测权重法的优点,使得快速变量选择在原子光谱分析领域成为可能(已报道的多用于近红外光谱分析),可推广适用于各种原子发射光谱分析过程,如激光诱导击穿光谱(libs)分析、电感耦合等离子体原子发射光谱(icp-aes)分析等,对于各种金属、非金属元素进行定量分析,有益于提高多元分析模型的性能。

附图说明:

图1示出本发明的特征谱线快速选择方法流程图。

图2示出应用本发明方法选择土壤原子光谱cu元素特征谱线的效果图。

图3示出应用本发明方法与其他方法进行cu元素定量分析的校准和预测结果对比图。

图4示出应用本发明方法定量分析土壤其他元素(ba、cr、mg、ga)的校准和预测结果图。

图3中,a为单一谱线分析的结果,b为全谱线分析的结果,c为间隔偏最小二乘分析的结果,d为本发明方法分析的结果。

图4中,a为钡(ba)元素定量分析的结果,b为铬(cr)元素定量分析的结果,c为镁(mg)元素定量分析的结果,d为钙(ga)元素定量分析的结果。

具体实施方式

本发明采用的技术方案是,一种用于原子发射光谱分析的特征谱线快速选择方法,如图1所示,由以下步骤组成:

第1步:对光谱原始数据x做光谱预处理,包括光谱标准化(谱线强度除以光谱均值强度)和小波阈值去噪(symlet小波,分解层数4,软阈值)两部分,以提高光谱数据质量。

第2步:将全部光谱变量x(谱线)等间隔地分为若干组xi,对每一间隔的变量(谱线)xi实施间隔偏最小二乘分析,并利用每一间隔得到的偏最小二乘权重矩阵bi计算得到间隔校正因子矩阵ki,对相应每个间隔的变量进行校正。

第3步:对第2步校正后的全部变量xˊ实施整体偏最小二乘分析,并利用整体得到的偏最小二乘权重矩阵计算得到整体校正因子矩阵kˊ,对相应整体的变量进行校正。

第4步:对现有的全部变量x″进行偏最小二乘分析,并利用现有每个变量的标准偏差值s以及偏最小二乘权重值b″计算得到每个变量的重要性,构成变量的重要性矩阵z。

第5步:利用现有变量整体的标准偏差s和现有变量个数n计算得到当前迭代循环的阈值thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值thr,则该变量被排除。

第6步:对第5步选择后的现有变量进行偏最小二乘分析,采用留一法交叉验证,并计算交叉验证的均方根误差值(rmsecv),综合考虑当前的变量个数和rmsecv值,如满足定量分析要求,则停止迭代过程,否则回到第4步。

下面结合附图和具体实施方式,进一步详细说明本发明。

一种用于原子发射光谱分析的特征谱线快速选择方法,如图1所示,由以下步骤组成:

第1步:对光谱原始数据x做光谱预处理,包括光谱标准化(谱线强度除以光谱均值强度)和小波阈值去噪(symlet小波,分解层数4,软阈值)两部分,以提高光谱数据质量。

第2步:将全部光谱变量x(谱线)等间隔地分为若干组xi,对每一间隔的变量(谱线)xi实施间隔偏最小二乘分析,并利用每一间隔得到的偏最小二乘权重矩阵bi计算得到间隔校正因子矩阵ki,对相应每个间隔的变量进行校正。

第3步:对第2步校正后的全部变量xˊ实施整体偏最小二乘分析,并利用整体得到的偏最小二乘权重矩阵计算得到整体校正因子矩阵kˊ,对相应整体的变量进行校正。

第4步:对现有的全部变量x″进行偏最小二乘分析,并利用现有每个变量的标准偏差值s以及偏最小二乘权重值b″计算得到每个变量的重要性,构成变量的重要性矩阵z。

第5步:利用现有变量整体的标准偏差s和现有变量个数n计算得到当前迭代循环的阈值thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值thr,则该变量被排除。

第6步:对第5步选择后的现有变量进行偏最小二乘分析,采用留一法交叉验证,并计算交叉验证的均方根误差值(rmsecv),综合考虑当前的变量个数和rmsecv值,如满足定量分析要求,则停止迭代过程,否则回到第4步。

以土壤中金属cu元素定量分析为例,如图2所示,利用本发明所提方法选择特征谱线,每一次迭代循环之后,剩余谱线逐渐减少,在最后一次迭代循环后,只有6个特征谱线保留下来,分别为324.742nm,324.753nm,324.764nm,327.380nm,327.391nm,327.402nm,与数据库公布的cu元素最强特征谱线(324.754nm,327.395nm)完全相符,证明了本方法的可行性。如图3所示,利用不同方法对cu元素含量作定量分析,包括3(a)单一谱线法、3(b)全谱线法、3(c)间隔片最小二乘法和3(d)本发明所提快速选择法,结果显示,利用本发明提出的方法选择的特征谱线数量显著低于其他方法,且提高了多元分析模型的稳健性和准确性,无论在校准还是预测结果中都具有较低的均方根误差值(rmsec和rmsep)和较高的相关性系数(r2),证明了本方法的优越性。如图4所示,利用本发明提出的方法对土壤中其他元素进行特征谱线选择以及定量分析,包括4(a)钡(ba)元素、4(b)铬(cr)元素、4(c)镁(mg)元素和4(d)钙(ga)元素,结果显示,不同元素的校准和预测结果均具有较低的均方根误差值(rmsec和rmsep)和较高的相关性系数(r2),证明了本方法的适用性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1