一种具有变量选择功能的红外光谱定量分析方法

文档序号:9429940阅读:645来源:国知局
一种具有变量选择功能的红外光谱定量分析方法
【技术领域】
[0001] 本发明属于红外光谱分析方法,具体涉及一种具有变量选择功能的红外光谱定量 分析方法。
【背景技术】
[0002] 红外光谱法越来越多的用于固体,半固体,液体和气体样本的特征分析。通常,样 本的特征主要由组分的浓度含量确定。偏最小二乘回归是一种常用的对红外光谱矩阵X和 物质浓度矩阵Y建模的方法。偏最小二乘回归的基本思路是这样的,首先即寻找向量W和 c满足:
[0004] 其中是得分向量u,V之间的协方差。通过拉格朗日乘子法可以得 到向量w满足:
[0005] XtYYtXw = λ w
[0006] 于是偏最小二乘可以表示为如下的收缩过程:
[0007] (1)计算XtYYtXw =入w即求矩阵XtYYtX最大特征值对应的特征向量w ;
[0008] (2)将矩阵X在特征向量w上投影得到成分t即计算t = Xw ;
[0009] (3)利用成分t去对矩阵X进行表示,表示系数为p求解模型mny P -
[0010] (4)更新矩阵X为X1= x-tp τ重复上述步骤k次,得到了 k个特征向量w pW;;,…, Wk进一步得到k个成分t i,t2,…,tk
[0011] (5)利用k个成分ti,t2,…,tk对浓度矩阵Y进行表示得到
[0013] 并将n,r2,…,rk保存用于未知浓度的光谱的预测。
[0014] 对于新到的样本X_浓度未知,那么可以将X _投影到w p w2,…,Wk得到k个成 分1:1,1:2,一,1^利用1'1,1'2,*",1\即可预测其浓度。
[0015] 在红外光谱分析中,一个很关键的问题是需要分析光谱变量与回归预测结果之间 的关系。最简单的方法是利用特征向量Wl,w2,…,^对变量与回归预测结果的关联性进行 分析。但是利用传统的偏最小二乘回归得到的k个特征向量Wl,W2,…,^对变量与结果关 联性进行分析存在以下问题即W1,W2,…,Wk选中了光谱所有的变量那么回归预测结果就整 个光谱的变量都相关,这实际上没意义,参见图1所示,该图为传统的偏最小乘特征向量W1, ?2的示意图。为了简单起见,只画出两个特征向量^。W2。从图1中可以看到,传统的偏最 小二乘回归得到的向量^,W2在光谱的整个范围,那么也就是说回归的结果和整个光谱都 有关系。参见图2,该图为与变量相关的特征向量W1, W2的示意图。从图2中可以看到,向 量^,《2选中了相同的变量,那么很明显回归的结果就只和选中的1500nm的变量是相关的。 意义就非常明确,即物质浓度回归预测的结果和1500nm附近的变量相关。通过查询红外光 谱分析手册可进一步查询变量和化学基团之间的关系。

【发明内容】

[0016] 本发明的目的在于,提出一种具有变量选择功能的红外光谱定量分析方法。这种 方法在建模的过程中具有变量选择功能,在每一次收缩过程中能选中相同的变量,以便于 分析物质浓度和变量之间的相关关系。
[0017] 为了实现本发明的目的,本发明提供如下技术方案。
[0018] (1)首先提出如下的模型:
[0020] 其中W = [W1, w2,…,wk]是特征向量组成的矩阵,max表示求最大值,s. t.表示 约束条件,tr表示求矩阵的迹,I I W| |2,i表示求矩阵的2, 1范数,即首先将矩阵W按行求2 范数再对得到的列向量求1范数。例如对于向量[ai,a2,…,ak]的2范数等于?I,向 量[如a2,…,ak]的2范数等于£匕_。
[0021] (2)对模型进行求解:将I I W| |2a表示为W2a= tr (WtDW),其中D是一个对角矩阵, 即对角线以外的元素为〇其第i个对角线上的元素为pfe。
[0022] 求解的具体过程是这样的:
[0023] (1)固定D利用拉格朗日乘子法,有
[0029] 则W1,W2,…,w# α X tYYtX- β D和λ XtX的广义特征向量。
[0030] (2)固定 W:
[0031] 求出W = [W1, w2,···,wk]后将X投影到W得到k个成分tp t2,···,tk,利用k个 成分h,t2,…,tk对浓度矩阵Y进行表示得到
[0033] 并将ri,r2,…,rk保存用于物质浓度或含量的预测。
[0034] 对于新样本Χ_浓度未知,那么可以将X _投影到w p w2,…,Wk得到k个成分t i, t2,…,!^,利用即可预测其浓度。
[0035] 本发明建立的模型算法,可利用植物光谱数据,对植物中的碳元素和硫元素含量 组成进行定量分析。优选地,所述植物为羊茅。
[0036] 进一步地,本发明建立的模型算法,还可利用植物光谱数据,定量分析植物中蛋白 质含量。优选地,所述植物为小麦。
[0037] 与现有技术相比,本发明的有益效果如下:
[0038] 1,本发明通过建立新的算法模型对红外光谱数据进行分析,分析获得的数据结果 相对于传统的偏最小二乘算法误差小,分析过程中使用的变量也更少。
[0039] 2,本发明使用的算法模型用到的向量Wl,W2,…,W k具有变量选择功能,并且能选 中相同的变量,因此解释性更强。
[0040] 3,算法中的参数能够自动迭代更 新。
[0041] 说明书附图
[0042] 图1为传统的偏最小乘特征向量W1, W2的示意图;
[0043] 图2为与变量相关的特征向量W1, W2的示意图;
[0044] 图3为本发明实施例1中羊茅光谱的示意图;
[0045] 图4为本发明实施例1中碳元素含量示意图;
[0046] 图5为本发明实施例1中硫元素含量示意图;
[0047] 图6为传统的偏最小二乘法分析羊茅光谱的特征向量W1, w2, w3, W4的示意图;
[0048] 图7为本发明的方法分析羊茅光谱的特征向量W1, w2, w3, W4的示意图;
[0049] 图8为本发明实施例2中训练集小麦光谱示意图;
[0050] 图9为本发明实施例2中测试集小麦光谱示意图;
[0051] 图10为本发明实施例2中本发明实施例2中训练集蛋白质含量示意图;
[0052] 图11为本发明实施例2中测试集蛋白质含量示意图;
[0053] 图12为利用本发明方法分析小麦蛋白质含量时参数α随迭代次数增加而收敛的 曲线;
[0054] 图13为利用本发明方法分析小麦蛋白质含量时参数β随迭代次数增加而收敛的 曲线。
【具体实施方式】
[0055] 以下通过具体实施例来说明本发明的技术方案。
[0056] 实施例1 :分析一种植物羊茅的光谱
[0057] 羊茅的光谱数据集,包含有141个近红外光谱,是将每一个羊茅样本磨成粉末后 采集128次取平均后得到的数据。参见图3,该图为羊茅光谱的示意图。光谱的变量个数 是796。响应矩阵是由碳和硫含量组成,其范围分别是29. 6%-40. 9%,0. 3%-1.7%。参 见图4和图5,图4为碳元素含量示意图,图5为硫元素含量示意图。
[0058] 建模与定量分析过程是这样的:
[0059] -:建模阶段
[0060] 1 :选择前71个光谱及其对应的碳、硫含量作为训练样本,用于计算模型中的W = [W1, w2,…,Wk];剩下的70个光谱即对应的碳、硫含量作为定量分析的测试样本;记Xt
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1