一种红外光谱定量分析方法及系统的制作方法

文档序号:10611313阅读:354来源:国知局
一种红外光谱定量分析方法及系统的制作方法
【专利摘要】本发明涉及一种红外光谱定量分析方法及系统,包括如下步骤:分别从标准样品和预测样品的红外光谱数据中,获取标准样品的红外光谱矩阵和预测样品的红外光谱矩阵;根据标准样品的红外光谱矩阵和标准样品的浓度数据,基于最大相关熵准则,求解偏最小二乘权重向量;根据偏最小二乘权重向量,构建偏最小二乘预测模型,并根据预测样品的红外光谱矩阵和所述偏最小二乘预测模型,求解预测样品的浓度数据。本发明用基于最大相关熵准则求解的偏最小二乘权重向量,构建偏最小二乘预测模型,用于红外光谱定量分析,具有更好的稳定性和泛化能力,能够更好的处理含有噪声和/或异常样本点的样本,具有较强的抗噪声能力。
【专利说明】
一种红外光谱定量分析方法及系统
技术领域
[0001] 本发明涉及红外光谱定量分析和化学计量学领域,特别涉及一种红外光谱定量分 析方法及系统。
【背景技术】
[0002] 红外光谱能够准确反映不同分子结构对红外光的吸收程度,常被用于鉴定物质的 组分浓度。随着化学计量学以及化学分析技术的飞速发展,红外光谱技术被广泛应用于农 业、石油化工、医药等领域。在红外光谱定量分析中,最常用的方法是偏最小二乘回归算法, 它由S.Wold等人在1983年提出,主要用来解决化学计量学中变量共线性问题和高维小样本 回归问题。在实际应用中,现有的偏最小二乘回归算法采用NIPALS算法实现,NIPALS算法的 关键在于求解偏最小二乘权重向量。在偏最小二乘权重向量求解过程中,NIPALS算法采用 最小二乘误差标准来求解偏最小二乘权重向量,求解得到的偏最小二乘权重向量可用于描 述浓度向量和红外光谱矩阵之间的相关程度。最小二乘误差标准通常易受噪声和异常样本 影响。而红外光谱矩阵由红外光谱数据组成,红外光谱数据在仪器采集过程中常会出现仪 器噪声,或由于操作原因导致出现异常样本点,因此基于最小二乘误差标准的偏最小二乘 权重向量的求解常常不稳定,导致红外光谱定量分析结果不稳定。

【发明内容】

[0003] 本发明目的是提供一种红外光谱定量分析方法及系统,解决现有技术中存在的上 述问题。
[0004] 本发明解决上述技术问题的技术方案如下:
[0005] -种红外光谱定量分析方法,包括如下步骤:
[0006] 步骤1,分别从标准样品和预测样品的红外光谱数据中,获取标准样品的红外光谱 矩阵和预测样品的红外光谱矩阵;
[0007] 步骤2,根据标准样品的红外光谱矩阵和标准样品的浓度数据,基于最大相关熵准 贝1J,求解偏最小二乘权重向量;
[0008] 步骤3,根据偏最小二乘权重向量,构建偏最小二乘预测模型,并根据预测样品的 红外光谱矩阵和所述偏最小二乘预测模型,求解预测样品的浓度数据。
[0009] 本发明的有益效果是:本发明输入为标准样品和预测样品的红外光谱数据,及标 准样品的浓度数据;输出为偏最小二乘预测模型和预测样品的浓度数据;在偏最小二乘权 重向量的求解过程中采用最大相关熵准则替代现有的最小二乘误差标准,当红外光谱数据 中含有噪声和/或异常样本点时,基于最大相关熵的偏最小二乘权重向量也能够有效描述 浓度向量和红外光谱矩阵之间的相关程度,具有较强的抗噪声能力;用基于最大相关熵准 则求解的偏最小二乘权重向量,构建偏最小二乘预测模型,用于红外光谱定量分析,较现有 的基于最小二乘误差标准的偏最小二乘算法,具有更好的稳定性和泛化能力,能够更好的 处理含有噪声和/或异常样本点的样本,具有较强的抗噪声能力。
[0010] 在上述技术方案的基础上,本发明还可以做如下改进。
[0011] 进一步,所述步骤2具体实现包括如下步骤:
[0012] 步骤21,构建具有正则化项的偏最小二乘权重向量优化模型;
[0013]所述具有正则化项的偏最小二乘权重向量优化模型如下:
[0014]
[0015] 其中,所述X为标准样品的红外光谱矩阵,X = [X1,X2,…Xi…,Χη]τ,所述γ为标准样 品的浓度数据对应的浓度向量,¥=[7 1,72,一71-,711]7,其中,所述11为标准样品的个数,所 述^为任一标准样品的光谱向量,所述光谱向量的维数为Ρ,所述所述任一标准样品的 浓度,所述i e {1,2,3…η};所述W为偏最小二乘权重向量,所述λ为正则化参数,所述D为对 角正则化矩阵,D = diag{dist(Y_X)};
[0016] 步骤22,基于最大相关熵准则,更新所述具有正则化项的偏最小二乘权重向量优 化模型,获得基于最大相关熵准则的偏最小二乘权重向量优化模型;
[0017] 所述基于最大相关熵准则的偏最小二乘权重向量优化模型如下:
[0018] !_ -1 *
y 」
[0019] 其中,所32
?征Y与Xw之间的相关熵,其中,所述j G {1,2,3… p},所述Xl沩所述Xl的第j列参数,所述w沩所述w的第j行参数,所述G( ·)为核函数;
[0020] 步骤23,根据所述基于最大相关熵准则的偏最小二乘权重向量优化模型,求解偏 最小二乘权重向量。
[0021] 采用上述进一步方案的有益效果是,在偏最小二乘权重向量优化模型中引入正则 化项,正则化项能够迫使偏最小二乘权重向量自适应的描述浓度向量和红外光谱矩阵之间 的相关程度,有助于更准确的获取偏最小二乘权重向量。
[0022] 进一步,所述步骤23的具体实现包括如下步骤:
[0023] 步骤231,令所述G( ·)为高斯核函数,即; .,且存在一个 \ / 共辄凸函数,其中,所述A和所述B为任意两个随机变量,所述〇为高斯核参数;则所述基于最 大相关熵准则的偏最小二乘权重向量优化模型的等价模型如下:
[0024]
[0025] 其中,所述以·)为所述共辄凸函数,所述(^((^,(^,…(^…,(^为辅助变量;
[0026] 对于固定的偏最小二乘权重向量,根据共辄凸函数的性质得辅助变量也固定,且 满足如下第一公式;
[0027] 所述第一公式如下:
[0028] a = -G(Y-Xw);
[0029] 对于固定的辅助变量,根据所述等价模型求解得偏最小二乘权重向量表达式如 下:
[0030] w=(XtHX+AD)_1XtHY
[0031] 其中,所述Η为对角矩阵,其主对角线上的元素 Huicu;
[0032] 步骤232,初始化偏最小二乘权重向量为单位向量,并代入第一公式更新辅助变 量;
[0033]步骤233,令正则化参数为预设数值,并根据偏最小二乘权重向量表达式和更新的 辅助变量,更新偏最小二乘权重向量;
[0034]步骤234,将更新的偏最小二乘权重向量,代入第一公式再次更新辅助变量,并执 行步骤233,再次更新偏最小二乘权重向量;
[0035] 步骤235,判断前后两次更新的辅助变量的改变量是否小于第一预设值,并判断步 骤234执行的次数是否达到预设次数;当所述改变量小于第一预设值和/或步骤234执行的 次数达到预设次数,输出最后更新的偏最小二乘权重向量,执行步骤3;否则,执行步骤234。
[0036] 进一步,所述步骤3具体实现包括如下步骤:
[0037]步骤31,根据如下第二公式提取主成分;并根据如下第三公式对主成分做归一化 处理;
[0038] 所述第二公式如下:
[0039] t=Xw
[0040] 所述第三公式如下:
[0041 ] tG = t/(tTt)
[0042] 其中,所述t为主成分,所述tG为归一化主成分;
[0043] 步骤32,根据如下第四公式计算主成分对应的载荷向量;
[0044] 所述第四公式如下:
[0045] z=XTtc
[0046] 其中,所述z为载荷向量;
[0047]步骤33,根据如下第五公式计算标准样品的浓度向量与归一化主成分的乘积; [0048] 所述第五公式如下:
[0049] q = tcTY
[0050] 其中,所述q为所述乘积;
[0051]步骤34,判断如下第六公式是否成立,是,则执行步骤36;否,则执行步骤35;
[0052] 所述第六公式如下:
[0053] |X-tczT| |F<e
[0054]其中,所述| | · | |f为矩阵的Frobenius范数,所述e为第二预设值;
[0055]步骤35,根据如下第七公式更新标准样品的红外光谱矩阵;并返回执行步骤2; [0056] 所述第七公式如下:
[0057] X'=X-tGzT
[0058] 其中,所述X'为标准样品更新的红外光谱矩阵;
[0059] 步骤36,按如下第八公式构建偏最小二乘预测模型;并根据预测样品的红外光谱 矩阵和所述偏最小二乘预测模型,求解预测样品的浓度数据;
[0060] 所述第八公式如下:
[0061] Ynew = Xnewff(ZTff)_1Q
[0062] 其中,所述Xnew为预测样品的红外光谱矩阵,所述Ynew为所述偏最小二乘预测模型 所求解得出的预测样品的浓度向量,根据所述预测样品的浓度向量,获取所述预测样品的 浓度数据,所述W=[wi,W2,···,w r],Z=[Z1,Z2,···,zr],Q=[qi,q2,···,qr];其中,所述r为循环 执行步骤2与步骤3的次数,所述wi,W2,…,w r分别为依次执行步骤2所输出的偏最小二乘权 重向量,所述Z1,Z2,…,Zr分别为依次执行步骤32所获取的载荷向量,所述qi,q2,…,qr分别 为依次执行步骤33所获取的所述乘积。
[0063] 进一步,所述步骤1的具体实现为分别对标准样品和预测样品的红外光谱数据进 行维数约减或波段选择,获取标准样品的红外光谱矩阵和预测样品的红外光谱矩阵。
[0064] 采用上述进一步方案的有益效果是,对红外光谱数据进行维数约减或波段选择, 有助于选择重要的变量,剔除无信息变量,降低红外光谱矩阵的维数,简化算法。
[0065]本发明的另一技术方案如下:
[0066] -种红外光谱定量分析系统,包括红外光谱矩阵提取模块、偏最小二乘权重向量 求解模块和预测样品浓度数据求解模块;
[0067] 所述红外光谱矩阵提取模块,其用于分别从标准样品和预测样品的红外光谱数据 中,获取标准样品的红外光谱矩阵和预测样品的红外光谱矩阵;
[0068] 所述偏最小二乘权重向量求解模块,其用于根据标准样品的红外光谱矩阵和标准 样品的浓度数据,基于最大相关熵准则,求解偏最小二乘权重向量;
[0069] 所述预测样品浓度数据求解模块,其用于根据偏最小二乘权重向量,构建偏最小 二乘预测模型,并根据预测样品的红外光谱矩阵和所述偏最小二乘预测模型,求解预测样 品的浓度数据。
[0070] 在上述技术方案的基础上,本发明还可以做如下改进。
[0071] 进一步,所述偏最小二乘权重向量求解模块包括构建单元、更新单元和求解单元;
[0072] 所述构建单元,其用于构建具有正则化项的偏最小二乘权重向量优化模型;
[0073]所述具有正则化项的偏最小二乘权重向量优化模型如下:
[0074]
[0075] 其中,所述X为标准样品的红外光谱矩阵,X = [ XI,X2,…Xi…,Xn]T,所述Y为标准样 品的浓度数据对应的浓度向量,¥=[71,7 2,一71-,711]7,其中,所述11为标准样品的个数,所 述^为任一标准样品的光谱向量,所述光谱向量的维数为P,所述所述任一标准样品的 浓度,所述i e {1,2,3…η};所述w为偏最小二乘权重向量,所述λ为正则化参数,所述D为对 角正则化矩阵,D = diag{dist(Y_X)};
[0076] 所述更新单元,其用于基于最大相关熵准则,更新所述具有正则化项的偏最小二 乘权重向量优化模型,获得基于最大相关熵准则的偏最小二乘权重向量优化模型;
[0077] 所述基于最大相关熵准则的偏最小二乘权重向量优化模型如下:
[0078]
[0079] 其中,所a I表征Y与Xw之间的相关熵,其中,所述jG{l,2,3…
、- J p},所述Xl沩所述Xl的第j列参数,所述W沩所述w的第j行参数,所述G( ·)为核函数;
[0080] 所述求解单元,其用于根据所述基于最大相关熵准则的偏最小二乘权重向量优化 模型,求解偏最小二乘权重向量。
[0081] 进一步,所述求解单元包括生成子单元、第一更新子单元、第二更新子单元、第三 更新子单元和更新终止子单元;
[0082] 所述生成子单元,其用于令所述G( ·)为高斯核函数,即
且存在一个共辄凸函数,其中,所述A和所述B为任意两个随机变量,所述σ为高斯核参数;则 所述基于最大相关熵准则的偏最小二乘权重向量优化模型的等价模型如下:
[0083]
[0084] 其中,所述ρ(·?为所述共辄凸函数,所述a = ((^?,···αΓ··,αη)为辅助变量;
[0085] 对于固定的偏最小二乘权重向量,根据共辄凸函数的性质得辅助变量也固定,且 满足如下第一公式;
[0086] 所述第一公式如下:
[0087 ] α = -G(Y-Xw);
[0088] 对于固定的辅助变量,根据所述等价模型求解得偏最小二乘权重向量表达式如 下:
[0089] w=(XtHX+AD)_1XtHY
[0090] 其中,所述Η为对角矩阵,其主对角线上的元素 Huicu;
[0091] 所述第一更新子单元,其用于初始化偏最小二乘权重向量为单位向量,并代入第 一公式更新辅助变量;
[0092] 所述第二更新子单元,其用于令正则化参数为预设数值,并根据偏最小二乘权重 向量表达式和更新的辅助变量,更新偏最小二乘权重向量;
[0093]所述第三更新子单元,其用于将更新的偏最小二乘权重向量,代入第一公式再次 更新辅助变量,并驱动第二更新子单元工作,再次更新偏最小二乘权重向量;
[0094] 更新终止子单元,其用于判断前后两次更新的辅助变量的改变量是否小于第一预 设值,并判断第三更新子单元执行的次数是否达到预设次数;当所述改变量小于第一预设 值和/或第三更新子单元执行的次数达到预设次数,输出最后更新的偏最小二乘权重向量, 驱动预测样品浓度数据求解模块工作;否则,驱动第三更新子单元工作。
[0095] 进一步,所述预测样品浓度数据求解模块包括主成分求解单元、载荷向量求解单 元、乘积求解单元、判断单元、红外光谱矩阵更新单元和预测样品浓度数据求解单元;
[0096] 所述主成分求解单元,其用于根据如下第二公式提取主成分;并根据如下第三公 式对主成分做归一化处理;
[0097] 所述第二公式如下:
[0098] t=Xw
[0099] 所述第三公式如下:
[0100] tG=t/(tTt)
[0101 ]其中,所述t为主成分,所述tc为归一化主成分;
[0102] 所述载荷向量求解单元,其用于根据如下第四公式计算主成分对应的载荷向量;
[0103] 所述第四公式如下:
[0104] z=XTtc
[0105] 其中,所述z为载荷向量;
[0106] 所述乘积求解单元,其用于根据如下第五公式计算标准样品的浓度向量与归一化 主成分的乘积;
[0107] 所述第五公式如下:
[0108] q = tcTY
[0109] 其中,所述q为所述乘积;
[0110] 所述判断单元,其用于判断如下第六公式是否成立,是,则驱动预测样品浓度数据 求解单元工作;否,则驱动红外光谱矩阵更新单元工作;
[0111]所述第六公式如下:
[0112] |X-tGZT| |p<e
[0113]其中,所述| | · | |f为矩阵的Frobenius范数,所述e为第二预设值;
[0114] 所述红外光谱矩阵更新单元,其用于根据如下第七公式更新标准样品的红外光谱 矩阵;并驱动偏最小二乘权重向量求解模块工作;
[0115] 所述第七公式如下:
[0116] X,=X-tGzT
[0117] 其中,所述X'为标准样品更新的红外光谱矩阵;
[0118] 所述预测样品浓度数据求解单元,其用于按如下第八公式构建偏最小二乘预测模 型;并根据预测样品的红外光谱矩阵和所述偏最小二乘预测模型,求解预测样品的浓度数 据;
[0119] 所述第八公式如下:
[0120] Ynew = Xnewff(ZTff)_1Q
[0121] 其中,所述Xne3W为预测样品的红外光谱矩阵,所述Yne3W为所述偏最小二乘预测模型 所求解得出的预测样品的浓度向量,根据所述预测样品的浓度向量,获取所述预测样品的 浓度数据,所述W=[wi,W2,···,w r],Z=[Z1,Z2,···,zr],Q=[qi,q2,···,qr];其中,所述r为偏最 小二乘权重向量求解模块与预测样品浓度数据求解模块工作的次数,所述 W1,W2,···,^分别 为偏最小二乘权重向量求解模块依次工作所输出的偏最小二乘权重向量,所述Zl·,Z2,…,Zr 分别为载荷向量求解单元依次工作所获取的载荷向量,所述Φ,Φ,···,αΓ分别为乘积求解单 元依次工作所获取的所述乘积。
[0122] 进一步,所述红外光谱矩阵提取模块具体用于分别对标准样品和预测样品的红外 光谱数据进行维数约减或波段选择,获取标准样品的红外光谱矩阵和预测样品的红外光谱 矩阵。
【附图说明】
[0123] 图1为本发明一种红外光谱定量分析方法的方法流程图;
[0124] 图2为本发明一种红外光谱定量分析系统的系统原理框图。
【具体实施方式】
[0125] 以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并 非用于限定本发明的范围。
[0126] 如图1所示,一种红外光谱定量分析方法,包括如下步骤:
[0127] 步骤1,分别从标准样品和预测样品的红外光谱数据中,获取标准样品的红外光谱 矩阵和预测样品的红外光谱矩阵。
[0128] 所述步骤1的具体实现为分别对标准样品和预测样品的红外光谱数据进行维数约 减或波段选择,获取标准样品的红外光谱矩阵和预测样品的红外光谱矩阵。
[0129] 步骤2,根据标准样品的红外光谱矩阵和标准样品的浓度数据,基于最大相关熵准 贝1J,求解偏最小二乘权重向量。
[0130] 所述步骤2具体实现包括如下步骤:
[0131 ]步骤21,构建具有正则化项的偏最小二乘权重向量优化模型;
[0132] 所述具有正则化项的偏最小二乘权重向量优化模型如下:
[0133]
[0134] 其中,所述X为标准样品的红外光谱矩阵,X = [ XI,X2,…Xi…,Xn]τ,所述Y为标准样 品的浓度数据对应的浓度向量,Υ = [ y 1,y2,…yi…,yn]τ,其中,所述η为标准样品的个数,标 准样品的个数可以为一个,也可以为多个,标准样品的个数越多,越有助于提高红外光谱定 量分析的稳定性及准确性,所述 Xl为任一标准样品的光谱向量,为一个列向量,所述光谱向 量的维数为P,所述为所述任一标准样品的浓度,为一个数值,所述i e {1,2,3…η};所述w 为偏最小二乘权重向量,所述λ为正则化参数,正则化参数根据实验经验进行选取,所述D为 对角正则化矩阵,D = diag{dist(Y-X)},即D的对角元素分别为Υ与X的每一列向量之间的距 离;
[0135] 步骤22,基于最大相关熵准则,更新所述具有正则化项的偏最小二乘权重向量优 化模型,获得基于最大相关熵准则的偏最小二乘权重向量优化模型;
[0136] 对于任意两个随机变量K和M,对给定的有限个观测数据Κ=[1α,1?,···1α···,1?],Μ = [mi,m2,'"mi···,mN],随机变量Κ与Μ之间的最大相关熵为:
[0137]
[0138] 其中,所述G( ·)为核函数,le{l,2,3…Ν};
[0139] 故,所述基于最大相关熵准则的偏最小二乘权重向量优化模型如下:
[0140]
[0141] 其中,所a €征¥与Xw之间的相关熵,其中,所述j G {1,2,3…
P },所述Xij为所述XiH、」J ,/71 JdiW 所述W的第j行参数;
[0142] 步骤23,根据所述基于最大相关熵准则的偏最小二乘权重向量优化模型,求解偏 最小二乘权重向量。
[0143] 所述步骤23的具体实现包括如下步骤:
[0144] 步骤231,令所述G( ·)为高斯核函数,SP
,且存在一个 共辄凸函数,其中,所述A和所述B为任意两个随机变量,所述〇为高斯核参数;则所述基于最 大相关熵准则的偏最小二乘权重向量优化模型的等价模型如下:
[0145]
[0146] 其中,所述为所述共辄凸函数,所述α = (αι,α2,…叱··,αη)为辅助变量;
[0147] 对于固定的偏最小二乘权重向量,根据共辄凸函数的性质得辅助变量也固定,且 满足如下第一公式;
[0148] 所述第一公式如下:
[0149] a = -G(Y-Xw);
[0150] 对于固定的辅助变量,根据所述等价模型求解得偏最小二乘权重向量表达式如 下:
[0151]
[0152]其中,所述Η为对角矩阵,其主对角线上的元素 Huicu;
[0153] 步骤232,初始化偏最小二乘权重向量为单位向量,并代入第一公式更新辅助变 量;
[0154] 步骤233,令正则化参数为预设数值,并根据偏最小二乘权重向量表达式和更新的 辅助变量,更新偏最小二乘权重向量;
[0155] 步骤234,将更新的偏最小二乘权重向量,代入第一公式再次更新辅助变量,并执 行步骤233,再次更新偏最小二乘权重向量;
[0156] 步骤235,判断前后两次更新的辅助变量的改变量是否小于第一预设值,并判断步 骤234执行的次数是否达到预设次数;当所述改变量小于第一预设值和/或步骤234执行的 次数达到预设次数,输出最后更新的偏最小二乘权重向量,执行步骤3;否则,执行步骤234。
[0157] 步骤3,根据偏最小二乘权重向量,构建偏最小二乘预测模型,并根据预测样品的 红外光谱矩阵和所述偏最小二乘预测模型,求解预测样品的浓度数据。
[0158] 所述步骤3具体实现包括如下步骤:
[0159] 步骤31,根据如下第二公式提取主成分;并根据如下第三公式对主成分做归一化 处理;
[0160] 所述第二公式如下:
[0161] t=Xw
[0162] 所述第三公式如下:
[0163] tc = t/ (tTt)
[0164] 其中,所述t为主成分,所述tc为归一化主成分;
[0165] 步骤32,根据如下第四公式计算主成分对应的载荷向量;
[0166] 所述第四公式如下:
[0167] z=XTtc
[0168] 其中,所述z为载荷向量;
[0169] 步骤33,根据如下第五公式计算标准样品的浓度向量与归一化主成分的乘积; [0170] 所述第五公式如下:
[0171] q = tcTY
[0172] 其中,所述q为所述乘积;
[0173] 步骤34,判断如下第六公式是否成立,是,则执行步骤36;否,则执行步骤35;
[0174] 所述第六公式如下:
[0175] |X-tczT| |F<e
[0176]其中,所述| | · | |f为矩阵的Frobenius范数;所述e为第二预设值,具体实施中取 一个很小的值,如e = 0.001;
[0177] 步骤35,根据如下第七公式更新标准样品的红外光谱矩阵;并返回执行步骤2;
[0178] 所述第七公式如下:
[0179] X,=X-tGzT
[0180] 其中,所述X'为标准样品更新的红外光谱矩阵;
[0181] 步骤36,按如下第八公式构建偏最小二乘预测模型;并根据预测样品的红外光谱 矩阵和所述偏最小二乘预测模型,求解预测样品的浓度数据;
[0182] 所述第八公式如下:
[0183] Ynew = Xnewff(ZTff)_1Q
[0184] 其中,所述Xne3W为预测样品的红外光谱矩阵,所述Yne3W为所述偏最小二乘预测模型 所求解得出的预测样品的浓度向量,根据所述预测样品的浓度向量,获取所述预测样品的 浓度数据,即所述预测样品的浓度向量中的每一个参数即为对应预测样品的浓度;所述W = [W1,W2,···,wr],Z=[Z1,Z2,···,zr],Q=[qi,q2,···,q r];其中,所述r为循环执行步骤2与步骤3 的次数,所述W1,W2,…,wr分别为依次执行步骤2所输出的偏最小二乘权重向量,所述Z1, Z2,…,zr分别为依次执行步骤32所获取的载荷向量,所述qi,q2,…,qr分别为依次执行步骤 33所获取的所述乘积,B=,所述B为回归系数。
[0185] 如图2所示,一种红外光谱定量分析系统,包括红外光谱矩阵提取模块、偏最小二 乘权重向量求解模块和预测样品浓度数据求解模块。
[0186] 所述红外光谱矩阵提取模块,其用于分别从标准样品和预测样品的红外光谱数据 中,获取标准样品的红外光谱矩阵和预测样品的红外光谱矩阵。
[0187] 所述红外光谱矩阵提取模块具体用于分别对标准样品和预测样品的红外光谱数 据进行维数约减或波段选择,获取标准样品的红外光谱矩阵和预测样品的红外光谱矩阵。
[0188] 所述偏最小二乘权重向量求解模块,其用于根据标准样品的红外光谱矩阵和标准 样品的浓度数据,基于最大相关熵准则,求解偏最小二乘权重向量。
[0189] 所述偏最小二乘权重向量求解模块包括构建单元、更新单元和求解单元。
[0190] 所述构建单元,其用于构建具有正则化项的偏最小二乘权重向量优化模型;
[0191] 所述具有正则化项的偏最小二乘权重向量优化模型如下:
[0192]
[0193] 其中,所述X为标准样品的红外光谱矩阵,X = [ XI,X2,…Xi…,Xn]τ,所述Y为标准样 品的浓度数据对应的浓度向量,¥=[71,7 2,一71-,711]7,其中,所述11为标准样品的个数,所 述^为任一标准样品的光谱向量,所述光谱向量的维数为Ρ,所述所述任一标准样品的 浓度,所述i e {1,2,3…η};所述w为偏最小二乘权重向量,所述λ为正则化参数,所述D为对 角正则化矩阵,D = diag{dist(Y_X)}。
[0194] 所述更新单元,其用于基于最大相关熵准则,更新所述具有正则化项的偏最小二 乘权重向量优化模型,获得基于最大相关熵准则的偏最小二乘权重向量优化模型;
[0195] 所述基于最大相关熵准则的偏最小二乘权重向量优化模型如下:
[0196] _ V, J = l
J _
[0197] 其中,所述
良征Y与Xw之间的相关熵,其中,所述j G {1,2,3~ p},所述Xl沩所述Xl的第j列参数,所述w沩所述w的第j行参数,所述G( ·)为核函数。
[0198] 所述求解单元,其用于根据所述基于最大相关熵准则的偏最小二乘权重向量优化 模型,求解偏最小二乘权重向量。
[0199 ]所述求解单元包括生成子单元、第一更新子单元、第二更新子单元、第三更新子单 元和更新终止子单元。
[0200]所述生成子单元,其用于令所述G( ·)为高斯核函数,即
且存在一个共辄凸函数,其中,所述A和所述B为任意两个随机变量,所述σ为高斯核参数;则 所述基于最大相关熵准则的偏最小二乘权重向量优化模型的等价模型如下:
[0201]
[0202] 其中,所述<Κ·)为所述共辄凸函数,所述α = (αι,α2,···α?…,〇为辅助变量;
[0203]对于固定的偏最小二乘权重向量,根据共辄凸函数的性质得辅助变量也固定,且 满足如下第一公式;
[0204] 所述第一公式如下:
[0205] α = -G (Y-Xw);
[0206] 对于固定的辅助变量,根据所述等价模型求解得偏最小二乘权重向量表达式如 下:
[0207] w=(XtHX+AD)_1XtHY
[0208] 其中,所述Η为对角矩阵,其主对角线上的元素 Hn = ai。
[0209] 所述第一更新子单元,其用于初始化偏最小二乘权重向量为单位向量,并代入第 一公式更新辅助变量。
[0210] 所述第二更新子单元,其用于令正则化参数为预设数值,并根据偏最小二乘权重 向量表达式和更新的辅助变量,更新偏最小二乘权重向量。
[0211] 所述第三更新子单元,其用于将更新的偏最小二乘权重向量,代入第一公式再次 更新辅助变量,并驱动第二更新子单元工作,再次更新偏最小二乘权重向量。
[0212] 更新终止子单元,其用于判断前后两次更新的辅助变量的改变量是否小于第一预 设值,并判断第三更新子单元执行的次数是否达到预设次数;当所述改变量小于第一预设 值和/或第三更新子单元执行的次数达到预设次数,输出最后更新的偏最小二乘权重向量, 驱动预测样品浓度数据求解模块工作;否则,驱动第三更新子单元工作。
[0213] 所述预测样品浓度数据求解模块,其用于根据偏最小二乘权重向量,构建偏最小 二乘预测模型,并根据预测样品的红外光谱矩阵和所述偏最小二乘预测模型,求解预测样 品的浓度数据。
[0214] 所述预测样品浓度数据求解模块包括主成分求解单元、载荷向量求解单元、乘积 求解单元、判断单元、红外光谱矩阵更新单元和预测样品浓度数据求解单元。
[0215] 所述主成分求解单元,其用于根据如下第二公式提取主成分;并根据如下第三公 式对主成分做归一化处理;
[0216] 所述第二公式如下:
[0217] t=Xw
[0218] 所述第三公式如下:
[0219] tc = t/(tTt)
[0220] 其中,所述t为主成分,所述tc为归一化主成分。
[0221] 所述载荷向量求解单元,其用于根据如下第四公式计算主成分对应的载荷向量; [0222]所述第四公式如下:
[0223] z=XTtc
[0224] 其中,所述z为载荷向量。
[0225] 所述乘积求解单元,其用于根据如下第五公式计算标准样品的浓度向量与归一化 主成分的乘积;
[0226] 所述第五公式如下:
[0227] q = tGTY
[0228] 其中,所述q为所述乘积。
[0229] 所述判断单元,其用于判断如下第六公式是否成立,是,则驱动预测样品浓度数据 求解单元工作;否,则驱动红外光谱矩阵更新单元工作;
[0230] 所述第六公式如下:
[0231] |X-tczT| |F<e
[0232]其中,所述| | · | |f为矩阵的Frobenius范数,所述e为第二预设值。
[0233] 所述红外光谱矩阵更新单元,其用于根据如下第七公式更新标准样品的红外光谱 矩阵;并驱动偏最小二乘权重向量求解模块工作;
[0234] 所述第七公式如下:
[0235] X,=X-tczT
[0236] 其中,所述X'为标准样品更新的红外光谱矩阵。
[0237] 所述预测样品浓度数据求解单元,其用于按如下第八公式构建偏最小二乘预测模 型;并根据预测样品的红外光谱矩阵和所述偏最小二乘预测模型,求解预测样品的浓度数 据;
[0238] 所述第八公式如下:
[0239] Ynew = Xnewff(ZTff)_1Q
[0240] 其中,所述Xne3W为预测样品的红外光谱矩阵,所述Yne3W为所述偏最小二乘预测模型 所求解得出的预测样品的浓度向量,根据所述预测样品的浓度向量,获取所述预测样品的 浓度数据,所述W=[wi,W2,···,w r],Z=[Z1,Z2,···,zr],Q=[qi,q2,···,qr];其中,所述r为偏最 小二乘权重向量求解模块与预测样品浓度数据求解模块工作的次数,所述 W1,W2,···,^分别 为偏最小二乘权重向量求解模块依次工作所输出的偏最小二乘权重向量,所述Zl·,Z2,…,Zr 分别为载荷向量求解单元依次工作所获取的载荷向量,所述Φ,Φ,···,αΓ分别为乘积求解单 元依次工作所获取的所述乘积。
[0241] 由于本发明的核心是在偏最小二乘权重向量的求解过程中采用最大相关熵准则 替代现有的最小二乘误差标准,提升和改进现有的基于最小二乘误差标准的偏最小二乘算 法,因此现有的基于最小二乘误差标准的偏最小二乘算法能够处理的多元校正回归问题, 本发明均有效。
[0242] 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种红外光谱定量分析方法,其特征在于,包括如下步骤: 步骤1,分别从标准样品和预测样品的红外光谱数据中,获取标准样品的红外光谱矩阵 和预测样品的红外光谱矩阵; 步骤2,根据标准样品的红外光谱矩阵和标准样品的浓度数据,基于最大相关赌准则, 求解偏最小二乘权重向量; 步骤3,根据偏最小二乘权重向量,构建偏最小二乘预测模型,并根据预测样品的红外 光谱矩阵和所述偏最小二乘预测模型,求解预测样品的浓度数据。2. 根据权利要求1所述一种红外光谱定量分析方法,其特征在于,所述步骤2具体实现 包括如下步骤: 步骤21,构建具有正则化项的偏最小二乘权重向量优化模型; 所述具有正则化项的偏最小二乘权重向量优化模型如下:其中,所述X为标准样品的红外光谱矩阵,乂=^1,^2,一^^-心]\所述¥为标准样品的 浓度数据对应的浓度向量,Y=[yl,y2,···yi···,yn]τ,其中,所述n为标准样品的个数,所述xi 为任一标准样品的光谱向量,所述光谱向量的维数为P,所述yi为所述任一标准样品的浓 度,所述ie{l,2,3…η};所述W为偏最小二乘权重向量,所述λ为正则化参数,所述D为对角 正则化矩阵,D = diag{dist(Y-X)}; 步骤22,基于最大相关赌准则,更新所述具有正则化项的偏最小二乘权重向量优化模 型,获得基于最大相关赌准则的偏最小二乘权重向量优化模型; 所述基于最大相关赌准则的偏最小二乘权重向量优化模型如下:其中,所过表征Y与Xw之间的相关赌,其中,所述j e {1,2,3…P},所 述XI功所述XI的第j列参数,所述W功所述W的第j行参数,所述G( ·)为核函数; 步骤23,根据所述基于最大相关赌准则的偏最小二乘权重向量优化模型,求解偏最小 二乘权重向量。3. 根据权利要求2所述一种红外光谱定量分析方法,其特征在于,所述步骤23的具体实 现包括如下步骤: 步骤231,令所述G(.)为高斯核函数,即且存在一个共辆凸 函数,其中,所述A和所述B为任意两个随机变量,所述σ为高斯核参数;则所述基于最大相关 赌准则的偏最小二乘权重向量优化模型的等价模型如下:其中,所述例>)为所述共辆凸函数,所述α = (αι,02,…Qi···,an)为辅助变量; 对于固定的偏最小二乘权重向量,根据共辆凸函数的性质得辅助变量也固定,且满足 如下第一公式; 所述第一公式如下: a = -G(Y-Xw); 对于固定的辅助变量,根据所述等价模型求解得偏最小二乘权重向量表达式如下: ¥=(χΤΗΧ+λ〇)-νΗΥ 其中,所述Η为对角矩阵,其主对角线上的元素出1 = 口1; 步骤232,初始化偏最小二乘权重向量为单位向量,并代入第一公式更新辅助变量; 步骤233,令正则化参数为预设数值,并根据偏最小二乘权重向量表达式和更新的辅助 变量,更新偏最小二乘权重向量; 步骤234,将更新的偏最小二乘权重向量,代入第一公式再次更新辅助变量,并执行步 骤233,再次更新偏最小二乘权重向量; 步骤235,判断前后两次更新的辅助变量的改变量是否小于第一预设值,并判断步骤 234执行的次数是否达到预设次数;当所述改变量小于第一预设值和/或步骤234执行的次 数达到预设次数,输出最后更新的偏最小二乘权重向量,执行步骤3;否则,执行步骤234。4.根据权利要求2所述一种红外光谱定量分析方法,其特征在于,所述步骤3具体实现 包括如下步骤: 步骤31,根据如下第二公式提取主成分;并根据如下第Ξ公式对主成分做归一化处理; 所述第二公式如下: t 二 Xw 所述第Ξ公式如下: tG = t/(t\) 其中,所述t为主成分,所述tG为归一化主成分; 步骤32,根据如下第四公式计算主成分对应的载荷向量; 所述第四公式如下: Z=X^tG 其中,所述Z为载荷向量; 步骤33,根据如下第五公式计算标准样品的浓度向量与归一化主成分的乘积; 所述第五公式如下: q = tc^Y 其中,所述q为所述乘积; 步骤34,判断如下第六公式是否成立,是,则执行步骤36;否,则执行步骤35; 所述第六公式如下: X-tGz'^'l |p<e 其中,所述II · IIf为矩阵的化obenius范数,所述e为第二预设值; 步骤35,根据如下第屯公式更新标准样品的红外光谱矩阵;并返回执行步骤2; 所述第屯公式如下: X,=X_t(;zT 其中,所述X '为标准样品更新的红外光谱矩阵; 步骤36,按如下第八公式构建偏最小二乘预测模型;并根据预测样品的红外光谱矩阵 和所述偏最小二乘预测模型,求解预测样品的浓度数据; 所述第八公式如下: Ynew = XnewW(ZTW)-lQ 其中,所述Xnew为预测样品的红外光谱矩阵,所述Ynew为所述偏最小二乘预测模型所求 解得出的预测样品的浓度向量,根据所述预测样品的浓度向量,获取所述预测样品的浓度 数据,所述W=[Wl,W2,···,Wr],Z=[Zl,Z2,…,Zr],Q=[ql,q2,…,qr];其中,所述r为循环执行 步骤2与步骤3的次数,所述Wl,W2,-|,Wr分别为依次执行步骤2所输出的偏最小二乘权重向 量,所述Z1,Z2,…,Zr分别为依次执行步骤32所获取的载荷向量,所述qi,Q2,…,qr分别为依 次执行步骤33所获取的所述乘积。5. 根据权利要求1所述一种红外光谱定量分析方法,其特征在于,所述步骤1的具体实 现为分别对标准样品和预测样品的红外光谱数据进行维数约减或波段选择,获取标准样品 的红外光谱矩阵和预测样品的红外光谱矩阵。6. -种红外光谱定量分析系统,其特征在于,包括红外光谱矩阵提取模块、偏最小二乘 权重向量求解模块和预测样品浓度数据求解模块; 所述红外光谱矩阵提取模块,其用于分别从标准样品和预测样品的红外光谱数据中, 获取标准样品的红外光谱矩阵和预测样品的红外光谱矩阵; 所述偏最小二乘权重向量求解模块,其用于根据标准样品的红外光谱矩阵和标准样品 的浓度数据,基于最大相关赌准则,求解偏最小二乘权重向量; 所述预测样品浓度数据求解模块,其用于根据偏最小二乘权重向量,构建偏最小二乘 预测模型,并根据预测样品的红外光谱矩阵和所述偏最小二乘预测模型,求解预测样品的 浓度数据。7. 根据权利要求6所述一种红外光谱定量分析系统,其特征在于,所述偏最小二乘权重 向量求解模块包括构建单元、更新单元和求解单元; 所述构建单元,其用于构建具有正则化项的偏最小二乘权重向量优化模型; 所述具有正则化项的偏最小二乘权重向量优化模型如下:其中,所述X为标准样品的红外光谱矩阵,乂=^1,^2,一^^-心]\所述¥为标准样品的 浓度数据对应的浓度向量,Y=[yl,y2,···yi···,yn]τ,其中,所述n为标准样品的个数,所述xi 为任一标准样品的光谱向量,所述光谱向量的维数为P,所述yi为所述任一标准样品的浓 度,所述ie{l,2,3…η};所述W为偏最小二乘权重向量,所述λ为正则化参数,所述D为对角 正则化矩阵,D = diag{dist(Y-X)}; 所述更新单元,其用于基于最大相关赌准则,更新所述具有正则化项的偏最小二乘权 重向量优化模型,获得基于最大相关赌准则的偏最小二乘权重向量优化模型; 所述基于最大相关赌准则的偏最小二乘权重向量优化模型如下:其中,所述表征Y与Xw之间的相关赌,其中,所述_]'曰{1,2,3-,},所 述XI功所述XI的第j列参数,所述W功所述W的第j行参数,所述G( ·)为核函数; 所述求解单元,其用于根据所述基于最大相关赌准则的偏最小二乘权重向量优化模 型,求解偏最小二乘权重向量。8.根据权利要求7所述一种红外光谱定量分析系统,其特征在于,所述求解单元包括生 成子单元、第一更新子单元、第二更新子单元、第Ξ更新子单元和更新终止子单元; 所述生成子单元,其用于令所述G( ·)为高斯核函数,即且 存在一个共辆凸函数,其中,所述A和所述B为任意两个随机变量,所述0为高斯核参数;则所 述基于最大相关赌准则的偏最小二乘权重向量优化模型的等价模型如下:其中,所述《Κ·)为所述共辆凸函数,所述α =(曰1,曰2,…化··,山)为辅助变量; 对于固定的偏最小二乘权重向量,根据共辆凸函数的性质得辅助变量也固定,且满足 如下第一公式; 所述第一公式如下: a = -G(Y-Xw); 对于固定的辅助变量,根据所述等价模型求解得偏最小二乘权重向量表达式如下: ¥=(χΤΗΧ+λ〇)-νΗΥ 其中,所述Η为对角矩阵,其主对角线上的元素出1 = 口1; 所述第一更新子单元,其用于初始化偏最小二乘权重向量为单位向量,并代入第一公 式更新辅助变量; 所述第二更新子单元,其用于令正则化参数为预设数值,并根据偏最小二乘权重向量 表达式和更新的辅助变量,更新偏最小二乘权重向量; 所述第Ξ更新子单元,其用于将更新的偏最小二乘权重向量,代入第一公式再次更新 辅助变量,并驱动第二更新子单元工作,再次更新偏最小二乘权重向量; 更新终止子单元,其用于判断前后两次更新的辅助变量的改变量是否小于第一预设 值,并判断第Ξ更新子单元执行的次数是否达到预设次数;当所述改变量小于第一预设值 和/或第Ξ更新子单元执行的次数达到预设次数,输出最后更新的偏最小二乘权重向量,驱 动预测样品浓度数据求解模块工作;否则,驱动第Ξ更新子单元工作。9.根据权利要求7所述一种红外光谱定量分析系统,其特征在于,所述预测样品浓度数 据求解模块包括主成分求解单元、载荷向量求解单元、乘积求解单元、判断单元、红外光谱 矩阵更新单元和预测样品浓度数据求解单元; 所述主成分求解单元,其用于根据如下第二公式提取主成分;并根据如下第Ξ公式对 主成分做归一化处理; 所述第二公式如下: t = Xw 所述第Ξ公式如下: tG = t/(t^t) 其中,所述t为主成分,所述tG为归一化主成分; 所述载荷向量求解单元,其用于根据如下第四公式计算主成分对应的载荷向量; 所述第四公式如下: Z=X^tG 其中,所述Z为载荷向量; 所述乘积求解单元,其用于根据如下第五公式计算标准样品的浓度向量与归一化主成 分的乘积; 所述第五公式如下: q = tG^Y 其中,所述q为所述乘积; 所述判断单元,其用于判断如下第六公式是否成立,是,则驱动预测样品浓度数据求解 单元工作;否,则驱动红外光谱矩阵更新单元工作; 所述第六公式如下:其中,所述II · IIf为矩阵的化obenius范数,所述e为第二预设值; 所述红外光谱矩阵更新单元,其用于根据如下第屯公式更新标准样品的红外光谱矩 阵;并驱动偏最小二乘权重向量求解模块工作; 所述第屯公式如下: X,=X_t(;zT 其中,所述X '为标准样品更新的红外光谱矩阵; 所述预测样品浓度数据求解单元,其用于按如下第八公式构建偏最小二乘预测模型; 并根据预测样品的红外光谱矩阵和所述偏最小二乘预测模型,求解预测样品的浓度数据; 所述第八公式如下: Ynew = XnewW(ZTW)-lQ 其中,所述Xnew为预测样品的红外光谱矩阵,所述Ynew为所述偏最小二乘预测模型所求 解得出的预测样品的浓度向量,根据所述预测样品的浓度向量,获取所述预测样品的浓度 数据,所述W=[Wl,W2,···,Wr],Z=[Zl,Z2,…,Zr],Q=[ql,q2,…,qr];其中,所述r为偏最小二 乘权重向量求解模块与预测样品浓度数据求解模块工作的次数,所述Wl,W2,一,Wr分别为偏 最小二乘权重向量求解模块依次工作所输出的偏最小二乘权重向量,所述Z1,Z2,…,Zr分别 为载荷向量求解单元依次工作所获取的载荷向量,所述qi,q2,···,qr分别为乘积求解单元依 次工作所获取的所述乘积。10.根据权利要求6所述一种红外光谱定量分析系统,其特征在于,所述红外光谱矩阵 提取模块具体用于分别对标准样品和预测样品的红外光谱数据进行维数约减或波段选择, 获取标准样品的红外光谱矩阵和预测样品的红外光谱矩阵。
【文档编号】G01N21/35GK105973828SQ201610270304
【公开日】2016年9月28日
【申请日】2016年4月27日
【发明人】彭江涛
【申请人】湖北大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1