基于分块稀疏贝叶斯优化的红外光谱波长选择方法

文档序号:9348501阅读:306来源:国知局
基于分块稀疏贝叶斯优化的红外光谱波长选择方法
【技术领域】
[0001] 本发明涉及红外光谱波长技术领域,更具体而言,涉及一种基于稀疏贝叶斯学习 的新型红外光谱波长选择方法,是一种利用光谱结构先验知识和光谱间共线性相关先验知 识的稀疏优化波长选择方法。
【背景技术】
[0002] 红外光谱分析是一种新兴的分析技术,由于它具有快速、无损和无污染等优点,在 农业、化工和环境监测等领域有着广泛的应用。但是,红外光谱通常具有波长点多、吸收峰 重叠、波长点之间存在严重的共线性关系等特点,给后续的定性与定量分析造成困难。因 此,研究波长选择方法,对于简化模型、提高模型的预测能力和鲁棒性具有重要的实际意 义。
[0003] 传统的波长选择方法包括前向选择法、群优化算法、区间偏最小二乘法、无信息变 量消除法等。前向选择法通过逐步回归,每次选择一个相关程度最高的波长,但是没有考虑 波长点间的共线性问题;群优化算法(遗传算法、蝙蝠算法等),通过特定的优化策略对目 标函数进行优化,从而实现波长的选择,但是普遍存在计算量大、鲁棒性弱等缺点;区间偏 最小二乘法通过将整个波长范围划分成若干个子区间,然后选择泛化性能最好的若干个子 区间,但是子区间的个数设置对结果的影响较大,且计算量较大;无信息变量消除法通过加 入一些人工随机变量,剔除稳定性低于随机变量的波长点,从而达到波长选择的目的,但是 选择出的波长点个数依然很多,模型复杂度较高。
[0004] 此外,考虑到红外光谱通常具有稀疏结构的特点(仅有少部分波长点对 于模型有贡献),文献[基于稀疏优化的近红外光谱波长选择方法,仪器仪表学 报.2011,32(5) : 1114-1118]将波长选择问题转化为一个稀疏优化问题,再根据优化结果 对波长进行排序,然后选择前面的部分波长。然而,该方法并没有考虑红外光谱的分块稀疏 特点及共波长点间的共线性问题,导致算法的鲁棒性较弱。
[0005] 综上所述,有必要对现有技术进行改进。

【发明内容】

[0006] 为了克服现有技术中红外光谱波长选择方法存在的计算量大、鲁棒性弱等不足, 本发明提出一种计算量小、可调参数少、鲁棒性强的一种基于分块稀疏贝叶斯优化的红外 光谱波长选择方法。
[0007] 为了解决上述技术问题,本发明采用的技术方案为:
[0008] 基于分块稀疏贝叶斯优化的红外光谱波长选择方法,首先利用红外光谱结构先验 知识和光谱间共线性先验知识,自适应确定光谱的分块稀疏结构;然后采用稀疏贝叶斯学 习算法计算出稀疏优化问题的最优解,从而筛选出最优的波长点组合。
[0009] 首先利用二阶导数光谱自适应确定光谱的分块稀疏结构,所述光谱自适应的划分 方法可以根据波长点的贡献大小自适应确定分块的大小,即贡献较大的光谱范围内每个 分块包含的波长点较少;反之,贡献较小的光谱范围内每个分块包含的波长点较多;将光 谱范围内划分为J个分块,第j个分块中包含的波长点个数为Pjj= 1,2,…,J,则满足
[0011] 上式中,YeH*54为待分析组分含量;xZ 为第个分块波长 点对应的回归系数;(6,. €11*^为第j个分块波长点对应的红外光谱信息;
优化解的稀疏度。
[0012] 所述分块稀疏贝叶斯学习算法按照如下具体步骤进行:
[0013] (1)假设每个分块Xi 均满足高斯分布:
[0014]
[0015] 其中,Y1为一个非负的参数,控制着X的稀疏度;当y1=0时,表示第i个分块 X1为零;6 为一个正定矩阵,表征第i个分块的相关信息;
[0016] ⑵假设各个分块间相互独立,则X的先验分布为PX; ;OyS0;
[0017]其中,2。=diagy!B1,…,yjBj;
[0018] (3)假设噪声也满足高斯分布:~AT〇,2I;其中,V为实验过程中引入的 噪声;A为一个正标量;I为单位矩阵;
[0019] (4)由步骤(1)-(3)可得,X的后验分布可表示为;
[0021] (5)所有的参数义7,,Bi么被估计出来后,X的最大后验估计i直接通过X的后验
[0022] (6)参数2, ^由第二类最大似然估计获得,即等效于计算以下损失函数的 最小值:
[0023]
[0024] 其中,Qg丄LB,. ^表示所有的待估计参数;
[0025] (7)采用期望最大化算法对步骤(6)进行求解,可以得到参数Y p A和B1的学习 规则:
[0029] 其中,//^做-为yx的第i个分块;为5:x的第i个主对角阵分块。 [0030] 与现有技术相比本发明所具有的有益效果为:
[0031] 本发明首先利用二阶导数方法将光谱自适应划分为若干个子区间(分块),然后 在充分利用各个分块的红外光谱的共线性先验知识的基础上采用稀疏贝叶斯优化算法计 算出稀疏解,从而筛选出最优的波长点组合;与现有方法相比,该方法具备计算量小、可调 参数少、鲁棒性强等优点,从而可以有效降低模型的复杂度,提升模型的泛化性能,可以广 泛应用于固相、液相和气相的红外光谱波长选择领域中。
【附图说明】
[0032] 下面通过附图对本发明的【具体实施方式】作进一步详细的说明。
[0033] 图1为60个汽油样品的近红外光谱图;
[0034] 图2为60个汽油样品平均光谱的二阶导数光谱;
[0035] 图3为基于稀疏贝叶斯优化的红外光谱波长选择结果。
【具体实施方式】
[0036] 下面实施例结合附图对本发明作进一步的描述。
[0037] 以下结合图1和图2对本发明进行详细阐述。
[0038] 如图1所示,假设有N个样品,利用光谱仪扫描出的红外光谱信号为对 应的待分析组分含量为Y G IR~I。其中,P为红外光谱的波长点数,一般情况下N << P。
[0039] 由化学计量学原理可得,待分析组分的含量预测模型可以表示为
[0040] Y= ?x+v (1)
[0041] 其中,待拟合的回归系数;VeM1为噪声误差。
[0042] 为了实现波长选择,利用凸优化理论,可以将问题转化为以下1范数稀疏优化问 题:
[0044]从如图2所示的二阶导数光谱中可以看出,仅有少部分波长点对模型的贡献较 大,且存在分块稀疏结构,即贡献较大的波长点大多集中分布在少数几个分块中。假设整个 光谱范围可以分为J个分块,第j个分块中包含的波长点个数为Pjj= 1,2,…,J,则满足
优化解的稀疏度。
[0048]从以上分析可以看出,当G时,即整个光谱范围分为N个分块,亦即每个波 长点为一个分块,上述分块稀疏优化问题(3)即退化为I1范数稀疏优化问题(2)。
[0049]为了将整个光谱范围划分为若干个分块,可以采用多种划分方法,如均匀划分。然 而,若采用均匀划分策略,则意味着所有波长点的贡献相同,在稀疏优化时可能会将贡献较 大的波长点剔除。因此,本发明基于二阶导数光谱提出
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1