多通道光谱系统的稳定性评价方法及预处理优化方法

文档序号:10651914阅读:458来源:国知局
多通道光谱系统的稳定性评价方法及预处理优化方法
【专利摘要】本发明公开了一种多通道光谱系统的稳定性评价方法及预处理优化方法,稳定性评价方法是:通过计算样品的动态吸光度矩阵、动态偏差谱,得到一稳定性评价指标。预处理优化方法是:建立一预处理方法数据库,计算各种预处理方法对应的原光谱及其校正谱的稳定性评价指标,对原光谱及其校正谱分别建立基于PLS方法的定标预测模型,计算得到近红外预测值与实测值之间的误差和相关性,最后根据稳定性评价指标、误差和相关性,确定最优的用于后续近红外光谱仪检测时的预处理方法。本发明客观地评价系统的整体稳定性,选择最优的预处理方法用于后续近红外光谱仪检测,使得检测信号更加准确,对于研制低成本近红外仪器以及近红外技术的规模化应用具有重要价值。
【专利说明】
多通道光谱系统的稳定性评价方法及预处理优化方法
技术领域
[0001] 本发明涉及多通道近红外光谱研究领域,特别涉及一种多通道光谱系统的稳定性 评价方法及预处理优化方法。
【背景技术】
[0002] 近红外是介于可见与中红外之间的电磁波。随着化学计量学和计算机技术的发 展,现代近红外光谱分析技术以其简便、快速和易于实现在线分析等优点,在农业、食品、环 境、生物医学等领域得到广泛应用。全波段通用型近红外仪器的技术已经比较成熟、但仪器 体积大、价格昂贵,主要适用于实验室检测,不便于近红外光谱技术的规模化应用。
[0003] 传统的通用型近红外仪器通常基于单个光源,采用光栅或滤光片等方式进行分 光,各波长吸光度的动态偏差谱之间的相关性较高。传统上,波长信噪比是近红外仪器稳定 性及预测性能的评价指标。为了降低近红外仪器成本,实现近红外技术的规模化应用,具有 多光源、多个分立波长的多通道光谱仪(如,半导体激光器型近红外仪器)是当前低成本近 红外仪器的重要研发方向,但对于多光源光谱系统,各波长吸光度的动态偏差谱之间的相 关性较低,各波长的信噪比难以评价系统的整体稳定性,仅提升各波长通道的信噪比难以 改进仪器的整体预测性能。

【发明内容】

[0004] 本发明的一个目的在于克服现有技术的缺点与不足,提供一种多通道光谱系统的 稳定性评价方法,该方法提出一个用于表征每个分立波长的系统稳定性评价指标,通过该 指标可以准确评价系统的整体稳定性,可用于后续多通道光谱系统的质量评定。
[0005] 本发明的一个目的在于提供一种基于上述稳定性评价方法的预处理优化方法,该 方法利用上述稳定性评价指标,可以对预处理方法进行预先筛选,从而得到最优的预处理 方法用于后续的信号处理,使得多通道光谱系统的精度得到较大提升,据此提升近红外预 测能力。
[0006] 本发明的目的通过以下的技术方案实现:多通道光谱系统的稳定性评价方法,包 括步骤:
[0007] S1、选择代表性样品,重复测试样品的近红外光谱:设近红外光谱仪具有m个分立 波长,对装好固定的样品连续测试其光谱η次,得到样品的动态吸光度矩阵如下:
[0008] A=(ak,i)mxn,k=l,2,…,m,i = l,2,…,η;
[0009] S2、计算样品的动态偏差谱:
[0010]首先计算样品的平均光谱如下:
[0012] 计算样品相对于平均光谱的偏差谱矩阵:
[0013] D=(dk,i)mxn,dk,i = ak,i_ak,k = l,2,…,m,i = l,2,…,η;
[0014] 进一步得到对应于每个分立波长的动态偏差谱:
[0015] dk - [dk:l,dk 2,··· ,dk n), k-1,2,···,m ;
[0016] S3、确定稳定性评价指标:首先计算任意两个分立波长动态偏差谱的相关系数,得 到相关矩阵R如下:
[0017] R=(Rp,q)mxm,p = l,2,…,m,q=l,2,…,m;
[0018] 其中,RP,q表不的是第p个分立波长动态偏差谱&和第q个分立波长动态偏差谱?ζ 的相关系数;计算对应第k个分立波长的m-1个相关系数的均值Rk,Ave3、标准差R k,SD,k=l, 2,…,m;
[0019] 最后得到每个分立波长的稳定性评价指标:
[0020] Rk=Rk.M,-Ri,s\r ^ = :
[0021] 其中,尾.值越大,表示系统越稳定。
[0022] 一种基于上述稳定性评价方法的预处理优化方法,包括步骤:
[0023] S1、建立一预处理方法数据库,数据库中存储各种预处理方法,同时各预处理方法 中涉及的各个参数选值范围也一定;
[0024] S2、采用近红外光谱仪对待检测样品连续测试其光谱η次;
[0025] S3、采用预处理方法数据库中的各种预处理方法分别对上述光谱进行处理,得到 对应的校正谱,计算原光谱及其校正谱的稳定性评价指标;
[0026] S4、对原光谱及其校正谱分别建立基于PLS方法的定标预测模型,根据模型计算得 到近红外预测值与实测值之间的误差和相关性;
[0027] S5、选择同时满足下列条件的预处理方法作为优选方法:稳定性评价指标大于预 设的第一阈值,误差小于预设的第二阈值,相关性大于预设的第三阈值;如果满足条件的有 多个,则选择稳定性评价指标最高的那个方法;
[0028] S6、最后将优选方法作为后续近红外光谱仪检测时的预处理方法。
[0029] 优选的,在预处理优化方法中,在采用近红外光谱仪对待检测样品连续测试其光 谱η次后,先利用近红外光谱仪自身所带的方法计算当前的信噪比;如果信噪比小于预设的 第四阈值,则执行步骤S3,否则,直接采用近红外光谱仪进行检测。
[0030] 优选的,所述预处理方法数据库中包括SG平滑(Savitzky-Golay平滑)方法、标准 正态变量变换、多元散射校正、归一化等。
[0031] 优选的,所述步骤S3的具体步骤是:
[0032] 收集充分的代表性样品,利用近红外光谱仪采集光谱数据,同时采用标准分析方 法测定样品的该指标理化值;
[0033]将收集到的样品随机划分为定标集、预测集,定标集用于建立基于偏最小二乘 (PLS)方法的近红外定量分析模型,预测集用于评估模型的预测效果;
[0034]采用预测均方根误差(RMSEP)、相关系数(RP)分别评价近红外预测值与实测值之 间的误差和相关性,其公式如下:
[0037] 其中,^心分别为第i个预测样品的预测值和实测值;(?ave,CAVE分别为预测值和实 测值的平均值;Μ为预测样品的个数;RMSEP值越小说明模型的精度越高,R P值越大说明预测 值和实测值的相关性越高。
[0038] 本发明与现有技术相比,具有如下优点和有益效果:
[0039] 1、本发明提出了一种新的稳定性评价指标,可以客观地评价系统的整体稳定性, 相较于传统的各波长的信噪比,更适用于多光源光谱系统整体稳定性评价。
[0040] 2、本发明根据提出的稳定性评价指标,进一步提出了预处理优化方法,通过该方 法,可以选择最优的预处理方法用于后续近红外光谱仪检测,使得检测信号更加准确,对于 研制低成本近红外仪器以及近红外技术的规模化应用具有重要参考价值。
【附图说明】
[0041] 图1为玉米粉样品重复测试20次的原始光谱。
[0042]图2为样品重复测试20次原始光谱的动态偏差谱。
[0043]图3为样品重复测试20次的SG校正谱。
[0044]图4为样品重复测试20次SG校正谱的动态偏差谱。
[0045]图5为268个玉米粉样品原始光谱。
[0046] 图6为268个玉米粉样品SG校正谱。
[0047]图7(a)为玉米水分原始谱预测值与实测值的比较。
[0048]图7(b)为玉米水分SG校正谱预测值与实测值的比较。
[0049] 图8为本实施例预处理优化方法的流程图。
【具体实施方式】
[0050] 下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限 于此。
[0051 ] 实施例1
[0052] 本实施例以NLD-D1半导体激光器型近红外仪器(广州讯动网络科技有限公司,中 国)为例,测试样品:玉米粉样品(饲料原料),检测指标:水分。该仪器采用了 11个分立波长 (简称通道,m=ll)的半导体激光器,对应可以采集到样品11个波长的吸光度,重复测试样 品次数η为20。以此提出多通道光谱系统的稳定性评价方法及预处理优化方法的具体步骤。 [0053]本实施例多通道光谱系统的稳定性评价方法,包括步骤:
[0054] 1、选择具有代表性的玉米粉样品,重复测试样品次数η为20,获取11个通道的动态 吸光度,如图1所示。
[0055] 动态吸光度矩阵如下:
[0056] A=(ak,i)mXn,k=l,2,.",m,i = l,2,.",n〇(l)
[0057] 2、计算样品的动态偏差谱。
[0058]计算样品的平均光谱如下:
[0060]计算样品相对于平均光谱的偏差谱矩阵:
[0061 ] D=(dk,i)mxn,dk,i = ak,i_ak,k = l,2,…,m,i = l,2,…,n,(3)
[0062] 进一步得到对应于每个分立波长的动态偏差谱,如图2所示:
[0063] 是:二(',?/Α'2,..·,1),女=1,:2,,..,挪 〇: (4)
[0064] 3、确定稳定性评价指标
[0065] 首先计算任意两个分立波长动态偏差谱的相关系数,得到相关矩阵R如下:
[0066] R=(Rp,q)mxm,p = l,2,.",m,q=l,2,.",m;
[0067] 其中,Rp,q表;^的是第p个分立波长动态偏差谱4和第q个分立波长动态偏差谱& 的相关系数;计算对应第k个分立波长的m-1个相关系数的均值Rk,Ave、标准差Rk, SD,k=l, 2,…,m;
[0068] 最后得到每个分立波长的稳定性评价指标:
[0069] hd" k = 1,2,m t
[0070] 其中,及,值越大,表示系统越稳定。
[0071] 采用上述方法,计算原光谱的相关矩阵R〇ngin如下: L(X) 0.90 -0.! I 0.88 0.76 0.08 -0/48 -0.53 -0.15 -0.51 -0,20- 0.90 1.00 0,18 0.94 0.84 0.17 -0,53 -0.58 -0.18 --0.37 0,03 -(Ul 0.18 1.00 0.1! (UI -0.06 -0.22 -035 -02 4 0,56 0.74 0.88 (?.94 (Ul 1.00 0.88 0.23 -0.49 --0.52 -(i.08 --().24 0.()4 0.76 0.84 (Ul 0.88 LOO 0.57 -(). 15 -0.16 0.25 -().22 024
[0072] /?(,叫iit= 0.08 0.17 -0.()6 0.23 0.57 1.00 0,()6 0.63 0.71 -0.15 0.35 -0.48 -0.53 -0.22 -0.49 -0.15 0.66 1.00 0,92 0.66 (),()0 0.12 -0.53 -0.58 A)35 -0.52 -0.16 0.63 0.92 1.00 0.79 0,02 0.10 -0.15 -0ΛΗ -()24 -0.08 0.25 0.71 0.66 0.79 LOO 0.09 0.26 -0.51 -0.37 0.56 -??.24 -().22 A)A5 0.(X) 0.02 (?.09 1.00 0.62 -0.20 0.03 0.74 0.04 0.24 0.35 0.12 0.10 (?.26 0.62 LOO
[0073] 原光谱的系统稳定性评价指标如表1。
[0074] 表1.原光谱的系统稳定性评价指标
[0075]
[0076] 可见,每个尾值均较小,各通道动态偏差谱的相关性较低,表明该光谱系统的整体 稳定性较差,因此需要优选一种适当的预处理方法,改进光谱系统的整体稳定性,进一步提 升模型的预测能力。下面结合图8,对本实施例的预处理优化方法进行具体的说明。
[0077] 1、建立一预处理方法数据库。
[0078] 预处理方法数据库中可以包括SG平滑方法、标准正态变量变换、多元散射校正、归 一化等各种现有的方法,每种方法中涉及的各个参数选值范围也预先设定,在使用时,从上 述预处理方法中选择一种最优的方法。
[0079] SG方法把w(奇数)个连续波长作为一个平滑窗口,在窗口内用多项式对吸光度数 据做最小二乘拟合,得到相应的多项式系数,然后计算出该窗口中心波长的吸光度及其各 阶导数的校正值。使窗口在全谱范围内移动,由此得到原光谱的SG校正谱(前后两端的波长 分别采用后向、前向拟合的校正办法KSG平滑可以有效消除基线漂移、倾斜等噪音。SG方法 采用3个参数,分别是导数阶数s、多项式次数t(t>s)和平滑点数w。根据3个参数的不同组 合,可以得到不同模式的SG平滑光谱预处理方法。本实施例中,限定预处理方法数据库中仅 包括上述不同参数组合得到的SG平滑光谱预处理方法,其中,导数阶数s选值范围为0、1、2、 3,多项式次数t选值范围为2、3、4、5、6,平滑点数w选值范围为5、7、9、11,由于t>s,故共有68 种SG平滑模式。也就是说,本实施例方法数据库中包括68种预处理方法,下面就采用本实施 例的预处理优化方法从中选择一种最优的来用于后续的检测。
[0080] 2、采用近红外光谱仪对待检测样品连续测试其光谱η次。
[0081 ] 3、分别计算68种SG模式的系统稳定性评价指标。
[0082]下面以导数阶数s为2、多项式次数t为4、平滑点数w为5为例,首先计算样品重复测 试20次的SG校正谱,如图3所示。
[0083]进一步得到其动态偏差谱,如图4所示。
[0084]得到相关矩阵Rsg。
[0086]进一步得到SG校正谱的系统稳定性评价指标,如表2所示。
[0087]表2. SG校正谱的系统稳定性评价指标
[0090] 可见,每个氧值均有大幅度的提高,各通道动态偏差谱的相关性较高,表明该光谱 系统的整体稳定性变得较好。
[0091] 4、对原光谱及其SG校正谱分别建立基于PLS方法的玉米粉样品水分指标的近红外 定量分析模型(定标预测模型)。
[0092] 收集玉米粉样品共268个作为样品集,其中定标样品个数为140,预测样品个数 128。图5和图6分别是原始光谱图和对应SG校正谱(s = 2,t = 4,w = 5)。
[0093] 分别对定标集的原始谱和SG校正谱建立基于PLS的近红外定量分析模型,预测集 用于评估模型的预测效果;采用预测均方根误差(RMSEP)、相关系数(RP)分别评价近红外预 测值与实测值之间的差和相关性,其公式如下:

[0096] 其中,(^心分别为第i个预测样品的预测值和实测值#AVE,CAVE分别为预测值和实 测值的平均值;Μ为预测样品的个数;RMSEP值越小说明模型的精度越高,R P值越大说明预测 值和实测值的相关性越高。
[0097] 建模结果如表3所示,预测值与实测值的比较如图7(a)和图7(b)所示。
[0098]表3.原始光谱与SG校正谱PLS模型的预测效果
[0100]从表2,表3,图7(a)和图7(b)可以看出,当原始样品光谱数据经过特定S-G平滑模 式处理后的稳定性评价指标(&)显著提升的同时,其定量分析模型预测均方根误差 (RMSEP)降低,预测值和实测值的相关系数(RP)提高,
[0101] 5、预先设置第一阈值、第二阈值第三阈值,选择同时满足下列条件的预处理方法 作为优选方法:稳定性评价指标大于第一阈值,误差小于第二阈值,相关性大于第三阈值。 如果满足条件的有多个,则选择稳定性评价指标最高的那个方法。
[0102] 6、最后将优选方法作为后续近红外光谱仪在检测该种样品时的预处理方法。
[0103] 通过本实施例可以得知,氣值既可以有效评价多通道光谱系统的稳定性,同时也 为提升其近红外预测能力提供了适当的方法。
[0104] 上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的 限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化, 均应为等效的置换方式,都包含在本发明的保护范围之内。
【主权项】
1. 多通道光谱系统的稳定性评价方法,其特征在于,包括步骤: 51、 选择代表性样品,重复测试样品的近红外光谱:设近红外光谱仪具有m个分立波长, 对装好固定的样品连续测试其光谱η次,得到样品的动态吸光度矩阵如下:52、 计算样品的动态偏差谱: 首先计算样品的平均光谱如下:计算样品相对于平均光谱的偏差谱矩阵:进一步得到对应于每个分立波长的动态偏差谱:53、 确定稳定性评价指标:首先计算任意两个分立波长动态偏差谱的相关系数,得到相 关矩阵R如下:其中,Rp,q表不的是第P个分立波长动态偏差谱和第q个分立波长动态偏差谱的相 关系数;计算对应第k个分立波长的m-ι个相关系数的均值^^、标准差取^汰=^,…,!!!; 最后得到每个分立波长的稳定性评价指标:其中,尾.值越大,表不系统越稳定。2. -种基于权利要求1所述稳定性评价方法的预处理优化方法,其特征在于,包括步 骤: 51、 建立一预处理方法数据库,数据库中存储各种预处理方法,同时各预处理方法中涉 及的各个参数选值范围也一定; 52、 采用近红外光谱仪对待检测样品连续测试其光谱η次; 53、 采用预处理方法数据库中的各种预处理方法分别对上述光谱进行处理,得到对应 的校正谱,计算原光谱及其校正谱的稳定性评价指标; 54、 对原光谱及其校正谱分别建立基于PLS方法的定标预测模型,根据模型计算得到近 红外预测值与实测值之间的误差和相关性; 55、 选择同时满足下列条件的预处理方法作为优选方法:稳定性评价指标大于预设的 第一阈值,误差小于预设的第二阈值,相关性大于预设的第三阈值;如果满足条件的有多 个,贝 1J选择稳定性评价指标最高的那个方法; 56、 最后将优选方法作为后续近红外光谱仪检测时的预处理方法。3. 根据权利要求2所述预处理优化方法,其特征在于,在预处理优化方法中,在采用近 红外光谱仪对待检测样品连续测试其光谱η次后,先利用近红外光谱仪自身所带的方法计 算当前的信噪比;如果信噪比小于预设的第四阈值,则执行步骤S3,否则,直接采用近红外 光谱仪进行检测。4. 根据权利要求2所述预处理优化方法,其特征在于,所述预处理方法数据库中包括SG 平滑方法、标准正态变量变换、多元散射校正、归一化。5. 根据权利要求2所述预处理优化方法,其特征在于,所述步骤S3的具体步骤是: 收集充分的代表性样品,利用近红外光谱仪采集光谱数据,同时采用标准分析方法测 定样品的该指标理化值; 将收集到的样品随机划分为定标集、预测集,定标集用于建立基于偏最小二乘方法的 近红外定量分析模型,预测集用于评估模型的预测效果; 采用预测均方根误差RMSEP、相关系数Rp分别评价近红外预测值与实测值之间的误差和 相关性,其公式如下:其中,^心分别为第i个预测样品的预测值和实测值;CAVE,CAVE分别为预测值和实测值 的平均值;M为预测样品的个数;RMSEP值越小说明模型的精度越高,Rp值越大说明预测值和 实测值的相关性越高。
【文档编号】G01N21/359GK106018331SQ201610557676
【公开日】2016年10月12日
【申请日】2016年7月13日
【发明人】潘涛, 沈鸿平, 肖青青, 许定舟, 鲁雄, 莫新敏, 张力培
【申请人】广州讯动网络科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1