基于粒子群算法的近红外光谱波长选择方法

文档序号:6222016阅读:565来源:国知局
基于粒子群算法的近红外光谱波长选择方法
【专利摘要】一种基于粒子群算法的近红外光谱波长选择方法,采集样本的近红外光谱信号,构成现场历史数据库,数据库包含有多个波长变量,将粒子群算法与偏最小二乘法(partial?linear?squares,PIS)相结合,对近红外光谱的各个波长进行选择,从而使得所建立的校正模型具有更强的预测能力,实现对物质成分浓度的精确检测与分析,为近红外光谱分析技术在各工业领域的应用提供更好的理论基础,具有重要的现实意义。
【专利说明】基于粒子群算法的近红外光谱波长选择方法
【技术领域】
[0001]本发明涉及近红外光谱在物质成分定量分析中的应用,具体涉及一种基于粒子群算法的近红外光谱波长选择方法。
【背景技术】
[0002]近红外光谱(near infrared spectroscopy, NIR)来源于分子振动对光的吸收,可用于物质的主要成分分析。红外光照射在物质上时,伴随着物质组成的不同,不同波长的光线吸收度也不同,即红外光谱图中吸收峰的位置随物质的组成而发生变化,吸收峰高度随物质含量的多少而变化。
[0003]近红外光谱分析技术利用精密的光谱仪器及化学计量学软件获取物质在近红外光谱区的吸收光谱,然后对所获取的近红外光谱数据进行分析处理,最终获得该物质成分的定性或定量分析结果,其性能准确、清洁,有着传统方法不可匹敌的高效性和稳定性,目前已在食品、制药、重工业、石油化工等行业得到广泛应用,现场实时在线分析,带来了可观的经济效益。
[0004]近红外光谱分析技术主要依赖于校正模型,根据所测物质的成分和性质的不同,采用不同的建模方法,并不断对校正模型进行扩充和维护。偏最小二乘法(partial linearsquares, PIS)是近红外光谱数据建模的主要方法之一,它是采用全波段的光谱数据进行建模,这样不仅使得运算速度变慢,而且会降低模型的预测精度。通过特定的方法筛选特征波长或者波长区域可以使得所建立的模型具有更强的预测能力和更好的稳健性。
[0005]目前,波长选择的方法主要有相关系数法、无信息变量消除法、遗传算法等。相关系数法是将校正集光谱矩阵中的每个波长对应的吸光度向量与浓度矩阵中的待测组分浓度向量进行相关性计算,得到波长的相关系数或决定系数,对应相关系数绝对值(或决定系数)越大的其波长信息应越多。结合化学知识给定阈值,选择相关系数大于该阈值的波长建立模型。相关系数法是利用线性统计方法建立起来的,当用于非线性相关系统或校正样本集分布不均匀时,利用该方法进行波长选择所建立的模型预测能力较差。无信息变量消除方法(elimination of uninformative variable, UVE)是基于 PLS 回归系数建立的一种波长选择方法,该方法的基本思想是将回归系数作为波长重要性的衡量指标。虽然该方法在选取波长变量时,同时考虑了噪声和浓度信息的影响,比较直观实用,但其效果在很大程度上依赖随机初始矩阵的生成。遗传算法(genetic algorithm, GA)是利用生物界自然选择和遗传机制,通过选择、交换、变异和突变等算子的操作,随着不断的遗传迭代,使目标函数值较优的波长变量被保留,较差的则淘汰,最终实现波长选择的结果。但遗传算法的局部搜索能力较差,容易产生“早熟”现象,而且在建模过程中,初始校正集样本的选取以及整个算法的计算过程都是具有很强的随机性。

【发明内容】

[0006]为了克服上述波长选择方法存在的不足,本发明的目的在于提供一种基于粒子群算法的近红外光谱波长选择方法,从而使得所建立的校正模型具有更强的预测能力,实现对物质成分浓度的精确检测与分析,为近红外光谱分析技术在各工业领域的应用提供更好的理论基础,具有重要的现实意义。
[0007]为了达到上述目的,本发明所采用的技术方案是:
[0008]一种基于粒子群算法的近红外光谱波长选择方法,步骤如下:
[0009]步骤1:首先采集样本的近红外光谱信号,构成现场历史数据库D,数据库D的测量光谱为近红外光谱;数据库D包括有N个波长变量;
[0010]步骤2:近红外光谱波长选择方法使用蒙特卡洛(Monte-Carlo, MC)方法,按照预设比例R:1将数据库D随机划分为训练集和验证集;
[0011]步骤3:近红外光谱波长选择方法初始化训练集,随机选取Num个粒子,每个粒子代表一个数据对象,即每个粒子是一个N维向量,Num即为粒子群大小;将这Num个粒子的飞行速度进行随机初始化;
[0012]步骤4:近红外光谱波长选择方法采用二进制编码对每个粒子进行位置编码;每个粒子长度等于全部波长N,每个波长对应一个二进制码,其中数值‘I’表示对应的波长被选中,数值‘0’表不对应的波长未被选中;
[0013]步骤5:近红外光谱波长选择方法采用偏最小二乘法(partial linear squares,PIS)建立分析校正模型,并选取交叉验证均方根误差RMSECV作为适应度函数,计算每个粒子的适应度值,并记录个体最优解Pi和全局最优解Pg;交叉验证均方根误差RMSECV的计算公式为:
【权利要求】
1.一种基于粒子群算法的近红外光谱波长选择方法,其特征在于:步骤如下: 步骤1:首先采集样本的近红外光谱信号,构成现场历史数据库D,数据库D的测量光谱为近红外光谱;数据库D包括有N个波长变量; 步骤2:近红外光谱波长选择方法使用蒙特卡洛Monte-Carlo, MC方法,按照预设比例R: I将数据库D随机划分为训练集和验证集; 步骤3:近红外光谱波长选择方法初始化训练集,随机选取Num个粒子,每个粒子代表一个数据对象,即每个粒子是一个N维向量,Num即为粒子群大小;将这Num个粒子的飞行速度进行随机初始化; 步骤4:近红外光谱波长选择方法采用二进制编码对每个粒子进行位置编码;每个粒子长度等于全部波长N,每个波长对应一个二进制码,其中数值‘I’表示对应的波长被选中,数值‘0’表不对应的波长未被选中; 步骤5:近红外光谱波长选择方法采用偏最小二乘法partial linear squares,PIS建立分析校正模型,并选取交叉验证均方根误差RMSECV作为适应度函数,计算每个粒子的适应度值,并记录个体最优解Pi和全局最优解Pg;交叉验证均方根误差RMSECV的计算公式为:
2.根据权利要求1所述的一种基于粒子群算法的近红外光谱波长选择方法,其特征在于:所述的近红外光谱波长选择方法采用USB2000+光纤光谱仪和计算机组成的光谱信号采集系统,并对相关成分在各个频段的光谱吸收率进行测量采集。
【文档编号】G01N21/359GK103913432SQ201410114669
【公开日】2014年7月9日 申请日期:2014年3月25日 优先权日:2014年3月25日
【发明者】曹晖, 王燕霞, 张彦斌, 周延 申请人:西安交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1