基于近红外光谱的校正模型建模方法

文档序号:6230979阅读:206来源:国知局
基于近红外光谱的校正模型建模方法
【专利摘要】本发明提供一种基于近红外光谱的校正模型建模方法,包括:步骤1,根据近红外光谱数据的预处理结果,获取全谱权重值;步骤2,以全谱波长的权重值为阀值,将全谱滤长划分为相关波长集、无关波长集和噪声波长集;步骤3,将浓度数据、相关波长集和无关波长集作为RBF神经网络的输入,同时将RBF神经网络的隐节点数设置为训练集的样本个数,训练RBF神经网络;步骤4,利用RBF神经网络的输出值与浓度数据通过偏最小二乘算法得出主成分个数;步骤5,根据训练集中的各样本的贡献值和贡献率的大小确定RBF神经网络的隐含层节点。本发明降低了校正模型的复杂度、校正模型的复杂度,有效提高了校正模型的精确度。
【专利说明】基于近红外光谱的校正模型建模方法
【技术领域】
[0001]本发明属于分析化学领域的无损分析技术,特指一种基于近红外光谱的校正模型建模方法。
【背景技术】
[0002]近红外光谱分析技术是分析化学领域迅猛发展的高新分析技术,其具有无破坏、无污染、分析重现性好、成本低等优点,广泛应用于石油化工、农业、食品等行业。近红外光谱分析技术主要分为定性和定量分析,定量分析的基础是利用近红外光谱获取的信息,通过建立校正模型,实现对物质各组分浓度的分析。但是,近红外区域(780-2526nm)主要体现含氢基团(_0H、-NH、-CH)的合频和各级倍频的吸收,该区间波段信息强度弱、谱峰重叠,导致校正模型的建立十分困难。
[0003]目前,在实际应用中校正模型创建方法主要采用线性方法多元线性回归算法、主成分回归算法和偏最小二乘回归算法。但是在实际中,光谱信息与浓度之间具有一定的非线性,特别是浓度范围较大时非线性更加明显。另外,由于物质的各成分相互作用、光谱仪的噪声和基线漂移等原因,也会引起非线性,这些导致线性校正模型方法精度不高。
[0004]针对该问题,专利“一种红花提取液测定方法(专利号:201310269615.X) ”采用最小二乘支持向量创建校正模型,但是在高维的近红外光谱数据下,该算法需要上百个样本才能建立满足实际应用的校正模型,这在一些实际工程应用中很不现实。
[0005]专利“一种近红外光谱的多模型建模方法(专利号:201310537968.3)提出了集成建模思路,将训练样本划分为那个子集,建立各个子集的校正模型,得到各子集校正模型的预测结果,将各子集预测结果利用权重值得到最终预测结果。但是该方法训练次数多,计算复杂。

【发明内容】

[0006]为解决上述技术问题,本发明提供了一种预测精确度高、模型稳健性好、所需样本少的基于近红外光谱的校正模型建模方法。
[0007]作为本发明的一个方面,提供了一种基于近红外光谱的校正模型建模方法,包括:步骤1,根据近红外光谱数据的预处理结果,获取全谱权重值;步骤2,以全谱波长的权重值为阀值,将全谱滤长划分为相关波长集、无关波长集和噪声波长集;步骤3,将浓度数据、相关波长集和无关波长集作为RBF神经网络的输入,同时将RBF神经网络的隐节点数设置为训练集的样本个数,训练RBF神经网络;步骤4,利用RBF神经网络的输出值与浓度数据通过偏最小二乘算法得出主成分个数;步骤5,根据训练集中的各样本的贡献值和贡献率的大小确定RBF神经网络的隐含层节点;步骤6,将主成分个数作为新的RBF神经网络的隐含层的节点个数,并将步骤5中的隐含层节点作为新的RBF神经网络的陷节点,将相关波数集、无关波数集作为新的RBF神经网络的输入,训练新的RBF神经网络从而得到校正模型。
[0008]进一步地,步骤I之前还包括以下步骤:根据光谱样本之间的距离及浓度样本之间的距离,对光谱数据进行划分,从而得到校正集,其中,校正集用于建立校正模型。
[0009]进一步地,步骤2还包括:将校正集等分为多个子区间,分别计算每个子区间的权重值;根据全谱权重值和每个子区间的权重值,利用下式将各子区间划分到相关波长集、无关波长集和噪声波长集中:
【权利要求】
1.一种基于近红外光谱的校正模型建模方法,其特征在于,包括: 步骤1,根据近红外光谱数据的预处理结果,获取全谱权重值; 步骤2,以所述全谱波长的权重值为阀值,将所述全谱滤长划分为相关波长集、无关波长集和噪声波长集; 步骤3,将浓度数据、所述相关波长集和所述无关波长集作为RBF神经网络的输入,同时将所述RBF神经网络的隐节点数设置为训练集的样本个数,训练所述RBF神经网络;步骤4,利用所述RBF神经网络的输出值与所述浓度数据通过偏最小二乘算法得出主成分个数; 步骤5,根据所述训练集中的各样本的贡献值和贡献率的大小确定所述RBF神经网络的隐含层节点; 步骤6,将所述主成分个数作为新的RBF神经网络的隐含层的节点个数,并将步骤5中的隐含层节点作为所述新的RBF神经网络的陷节点,将所述相关波数集、无关波数集作为所述新的RBF神经网络的输入,训练所述新的RBF神经网络从而得到校正模型。
2.根据权利要求1所述的方法,其特征在于,所述步骤I之前还包括以下步骤: 根据光谱样本之间的距离及浓度样本之间的距离,对光谱数据进行划分,从而得到校正集,其中,所述校正集用于建立所述校正模型。
3.根据权利要求1所述的方法,其特征在于,所述步骤2还包括: 将所述校正集等分为多个子区间,分别计算每个所述子区间的权重值; 根据所述全谱权重值和所述每个子区间的权重值,利用下式将所述各子区间划分到所述相关波长集、无关波长集和噪声波长集中:
4.根据权利要求1所述的方法,其特征在于,所述贡献值通过下式确定:
5.根据权利要求1所述的方法,其特征在于,所述贡献率由下式计算得到:
6.根据权利要求1所述的方法,其特征在于,所述步骤4包括: 将所述RBF神经网络的输出值构成多维欧式空间,将所述多维欧式空间与所述浓度数据通过偏最小二乘算 法得出主成分个数。
【文档编号】G01N21/359GK104020135SQ201410272819
【公开日】2014年9月3日 申请日期:2014年6月18日 优先权日:2014年6月18日
【发明者】徐泽宇, 刘永福, 何国田, 赵健, 林远长, 朱晓强, 何骥鸣, 吴娇娇, 何瑞英 申请人:中国科学院重庆绿色智能技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1