基于连续投影算法的近红外波长变量选择方法

文档序号:6543501阅读:1435来源:国知局
基于连续投影算法的近红外波长变量选择方法
【专利摘要】本发明公开了一种基于连续投影算法的近红外波长变量选择方法。利用权重值方法,将全谱分成三类:相关波数点集、无关波数点集、噪声波数点集,在“相关波数点集”、“无关波数点集”中选取波数点集,建立校正模型,采用正交投影来判断新选入的波长变量的重要性。该方法克服线性相关性、有效降低数据维数、最大限度提取解释信息,确保建立的校正模型校正具有较高的稳健性。
【专利说明】基于连续投影算法的近红外波长变量选择方法
【技术领域】
[0001]本发明涉及一种对石油或农产品品质进行分析的近红外波长变量选择方法,具体涉及基于连续投影算法的近红外波长变量选择方法,属于分析化学【技术领域】。
【背景技术】
[0002]近红外分析技术是分析化学领域迅猛发展的高新分析技术,其具有无破坏、无污染、分析重现性好、成本低等优点,广泛应用于石油化工、农业、食品等行业。例如在石化领域测定油品辛烷值,农业领域测定谷物的蛋白质、脂肪等含量。但是,近红外区域(780-2526nm)主要体现含氢基团(_0H、-NH、-CH)的合频和各级倍频的吸收,具有信息强度弱、谱峰重叠等缺点,而且波长点之间存在严重的线性关系,导致建模失败。
[0003]在实际应用中,常使用全光谱建模如PCR、PLS等。但是,光谱中的某些波长不仅对分析建模没有贡献,而且会提高模型的复杂度、降低其稳健性。常用的方法:采用将近红外全光谱分成若干个子区间,以区间为单位进行波长变量选择,如基于模拟退火算法的近红外光谱波长子区间选择办法(专利号:201010123945.4),或采用全局寻优算法来找出最佳波长变量,如一种蚁群优化算法的近红外光谱特征波长选择方法(专利号:201310269615.X)。但是,上述方法 对于子区间个数的确定是个难点,并且需要不停的迭代计算,以确定最佳子区间个数,导致其存在计算时间偏高、运行效率偏低;同时划分子区间存在一定的主观性,导致模型稳健性不佳。

【发明内容】

[0004]为了克服现有技术的不足,本发明提出了一种基于连续投影算法的石油、农产品品质近红外光谱波长变量选择方法。利用权重值方法,将全谱分成三类:相关波数点集、无关波数点集、噪声波数点集,在“相关波数点集”、“无关波数点集”中选取波数点集,建立校正模型。该方法克服线性相关性、有效降低数据维数、最大限度提取解释信息,确保建立的校正模型校正具有较高的稳健性。
[0005]本发明的技术方案包含如下步骤:
[0006](A)对近红外光谱进行预处理,消除数据采集过程中因仪器本身的信号漂移、环境变化引起的噪声;对校正集和验证集样本进行划分,从样本集中选择光谱代表性强的样本、浓度范围广的样本作为校正集;
[0007](B)利用预处理后的校正集近红外的全谱建立校正模型,设权重值为W,将其作为阈值,计算全谱X的权重值W,其计算如公式(I)所示;
【权利要求】
1.基于连续投影算法的近红外波长变量选择方法,其特征在于:包括如下步骤: (A)对近红外光谱进行预处理,对校正集和验证集样本进行划分; (B)利用预处理后的校正集近红外的全谱建立校正模型,设权重值为W,将其作为阈值,计算全谱X的权重值W,其计算如公式(I)所示;
【文档编号】G06F19/00GK103927438SQ201410145445
【公开日】2014年7月16日 申请日期:2014年4月11日 优先权日:2014年4月11日
【发明者】刘永福, 徐泽宇, 赵健, 林远长, 何国田, 石珍, 朱晓强, 吴姣娇 申请人:中国科学院重庆绿色智能技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1