一种基于近红外光谱特征的烟叶风格相似性分类方法与流程

文档序号:12118520阅读:584来源:国知局
一种基于近红外光谱特征的烟叶风格相似性分类方法与流程

本发明属于近红外无损检测技术领域,具体涉及一种基于近红外光谱特征的烟叶风格相似性分类方法,用于烟叶风格的区分识别。



背景技术:

近红外(Near Infrared),简称NIR,谱区是介于可见光(VIS)和中红外(MIR)谱区之间的电磁波,是人们认识最早的非可见光区域。根据美国实验和材料协会(ASTM)的规定,其波长范围为780~2526mn。分子在NIR区的吸收主要由C-H、0-H、N-H和C=0等基团的合频吸收与倍频吸收组成,此区的吸收强度低、谱带复杂、重叠严重,无法使用经典定性、定量的方法,必须借助化学计量学中的多元统计、曲线拟合、聚类分析等方法进行定标建模,并结合合适的模型实现快速多组分分析。NIR光谱技术具有分析过程高效、绿色、环保的现代分析特征,因而成为近年来发展较快、引人注目的光谱分析技术之一。在烟草行业,近红外检测技术比较普遍地应用于烟叶中的烟碱、总糖、还原糖、总氮、钾、氯含量等常规化学成分的检测。其原理是由于近红外光对C-H、N-H、O-H等含氢基团有吸收,据理论推断,烟叶中多达80%~90%以上的化学成分是可能应用近红外技术进行研究和检测的,近红外光谱所包含的烟草化学成分的关联信息非常丰富,基于近红外信息进行烟叶聚类分析和模式识别具有可靠的物质基础。近年来,该技术也逐渐被国内烟草行业应用于原料、辅料的质量控制和卷烟品质检测等方面,但尚未见报道将其用于烟叶风格相似性分析方面的研究。

烟叶的风格特征是烤烟型卷烟设计及烟叶选择使用的重要依据,不同地区烟叶具有不同的香气特征,但是由于烟叶和烟气成分的复杂性,烟叶风格类型的区分判断还只能依靠感官评吸的这种经验方法。如今已有文献报道近红外光谱信息可以识别不同产地的烟叶,即可在烟草近红外光谱信息中捕捉到与地区风格特征具有紧密关系的数据信息用于描述不同烟叶的风格特征,实现烟叶风格特征的客观描述和识别,建立该区域烟叶风格的PCA区分模型,并利用模型对不同产区的烟叶进行风格相似性分析,为紧缺产区烟叶的替代提供科学依据,从而在技术上支持和辅助卷烟的配方设计。



技术实现要素:

本发明的目的是提供一种能够快速、简便、准确区分烟叶风格的方法。本发明操作简单、易于操作,环保无污染。

本发明提供的一种基于近红外光谱特征的烟叶风格相似性分类方法,其包括以下步骤:

首先收集建模样品:样品信息按照品种、种植区域和等级进行分类;然后进行烟叶光谱扫描,将扫描的同种植区域、同品种、不同部位的烟叶光谱,通过主成分分析法提取每个光谱的特征,然后对所有的近红外光谱按行排列,获得数据矩阵,对矩阵进行主成分分析,通过特征向量计算出主成分,通过计算相关数据,确定分类线,建立该区域烟叶风格的PCA区分模型。

所述PCA区分模型的建立包括如下步骤:

(1)光谱扫描;

(2)光谱预处理;

(3)导出光谱数据;

(4)建立数据矩阵;

(5)主成分分析:通过特征向量计算出主成分,分析并保留;

(6)计算所保留主成分的均值,以此均值作为该区域烟叶风格的区分模型的中心;

(7)计算所有该区域烟叶到此中心的距离,并计算所有距离的均值和标准偏差,以平均值加1.2倍标准偏差作为该区域烟叶风格的分类线;

(8)建立PCA模型。

本发明提供的一种基于近红外光谱特征的烟叶风格相似性分类方法,PCA区分模型的建立优选技术方案为:

(1)光谱扫描:利用近红外光谱仪扫描烟叶样品获得其近红外谱图,操作参数为:光谱扫描范围12 000~4 000cm-1,光谱分辨率8cm-1,扫描次数64次(约30s)。以透过方式采集光谱数据并处理为吸收光谱的一阶微分。每个样品扫描10次取平均光谱,每个样品扫描获得2个以上的平均光谱;

(2)光谱预处理:采用标准正态变量变换法消除固体样品颗粒大小、表面散射以及光程变化对带来的差异,通过小波变换对光谱进行平滑滤噪,采用二阶导数处理原始光谱,消除基线漂移,提高光谱分辨率,并提取特征光谱;

(3)导出光谱数据:将12 000~4 000cm-1光谱范围的数据点导出;

(4)建立数据矩阵:将同区域的烟叶近红外光谱按行排列,获得数据矩阵;

(5)主成分分析:通过特征向量计算出主成分,分析并保留;

(6)计算所保留主成分的均值,以此均值作为该区域烟叶风格的区分模型的中心;

(7)计算所有该区域烟叶到此中心的距离,并计算所有距离的均值和标准偏差,以平均值加1.2倍标准偏差作为该区域烟叶风格的分类线。

(8)建立PCA模型:利用正常状态下采集的光谱建立模型,公式如下:

式中:X(m×n)代表m条光谱n个波长点的光谱数据矩阵,Ti为得分向量,Pi为载荷向量。A为因子数,E为误差项,上表T表示矩阵得转置。

本发明同时提供了一种应用上述模型对未知烟叶样品风格进行识别的方法,按照以下步骤进行:

(1)扫描并获得该样品的近红外光谱;

(2)根据光谱的特征向量计算出该烟叶样品的主成分;

(3)计算主成分到所建模型中心的距离,根据距离判断风格相似性,若该距离落在分类识别线内,则可判定该烟叶风格与所建模型风格相似,否则判定其为不同风格。

本发明提供的一种基于近红外光谱特征的烟叶风格相似性分类方法,与现有技术相比,具有如下显著的进步:

1、本发明利用近红外光谱特征结合主成分分析对烟叶的风格特征进行描述,建立不同区域烟叶风格相似性分类识别模型。

2、本发明实验过程不使用有毒有害化学品,简便、快捷、对样品无破坏性、对环境无污染。

3、本发明具有操作简便、快速、准确、成本低、效率高的优点。

附图说明

图1是本发明的建模流程图;

图2是烟叶的近红外扫描原始谱图;

图3是GZ产区烟叶近红外光谱建立的识别模型;

具体实施方式

下面结合附图对本发明的具体实施方式作进一步详细说明。

实施例1

1、实验仪器

BRUKER公司(德国)生产的MPA型傅里叶近红外光谱仪,1095Cyclotec(XF-98B)型旋风精密粉碎机。

2、样品采集

为了使建立的分类模型具有广泛的适用性,本实施例样品选取了2012~2015年GZ产区、同一等级的初烤把烟样品共计90个样品用于建立GZ产区烟叶风格模型,选取15个未知样品对模型进行外部验证。

3、样品制备

将烟叶置于40℃的烘箱中烘干,使样品的水份基本保持一致,再用1095Cyclotec(XF-98B)型旋风精密粉碎机充分粉碎,过60目筛。

4、光谱扫描和数据处理

烟叶样品谱图扫描采用BRUKER公司(德国)生产的MPA型傅里叶近红外光谱仪(带近红外定量分析漫反射镀金大积分球和样品旋转器采样附件)进行,应用Bruker OPUS中定性分析软件QUANT6.5对谱图进行处理。具体操作如下:将烟草粉末装入样品杯,在杯中的高度约为3cm,将砝码压在样品上10s后取出,用纱布将杯子底部的石英玻璃擦拭干净,然后将样品杯置于旋转平台上进行NIR扫描。操作参数为:光谱扫描范围12 000~4 000cm-1,光谱分辨率8cm-1,扫描次数64次(约30S)。以透过方式采集光谱数据并处理为吸收光谱的一阶微分。卷烟烟丝的原始扫描图见图2。在建模过程中,为消除噪音和基线的影响,采用标准正态变量变换法消除固体样品颗粒大小、表面散射以及光程变化对带来的差异,通过小波变换对光谱进行平滑滤噪,采用二阶导数进行预处理。样品扫描后,用统计学软件对光谱数据进行处理。

5、模型建立

模型的建立步骤如下:

(1)光谱扫描:利用近红外光谱仪扫描烟叶样品获得其近红外谱图,操作参数为:光谱扫描范围12 000~4 000cm-1,光谱分辨率8cm-1,扫描次数64次(约30s)。以透过方式采集光谱数据并处理为吸收光谱的一阶微分。每个样品扫描10次取平均光谱,每个样品扫描获得2个以上的平均光谱,

(2)光谱预处理:采用标准正态变量变换法消除固体样品颗粒大小、表面散射以及光程变化对带来的差异,通过小波变换对光谱进行平滑滤噪,采用二阶导数处理原始光谱,消除基线漂移,提高光谱分辨率,并提取特征光谱;

(3)导出光谱数据:将12 000~4 000cm-1光谱范围的数据点导出;

(4)建立数据矩阵:将同区域的烟叶近红外光谱按行排列,获得数据矩阵;

(5)主成分分析:通过特征向量计算出主成分,分析并保留;

(6)计算所保留主成分的均值,以此均值作为该区域烟叶风格的区分模型的中心;

(7)计算所有该区域烟叶到此中心的距离,并计算所有距离的均值和标准偏差,以平均值加1.2倍标准偏差作为该区域烟叶风格的分类线。

(8)建立PCA模型:利用正常状态下采集的光谱建立模型,公式如下:

通过对扫描的产区烟叶光谱进行主成分分析,

所建立的GZ产地烟叶近红外光谱建立的识别模型见图3。

5、模型的预测效果

为了检验以上所建模型预测的准确性,从广西中烟物资采购中心随机抽取了15个2014年的GZ产地不同地市(均在模型预测的产地范围)的烟叶样品,对模型的鉴定能力进行了外部检验,样品经处理后,用近红外进行光谱采集,最后用所建的产地鉴别模型对光谱进行了产地预测,结果见表1。

表1“GZ”产地烟叶特征模型的识别结果

从上表可以看出,模型对15个样品中的个预测到14个正确的产地,产地鉴别正确率达到93%,说明模型产地预测精度很高。

实施例2建立近红外烟叶风格分类模型

1、实验仪器

BRUKER公司(德国)生产的MPA型傅里叶近红外光谱仪,1095Cyclotec(XF-98B)型旋风精密粉碎机。

2、样品采集

本实施例样品分别选取了2012~2015年与建模的GZ产区相近的GX产区和YN产区不同等级的初烤把烟样品共计105个样品,用于所建模型不同产地烟叶风格相似性分析。

3、烟叶风格相似性预测效果

本实施例中样品的制备、光谱扫描级模型建立方法同实施例一,从105个不同产地不同等级烟叶中共筛选出8个与所建模型烟叶风格相似的样品,具体分析结果见表2,对选择出的相似样品,通过感官评吸,与待替代样品进行感官评吸对比以确认能否替代(表2)。

表2烟叶风格相似性识别结果

从上表可以看出,模型从105个邻近产地样品中的预测到8个风格相似样品,通过评吸验证,识别出的样品均可用于替代,说明模型对于烟叶风格相似性的预测精度较高。

通过上述实施例可以看出,本发明利用近红外光谱特征结合主成分分析法建立的模型,对烟叶产地的预测准确率高达90%以上,对烟叶风格相似性的识别及替代率较高,由此可见,应用近红外分析技术能够很好用于烟叶风格相似性分析,是一种有效可行的方法,具较强的实用性和现实意义。

本发明的上述实施例仅仅清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动,这里无法对所用的实施方式予以穷举,凡是属于本发明技术方案所引申出的显而易见的变化或变动仍处于本发明的保护范围之列。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1