基于近红外光谱鉴别染色橙的方法与流程

文档序号:14247732阅读:605来源:国知局
基于近红外光谱鉴别染色橙的方法与流程

本发明涉及食品染色鉴定领域,具体涉及一种基于近红外光谱鉴别染色橙的方法。



背景技术:

近年来,食品染色给消费者带来安全隐患,也给监管部门带来压力。目前,部分市场出现“染色脐橙”,同时给脐橙产业带来较大的负面影响。而国内外在脐橙方面的研究多集中于内在品质指标检测(如总糖、总酸、糖酸比、可溶性固形物等)农药残留检测及重金属检测,对脐橙染色剂的检测方面相对较少,现有检测方法多采用高效液相色谱技术,该方法前处理步骤繁琐,检测成本高时间长。



技术实现要素:

本发明的目的是提供一种基于近红外光谱鉴别染色橙的方法,本发明方法既快速简便,又无需进行复杂的样品前处理,可以满足市场监管部门快速检测的要求。

本发明的目的是通过如下方案实现的:

一种基于近红外光谱鉴别染色橙的方法,包括如下步骤:

(1)采集数据并建立定性模型:采集橙子样品表面采集点的光谱数据,将所述的光谱数据分为预测集和校正集,建立定性模型;

(2)主成分分析:进行光谱校正,根据校正图像中定性模型的聚类来确定主成分,将具有相关性的自变量进行数据降维;

(3)通过主成分分析鉴别染色橙。

进一步的,所述的采集点位于橙子的肩部和赤道部。

进一步的,采集点的数量不少于20个,每个采集点的采集数据条数不少于200,所述的预测集与校正集的数据条数比值为1∶9其中预测集数据条数不少于200。

进一步的,所述的光谱校正包括对高频随机噪音、基线漂移、样本不均匀、光散射的校正。

进一步的,所述的光谱校正方法包括噪声数学校正和散射校正。

进一步的,所述的噪声数学校正包括移动平均数、中值滤波和s-g平滑。

进一步的,所述的散射校正包括标准化和多元散射校正。

进一步的,主成分分析是将原来具有相关性的自变量,通过线性组合的方式重新组合成一组线性无关的综合变量来代替所述的自变量,实现数据降维。

与现有技术相比,本发明方法至少具有如下有益效果:

本发明基于近红外光谱技术,采用主成分分析法,将原来具有相关性的自变量,通过线性组合的方式重新组合成一组线性无关的综合变量来代替所述的自变量,实现数据降维,使得染色橙的鉴别既快速简便,又无需进行复杂的样品前处理,可以满足市场监管部门快速检测的要求。

附图说明

图1为本发明实施例1中五类脐橙样品的近红外光谱曲线;

图2为本发明实施例1中移动平均数处理方式对建模效果的影响;

图3为本发明实施例1中中值滤波处理方式对建模效果的影响;

图4为本发明实施例1中s-g平滑处理方式对建模效果的影响;

图5为本发明实施例1中标准化处理方式对建模效果的影响;

图6为本发明实施例1中多元散射校正处理方式对建模效果的影响;

图7为本发明实施例1中主成分解释程度图;

图8为本发明实施例2中600个校准集样品的主成分1和2的得分图。

具体实施方式

下面结合具体实施例对本发明作进一步详细描述,但不作为对本发明的限定。

一种基于近红外光谱鉴别染色橙的方法,包括如下步骤:

(1)采集数据并建立定性模型:采集橙子样品表面采集点的光谱数据,将所述的光谱数据分为预测集和校正集,建立定性模型;

(2)主成分分析:进行光谱校正,根据校正图像中定性模型的聚类来确定主成分,将具有相关性的自变量进行数据降维;

(3)通过主成分分析鉴别染色橙。

以上方案已经可以实现染色橙的快速鉴别,下面在此基础上给出优选方案:

作为优选,所述的采集点位于橙子的肩部和赤道部。具体采集方法:从每个果实赤道部(脐橙最大横向直径处)选择3个相距约120度的点测定果面反射光谱,将平均值作为一个该果实的一个光谱数据,从果实肩部选取3个相距约120度的点测定果面反射光谱,将平均值作为一个该果实的一个光谱数据。采用多检测点平均光谱数据更具有代表性,所建预测模型的精度更高。

作为优选,采集点的数量不少于20个,每个采集点的采集数据条数不少于200,所述的预测集与校正集的数据条数比值为1∶9,其中预测集数据条数不少于200。

作为优选,所述的光谱校正包括对高频随机噪音、基线漂移、样本不均匀、光散射的校正。

作为优选,所述的光谱校正方法包括噪声数学校正和散射校正。

作为优选,所述的噪声数学校正包括移动平均数、中值滤波和s-g平滑。

作为优选,所述的散射校正包括标准化和多元散射校正。

作为优选,主成分分析是将原来具有相关性的自变量,通过线性组合的方式重新组合成一组线性无关的综合变量来代替所述的自变量,实现数据降维。

这里要说明的是:采用主成分分析法,将原来具有相关性的自变量,通过线性组合的方式重新组合成一组线性无关的综合变量来代替所述的自变量,实现数据降维,使得染色橙的鉴别既快速简便,又无需进行复杂的样品前处理,可以满足市场监管部门快速检测的要求。

下面是具体实施例

仪器设备

实验使用jdsu公司的micronir1700光谱仪,采样间隔为29ms,测定范围900~1700nm,扫描次数100次。

光谱数据分析软件为theunscrambler9.7。

样品及采集方法

实验共采集五类脐橙样品,分别为未染色脐橙、经sudani染色脐橙、经sudanii染色脐橙、经sudaniii染色脐橙、经sudaniv染色脐橙,各取40个,共计200个样品。采集光谱时检测探头与待测果实表面垂直,从每个果实赤道部(脐橙最大横向直径处)选择3个相距约120度的点测定果面反射光谱,将平均值作为一个该果实的一个光谱数据,按此方法采集5次,从果实肩部选取3个相距约120度的点测定果面反射光谱,将平均值作为一个该果实的一个光谱数据,按此方法采集5次,每个样品共计10条样品数据。从每类光谱数据中随机抽取40个光谱数据作为预测集,剩下的360个光谱数据作为校正集。每类脐橙分别建立定性模型,共计五个模型。

表1样品数据表

为了去除来自高频随机噪音、基线漂移、样本不均匀、光散射等影响,需要进行光谱预处理。移动平均数(movingaverage)、中值滤波(medianfilter)、s-g平滑(s-golay)是常采用的滤波方法,成为数字滤波,是对光谱中随机噪声的数学校正。由于食品样品存在较多的散射介质,再加上样品状态、装样条件、仪器测量系统、操作参数、测量环境等特征的影响,散射光谱各个波长点与待测量浓度间是一种复杂的多元关系,而变动的背景使得这种关系难以量化,因此需要对其进行散射校正,常用的校正散射影响的方法有标准化(normalize)、多元散射校正(multiplicativescattercorrection,msc)等。msc法认为每一条光谱都应该与“理想”光谱成线性光谱,而真正的“理想”光谱无法得到,可以用校正集的平均光谱来近似。经msc校正的光谱并不就是样品的真实光谱,只能说通过这样的校正,随机变量得到最大可能的扣除。在光谱与浓度线性较好和化学性质相似的情况下,msc校正的效果较好。

主成分分析

主成分分析是设法将原来众多具有一定相关性的自变量,通过线性组合的方式重新组合成一组较少的线性无关的综合指标来代替原来的指标,新变量能反映原变量的绝大部分信息。通过这种方式达到数据降维的目的。

实验结果与分析

五类脐橙的典型近红外光谱曲线如图1所示。图1中横坐标为波长,范围是900~1700nm,纵坐标为光谱漫反射率。从图1中可以看出,不同类别染色橙的光谱曲线有明显区别,并具有一定的特征性和指纹性,这一差异为茶叶的不同品种鉴别奠定了数学基础。

图2-图6为900个校准集样品的主成分1和2的得分图,图2-6中横坐标表示每个样本的第一主成分得分值,纵坐标表示每个样本的第二主成分得分值;其中,u表示未染色脐橙;s1表示经sudani染色脐橙;s2表示经sudanii染色脐橙;s3表示经sudaniii染色脐橙;s4表示经sudaniv染色脐橙。在建模过程中,分别采用移动平均数(movingaverage)、中值滤波(medianfilter)、s-g平滑(s-golay)、标准化(normalize)、多元散射校正(multiplicativescattercorrection,msc)等方式对光谱数据进行了处理,不同处理方式的主成分得分图上图所示。由图2-5中可以看出,采用移动平均数、中值滤波、s-g平滑、标准化等数据处理方式所建模型的分类效果不明显,未染色脐橙、经sudani染色脐橙、经sudanii染色脐橙、经sudaniii染色脐橙、经sudaniv染色脐橙这五类脐橙重叠在一起。因此本研究中先采用移动平均数(movingaverage)滤除各种因素产生的高频噪音,再进行多元散射校正(msc),数据通过该处理后能较好的聚类,五种不同类别的脐橙被明显的分成五个区域,前两个主成分的累计贡献率约为99%,说明主成分1和2对染色橙有很好的聚类作用,如图6所示。图6中,五种类别脐橙呈条状聚类,五类样本点分布在五个平行的聚类块中,经sudani染色脐橙、经sudanii染色脐橙、经sudaniii染色脐橙、经sudaniv染色脐橙这四类染色橙被明显分成四类,这四类染色橙的聚合度很好,但经sudani染色脐橙和未染色脐橙的分界线不如前面几种清晰,分析原因在于前两个主成分还不能很好的区分,需要其他成分协助分析。

主成分分析的目的是将数据降维,以消除众多信息共存中相互重叠的信息部分。通过对原始大量光谱变量进行转换,使数目较少的新变量成为原变量的线性组合,而且,新变量能最大限度的表征原变量的数据结构特征,并不丢失信息。对五类脐橙样品共计900个样本进行主成分分析聚类。分析表明前两个主成分的累计贡献率达98.587%,对染色橙样品有很好的聚类作用,能定性区分不同染色剂染色橙以及是否染色。样品光谱从900~1700nm共有125个点,采用这些点进行计算时计算量大,通过主成分分析,选取对于染色橙类别敏感的主成分建立染色橙鉴别模型,可提高计算速度和分类准确度。图7所示为前10个主成分对原始变量的解释程度。横坐标表示主成分数量,从左到右依次为pc1到pc10。纵坐标表示主成分的累积可信度,即主成分能够解释原始波长变量的程度。由图7可知,前6个主成分能够解释原始波长变量的99.919%,说明前6个主成分可代表原来125个变量,说明主成分分析是一种非常有效的数据挖掘方法,它把原来的125个波长变量压缩成了彼此正交的新变量,这6个新变量能够代表绝大部分原变量包含的信息,且彼此互不影响。

表2未知样品的预测结果

注:0-未染色脐橙;1-经sudani染色脐橙;2-经sudanii染色脐橙;3-经sudaniii染色脐橙;4-经sudaniv染色脐橙;/-未识别样品(significance=5%)

采用主成分分析法分别建立五类脐橙的鉴别模型,用所建模型对100个未知样本(每类各20个)进行预测,预测结果如表2所示。0-4分别代表未染色脐橙、经sudani染色脐橙、经sudanii染色脐橙、经sudaniii染色脐橙、经sudaniv染色脐橙五类脐橙,模型识别率依次为:95%、90%、100%、90%、95%,总模型识别率达到了94%。由此可见,采用主成分分析法建立染色橙快速鉴别模型是可行的。

采用移动平均数与多元散射校正相结合的方法对光谱数据进行处理,利用主成分分析建立未染色脐橙、经sudani染色脐橙、经sudanii染色脐橙、经sudaniii染色脐橙、经sudaniv染色脐橙五类脐橙的近红外判别模型,模型识别率为94%。结果表明,近红外分析技术应用于染色橙的快速鉴别是可行的,而且检测效率和准确率较高,在染色橙快速鉴别方面有很大的应用前景,为染色橙市场监管提供一种快速的检测手段。

实施例2

仪器设备

实验使用jdsu公司的micronir1700光谱仪,采样间隔为33.6ms,测定范围900~1700nm,扫描次数100次。

光谱数据分析软件为theunscramblerx10.4。

样品及采集方法

实验共采集两类脐橙样品,分别为未染色脐橙和染色脐橙(经sudanii染色脐橙),分别取40个和20个,共计60个样品,采集光谱时检测探头与待测果实表面垂直,从每个果实赤道部(脐橙最大横向直径处)选择3个相距约120度的点测定果面反射光谱,将平均值作为一个该果实的一个光谱数据,按此方法采集5次,从果实肩部选取3个相距约120度的点测定果面反射光谱,将平均值作为一个该果实的一个光谱数据,按此方法采集5次,每个样品共计10条样品数据,共计600条样品数据。从每类光谱数据中随机抽取50个光谱数据作为预测集,剩下的500个光谱数据作为校正集。

表1样品数据表

在近红外分析过程中,采集的样品光谱信息可能存在失真,必须对光谱数据进行预处理,除去来自随机噪声、不均匀性、基线漂移、谱峰叠加、光散射等影响。移动平均数(movingaverage)、中值滤波(medianfilter)、s-g平滑(s-golay)是常采用的滤波方法,称为数字滤波,是对光谱中随机噪声的数学校正。由于脐橙等食品样品存在较多的散射介质,同时又受样品状态、采集条件、仪器条件、操作条件和环境等特征的影响,光谱中各个波长点与待测量浓度间呈现一种复杂的多元关系,而背景带来的影响会大大加大分析难度,因此需要对其进行散射校正,常用的校正散射影响的方法有标准化(normalize)、多元散射校正(multiplicativescattercorrection,msc)等。msc法认为样品的“理想”光谱虽不可以得到,但可以用校正集的平均光谱来近似,通过校正可将随机变量得到最大程度的扣除。

偏最小二乘回归

偏最小二乘回归(pls)是构造回归方程的一种方法,采取成分提取的工作方式,首先从自变量矩阵中提取主成分矩阵,主成分矩阵一方面能最好的概括原有自变量矩阵中信息,又能对因变量的解释能力达到最大。

实验结果与分析

未染色脐橙和染色脐橙的典型近红外光谱曲线如图1所示。图1中横坐标为波长,范围是900~1700nm,纵坐标为光谱漫反射率。从图1中可以看出,未染色脐橙和染色脐橙的光谱曲线有明显区别,并具有一定的特征性和指纹性,这一差异为染色橙的快速鉴别奠定了数学基础。

图8为600个校准集样品的主成分1和2的得分图,图中横坐标表示每个样本的第一主成分得分值,纵坐标表示每个样本的第二主成分得分值;在建模过程中,分别采用移动平均数(movingaverage)、中值滤波(medianfilter)、s-g平滑(s-golay)、标准化(normalize)、多元散射校正(multiplicativescattercorrection,msc)等方式对光谱数据进行了处理,多元散射校正(msc)建模效果最佳,因此,采用多元散射校正(msc)对光谱数据进行预处理。由图1中可以看出,采用偏最小二乘(pls)的方法所建模型的分类效果明显,未染色脐橙和染色脐橙呈片条状分布,分布在两个聚类块中,不同类别脐橙的聚合度很好,该模型的均方根误差(rootmeansquarederrorofcalibration,rmsecv)较低,约为0.043,相关系数r2达到0.9917,建模效果较好。

以上实施例仅为本发明的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1