一种基于近红外光谱技术鉴别不同品牌和段数奶粉的方法与流程

文档序号:11588062阅读:593来源:国知局

技术领域:

本发明涉及一种基于近红外光谱技术鉴别不同品牌和段数奶粉的方法,属于奶粉鉴别技术领域。



背景技术:

奶粉作为重要的乳制品,是婴幼儿的重要营养摄取途径。作为祖国的未来,社会各界有义务充分保障婴幼儿的食品安全和品质。奶粉的安全及品质决定着婴幼儿的身体健康。

近年来,奶粉安全事故不断出现,2008年的“三鹿奶粉”事件令社会震惊和痛心,也给我国奶制品产业蒙上了阴影。父母们逐渐将目光转向洋品牌。洋品牌由于其奶源优质、质量稳定逐渐受到父母们的青睐。近几年,随着海淘、海代的迅速发展,喝到洋奶粉成为安全可靠的代名词。2016年4月,上海警方破获了一起假冒奶粉案,查获假冒雅培奶粉1.7万罐。与此同时,食药监总局在官网回应称,警方已对查获的冒牌奶粉进行检验,产品符合国家标准,并不存在安全风险。这次事件是不法分子将合格奶粉换包装后卖出,以赚取差价的不法行为。他们把国产品牌换成进口品牌,把小品牌换成大品牌。虽然没有造成婴幼儿身体的损伤,但给消费者带来了经济损失,也侵害了被侵权企业的利益。

近红外光谱技术是20世纪50年代发展起来的一项分析检测技术,以快速、无损、绿色、安全等特点迅速在各行业得到广泛应用。近年来,国内外很多学者尝试应用近红外技术检测奶粉中营养成分、风险指标或奶粉掺假物质。例如:常敏等等采用近红外漫反射光谱检测奶粉中蛋白质含量。通过波长优选和数据预处理方法选择,建立了快速测定不同种类奶粉蛋白质含量的近红外快速检测方法。钱枫通过近红外技术,建立了测定奶粉中是否含有添加三聚氰胺的预测模型,取得了较好的效果。唐玉莲应用线性判别快速无损鉴别结合近红外光谱鉴别婴幼儿和中老年奶粉,对不同品牌的中老年和婴幼儿奶粉两种不同年龄段奶粉品种进行了判定,对未知样品的预测相对偏差均为5%以下,识别率达到100%。

以上例子中,将近红外光谱技术应用于奶粉质量的检测和判定中,但存在以下不足:1、奶粉质量是一个复杂的综合性指标,仅通过检测奶粉中一种或几种有效成分含量,不能全面反映奶粉质量。2、奶粉中添加的外源性物质种类繁多,不法商贩添加大豆蛋白、糊精、三聚氰胺、麦芽精等物质以提高奶粉中蛋白质检测含量,为使掺假奶粉达到奶粉产品检测标准的目的。但该类方法需要在建立模型时自行配制掺假样品或用实际掺假样品作为建模样本,操作难度大,无法满足识别不同种类掺假物质的需求。3、通过建立真假奶粉或特定品牌的奶粉的近红外判别模型,可以识别不同品牌奶粉。但对于同一品牌的不同段数或不同产地的奶粉鉴别存在对象局限,无法满足打击五花八门的造假情形的要求。4、奶粉品牌和段数种类复杂、版本繁多,仅仅通过一种方法鉴别便下结论,可能会有误判的现象的产生,

偏最小二乘-判别分析(pls-da)方法是一种有监督的线性回归方法,具有压缩数据并提取特征信息的优良性能,以二进制的类别变量作为y变量,是基于pls的判别分析方法。在构造因素时考虑到了辅助矩阵以代码形式提供了类成员信息,因此具有高效的鉴别能力。

pls-da是一种基于偏最小二乘的有监督的模式识别方法,它利用先验分类知识,建立一个pls-da分类模型,然后利用该类模型判别待测样品的归属。其主要过程如下:

选择适量的已知类别样品光谱作为训练集。在训练集中,对任意一个样品的光谱xi可用矢量表示为:

xi=[xi1xi2…xin]

对m个样品构成的样品集,可构成一个m×n阶的光谱数据矩阵:

将m个样品的类别设定为响应变量,并进行量化,本类取值为1,非本类取值为0,这样,就可以得到m×1阶的类别矩阵ym×1。

通过偏最小二乘法,建立光谱矩阵与类别矩阵的偏最小二乘类模型:

ym×1=xm×nbn×1

式中,bn×1为回归系数矩阵。

对于待测样品xnew,可根据下式来计算待测样品的类别值:

ynew=xnewbn×1

对ynew进行取整之后,根据其大小,可以准确的判别待测样品的类别。判别规则为:①当ynew>0.5,且偏差<0.5时,判定样品属于本类;②当ynew<0.5,偏差<0.5时,判定样品不属于本类;③当ynew的偏差≥0.5,判定不稳定。

pls-da分类算法的一般处理流程为:

(1)对光谱数据进行光谱前处理,如求导、中心化等,以消除影响;

(2)应用偏最小二乘法建模;

(3)剔除异常样品,重复运算、交互性验证,确定类模型的适宜主成分数;

(4)利用类模型预测待测样品;

(5)根据预测结果,使用判别规则判断类别。

此种算法过程较为复杂,且鉴定结果存在一定的误差。

hotellingt2统计量表征的是对主成分模型内部变化的一种测度。通过主成分模型内部的主成分向量模的波动来反映多变量变化的情况,它表示多变量数据的均值与采样数据点在主成分平面上映射点之间的距离。如果t2统计量超出控制限,则说明其样本质量有异常,否则样本质量正常。hotellingt2统计量具有各种各样的优良性,它是一致最强的不变检验,具有允许性与极小化极大风险的性质等优良性。

应用近红外光谱仪,采集不同来源样品的近红外光谱数据,即可构成样本的光谱数据集。对所采集的任意一个样本均可用一组参量来表征,这些参量其实就是原始的光谱数据,可用矢量表示为:xi=[xi1xi2。。。xin]。那么,对m个样本构成的样本集,就可表达为m×n阶的光谱数据矩阵xm×n,在矩阵xm×n中,既包含样本性质的信息,也包含样本特征或变量的信息。从数学角度来看,样本集可由特征坐标轴构成的n维特征空间中的点集来表示。一个样本对应一个点,n个特征包含了样本性质的全部信息,样本与样本之间的关系、变量与变量之间的关系以及样本与变量之间的关系等,就是多变量分析要处理的3个基本问题。多变量分析中,采用主成分分析建立不同类别样品的类模型,可表征在样本集中样本与样本之间、样本与类之间的隐含关系。主成分分析(pca)按下式(1)对光谱数据矩阵进行分解,

式中ti代表xm×n的得分向量;pi代表xm×n的载荷向量;a为因子数;t表示矩阵的转置;e代表xm×n的误差项。

对矩阵xm×n进行t2检验,t2检验是一种常用的多变量检验方法,是一种多元分析中对均值差异的显著性检验,假设h0∶μ1=μ2=…=μp,分别计算出各变量的均值构成的均向量及协方差阵v,则hotellingt2的统计量各均向量比较的hotellingt2统计量与统计量f有如下关系:

由f分布作出判断。

在实际的样品类别判定过程中,此种方法对样品进行类别预测,存在一定的局限性。对于边界样品,会因为各种因素影响,导致一定几率的误判,使模型识别能力下降。

因此目前现阶段需要寻找一种安全可靠的,测定结果准确的且操作简单快捷的奶粉品牌和段数的检测方法。



技术实现要素:

针对上述问题,本发明要解决的技术问题是提供一种简便、快速、利用近红外光谱仪,无须专业检测人员即可快速对未知奶粉品牌和段数进行鉴别的方法。

本发明的基于近红外光谱技术鉴别不同品牌和段数奶粉的方法为:步骤一、近红外原始光谱采集:收集不同品牌和段数的正品合格奶粉,在恒温恒湿条件下,利用近红外光谱分析仪,分别采集不同类型奶粉的近红外漫反射光谱,光谱采集范围为:波数在12000cm-1-4000cm-1之间;

步骤二、选取原始光谱波段内特征明显的光谱波段或波长为建模波段或波长;

步骤三、光谱预处理:对建模波段或波长,采用多元散射校正、标准正态变化、微分、平滑等方法中的一种或几种对光谱进行预处理,以去除光谱噪声,提高信噪比,达到理想的建模效果;

步骤四、pls-da分类模型的建立:将预处理后的样品光谱,按类别用主成分分析法对每一类奶粉样品光谱进行探索性分析,初步剔除光谱异常样品;将每一类样品分为训练集和验证集,对于训练集和验证集的选择,参考gb/t29858《分子光谱多元校正定量分析通则》,用训练集样品建立分类模型,在建模过程中,通过不断优化模型,提高模型的判别能力和稳健性,对异常样品进行识别,选择适宜的主成分数建模;

步骤五、pls-da分类模型的验证:利用验证集对建立的分类模型进行验证,通过识别率评估类模型的判别能力;

步骤六、主成分类模型的建立:按第四步步骤对光谱进行处理,剔除异常样品后,划分训练集和验证集,用训练集样品分别建立每一类奶粉样品的pca类模型,在建模过程中不断优化,选取最适宜的主成分数建模,通过hotellingt2统计量监测未知样品,以hotellingt2统计量的99%置信限作为控制限,95%置信限作为预警限,建立的类模型能确证未知样品是否属于该类别;

步骤七、pca类模型的验证:通过建立的奶粉主成分类模型,提取hotellingt2统计量对不同类型奶粉样本进行验证;

步骤八、奶粉品牌和段数的鉴别:将建立好的奶粉品牌和段数的pls-da模型应用于未知奶粉样品,计算样本类别值,先根据类别值判定奶粉的品牌和段数,再利用pls-da判定结果,调取该类别相应的主成分类模型,提取hotellingt2统计量进行判定,如两种方法判定都属于该类别,则该样品为正品。

本发明的有益效果:本方法通过采集不同品牌和段数的奶粉近红外漫反射光谱,通过对光谱进行预处理,采用化学计量学方法建立判别模型,利用验证集对模型有效性进行验证;将未知奶粉样品的近红外光谱输入模型,计算样品在不同类之间的类别值,按照判定规则初步判定未知样品属于哪一类奶粉。再通过初步判定的该类别主成分类模型,提取hotellingt2统计量进行验证,本方法是一种简便、快速、无损无污染的奶粉品牌和段数的鉴别方法,利用近红外光谱仪,无须专业检测人员即可快速对未知奶粉品牌和段数进行鉴别,可在奶粉流通环节进行推广,实现对奶粉质量的有效监督,防止不法商贩生产、销售假冒、劣质奶粉等现象发生。

附图说明:

为了易于说明,本发明由下述的具体实施及附图作以详细描述。

图1为本发明的检测方法的流程图;

图2为本发明实施例1中不同主成分数建立pls-da模型的统计结果图;

图3为本发明实施例1中a、b、c、d四类样品不同主成分数建立pca类模型的统计结果图;

图4为本发明实施例1中4种奶粉的pls-da模型第一、第二主成分得分示意图。

图5为本发明实施例1中a奶粉的pca类模型第一、第二主成分得分示意图。

图6为本发明实施例1中建立的pls-da模型对a类样品验证集的鉴别结果示意图。

图7为本发明实施例1中建立的pls-da模型对b类样品验证集的鉴别结果示意图。

图8为本发明实施例1中建立的pls-da模型对c类样品验证集的鉴别结果示意图。

图9为本发明实施例1中建立的pls-da模型对d类样品验证集的鉴别结果示意图。

图10为本发明实施例1中a类奶粉建立的类模型对四种奶粉的预测结果示意图。

具体实施方式:

本具体实施方式采用以下实施例来进一步的详细描述。

实施例1,如附图1所示的一种基于近红外光谱分析技术鉴别不同品牌和段数奶粉的方法,包括以下步骤:

步骤一:奶粉近红外光谱的采集:使用傅里叶变换近红外光谱仪采集不同品牌和段数奶粉的近红外漫反射光谱,详细步骤如下:

(1-1)样品准备:购买4种不同品牌1段的婴幼儿奶粉(a奶粉为荷兰产、b奶粉为德国产、c奶粉为新西兰产、d奶粉为德国产),a、b、c、d四种奶粉在不同正规渠道分别购买不同生产日期的样品50个,共计200个。

(1-2)将奶粉样品装入专用采样杯中,放在近红外光谱仪上进行采集,利用计算机上的光谱采集软件得到原始光谱。

(1-3)光谱采集:实验室温度恒温20℃,近红外光谱仪的具体参数:光谱采集范围:12000波数(cm-1)-4000波数(cm-1);分辨率4cm-1,扫描次数:64次,每个奶粉样品扫描1次。

步骤二:选取建模波段:获得的原始光谱的光谱波段,短波区域信息较少,选择8500波数(cm-1)-4100波数(cm-1)作为建模波段。

步骤三:光谱预处理:采用多元散射校正、一阶微分、savitzky-golay滤波对原始光谱进行处理。

步骤四:pls-da模型的建立:对每类样品进行探索性分析,剔除光谱异常样品,使用经步骤三处理过的光谱:(4-1)将设置a、b、c、d四类样品中各样品,属于本类别设置类别为“1”,不属于该类样本类别为“0”,将样品划分为训练集和验证集,每类奶粉的30个奶粉作为训练集样本,共计120个作为训练集建立模型,其余80个样本验证集;(4-2)确定模型主成分数,通过模型的累积解释能力(用r2xcum表示)和模型的预测精度(用累计交互有效性q2cum表示)来确定模型最优主成分数,图2中显示了不同主成分数建模的统计结果,从图2中可以看出,主成分数增加到6时,已对提升模型预测精度的贡献不显著,所以,模型的最佳的主成分数确定为5;(4-3)在模型最佳主成分数条件下建立pls-da模型,利用训练集120个样本进行建模,得到4种奶粉的pls-da分类模型。

步骤五:pca类模型的建立:(5-1)对a、b、c、d四类样品,分别建立各类样品的pca类模型。每类奶粉中的30个样本作为训练集,其余20个作为验证集。(5-2)确定模型主成分数,通过模型的累积解释能力(用r2xcum表示)和模型的预测精度(用累计交互有效性q2cum表示)来确定每类模型最优主成分数,图3中显示了四个类别pca泪模型的不同主成分数建模的统计结果。以a类奶粉模块为例,当主成分数增到5时,新增加的第五主成分对提升模型预测精度的贡献不显著。所以,a类奶粉类模型的适宜主成分数应为4。依次类推,b,c,d类样品类模型的适宜主成分数分别为3、5、3。

步骤六:奶粉品种的判定:计算验证集80个样本分类变量值,按照判定规则判断样本属于哪一类。

利用建立的pls-da模型对验证集种4类80个样本进行了类型判定,结果如附图6-图9所示,a、b、c、d四类样本验证集的鉴别准确率为100%。附图6的验证集样本中,a奶粉样本的分类变量预测值都接近1,偏差小于0.5,其余三类样本的分类变量预测值均接近0,偏差小于0.5。根据判定规则,验证集中的a类样本均被正确识别,其他三类样本都被认定为非本类,对附图7、8和9中的预测结果分析与附图8相同。可以得到,建立的pls-da模型对a、b、c、d四类奶粉样本的鉴别准确率均为100%。

以a模型为例,利用建立的a类样本类模型对以上判定结果进行验证。结果如附图10所示,a类样本验证集的hotellingt2统计量均低于95%预警限。其余三类样本验证集的hotellingt2统计量均远高于99%控制限。因此,建立的四类奶粉样本的鉴别准确率均为100%。

通过以上两种鉴别方法联用,可以避免因一种方法的局限而产生的误判。通过互相验证,使鉴别结果更加准确可靠。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1