一种拉曼光谱结合PLS-DA快速筛查生鲜乳中多种掺假物质的方法

文档序号:28318430发布日期:2022-01-04 20:50阅读:591来源:国知局
一种拉曼光谱结合PLS-DA快速筛查生鲜乳中多种掺假物质的方法
一种拉曼光谱结合pls

da快速筛查生鲜乳中多种掺假物质的方法
技术领域
1.本发明涉及一种拉曼光谱结合pls

da快速筛查生鲜乳中多种掺假物质的方法,属于食品检测技术领域。


背景技术:

2.为了经济利益而在牛奶中掺假是一个持续了150多年的问题:早在1857年就有用水稀释牛奶的报道,并在1890年《纽约时报》揭露了添加硼砂、碳酸钠或水杨酸等化合物来延长牛奶货架期的掺假手段,这种欺诈行为一直持续到如今,甚至有更多的掺假物质(三聚氰胺、尿素、麦芽糊精、乳清等)被添加到牛奶中,这些掺假物质会给消费者带来健康风险。因此,对乳品行业来说迫切需要开发快速、无损的检测方法,以确保食品安全,避免对消费者的健康造成威胁。
3.在生鲜乳中加水以增加其体积是最常见的掺假方式,加水会导致牛奶密度下降,这种欺诈行为可以通过添加增稠剂一类的物质来掩盖。生鲜乳在长时间放置下产生乳酸,造成质量问题,当这种情况发生时,可以添加弱碱来降低酸度。此外,在生鲜乳中添加奶酪乳清的欺诈行为在一些地方也有报道。
4.针对生鲜乳的掺假行为,已被证明有效的检测方法有紫外光谱、毛细管电泳、液相色谱串联质谱、中红外光谱和拉曼光谱等。然而,除了拉曼光谱以外的其他方法通常都需要复杂的样品制备,包括使用有机溶剂沉淀蛋白质、离心、浓缩和过滤等步骤,并且因设备大型昂贵而无法满足现场快速检测的要求。因此,现急需一种能够高效、快速且高精准度的处理大量数据样本的生鲜乳中掺假的筛查方法。


技术实现要素:

5.本发明所要解决的技术问题是:提供一种能够高效、快速且高精准度的处理大量数据样本的生鲜乳中掺假的筛查方法。
6.为了解决上述问题,本发明提供了一种拉曼光谱结合pls

da快速筛查生鲜乳中多种掺假物的方法,包括以下步骤:
7.步骤s1、掺假生鲜乳制品样品的制备;
8.步骤s2、采集包括步骤s1制备获得的掺假生鲜乳制品样品以及未掺假生鲜乳样品的拉曼光谱;
9.步骤s3、对步骤s2采集到的拉曼光谱数据进行处理;
10.步骤s4、采用主成分分析pca对处理后的拉曼光谱数据进行离群点检测,剔除异常数据样本;
11.步骤s5、采用步骤s4中得到的数据建立所述掺假生鲜乳制品样品的定性模型和定量模型,其中,建立所述定性模型的方法为pls

da,得到pls

da模型;建立所述定量模型的方法为pls回归法,得到pls模型;
12.步骤s6、采用建立的定性、定量模型对实际生鲜乳制品样品进行筛查,判定所述生鲜乳中的掺假物种类及含量。
13.优选地,所述步骤s1具体为:向生鲜乳中分别添加掺假物质麦芽糊精、碳酸钠和乳清,得到三种掺假生鲜乳样品。
14.优选地,向生鲜乳中添加掺假物质的浓度范围为:麦芽糊精0

15wt%,碳酸钠0

100ppm,乳清0

20wt%。
15.优选地,所述步骤s2具体为:取掺假生鲜乳制品样品于液体测样板上,对焦后于500

3000cm
‑1范围内获取拉曼光谱,选择不同位置的n个点采集,每个点采集m次拉曼信号取平均光谱为样品的拉曼光谱。
16.优选地,所述拉曼光谱的测量条件为:激光功率10

50mw,激光扩束器直径5

10mm,拉曼采集时间3

5s/次。
17.优选地,所述步骤s3中的处理具体为:采用窗口平均化对所述拉曼光谱进行预处理,并对预处理后的拉曼光谱数据进行特征提取,选取投影重要变量图vip值大于1的变量。
18.优选地,所述预处理的方法为一阶导数法。
19.优选地,所述步骤s2中采集拉曼光谱时掺假生鲜乳制品样品的温度为25
±
5℃。
20.优选地,所述步骤s6具体为:按照所述步骤s2获得实际生鲜乳制品样品的拉曼光谱,利用所述pls

da模型,鉴定所述样品是否为纯品生鲜乳。
21.优选地,如果鉴定所述生鲜乳制品样品为掺假样品,则通过所述pls回归模型,预测所述样品的掺假物的含量;所述pls模型得出的掺假物含量为预测值,预测值与真实值之间的差值为残差。
22.与现有技术相比,本发明的有益效果在于:
23.1.本发明在采用拉曼光谱分析技术对得到的拉曼光谱数据进行预处理的基础上,进一步选择选取vip(投影中的重要变量)值大于1的变量作为特征变量,这是基于原始数据维度过大的前提,通过采用vip值筛选的方法对数据降维,能够在保留原始数据信息的前提下,减少数据维度,将原始光谱数据从“高维度”转换为更便于处理的低维度的数据,减少了后续处理的复杂性,并提高数据处理的精度;
24.2.针对现有技术只能单一检测某一掺假物的局限性,本发明同时获取到了三种掺假生鲜乳及未掺假生鲜乳的拉曼光谱,可建立多种生鲜乳的拉曼光谱指纹图谱库,利用该方法得到的光谱建立的pls

da(偏最小二乘

判别分析)分类模型可同时检测多种掺假物质,具有高效准确率高的特点;
25.3.本发明基于选取特征提取后的数据进行pls(偏最小二乘)定量数学模型的建立,基于已知浓度的拉曼光谱数据进行建模,在建立的数学模型的基础上对未知浓度的拉曼光谱数据进行预估,基于此方法对待测生鲜乳的拉曼光谱数据进行分析计算,结合pls

da分类模型可以达到定性分析的目的,进而完成定量计算的处理;
26.4.利用该方法得到的光谱建立的模型,降低了模型的复杂性和提高了模型的稳定性;不需要样品制备的任何步骤,测定过程简单、快速,是一种快速且经济有效的方法,具有很好的实际应用价值。
附图说明
27.图1为麦芽糊精、碳酸钠、乳清掺假生鲜乳和未掺假生鲜乳样品的拉曼光谱图;
28.图2为所有变量在pls

da分析时的vip得分图;
29.图3为144个生鲜乳样品光谱数据的pca分析得分图;
30.图4为pls

da分类模型的roc曲线;其中,(a)、(b)、(c)、(d)分别为麦芽糊精、乳清、碳酸钠掺假乳样和未掺假生鲜乳样品的pls

da分类模型的roc曲线;
31.图5为用于测定麦芽糊精(a)、碳酸钠(b、乳清(c)掺假生鲜乳和纯生鲜乳(d)的pls

da分类模型;
32.图6为pls的预测值与麦芽糊精(a)、碳酸钠(b)、乳清(c)真实值的之间的相关性。
具体实施方式
33.为使本发明更明显易懂,兹以优选实施例,并配合附图作详细说明如下。
34.以下实施例中的百分浓度,如无特殊说明,均为质量百分浓度。
35.实施例1
36.掺假生鲜乳样品的制备:
37.生鲜乳样品采集自上海乳品四厂,出厂时生鲜乳的蛋白质、脂肪及碳水化合物等指标均符合标准。
38.将1.5g麦芽糊精溶液加入50g加水适当稀释过的生鲜中,搅拌2h,可制得30.0%的生鲜乳溶液。用纯生鲜乳将30.0%的麦芽糊精掺假乳液进行稀释,得到麦芽糊精的质量分数分别为0、1、2、4、5、6、7、8、9、11、13和15%。对于碳酸钠掺假样品,首先制备浓度为100ppm的碳酸钠生鲜乳溶液,然后使用纯生鲜乳不断稀释100ppm的掺假溶液,制得10、25、30、40、45、50、60、70、75、80、90和100ppm的碳酸钠掺假样品。最后,在生鲜乳中添加不同比例的乳清制备了12种浓度的掺假样品:乳清的质量分数0、2、3、4、7、9、11、12、14、16、18和20%。为每种浓度制备三份掺假的生鲜乳样品,共144份样品,其中掺假生鲜乳108份,未掺假生鲜乳36份(36批不同时间取样的纯生鲜乳),每个样品重复测定3次。
39.实施例2
40.生鲜乳样品的拉曼光谱采集:
41.使用dxr激光显微拉曼光谱仪进行奶样检测,取适量样品于液体测样板上,对焦后于50

3500cm
‑1范围内获取拉曼光谱,采集时间5s/次,激光器为532nm dpss激光器,功率为10mw,激光扩束器直径为5mm,选择不同位置的3个点采集,每个点采集6次所得平均谱图,即得到所有生鲜乳样品的拉曼光谱图(未掺假生鲜乳和麦芽糊精、碳酸钠、乳清掺假生鲜乳,共144个样品的拉曼光谱的集合)。
42.实施例3
43.光谱预处理及变量筛选:
44.光谱预处理包括除去原始数据500

3000cm
‑1之间没有峰出现的区域,将光谱的范围缩小到1000

3000cm
‑1,并去除噪声和背景的干扰。在使用simca14.1进行统计分析之前,研究了光谱预处理对pls

da分类模型性能和分类正确率的影响,结果如表1所示,不同的预处理方法(一阶导数、正交信号校正和乘性散射校正)可以提高、降低或不明显地影响分类能力。在选择了最佳的信号预处理方法后,对整组光谱进行了相同的处理。并对检测条件进
行了优化,使平行样品的相对标准偏差低于10%。最后,与未经预处理的光谱相比,具有一阶导数的数据为校准和验证集提供了更好的灵敏度和特异性。因此,使用一阶导数法进行处理后的所有的光谱数据(108个训练集的光谱和36个验证集的光谱),建pls

da和pls模型,如图1所示。
45.使用vip得分进行数据约简,通过投影重要变量图(vip),分析了在pls

da分类模型中对测定有贡献的拉曼光谱区域,全拉曼光谱点vip得分如图2所示。结果表明,vip>1的变量所建立的模型具有最高的分类准确率。rmsecv显著低于未选择vip变量的pls

da模型。因此,后续研究采用一阶导数对光谱数据进行预处理,选取vip>1的光谱点进行pls

da和pls建模。
46.表1光谱预处理和变量选择对多类pls

da模型性能的影响
[0047][0048][0049]
在表1中,rmsecv=交叉验证均方根误差;aav=相邻平均,msc=乘性散射校正,snv=标准正态变量,osc=正交信号校正,1st dsg=savitzky

golay一阶导数,2nd dsg=savitzky

golay二阶导数,1st der=一阶导数。
[0050]
实施例4
[0051]
pls

da建模结果:
[0052]
图3所示为144个光谱数据集的pca得分图,掺假的生鲜乳样品按成分浓度分布在pc1轴上,但许多低掺假浓度的样品得分与未掺假的样品相近。为了更好地区分掺假和未掺假的样品,需要建立pls

da模型。108个样本集,包括36个未掺假光谱和掺有麦芽糊精、乳清和碳酸钠的生鲜乳光谱各24个,用来训练pls

da校正模型。
[0053]
pls

da分类模型提供了区分四个生鲜乳样本的可能性。根据rmsecv、灵敏度、特异度(校准集)的变化,为pls

da掺假判别模型选择最优潜在变量(lv)的个数为8,如表2所示。模型的roc曲线如图4所示,麦芽糊精、乳清和碳酸钠掺假乳样的auc值均大于0.99,表明该模型是非常有效的。roc的左上角代表最高的灵敏度和特异度,此时对应的阈值是模型的最优阈值。掺假生鲜乳和纯生鲜乳的最佳临界点存在偏差,考虑到真实的分类过程希望掺假生鲜乳的误判率最低。因此,选择掺假生鲜乳的roc曲线阈值作为pls

da模型的判别阈值,而对应的纯生鲜乳的分类正确率会相应地降低。当判别模型的预测值大于或等于阈值时,将样本识别为阳性样本,当判别模型的预测值小于阈值时,将样本识别为阴性样本。
[0054]
模型判别的结果如图5所示,可以观察到麦芽糊精、乳清、碳酸钠掺假生鲜乳和纯生鲜乳四个明显的分区。在碳酸钠掺假样品的分类中,pls

da模型显示灵敏度(tpr)和特异性(tnr)均为1,分类正确率可达到100%(表2)。相较之下,乳清掺假和麦芽糊精掺假的模型略差(图5),这两类掺假样品的分类正确率分别为95.84%和95.83%。为了保证掺假样品有高的分类正确率,从而得到的纯生鲜乳的分类正确率为92.25%,这符合生鲜乳质量现场快速筛查的需要。
[0055]
表2pls

da分类模型的参数
[0056][0057]
在表2中,rmse
c
为校正集均方根误差;rmse
cv
为交叉验证均方根误差;rmse
p
为验证集(预测集)均方根误差;tpr
c
、tnr
c
为校正集的灵敏度和特异性,tpr
p
、tnr
p
为验证集的灵敏度和特异性;acc为总分类正确率,是校准集和验证集和分类正确率的算术平均值。
[0058]
实施例5
[0059]
pls建模结果:
[0060]
为了定量生鲜乳中的掺假物质浓度,建立了pls模型。图6显示了参考值与pls预测值之间的相关性。结果表明,三种掺假样品的校正集与验证集的相关性均大于0.95。用5

6个lv建立了模型,并解释了多光谱数据集中90%以上的方差,r2val在0.90

0.98之间,显示了定量模型的预测稳健性。根据灵敏度、准确度和精密度评价该方法的分析性能(lod、loq、rsd和rep),麦芽糊精、碳酸钠和乳清的最低检出限分别为1.46%、4.86ppm和2.64%。掺假是为了获取经济效益,而5%以下的掺假是不经济的。因此,所建立的方法性能是理想的,足
以用于掺假物质的定性和定量检测。相对分析误差(rpd)估算表明,当rpd>8时,pls与拉曼光谱相结合的模型对所有的分析任务都是优异的。对于碳酸钠和乳清rpd分别为9.17和8.79,可知pls校正模型非常适用于碳酸钠和乳清的定量检测,而对于麦芽糊精,其rpd为5.61,仅适合用于定性检测。
[0061]
表3用于评估回归的可靠性和模型性能的统计参数
[0062][0063]
在表3中,lod为检出限;loq为定量限;rsd为相对标准偏差;rep为预测相对标准偏差;rmse
c
为校准均方根误差;rmse
p
为预测均方根误差。
[0064]
实施例6
[0065]
pls

da分类和pls定量模型的应用:
[0066]
制备掺入麦芽糊精、碳酸钠和乳清的生鲜乳样品各四个浓度作为盲样,每种浓度对应着20组共计240组的拉曼光谱数据。
[0067]
使用dxr激光显微拉曼光谱仪进行奶样检测,取适量样品于液体测样板上,对焦后于500

3000cm
‑1范围内获取拉曼光谱,采集时间5s/次,激光器为532nm dpss激光器,功率为10mw,激光扩束器直径为5mm,选择不同位置的20个点采集,每个点采集3次所得平均谱图,即得到添加不同浓度掺假物质的生鲜乳拉曼光谱图。
[0068]
将采集到的拉曼光谱数据经过预处理和特征提取后,将每种浓度对应的40组数据作为输入数据,导入到matlab r2019b统计分析软件已建立好的pls

da中,输出每个样本的分类结果见表4。分类结果以阴性表示未掺假样本,以阳性1表示麦芽糊精掺假样本、阳性2表示碳酸钠掺假样本、阳性3表示乳清掺假样本。阴性样本分类正确率分别为95%,阳性样本的分类正确率为96.67%(阳性1),100%(阳性2),98.33%(阳性3),结果证明pls

da对于掺假生鲜乳的分类准确率高,模型分类性能良好。
[0069]
表4盲样实验pls

da定性检测结果
[0070][0071]
从pls

da定性的结果中挑选判定结果为阳性的样本带入pls模型中,对生鲜乳中掺假物质的浓度进预测,结果如表5所示。结果显示预测值与真实值之间的残差在0.18

0.45之间,预测模型性能良好。
[0072]
表5盲样实验pls定量结果
[0073][0074]
尽管上述实施例对本发明做出了详尽的描述,但它仅仅是本发明一部分实施例,而不是全部实施例,并非对本发明任何形式上和实质上的限制,应当指出,对于本技术领域的普通技术人员,在不脱离本发明的前提下,还将可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1