专利名称:利用近红外光谱进行生鲜乳掺假识别的方法
技术领域:
本发明涉及一种生鲜乳检测方法,更具体地,涉及一种利用近红外光谱进行生鲜乳掺假识别的方法。
背景技术:
在生鲜乳中掺加水、糊精、植脂末、三聚氰胺等低成本物质以牟取商业利润是一种常见的违法行为。现有试纸、色谱检测方法通常是针对某一特定掺假物进行分离分析,因此识别不同掺假物需要经过不同的前处理步骤后再分别进行判定,比较费时费力。近期有学者采用商品奶进行了若干采用近红外技术对掺假牛奶的定性识别或定量分析的研究并取得了良好的结果。但商品奶经过了均质、灭菌等处理过程并加有添加剂及助剂等,其性状和生鲜乳有着较大差异。因此欲探索近红外技术对生鲜乳掺假识别的可行性,应以生鲜乳为基础,采用接近实际情况的方式配制掺假乳样品。本专利发明人曾收集了 2010年6-7月期间上海市以及周边地区各个牧场未加工的生鲜乳162个,配制相同数目含氮量达标、掺水量为1% 20%的含三聚氰胺、尿素、硝酸铵的掺假乳溶液,分别采集生鲜乳样品和掺假乳样品的近红外光谱,通过比较不同光谱预处理方法及建模方法,确立最佳的近红外判别模型,结果表明采用近红外商业软件建立的判别模型对未知乳样品的判别正确率在40%左右,且无法对模型参量进行更新,而采用自开发的IS-KNN方法(改进与简化的K-最邻近法)建立的判别模型对已知掺假物类别的掺假乳的判别正确率最高可达100%,但对含有多种未知掺假物的掺假乳的判别正确率通常在80% 90%,因此,现有方法对于含有多种未知掺假物的掺假乳的判别正确率以及判别模型的参量更新维护还存在可提高的空间。
发明内容
本发明提出一种利用近红外光谱进行生鲜乳掺假识别的方法,以提高对含有多种未知掺假物的掺假乳的判别正确率,并使判别模型参量得到更新维护。为了达到上述目的,本发明从监控区域收集未经加工的生鲜乳样品,并以此为基础采用各种掺假物配制掺假乳样品,检测其近红外光谱,采用支持向量机法(Surprot Vector Machine, SVM)法建立生鲜乳的近红外判别模型,以实现对掺假乳的快速鉴别,具体步骤如下步骤⑴采集多种生鲜乳样品和掺假乳样品的近红外光谱,对应建立生鲜乳谱库和掺假乳谱库;步骤(2):利用生鲜乳谱库和掺假乳谱库中的近红外光谱建立判别模型,校正判别模型以得到最优判别模型;步骤(3):采集未知是否掺假的未知乳样品的近红外光谱,利用最优判别模型对未知乳样品的近红外光谱进行判别,从而得到未知乳样品的判别结果;
其中,所述步骤(2)中,采用SVM方法建立判别模型。所述步骤(3)还包括,若未知乳样品的判别结果为假,则对该未知乳样品进行确证。所述步骤(3)还包括,若确证结果为假,则将该未知乳样品的近红外光谱加入掺假乳谱库以更新最优判别模型。所述步骤(3)还包括,若确证结果为真,则将该未知乳样品的近红外光谱加入一假阳性谱库。所述利用近红外光谱进行生鲜乳掺假识别的方法,进一步包括步骤⑷采集已知是否掺假的已知乳样品的近红外光谱,利用最优判别模型对已知乳样品的近红外光谱进行判别,得到已知乳样品的判别结果,若已知乳样品的判别结果与实际类别一致,则将已知乳样品的近红外光谱加入其判别结果对应的谱库以更新最优判别模型。所述利用近红外光谱进行生鲜乳掺假识别的方法,进一步包括步骤⑷采集已知是否掺假的已知乳样品的近红外光谱,利用最优判别模型对已知乳样品的近红外光谱进行判别,得到已知乳样品的判别结果,若已知乳样品的判别结果与实际类别不一致,则将已知乳样品的近红外光谱作为异常样本保存,当异常样本累积超过预设数目时,将异常样本加入其实际类别对应的谱库以更新最优判别模型。所述生鲜乳谱库或掺假乳谱库中每添加一个新的近红外光谱,则从该谱库中相应地删除一个采集日期最早的样品的近红外光谱。在采集近红外光谱之前,将生鲜乳样品、掺假乳样品、未知乳样品和/或已知乳样品在40°C下超声处理10 20min。所述步骤(2)还包括,采用SVM方法建立判别模型之前,使用T检验剔除离群的近红外光谱。所述步骤⑵还包括,采用SVM方法建立判别模型之前,采用SNV方法、MSC方法或一阶导方法对已剔除离群样本的近红外光谱集进行预处理。所述步骤(2)还包括,采用留三分之一或四分之一法校正判别模型。所述生鲜乳样品由从监控区域采集的未经加工的生鲜乳制成。所述掺假乳样品由在所述生鲜乳中添加不同种类或不同浓度的掺假溶液制成。本发明的利用近红外光谱进行生鲜乳掺假识别的方法,采用SVM方法建立判别模型,采用留三分之一或四分之一法校正判别模型以得到最优判别模型,对于含有多种未知掺假物的掺假乳的判别正确率得到大幅提高,通过扩充和更新生鲜乳谱库和掺假乳谱库中的近红外光谱,使最优判别模型得到更新维护。
图I所示为本发明的利用近红外光谱进行牛奶掺假识别的方法的步骤(2)的流程图;图2所示为本发明的利用近红外光谱进行牛奶掺假识别的方法的步骤(3)的流程图。
具体实施方式
下面结合附图详细说明本发明的技术方案。本发明的利用近红外光谱进行生鲜乳掺假识别的方法,包括如下步骤步骤(I):采集多种生鲜乳样品和掺假乳样品的近红外光谱,对应建立生鲜乳谱库和掺假乳谱库。通常,可以从监控区域内采集未经加工的生鲜乳样品200份左右,扫描其近红外光谱,建立生鲜乳谱库;在每份生鲜乳中加入不同类型或不同浓度的掺假溶液,作为掺假乳样品,扫描其近红外光谱,建立掺假乳谱库。由于放置一段时间的生鲜乳样品可能出现分层、固形物析出、脂肪析出等现象,为了得到均质的样品溶液以保证其近红外光谱的准确性,通常在光谱采集之前先将生鲜乳样品和掺假乳样品在40°C下超声处理10 20min,对于未出现分层、固形物析出、脂肪析出等现象的样品该步骤可省略。步骤(2):利用生鲜乳谱库和掺假乳谱库中的近红外光谱建立判别模型,校正判别模型以得到最优判别模型。步骤⑵的流程如图I所示,主要包括首先,为提高判别正确率,需要剔除明显异常的近红外光谱,例如可使用T检验剔除离群的近红外光谱;然后,通过SNV、MSC或一阶导方法对剔除离群样本后的近红外光谱集进行预处理,以消除信号漂移、噪声等对光谱的干扰;接下来,采用SVM方法建立判别模型,并采用留三分之一或四分之一法对判别模型进行校正,从而得到最优判别模型。SVM方法是Cortes和vapnik于1995年首先提出的一种基于统计学理论的机器学习方法,目前已被广泛用于模式识别、函数拟合、回归估计、密度估计、数据挖掘、三维识别、 遥感图像分析和非线性控制等众多领域。本发明创造性地将其运用于生鲜乳的掺假识别中。具体步骤如下(I)训练前检查与空值处理;(2)对由生鲜乳谱库和掺假乳谱库中的近红外光谱组成的建模集做主成分分析, 选取主成分及其载荷向量;(3)从建模集中选取训练集和检验集,轮流进行训练与检验;(4)采用“一对一”方法进行训练,共产生η (n-1)/2个分类超平面,其中η为类别数;(5)当η > 2时,即用于多类识别问题时,需要对分类超平面引入模糊隶属函数,建立样本集的判别函数;(6)统计判别正确率,校正判别模型参量。其中,可从建模集中选取三分之一或四分之一的光谱作为检验集,其余光谱作为训练集。例如,假设建模集中共有S1-S15共15个样本,每次取其中1/3作为检测集,第一次SI、S4、S7、S10、S13作为检测集,其它作为训练集;第二次S2、S5、S8、S1US14作为检测集,其它作为训练集;第三次33、36、39、312、315作为检测集,其它作为训练集;如此,每个样本都可轮流做一次检验集。利用训练集建立判别模型,利用检验集检验该判别模型的判别正确率,从而不断校正判别模型参量,得到最优判别模型。对于完全不同的两类物质,采用IS-KNN方法和采用SVM方法建立的判别模型的判别正确率相差并不大,这适用于未知乳样品中含有已知掺假物的情况,可以针对该具体掺假物进行判别。然而在实际检测中,未知乳样品中可能含有多种掺假物并且并不预先知道掺假物的具体成分,这种情况下,由于SVN方法的学习功能好,适应性宽,其中嵌入的模糊隶属函数对判别难以归类的样本有优势,因此采用SVM方法建立的判别模型的判别正确率较高,通常在90%以上,其中掺假乳被识别出的正确率更高一些,可达95%。步骤(3):采集未知是否掺假的未知乳样品的近红外光谱,利用最优判别模型对未知乳样品的近红外光谱进行判别,从而得到未知乳样品的判别结果。为了得到均质的未知乳样品,以保证其近红外光谱的准确性,当未知乳样品出现分层、固形物析出、脂肪析出等现象时,也需首先将该未知乳样品在40°C下超声处理10 20min。然后采集未知乳样品的近红外光谱,并利用最优判别模型进行判别,从而得到该未知乳样品的判别结果。如图2所示,若未知生鲜乳样品的判别结果为假,则需对该未知乳样品进行确证, 例如采用液相色谱、质谱等方法进行确证。若确证结果为假,则可将该未知乳样品的近红外光谱加入掺假乳谱库,从而不断扩充掺假乳谱库中的光谱数量,以便更新和优化最优判别模型。优选地,当掺假乳谱库中每添加一个新的近红外光谱时,相应地从该谱库中删除一个采集日期最早的样品的近红外光谱,从而维持该谱库中光谱数量的稳定。若判别结果为假, 而确证结果为真,则将该未知乳样品的近红外光谱单独置于一类假阳性谱库,作为特殊样本的比对参考。步骤(4):利用已知是否掺假的已知乳样品的近红外光谱对最优判别模型进行更新和维护。由于生鲜乳本身可能随着季节等因素变化而存在较大差异,用于生鲜乳掺假识别的最优判别模型需要进行更新和维护。可定期采集已知是否掺假的已知乳样品的近红外光谱,利用最优判别模型对已知乳样品的近红外光谱进行判别,得到已知乳样品的判别结果, 若已知乳样品的判别结果与实际类别一致,则将已知乳样品的近红外光谱加入其判别结果对应的谱库;若已知乳样品的判别结果与实际类别不一致,则将已知乳样品的近红外光谱作为异常样本保存,当异常样本累积超过预设数目时,将异常样本加入其实际类别对应的谱库,从而更新和优化最优判别模型。优选地,当生鲜乳谱库或掺假乳谱库中每添加一个新的近红外光谱时,相应地从该谱库中删除一个采集日期最早的样品的近红外光谱,从而维持该谱库中光谱数量的稳定。以上所述的,仅为本发明的较佳实施例,并非用以限定本发明的范围,本发明的上述实施例还可以做出各种变化。即凡是依据本发明申请的权利要求书及说明书内容所作的简单、等效变化与修饰,皆落入本发明专利的权利要求保护范围。
权利要求
1.一种利用近红外光谱进行生鲜乳掺假识别的方法,包括步骤(I):采集多种生鲜乳样品和掺假乳样品的近红外光谱,对应建立生鲜乳谱库和掺假乳谱库;步骤⑵利用生鲜乳谱库和掺假乳谱库中的近红外光谱建立判别模型,校正判别模型以得到最优判别模型;步骤(3):采集未知是否掺假的未知乳样品的近红外光谱,利用最优判别模型对未知乳样品的近红外光谱进行判别,从而得到未知乳样品的判别结果;其特征在于,所述步骤(2)中,采用SVM方法建立判别模型。
2.如权利要求I所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于,所述步骤(3)还包括,若未知乳样品的判别结果为假,则对该未知乳样品进行确证。
3.如权利要求2所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于,所述步骤⑶还包括,若确证结果为假,则将该未知乳样品的近红外光谱加入掺假乳谱库以更新最优判别模型。
4.如权利要求2所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于,所述步骤(3)还包括,若确证结果为真,则将该未知乳样品的近红外光谱加入一假阳性谱库。
5.如权利要求3所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于,进一步包括步骤(4):采集已知是否掺假的已知乳样品的近红外光谱,利用最优判别模型对已知乳样品的近红外光谱进行判别,得到已知乳样品的判别结果,若已知乳样品的判别结果与实际类别一致,则将已知乳样品的近红外光谱加入其判别结果对应的谱库以更新最优判别模型。
6.如权利要求3所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于,进一步包括步骤(4):采集已知是否掺假的已知乳样品的近红外光谱,利用最优判别模型对已知乳样品的近红外光谱进行判别,得到已知乳样品的判别结果,若已知乳样品的判别结果与实际类别不一致,则将已知乳样品的近红外光谱作为异常样本保存,当异常样本累积超过预设数目时,将异常样本加入其实际类别对应的谱库以更新最优判别模型。
7.如权利要求5或6所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于, 所述生鲜乳谱库或掺假乳谱库中每添加一个新的近红外光谱,则从该谱库中相应地删除一个采集日期最早的样品的近红外光谱。
8.如权利要求7所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于,在采集近红外光谱之前,将生鲜乳样品、掺假乳样品、未知乳样品和/或已知乳样品在40°C下超声处理10 20min。
9.如权利要求I所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于,所述步骤(2)还包括,采用SVM方法建立判别模型之前,使用T检验剔除离群的近红外光谱。
10.如权利要求9所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于,所述步骤(2)还包括,采用SVM方法建立判别模型之前,采用SNV方法、MSC方法或一阶导方法对已剔除离群样本的近红外光谱集进行预处理。
11.如权利要求10所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于, 所述步骤(2)还包括,采用留三分之一或四分之一法校正判别模型。
12.如权利要求I所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于,所述生鲜乳样品由从监控区域采集的未经加工的生鲜乳制成。
13.如权利要求12所述的利用近红外光谱进行生鲜乳掺假识别的方法,其特征在于, 所述掺假乳样品由在所述生鲜乳中添加不同种类或不同浓度的掺假溶液制成。
全文摘要
本发明提供一种利用近红外光谱进行生鲜乳掺假识别的方法,包括步骤(1)采集多种生鲜乳样品和掺假乳样品的近红外光谱,对应建立生鲜乳谱库和掺假乳谱库;步骤(2)利用生鲜乳谱库和掺假乳谱库中的近红外光谱建立判别模型,校正判别模型以得到最优判别模型;步骤(3)采集未知是否掺假的未知乳样品的近红外光谱,利用最优判别模型对未知乳样品的近红外光谱进行判别,从而得到未知乳样品的判别结果;其中,所述步骤(2)中,采用SVM方法建立判别模型。本发明的方法对于含有多种未知掺假物的掺假乳的判别正确率得到大幅提高,通过扩充和更新生鲜乳谱库和掺假乳谱库中的近红外光谱,使最优判别模型得到更新维护。
文档编号G01N21/35GK102590128SQ20121000626
公开日2012年7月18日 申请日期2012年1月10日 优先权日2012年1月10日
发明者严凤, 倪力军, 吴剑平, 张文刚, 张立国, 张鑫, 李丹妮, 王蓓, 钟珍珍, 顾欣, 黄士新 申请人:上海市兽药饲料检测所, 华东理工大学