本发明涉及了一种拉曼光谱的肉质品分类方法,尤其是涉及一种基于拉曼光谱的猪肉和牛肉分类方法,尤其是五个最终用于牛肉和猪肉分类模型建立的拉曼特征谱峰。
背景技术:
肉类是人体重要的营养物质来源之一。近年来各国食品安全问题不断涌现。部分不法商贩以较低经济价值的肉作为掺假物混入高经济价值的肉制品中,以此谋取经济利益。这类“经济利益驱动型掺假”严重损害了消费者和供应商的利益,动摇了公众对肉制品安全的信心。
目前,国内外对肉制品种类的鉴别方式主要以理化分析为主,包括酶联免疫吸附法(elisa)、聚合酶链反应法(pcr)以及质谱分析法等。mandi等(mandlij,elfatimii,seddaouin,etal.enzymeimmunoassay(elisa/immunosensor)forasensitivedetectionofporkadulterationinmeat[j].foodchemistry,2018:s0308814618302085.)采用elisa检测牛肉中的猪肉掺假;古淑青等(古淑青,詹丽娜,赵超敏,等.基于液相色谱-串联质谱法的肉类特征肽段鉴别及掺假测定[j].色谱,2018,36(12):1269-1278.)利用超高效液相色谱—四极杆/静电场轨道阱高分辨质谱相结合的方法检测羊肉中的鸭肉掺假;朱杨等(朱扬,刘永峰,魏燕超,etal.牛肉及其中式加工品中猪肉成分的定性、定量检测方法研究[j].中国农业科学,2018,51(22):139-150.)利用pcr方法检测牛肉干中的猪肉掺假情况。这些方法各自存在前处理复杂、时间成本高、效率低、假阳性率高等缺点,难以满足市场的需求。而作为无损检测技术其中一种的近红外光谱技术对水等极性物质较为敏感,针对肉类这类含水量较高的物质而言,存在着劣势(zaj?ca,hanuzaj,dymińska,l.ramanspectroscopyindeterminationofhorsemeatcontentinthemixturewithothermeats[j].foodchemistry,2014,156:333-338.)。
技术实现要素:
为了解决背景技术中存在的问题,为了解决原始拉曼光谱数据有较多荧光信号干扰且谱峰密集而导致分类会会降低模型准确度、提高分类的难度的技术问题,本发明通过分析采集的牛里脊肉糜和猪里脊肉糜的拉曼光谱数据,提出了一种基于拉曼光谱的猪肉和牛肉分类方法,找到最能表征样品特征的拉曼谱峰,极大地提升了分类处理的鲁棒性,加快光谱数据处理速度。
如图1所示,本发明解决其技术问题所采用的技术方案是:
1)通过共聚焦显微拉曼光谱仪器采集猪肉和牛肉样本表面的拉曼光谱数据;
2)对拉曼光谱数据进行预处理操作,再进行主成分分析,之后建立主成分载荷散点图,然后分析提取主成分载荷散点图的散点特征,根据散点特征筛选出拉曼特征谱峰;3)将拉曼特征谱峰结合猪肉/牛肉的分类标签输入到k近邻分类器进行训练,用训练后的k近邻分类器对待测肉样本的拉曼特征谱峰处理分类识别。
所述的预处理操作包括依次进行的平滑和基线校正处理。
本发明的重点处理在于创建主成分载荷散点图,并根据散点特征提取特征值。以下利用主成分载荷散点图对主成分分析的结果进行进一步优化,提取特征值并进行分类。
所述步骤2)具体为:
2.1)对经过预处理后获得的n个样本、m条波段的拉曼光谱数据集b(b1,b2,…,bn),即每一条光谱bi均包含m个波段;采用随机取样方法从数据集b中提取出
其中,βk为第k波段,α1k表示第一主成分下第k波段对应的载荷系数,α2k表示第二主成分下第k波段对应的载荷系数;
2.2)绘制主成分载荷散点图
以载荷系数α1k为横轴、以载荷系数α2k为纵轴建立二维坐标图,将两个主成分中的同一波段的拉曼位移点βk对应的载荷系数α1k和载荷系数α2k作为第k波段的散点坐标(α1k、α2k),在二维坐标图上绘制,形成主成分载荷散点图,即绘制出各拉曼位移点βk的载荷系数αjk的散点图,j=1or2;
2.3)计算各个散点的横轴坐标之和αk:
αk=λ1α1k+λ2α2k
其中,λ1和λ2分别为第一主成分pc1和第二主成分pc2的特征向量所对应的权重;
2.4)特征拉曼谱峰提取
绘制各个散点αk的第一曲线l1,第一曲线l1上任一散点αj满足αj-1<αj且αj>αj+1则识别散点αj为第一曲线l1中一峰值点,统计第一曲线l1中所有的峰值点数目记为p1,将第一曲线l1中所有的峰值点提取出再绘制成新的曲线作为第二曲线l2,对第二曲线l2重复按照与第一曲线l1相同方式识别峰值点,不断直至第t曲线lt的峰值点pt数目满足pt<10时则停止识别峰值点;最后获取第t曲线lt中前五高峰的峰值点,找到五个峰值点所对应的拉曼位移点βk作为五个拉曼特征谱峰。
所述步骤3)具体为:
采集已知类别的相同数目的牛肉、猪肉和掺假肉糜样本的拉曼光谱数据按照上述步骤处理获得五个拉曼特征谱峰,然后将各个样本五个拉曼特征谱峰的峰强度结合其对应的类别标签输入到分类器中进行训练,分类器采用k近邻分类器,分类器中最近邻实例数目k的取值范围是4~10,对于k近邻分类器的不同k值建立模型,取分离加权结果(f1度,f1score)最大模型作为最终的分类模型,用最终的分类模型对待测肉样本进行分类识别。
本发明方法能用于识别分类检测出牛里脊、猪里脊肉以及混合掺假肉糜,能从牛里脊肉糜、猪里脊肉糜和掺有猪里脊肉糜中区分出牛里脊肉糜。
本发明具有的有益的效果是:
本发明利用猪肉和牛肉中特定化学键及基团的种类差异导致的5个拉曼特征谱峰构建了猪肉和牛肉的k近邻分类器分类模型,准确率高,分类速度快,鲁棒性好。
附图说明
图1是本发明的拉曼光谱数据处理流程图。
图2是本发明筛选的拉曼特征谱峰分布图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
如图1所示,本发明的实施例如下:
在本例中,主要区分三种类型的样品。分别是等质量混合的掺假肉糜样品以及纯牛肉和纯猪肉的肉糜样品。肉来源均是同一批次宰杀的真空包装的新鲜猪、牛里脊肉(按标准屠宰加工并经卫生检疫部门检验合格,24h排酸后)。实验前从冷冻室中取出肉,放置在常温水中解冻后风干并去除样品中明显的脂肪和结缔组织。将猪肉和牛肉等质量混杂,放入绞肉机内搅拌两次,每次30s,得到掺假肉糜样品。再将纯牛肉和纯猪肉分别放入绞肉机内搅拌两次,每次30s,得到纯牛肉肉糜样品和纯猪肉肉糜样品。
下面是猪肉和牛肉拉曼光谱采集以及模型建立的方法。
a)样品拉曼光谱采集。本例选用633nm为激发光源的拉曼光谱仪(ramanspectrometer-labramhrevolution)为采集仪器。ccd相机冷却温度为-65℃,曝光时间为3s。线激光光源的有效功率为25%。三类样品数据采集完成后,导出为txt格式并传输给pc机。在本实施例中采集牛肉肉糜、猪肉肉糜和掺假肉糜样品光谱各30条,每条牛肉和猪肉的拉曼光谱分别记为bi、pi、mi(i=1,2,…,30)。
b)拉曼光谱平滑和去噪。对每条光谱指定建立平滑数据的窗口大小m=21。对于窗口中心点,利用五次多项式对窗口内的数据点进行拟合,形成21个六元线性方程所构成的方程组。求该方程组的最小二乘解,得到拟合参数aj(j=0,1,…,5)。将拟合参数aj代入五次多项式,计算得到平滑后三类样品的光谱b′i、p′i、m′i。
c)拉曼光谱基线校正。对每一条光谱信号bi采用自适应迭代重加权惩罚最小二乘法进行基线校正。设定曲线粗糙度惩罚系数λ=100,得到基线校正后的光谱b″i、p″i、m″i。
d)拉曼光谱特征谱峰范围确定。从b″i、p″i、m″i中各提取20条光谱组成训练集ci1(i1=1,2,…,60)。对ci1进行主成分分析,提取前2个主成分pc1、pc2。
以载荷系数α1k为横轴、以载荷系数α2k为纵轴建立二维坐标图,将两个主成分中的同一波段的拉曼位移点βk对应的载荷系数α1k和载荷系数α2k作为散点坐标(α1k、α2k),在二维坐标图上绘制,形成主成分载荷散点图,如图2所示。
e)拉曼特征谱峰提取。
e.1)首先计算各个散点的横轴坐标之和αk。
e.2)然后绘制各个散点αk的第一曲线l1,第一曲线l1上任一散点αj满足αj-1<αj且αj>αj+1则识别散点αj为第一曲线l1中一峰值点,统计第一曲线l中所有的峰值点数目记为p1,将第一曲线l1中所有的峰值点提取出再绘制成新的曲线作为第二曲线l2,对第二曲线l2重复按照与第一曲线l1相同方式识别峰值点,不断直至第t曲线lt的峰值点pt数目满足pt<10时则停止识别峰值点;最后获取第t曲线lt中前五高峰的峰值点,找到五个峰值点所对应的拉曼位移点βk作为五个拉曼特征谱峰。
本例中筛选的5个特征谱峰是1602cm-1、1646cm-1、1416cm-1、1708cm-1、和2949cm-1。
f)基于拉曼光谱的猪肉牛肉分类模型的建立。
采取10次10折交叉验证的方法划分训练集和测试集,采用分层取样的方式使得每个互斥子集中各有3个牛肉和猪肉样本。
将上述步骤中已提取的五个拉曼特征谱峰对应的峰强结合类别标签输入到分类器中进行训练,分类器采用k近邻分类器,分类器中最近邻实例数目k的取值范围是4~10,对于k近邻分类器的不同k值建立模型,取分离加权结果f1score最大的模型作为最终的分类模型,用最终的分类模型对待测肉样本进行分类识别。
本实例中最佳模型对应的k值为5,分类结果如表1所示。
表1分类结果
由上表可见,采用上述方法步骤建立的基于拉曼光谱技术的牛肉猪肉分类模型可以对测试集样本进行准确地分类,准确度较高,说明本发明对猪肉、牛肉分类准确率高。