一种基于多尺度稀疏表示的奶酪产地鉴别方法

文档序号:6537260阅读:231来源:国知局
一种基于多尺度稀疏表示的奶酪产地鉴别方法
【专利摘要】本发明公开了一种基于多尺度稀疏表示的奶酪产地鉴别方法,包括以下步骤:采用中红外光谱获取三种不同产地的奶酪在4000-7800nm之间的光谱反射特征曲线。每种产地的奶酪随机选取150份作为训练样本,17份作为测试样本。稀疏表示方法的冗余字典由训练集样本组成,对每一个测试样本,用训练样本的线性组合来表示测试样本,并且该线性组合是稀疏的。计算测试样本在冗余字典上的投影,将具有最小投影误差的类作为测试样本所属的产地。试验结果表明,采用稀疏表示的方法对3种奶酪产地的综合识别准确率为94.2%,获得了很好的效果。基于稀疏表示的识别方法具有很好的抗噪性和鲁棒性,为奶酪的产地识别提供了一种新的有效方案。
【专利说明】—种基于多尺度稀疏表示的奶酪产地鉴别方法
【技术领域】
[0001]本发明涉及产地鉴别领域,特别涉及一种基于多尺度稀疏表示的奶酪产地鉴别方法。
【背景技术】
[0002]产品的生产产地与其品质之间有着密切联系,当产地变更时,产品的品质也会随之产生很大的变化,产地环境因素是产品品质保证的重要因素,习惯上将这类产品称为原产地产品。不同产地的奶酪由于生产工艺、原料奶的成分以及奶酪成熟过程中发生的生物化学反应不同,使得不同产地的奶酪在产品品质方面存在着差异。例如不同产地的奶酪在颜色及脂肪酸总蛋白、水溶性氮等化学成分的含量上存在明显差异。传统的奶酪产地鉴定技术是基于对奶酪产品内部化学成分分析的基础上,主要包括对奶酪脂肪分提物的气相色谱分析和蛋白质电泳分析等。虽然这些方法能有效鉴别奶酪的产地,但存在耗时、操作过程复杂、分析成本高、不易实现在线快速检测等问题。而红外光谱以其独有的“指纹”特性,越来越受到人们的重视。红外光谱法是一种快速简便无损的分析方法,可以反映物质内部的有机成分,特别是C-H、0-H、N-H等基闭的倍频和合频吸收,可用于定量测定物质有机物质的含量。红外光谱技术以其样品消耗量小、快速、经济等优点已被广泛应用于农业、制药、饲料、食品、石油化工、医药等行业。国内外很多学者利用红外光谱技术进行物质品种鉴别。在奶酪产地快速检测研究中具有广泛的应用潜力。

【发明内容】

[0003]为了解决现有奶酪产品地理标志鉴别的问题,本发明提供一种快速简便无损的产地鉴定方法对不同产地的奶酪进行鉴别,该发明在产品地理标志鉴别上具有重要应用价值。
[0004]一种基于多尺度稀疏表示的奶酪产地鉴别方法,其特征包括如下步骤:
[0005]I)利用中红外光谱仪采集已知奶酪样本的原始光谱数据样本图像,并对采集到的原始光谱数据预处理;
[0006]2)运用遗传算法抽取步骤I)预处理后的原始光谱数据的15个特征波长;
[0007]3)将步骤2)所述抽取的15个特征波长运用稀疏表示分解方法一正交匹配追踪算法进行模式特征分析得到冗余字典;
[0008]4)计算测试样本在冗余字典上的投影,将具有最小投影误差的类作为测试样本所
属的产地。
[0009]所述采集原始光谱数据的波长范围为4000_7800nm。
[0010]红外光谱仪置于已知奶酪样本的正上方,距已知奶酪样本表面15-20mm;分析谱区采用4000-7800nm范围的数据,间隔点为3,即在4000_7800nm区间每三个波长点选取一个数据点。
[0011]所述光谱数据预处理方法,先对原始光谱数据进行SavitzkyGolay Derivatives处理,再采用Savitzky-Golay平滑法,选用平滑点数为6,最后对原始光谱数据进行SNV处理。
[0012]运用遗传算法抽取15 个特征波长是:5478nm,5579nm,7649nm,5479nm,6473nm,6260nm,6101nm,6630nm,7965nm,7696nm,5842nm,4596nm,7256nm,4959nm,4436nm。
[0013]与现有技术相比,本发明的有益效果是:传统的奶酪产地鉴定技术是基于对奶酪产品内部化学成分分析的基础上,主要包括对奶酪脂肪分提物的气相色谱分析和蛋白质电泳分析等。虽然这些方法能有效鉴别奶酪的产地,但存在耗时、操作过程复杂、分析成本高、不易实现在线快速检测等问题。本发明应用中红外光谱技术结合特征波长提取方法提取15 个特征波长,提取的特征波长分别是:5478nm,5579nm,7649nm,5479nm,6473nm,6260nm,6101nm, 6630nm, 7965nm, 7696nm, 5842nm, 4596nm, 7256nm, 4959nm, 4436nm,建立了基于稀疏表示分解算法一正交匹配追踪算法模式特征分析模型。计算测试样本在冗余字典上的投影,将具有最小投影误差的类作为测试样本所属的产地。试验结果表明,采用稀疏表示的方法对3种奶酪产地的综合识别准确率为94.2%,获得了很好的效果。基于稀疏表示的识别方法具有很好的抗噪性和鲁棒性,为奶酪的产地识别提供了 一种新的有效方案。
【专利附图】

【附图说明】
[0014]图1是本发明的系统框图;
[0015]图2是本发明不同产地预测集样本稀疏表示贡献值图。
【具体实施方式】
[0016]如图1所示,本发明一种基于多尺度稀疏表示的奶酪产地鉴别方法,其特征包括如下步骤:
[0017]I)利用中红外光谱仪采集已知奶酪样本的原始光谱数据样本图像,并对采集到的原始光谱数据预处理;
[0018]2)运用遗传算法抽取步骤I)预处理后的原始光谱数据的15个特征波长;
[0019]3)将步骤2)所述抽取的15个特征波长运用稀疏表示分解方法一正交匹配追踪算法进行模式特征分析得到冗余字典;
[0020]4)计算测试样本在冗余字典上的投影,将具有最小投影误差的类作为测试样本所
属的产地。
[0021]所述采集原始光谱数据的波长范围为4000_7800nm。
[0022]红外光谱仪置于已知奶酪样本的正上方,距已知奶酪样本表面15-20mm;分析谱区采用4000-7800nm范围的数据,间隔点为3,即在4000_7800nm区间每三个波长点选取一个数据点。
[0023]所述光谱数据预处理方法,先对原始光谱数据进行SavitzkyGolay Derivatives处理,再采用Savitzky-Golay平滑法,选用平滑点数为6,最后对原始光谱数据进行SNV处理。
[0024]运用遗传算法抽取15 个特征波长是:5478nm,5579nm,7649nm,5479nm,6473nm,6260nm,6101nm,6630nm,7965nm,7696nm,5842nm,4596nm,7256nm,4959nm,4436nm。
[0025]所述稀疏表示分解方法一正交匹配追踪算法模式特征分析,方法和步骤如下:[0026]I)冗余字典D由所有训练样本集组成,并将字典D的列向量进行归一化处理。
[0027]2)采用正交匹配寻踪(OMP)算法。从冗余字典D中选择最贴近残差信号的原子来表示信号,同时从残差信号中去掉信号在该原子上的投影,以获得新的残差信号。此过程不断地迭代进行,直至残差值小于给定的阈值e = 0.001。最终得到测试样本基于冗余字典D的稀疏线性表示。
[0028]3)由于我们得到了每一个测试样本基于训练集样本的一组线性表示,因此我们用这组线性表示来重建每一个测试样本。其中冗余字典中的每个训练样本都对测试样本的重建做出了贡献,然后根据其训练样本所属的类别将得到的贡献进行归类,并把属于相同类别的贡献相加,得到各个类对于测试样本的贡献。最后计算测试样本与各类贡献之间的距离,将测试样本归类于距离最小的一类中。
[0029]实施例
[0030]采集范围在4000-7800nm之间的光谱数据,光谱采样间隔为1.5nm,扫描次数30次,光源采用与光谱仪配套的14.5V卤素灯。
[0031]三种不同产地的奶酪 样本共167个样本。全部实验样本随机分成建模集和预测集,建模集有150个样本(每个品种50个),预测集有17个样本。光谱仪经白板校准后进行测试。光谱仪置于样本的上方,距奶酪样本表面15-20mm,对每一个样本扫描20次,取平均值。
[0032]为了去除随机噪音、光散射、基线漂移、样本不均匀等影响,需要对采集到的光谱数据进行数据预处理。先对数据进行SavitzkyGolayDerivatives —阶微分处理,平滑点数设置为6,用以去除同波长无关的漂移。再采用MovingAverageSmoothing平滑法,平滑点数设置为6,用以提高分析信号的信噪比,有效地滤除各种因素产生的高频噪音。最后对数据进行多元散射校正处理,MSC可以去除中红外漫反射光谱中样品的镜面反射及不均匀性造成的噪声,消除漫反射光谱的基线及光谱的不重复性。处理后的光谱数据作为遗传算法的输入。
[0033]遗传算法控制参数设定:初始群体100,遗传迭代次数50,交叉概率0.7,变异概率0.1。将预处理后的光谱数据用GA进行波长筛选,共提取15个特征波长作为稀疏表示的输入变量。进行数据稀疏分析之前所有训练样本的数据已经进行大小归一化处理。第i类的训练样本用Ni表示,将给出的η个训练样本组合成矩阵Di,则Di =[d^, φ,2,Cli,n] e Rmxn,其中Ni表示属于第i类的训练样本,m表示样本维数,每一个列向量即训练集样本已经进行归一化处理。
[0034]我们采用稀疏表示的方法对测试样本y用冗余字典D进行线性表示,得到的稀疏表示的系数向量记为A,则y = DA。理想情况下,假设测试样本y属于第k类,稀疏系数向量A中的非O值所对应的训练样本应该都属于第k类,其余类的稀疏系数向量值均为O。这样的话,我们可以很简单地将测试样本y归类于第k类。然而由于噪声的影响,可能会使得系数向量A中的一些非O值对应的训练样本属于其他的类。对于稀疏表示来说,我们可以有很多的分类方法来进行分类,其中最简单的一种可以直接将测试样本y归于系数向量A中非O系数相加最大的项所对应的训练样本属于的类中。但该方法的分类效果准确率不够高。要使得分类器达到更准确地分类效果,我们采用加权计算的方法得出的线性表示进行分类,我们要把所有的系数向量A中的非O值都计算在内。[0035]由于我们得到了测试样本y的一组线性表示,因此我们可以用这组线性表示来重建该测试样本,其中每个冗余字典中的训练样本都对重建该测试样本做出了贡献,其贡献大小为其系数与训练样本的乘积aiXi。我们计算所有的系数向量A中的非O值%与其相对应的训练样本Xi的乘积aiXi作为该训练样本对测试样本的贡献,然后根据训练样本所属的类别将这些贡献进行归类,并把属于相同类别的贡献值相加,由此得到各个类对于测试样本I的总体贡献值,这也是各个类对于测试样本I的逼近。
[0036]假设我们得到的系数向量A中第r类的非O值为as,...,at,其对应的冗余字典中的训练样本为Xs,...,Xt,则每类对于测试样本y的贡献为:
[0037]gr = X δ r (A), r e L [0038]其中,第r类对于测试样本的贡献值记为gp
[0039]然后我们计算每个测试样本y与贡献值&之间的距离,并将测试样本y归类于距离最小的一类中。其数学表达形式如下:
[0040]
【权利要求】
1.一种基于多尺度稀疏表示的奶酪产地鉴别方法,其特征包括如下步骤: 1)利用中红外光谱仪采集已知奶酪样本的原始光谱数据样本图像,并对采集到的原始光谱数据预处理。 2)运用遗传算法抽取步骤I)预处理后的原始光谱数据的15个特征波长。 3)将步骤2)所述抽取的15个特征波长运用稀疏表示分解方法一正交匹配追踪算法进行模式特征分析得到冗余字典。 4)计算测试样本在冗余字典上的投影,将具有最小投影误差的类作为测试样本所属的产地。
2.根据权利要求1所述的一种基于多尺度稀疏表示的奶酪产地鉴别方法, 其特征在于:所述采集原始光谱数据的波长范围为4000-7800nm。
3.根据权利要求1所述的一种基于多尺度稀疏表示的奶酪产地鉴别方法, 其特征在于:红外光谱仪置于已知奶酪样本的正上方,距已知奶酪样本表面15-20mm;分析谱区采用4000-7800nm范围的数据,间隔点为3,即在4000_7800nm区间每三个波长点选取一个数据点。
4.根据权利要求1所述的一种基于多尺度稀疏表示的奶酪产地鉴别方法, 其特征在于:所述光谱数据预处理方法,先对原始光谱数据进行SavitzkyGolayDerivatives处理,再采用Savitzky-Golay平滑法,选用平滑点数为6,最后对原始光谱数据进行SNV处理。
5.根据权利要求1所述的一种基于多尺度稀疏表示的奶酪产地鉴别方法, 其特征在于:运用遗传算法抽取15个特征波长是:5478nm,5579nm,7649nm,5479nm,6473nm,6260nm,6101nm,6630nm,7965nm,7696nm,5842nm,4596nm,7256nm,4959nm,4436nm。
【文档编号】G06K9/46GK103778417SQ201410041429
【公开日】2014年5月7日 申请日期:2014年1月28日 优先权日:2014年1月28日
【发明者】林萍, 陈永明, 胡国文 申请人:盐城工学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1