基于二维近红外相关光谱不变矩特征判别掺杂尿素牛奶的方法与流程

文档序号:12450718阅读:251来源:国知局
基于二维近红外相关光谱不变矩特征判别掺杂尿素牛奶的方法与流程

本发明属于牛奶检测技术领域,具体来说涉及一种基于二维近红外相关光谱不变矩特征判别掺杂尿素牛奶的方法。



背景技术:

牛奶中含有人体所需的蛋白质、脂肪、乳糖、无机盐和钙等各种营养物质,随着人们生活水平的提高,对乳制品的需求量也越来越大。不法商贩在利益的驱使下向牛奶中掺杂大豆蛋白、水、乳清、三聚氰胺等物质,以降低生产成本,从而导致牛奶安全问题频出,对消费者的身体健康造成很大影响。

传统的奶制品质量检测主要是采用一些物理化学方法,这些方法虽然结果比较准确,但其过程一般比较复杂,对实验人员有一定的要求,且耗时费力,有时还需要特定的试剂,对样本具有破坏性,不适合于原料奶收购中质量的及时控制。红外光谱分析技术其过程简单,对实验人员要求不高,成本低,且无需对样品处理就可实现对样品的无损检测,适合对乳制品中掺杂物质的检测。目前二维相关光谱技术的应用主要是科研人员针对研究对象和特定外扰,构建等高线形式的同步谱和异步谱,结合相应读谱规则进行定性分析。随着科学技术的不断进步,二维相关光谱技术正向着与化学计量学模式识别、人工智能相结合,实现自动识别的道路。

中国发明专利公开号CN104316491A公开了一种基于同步-异步二维近红外相关谱检测掺尿素牛奶的方法,该方法直接将同步-异步二维近红外相关谱矩阵与多维化学计量学集合实现掺尿素牛奶的定性判别。虽然其分析结果较好,但同步-异步二维近红外相关谱矩阵是三维矩阵,包含大量的数据,需要多维化学计量学来进行建模,模型复杂,计算时间长,效率低。本发明所提出掺尿素牛奶的判别方法是建立在提取不变矩特征的基础上进行的,其不仅有效提取了二维近红外相关谱的特征信息,而且压缩了数据,提高了建模效率。



技术实现要素:

针对现有技术的不足,本发明的目的在于提供一种基于二维近红外相关光谱不变矩特征判别掺杂尿素牛奶的方法,该方法利用支持向量机算法和样品的特征信号建立分类器,通过提取二维近红外相关光谱不变矩特征和对样品类别的支持向量机算法模型研究,检测牛奶是否掺杂。

本发明的目的是通过下述技术方案予以实现的。

一种基于二维近红外相关光谱不变矩特征判别掺杂尿素牛奶的方法,包括以下步骤:

1)准备纯牛奶和掺杂牛奶作为训练样品,通过扫描得到所述训练样品的一维近红外光谱,并通过Noda理论进行相关谱计算,得到每一个训练样品的同步—异步二维近红外光谱矩阵(详细计算过程见杨仁杰.基于二维相关谱掺杂牛奶检测方法研究[D].天津大学,2013.),并将所得到的同步—异步二维近红外光谱矩阵转化成二维近红外相关光谱图;

在所述步骤1)中,所述同步—异步二维近红外光谱矩阵转化成二维近红外相关光谱图的方法为:将所述同步—异步二维近红外光谱矩阵的数据归一化至0-255之间,通过matlab软件的image命令得到所述二维近红外相关光谱图。

在上述技术方案中,采用离差标准化(min-max标准化)对所述同步—异步近红外二维光谱矩阵的数据进行归一化,离差标准化的转换公式为:

新数据=(原数据-原数据的极小值)*255/(原数据的极大值-原数据的极小值)(1)

其中,原数据为未归一化的同步—异步二维近红外光谱矩阵的数据,新数据为归一化后的同步—异步二维近红外光谱矩阵的数据。

2)根据不变矩理论,提取步骤1)所得二维近红外相关光谱图的不变矩特征;

在所述步骤2)中,提取不变矩特征的方法为:

①根据公式(2)和(3)计算m×n的所述二维近红外相关光谱图的二维矩阵f(x,y)的p+q阶中心矩upq

其中,p和q均为整数,p和q=0、1、2和3,f(x,y)为所获得的同步—异步二维近红外光谱矩阵按所述归一化方法转化后的二维矩阵,M00为所述二维近红外相关光谱图的二维矩阵f(x,y)的零阶矩,M10和M01均为所述二维近红外相关光谱图的二维矩阵f(x,y)的一阶矩;

②通过公式(4)计算所述二维近红外相关光谱图的二维矩阵f(x,y)的M00、M10和M01

其中,m×n为所述二维近红外相关光谱图的分辨率。

③通过公式(5)对步骤①中所得的p+q阶中心矩upq进行归一化,得到ηpq

ηpq=upq/u00γ (5)

其中,

④将步骤③所得的ηpq依次代入公式(6),得到不变矩特征φ1、φ2、φ3、φ4、φ5、φ6和φ7

3)利用主成分分析法对步骤2)所得不变矩特征进行优选,得到优选不变矩特征;

在所述步骤3)中,对步骤2)所得不变矩特征进行优选的方法为:

I按照公式(7)将多个训练样品的不变矩特征组成特征数据矩阵X′=(xij')s×l

其中,xij'为第i个训练样品的第j个不变矩特征参数,l为不变矩特征个数,s为训练样品的个数;标准化处理所述特征数据矩阵X′,得到X=(xij)s×l,其中,

其中,

II按照公式(11)计算X的相关系数,得到相关系数矩阵R=(rij)s×l

III计算所述相关系数矩阵R的特征值(λ12,…,λl);

IV计算贡献率:将步骤III所得特征值依次代入公式(12),得到l个贡献率;

V确定主成分:将l个步骤IV所得贡献率从大到小排列并进行累加,选取贡献率累加值大于等于85%的前t个主成分,确定所述t个主成分的不变矩特征为优选不变矩特征。

4)建立支持向量机模型,采用支持向量机法对所述训练样品的二维近红外相关光谱图进行分类识别,输入为步骤3)所得的优选不变矩特征,输出为训练样品的种类:纯牛奶或掺杂牛奶,其中,调用支持向量机模型的训练函数Svmtrain对所述训练样品进行训练;

5)按照上述方法计算未知种类牛奶的二维近红外相关光谱图的优选不变矩特,将未知种类牛奶的二维近红外相关光谱图的优选不变矩特征输入步骤4)中训练后的支持向量机模型中,即可判别所述未知种类牛奶的种类。

相比于现有技术,本发明的方法采用二维近红外相关光谱图的不变矩特征表征纯牛奶与掺杂牛奶所包含的信息,将图像处理技术与牛奶掺杂判别结合起来,有别于以往的构建等高线形式的同步谱和异步谱,结合相应读谱规则进行定性分析。该方法可实现大量数据的同时处理,判别效率高。除此之外,本发明将二维近红外相关光谱图不变矩特征与支持向量机相结合,通过提取二维近红外相关光谱图的不变矩特征将二维近红外光谱技术与模式识别相结合,实现了掺杂牛奶与纯牛奶的定性判别。该方法克服了谱图用人眼直接比对存在主观误判和无法大量谱图同时比对的缺点,判别效率和正确率高。

附图说明

图1为本发明方法的流程图;

图2为支持向量机的原理图。

具体实施方式

下面结合附图和具体实施例进一步说明本发明的技术方案。

如图1~2所示,一种基于二维相关光谱不变矩特征判别掺杂尿素牛奶的方法,包括以下步骤:

1)准备纯牛奶和掺杂牛奶作为训练样品,通过扫描得到所述训练样品的一维近红外光谱,并通过Noda理论进行相关谱计算,得到每一个训练样品的同步—异步二维近红外光谱矩阵,将所述同步—异步二维近红外光谱矩阵转化成二维近红外相关光谱图,建立样品图库。

其中,获得同步—异步二维近红外光谱矩阵的方法记载于公开号为:CN104316491A的发明专利中(也可参考文献杨仁杰.基于二维相关谱掺杂牛奶检测方法研究[D].天津大学,2013)。同步—异步近红外二维光谱矩阵转化成二维近红外相关光谱图的方法为:将所述同步—异步二维近红外光谱矩阵的数据归一化至0-255之间,归一化处理方法有很多种,在本发明的具体实施方式中采用离差标准化(min-max标准化)对同步—异步二维近红外光谱矩阵的数据进行归一化,使结果值映射到[0-255]之间。离差标准化的转换公式为:

新数据=(原数据-原数据的极小值)*255/(原数据的极大值-原数据的极小值)(1)

其中,原数据为未归一化的同步—异步二维近红外光谱矩阵的数据,新数据为归一化后的同步—异步二维近红外光谱矩阵的数据。

对归一化的同步—异步二维近红外光谱矩阵的数据使用matlab软件的image()命令即可得到二维近红外相关光谱图。

2)根据不变矩理论,提取步骤1)所得二维近红外相关光谱图的不变矩特征;

在所述步骤2)中,提取不变矩特征的方法为:

①根据公式(2)和(3)计算m×n的所述二维近红外相关光谱图的二维矩阵f(x,y)的p+q阶中心矩upq

其中,p和q均为整数,p和q=0、1、2和3,f(x,y)为同步—异步二维近红外光谱矩阵按前述归一化方法转化后的二维矩阵,M00为所述二维相关光谱图的二维矩阵

f(x,y)的零阶矩,M10和M01均为所述二维近红外相关光谱图的二维矩阵f(x,y)的一阶矩;

②通过公式(4)计算二维近红外相关光谱图的二维矩阵f(x,y)的M00、M10和M01

其中,m×n为所述二维近红外相关光谱图的分辨率。

③通过公式(5)对步骤①中所得的p+q阶中心矩upq进行归一化,得到ηpq

ηpq=upq/u00γ (5)

其中,

④将步骤③所得的ηpq依次代入公式(6),得到不变矩特征φ1、φ2、φ3、φ4、φ5、φ6和φ7

3)利用主成分分析法对步骤2)所得不变矩特征进行优选,得到优选不变矩特征;

其中,对步骤2)所得不变矩特征进行优选的方法为:

I按照公式(7)将多个训练样品的不变矩特征组成特征数据矩阵X′=(xij')s×l

其中,xij'为第i个训练样品的第j个不变矩特征参数,l为不变矩特征个数,s为训练样品的个数;原始的不变矩特征数据量纲不同,会对结果产生一定的影响,为了消除不同不变矩特征的量纲影响,必须标准化处理所述特征数据矩阵X′,得到X=(xij)s×l,其中,

其中,

II按照公式(11)计算X的相关系数,得到相关系数矩阵R=(rij)s×l

III计算所述相关系数矩阵R的特征值(λ12,…,λl);

IV计算贡献率:贡献率是指某个主成分的方差占全部方差的比重,实际也就是某个特征值占全部特征值合计的比重。将步骤III所得特征值依次代入公式(12),得到l个贡献率;

V确定主成分:将l个步骤IV所得贡献率从大到小排列并进行累加,选取贡献率累加值大于等于85%的前t个主成分,确定所述t个主成分的不变矩特征为优选不变矩特征;

4)建立支持向量机(SVM)模型,支持向量机原理如图2所示,输入为X1,X2……,Xn,输出为Y,内积核函数为K1(X),K2(X),……,Kn(X)。采用支持向量机法对所述训练样品的二维近红外相关光谱图进行分类识别,输入为步骤3)所得的优选不变矩特征,输出为训练样品的种类:纯牛奶或掺杂牛奶,其中,调用支持向量机模型的训练函数Svmtrain对所述训练样品进行训练;

5)将未知种类牛奶的二维近红外相关光谱图的优选不变矩特征输入步骤4)中训练后的支持向量机模型中,即可判别所述未知种类牛奶的种类。

下面以纯牛奶和掺杂尿素牛奶为例,对本发明的技术方法进行说明。

1)准备27个纯牛奶和27个掺杂尿素牛奶作为训练样品,通过扫描得到54个训练样品的同步-异步二维近红外光谱矩阵,将同步-异步二维近红外光谱矩阵转化成二维近红外相关光谱图;

2)根据不变矩理论,提取步骤1)所得二维近红外相关光谱图的不变矩特征,表1和表2分别为54个训练样品中5个纯牛奶和5个掺杂尿素牛奶的不变矩特征数据;

表1纯牛奶的同步-异步二维近红外光谱图的不变矩特征数据

表2掺杂尿素牛奶的同步-异步二维近红外光谱图的不变矩特征数据

3)利用主成分分析法对步骤2)所得不变矩特征进行优选,得到4个优选不变矩特征,如表3所示。

表3主成分分析结果

由表3可知,经过主成分分析,纯牛奶与掺杂尿素的同步-异步二维近红外光谱图的前4个主成分累计贡献率为92.94%,达到85%以上,能够很好提取原特征统计量的分布特性,即,不变矩φ1、不变矩φ3、不变矩φ2和不变矩φ6为优选不变矩特征。

4)建立支持向量机模型,采用支持向量机法对所述训练样品的二维近红外相关光谱图进行分类识别,输入为步骤3)所得的54个训练样品的优选不变矩特征,输出为训练样品的种类:纯牛奶或掺杂牛奶,其中,调用支持向量机模型的训练函数Svmtrain对所述训练样品进行训练。利用支持向量机模型对校正集进行外部预测,其结果显示,54个训练样品中有3个判别错误,其中有一个纯牛奶被误判为掺杂尿素的牛奶,两个掺杂尿素牛奶别误判为纯牛奶。所建支持向量机模型对校正集的判别准确率为94.4444%。

5)将13个纯牛奶和13个掺杂尿素牛奶作为未知种类牛奶,将26个未知种类牛奶的二维近红外相关光谱图的优选不变矩特征输入步骤4)中训练后的支持向量机模型中,即可判别所述未知种类牛奶的种类。利用模型对校正集进行外部预测,其结果显示,26个样本数据中有4个判别错误,其中纯牛奶判别结果全部正确,4个掺杂尿素的牛奶误判为纯牛奶。所建模型对校正集的判别准确率为84.6154%。

以上对本发明做了示例性的描述,应该说明的是,在不脱离本发明的核心的情况下,任何简单的变形、修改或者其他本领域技术人员能够不花费创造性劳动的等同替换均落入本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1