基于决策树提取特征判别马苏里拉奶酪身份标识的方法与流程

文档序号:16544384发布日期:2019-01-08 20:45阅读:412来源:国知局
基于决策树提取特征判别马苏里拉奶酪身份标识的方法与流程

本发明涉及奶酪身份特征的识别技术,尤其涉及一种基于决策树提取特征判别马苏里拉奶酪身份标识的方法。



背景技术:

马苏里拉奶酪是是进口量仅次于切达奶酪的一种拉伸奶酪。水牛奶马苏里拉奶酪的营养价值相对牛奶的而言更丰富,但其成本也更高,因此极易发生掺假现象。通常而言不同级别的马苏里拉奶酪的评价大多以主观的感官评价为主,缺少客观的评价标准,但由于不同乳源马苏里拉奶酪风味差异程度较小,通常不是经验丰富的马苏里拉奶酪制造者或者使用者,很难对两种不同乳源的奶酪进行确定。另外对于奶酪基本依赖进口的我国而言,水牛奶马苏里拉奶酪的感官评定分级方法因缺少生产经验和使用经验而难以操作,主要依赖进口标签对其进行区分,因此很容易造成掺假,导致品质良莠不齐。如何利用仪器分析对进口水牛奶马苏里拉奶酪的身份以及奶酪品质进行确定,一直是我国进口奶酪产业一个难以解决的问题。

奶酪的风味与其品质有较大相关性,是影响其质量的关键因素,不同等级的奶酪具有不同浓度的挥发性特征组分,因此近年来也有研究者利用风味分析方法对马苏里拉奶酪分级展开初步研究,但大多采用固相微萃取气相色谱质谱联用仪(spme-gc-ms)得到不同奶酪中的挥发性组分峰面积,再结合电子鼻,采用主成分分析(principalcomponentanalysis)、聚类分析(clusteranalysis)、偏最小二乘法(partialleastsquares)等方法直接鉴别样本,并没有对不同等级奶酪特有的身份判别风味组分进行分析,信息特征不够,因而不能准确地区分不同成熟期的马苏里拉奶酪。



技术实现要素:

为了克服上述现有技术的不足,本发明提供一种基于决策树提取特征判别马苏里拉奶酪身份标识(特征化合物)的方法,基于决策树算法提取马苏里拉奶酪特征,建立马苏里拉奶酪身份标识性特征风味组分模型,识别出不同的身份标识性特征风味组分,由此判别马苏里拉奶酪的身份等级。

本发明提供的技术方案是:

基于决策树提取特征判别马苏里拉奶酪身份标识的方法,包括如下步骤:

1)对马苏里拉奶酪的特征风味组分进行确定并定量;执行如下操作:

11)采用香气提取物稀释分析方法(aeda)测定马苏里拉奶酪的特征风味组分,得到每种挥发性香气物质的香气稀释因子;

具体地,通过溶剂辅助风味蒸发法(safe),对水牛奶马苏里拉奶酪样品的挥发性分为组分进行萃取,得到浓缩液;将得到的浓缩液用正己烷按1:3进行系列稀释(按照3的n次方进行稀释),稀释倍数分别为3、9、81、243...,每次稀释后的溶液进入气相-嗅闻装置(gc-o)进行分析,直到感官评价员在嗅探口末端不再闻到任何气味则停止稀释,每种挥发性香气物质的最高稀释倍数即为其fd因子(flavordilutionfactor,香气稀释因子)。每个稀释倍数的样品由感官评价员分析三次,有两次以上在同一嗅闻时间有相同感官描述即为有效结果。通过aeda方法确定得到水牛奶马苏里拉奶酪中共有23种特征风味组分。

12)特征风味组分的标准曲线的制备;

将aeda法选出的23种特征风味组分(香气标准品),按照内标半定量结果的浓度范围,将选定化合物使用式1计算标准曲线(最小回归偏差大于0.96)。将酸性化合物(乙酸、丁酸、壬酸)溶于10ml正己烷,按设定的浓度范围配置,内标选用2-甲基戊酸且浓度恒定;同理,将中/碱性化合物(乙酸乙酯、3-己酮、戊酸甲酯、己酸乙酯、辛醛、2-壬酮、壬醛、辛酸乙酯、癸醛、苯甲醛、2-十一烷酮、2-壬烯醛、十一醛、苯乙酮、月桂醛、苯甲醇、呋喃酮、δ-壬内酯、γ-十二内酯、δ-十二内酯),按设定的浓度范围配置并溶于10ml正己烷中,内标为2-甲基-3-庚酮且浓度恒定。在此基础上做出23种特征风味组分标准曲线。

式1中:a<[s]>为内标物质的峰面积或峰高;a<[r]>为目标化合物的峰面积或峰高;m<[s]>为加入内标物质的量;m<[r]>为加入目标化合物的量;n为标准曲线的斜率;k为标准曲线的截距。

13)样品中特征风味组分含量检测

gc-ms条件将通过顶空固相微萃取气质联用法(spme-gc-ms)来萃取风味组分用于气相色谱质谱联用(gc-ms)分析。gc条件:采用db-wax毛细管柱(30m×0.25mm,0.25μm),氦气作载气,使用1ml/min恒定流速。色谱柱升温程序:起始柱温35℃,保持5min,溶剂延迟4min,以5℃/min升到100℃,保持2min,然后以6℃/min升到180℃,最后以8℃/min升到230℃,保持2min。采用不分流模式,进样口温度为250℃。ms条件:电子电离源,电离能量70ev,离子源温度为230℃,接口温度为250℃,四极杆温度150℃,检测器温度为280℃,扫描模式全扫描,质量范围m/z20~350。

数据处理由masshunter化学工作站完成,待鉴定化合物经检索与nist14标准品的质谱谱库中该挥发性成分谱图进行对比,仅当两者匹配度大于800(完全一致匹配度为1000)的鉴定结果才确认是该化合物,定性分析所得挥发性化合物,并根据内标浓度对化合物进行定量。

保留指数ri测定方法:在色谱条件相同的情况下,将正构烷烃c7~c40与马苏里拉奶酪在相同的色谱条件下得出gc保留时间,并根据公式2计算待测物i的保留指数(tn<ti<tn+1)。

式2中:ri—保留指数;n—碳原子数;ti—为样品i的保留时间;tn—碳原子数为n的正构烷烃的保留时间;tn+1—碳原子数为n+1的正构烷烃的保留时间。

2)生成身份标识性特征风味组分模型;

基于上述实验得到24个马苏里拉奶酪样本的23种身份标志性特征风味组分浓度,级别分布为:新鲜水牛、新鲜牛奶、半硬质牛奶,用决策树进行特征选择,流程如图1,主要是基于基尼指数构建决策树,根据公式3计算在给定不同特征风味组分情况下样本集合的基尼指数gini(d,a),基尼指数越小说明样本越属于一类,最小基尼指数所对应的特征风味组分即为分裂特征,选择所有的分裂特征作为身份标识性特征风味组分,进行后续的类别鉴定,将提高分类效率以及准确度,决策树如图2,可见通过决策树得到的马苏里拉奶酪身份标识性特征风味组分为乙酸(aceticacid)、2-十一烷酮(2-undecanone)。

式3中:a为给定的特征风味组分,d为马苏里拉奶酪样本集合,d1、d2为在给定特征a下样本集合d被划分为两个子集,其中k为马苏里拉奶酪的类别,ck为对应类别的子集。

3)未知马苏里拉奶酪级别的判定;

利用支持向量机(supportvectormachine,svm)模型判别未知马苏里拉奶酪级别。保留马苏里拉奶酪身份标识性特征风味组分乙酸、2-十一烷酮,将24个样本输入支持向量机分类模型,通过五折交叉验证得到准确率和f1-score,f1-score是精确率(precision)和召回率(recall)的一种调和平均数,越高说明分类模型性能越好,如图3,通过决策树特征选择后的类别鉴定结果比原始23个特征风味组分的类别鉴定结果好,准确率、f1-score均高达96%,能够很好的区分负样本和识别正样本,判定未知的马苏里拉奶酪级别。

与现有技术相比,本发明的有益效果是:

本发明提供一种基于决策树提取特征判别马苏里拉奶酪身份标识的方法,获得判别马苏里拉奶酪身份标识的特征化合物,很好的区分了不同等级的马苏里拉奶酪。本发明具有以下技术优势:

(一)通过提取特征风味组分,提出了一种马苏里拉奶酪身份判别的创新方法,与传统的感官评定方法相比,节省了大量人力与感官评价相关费用,同时对于不熟悉马苏里拉奶酪品质相关背景的我国消费者者而言,具有使奶酪分级更加客观、有效的作用;

(二)本发明中,打破传统的马苏里拉奶酪判别方法,基于特征风味组分,采用决策树分类提高了马苏里拉奶酪身份判别的准确率。

附图说明

图1为本发明提供的基于决策树提取判别马苏里拉奶酪身份标识性特征化合物的方法的流程框图。

图2为本发明实施例中马苏里拉奶酪特征风味组分决策树图。

图3为本发明实施例中不同马苏里拉奶酪特征风味组分的分类准确率及f1-score示意图。

具体实施方式

下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。

本发明提供一种基于决策树提取特征判别马苏里拉奶酪身份标识的方法,能够很好的区分负样本和识别正样本,判定未知的马苏里拉奶酪级别。

图1为本发明提供的基于决策树提取判别马苏里拉奶酪身份标识性特征化合物的方法的流程框图,具体实施包括如下步骤:

1)对马苏里拉奶酪的特征风味组分进行确定并定量;执行如下操作:

11)采用香气提取物稀释分析方法(aeda)测定马苏里拉奶酪的特征风味组分,得到每种挥发性香气物质的香气稀释因子;

具体地,通过溶剂辅助风味蒸发法(safe),对水牛奶马苏里拉奶酪样品的挥发性分为组分进行萃取,得到浓缩液;将得到的浓缩液用正己烷按1:3进行系列稀释,稀释倍数分别为3、9、81、243...,每次稀释后的溶液进入气相-嗅闻装置(gc-o)进行分析,直到感官评价员在嗅探口末端不再闻到任何气味则停止稀释,每种挥发性香气物质的最高稀释倍数即为其fd因子(flavordilutionfactor,香气稀释因子)。每个稀释倍数的样品由感官评价员分析三次,有两次以上在同一嗅闻时间有相同感官描述即为有效结果。通过aeda方法确定得到水牛奶马苏里拉奶酪中共有23种特征风味组分。

12)特征风味组分的标准曲线的制备;

将aeda法选出的23种特征风味组分(香气标准品),按照内标半定量结果的浓度范围,将选定化合物使用式1计算标准曲线(最小回归偏差大于0.96)。将酸性化合物(乙酸、丁酸、壬酸)溶于10ml正己烷,按设定的浓度范围配置,内标选用2-甲基戊酸且浓度恒定;同理,将中/碱性化合物(乙酸乙酯、3-己酮、戊酸甲酯、己酸乙酯、辛醛、2-壬酮、壬醛、辛酸乙酯、癸醛、苯甲醛、2-十一烷酮、2-壬烯醛、十一醛、苯乙酮、月桂醛、苯甲醇、呋喃酮、δ-壬内酯、γ-十二内酯、δ-十二内酯),按设定的浓度范围配置并溶于10ml正己烷中,内标为2-甲基-3-庚酮且浓度恒定。在此基础上做出23种特征风味组分标准曲线。

式1中:a<[s]>为内标物质的峰面积或峰高;a<[r]>为目标化合物的峰面积或峰高;m<[s]>为加入内标物质的量;m<[r]>为加入目标化合物的量;n为标准曲线的斜率;k为标准曲线的截距。

14)样品中特征风味组分含量检测

gc-ms条件将通过顶空固相微萃取气质联用法(spme-gc-ms)来萃取风味组分用于气相色谱质谱联用(gc-ms)分析。gc条件:采用db-wax毛细管柱(30m×0.25mm,0.25μm),氦气作载气,使用1ml/min恒定流速。色谱柱升温程序:起始柱温35℃,保持5min,溶剂延迟4min,以5℃/min升到100℃,保持2min,然后以6℃/min升到180℃,最后以8℃/min升到230℃,保持2min。采用不分流模式,进样口温度为250℃。ms条件:电子电离源,电离能量70ev,离子源温度为230℃,接口温度为250℃,四极杆温度150℃,检测器温度为280℃,扫描模式全扫描,质量范围m/z20~350。

数据处理由masshunter化学工作站完成,待鉴定化合物经检索与nist14标准品的质谱谱库中该挥发性成分谱图进行对比,仅当两者匹配度大于800(完全一致匹配度为1000)的鉴定结果才确认是该化合物,定性分析所得挥发性化合物,并根据内标浓度对化合物进行定量。

保留指数ri测定方法:在色谱条件相同的情况下,将正构烷烃c7~c40与马苏里拉奶酪在相同的色谱条件下得出gc保留时间,并根据公式2计算待测物i的保留指数(tn<ti<tn+1)。

式2中:ri—保留指数;n—碳原子数;ti—为样品i的保留时间;tn—碳原子数为n的正构烷烃的保留时间;tn+1—碳原子数为n+1的正构烷烃的保留时间。

2)生成身份标识性特征风味组分模型;

基于上述实验得到24个马苏里拉奶酪样本的23种身份标志性特征风味组分浓度,级别分布为:新鲜水牛、新鲜牛奶、半硬质牛奶,用决策树进行特征选择,流程如图1,主要是基于基尼指数构建决策树,根据公式3计算在给定不同特征风味组分情况下样本集合的基尼指数gini(d,a),基尼指数越小说明样本越属于一类,最小基尼指数所对应的特征风味组分即为分裂特征,选择所有的分裂特征作为身份标识性特征风味组分,进行后续的类别鉴定,将提高分类效率以及准确度,决策树如图2,可见通过决策树得到的马苏里拉奶酪身份标识性特征风味组分为乙酸(aceticacid)、2-十一烷酮(2-undecanone)。

式3中:a为给定的特征风味组分,d为马苏里拉奶酪样本集合,d1、d2为在给定特征a下样本集合d被划分为两个子集,其中k为马苏里拉奶酪的类别,ck为对应类别的子集。

3)未知马苏里拉奶酪级别的判定;

利用支持向量机(supportvectormachine,svm)模型判别未知马苏里拉奶酪级别。保留马苏里拉奶酪身份标识性特征风味组分乙酸、2-十一烷酮,将24个样本输入支持向量机分类模型,通过五折交叉验证得到准确率和f1-score,f1-score是精确率(precision)和召回率(recall)的一种调和平均数,越高说明分类模型性能越好,如图3,通过决策树特征选择后的类别鉴定结果比原始23个特征风味组分的类别鉴定结果好,准确率、f1-score均高达96%,能够很好的区分负样本和识别正样本,判定未知的马苏里拉奶酪级别。

需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1