一种小麦粉蛋白质及湿面筋含量快速检测方法与流程

文档序号:14325862阅读:1843来源:国知局

本发明涉及近红外光谱快速检测领域,特别涉及一种基于近红外光谱和联合区间支持向量机预测模型的小麦粉蛋白质及湿面筋含量快速检测方法。



背景技术:

我国不仅是小麦生产大国,也是小麦食品消费的大国。小麦粉的主要成份是碳水化合物、蛋白质、脂肪、水分、矿物质和维生素等。蛋白质是小麦粉最重要的营养成分之一,面筋反应了小麦蛋白质的组成和比例。一方面,蛋白质作为食品中的营养物质,为人体生命活动提供必需的氨基酸,另一方面作为食品加工原料的重要组成成分,对食品的加工、处理、储藏性质产生重要的影响。蛋白质是小麦粉最重要的营养成分之一,也是形成面筋的主要成分,对面团的流变学特性及最终产品品质有重要的影响。依据蛋白质含量的高低,可以把小麦粉分为高筋粉(蛋白质含量约为12-15%,湿面筋含量在35%以上,常用于制作面包)、低筋粉(蛋白质含量为7-9%,湿面筋含量在25%以下,常用于制作蛋糕、饼干等松散、酥脆的没有韧性的点心)和中筋粉(介于高筋粉与低筋粉之间,常用于制作中式点心,馒头、包子、面条等)。面筋主要是由小麦粉中的麦谷蛋白和麦醇溶蛋白经水合而成,反应了小麦粉中蛋白质的组成和比例。快速地检测小麦粉中的蛋白质及湿面筋含量,对于面制品企业评价原料等级、优化生产工艺、监控产品品质等有非常重要的意义。常见的蛋白质含量测定方法,如凯氏定氮法、双缩脲法、福林-酚法等,操作较复杂,需要消耗能源、试剂,样品消化时会释放有毒气体。常用的湿面筋含量测定方法是手洗法或面筋仪法,需要一定的操作技能或专用的仪器设备。因此,快速测定小麦粉中蛋白质及湿面筋含量对于推动食品企业提高生产效率、强化产品品质控制等有非常重要的意义。

近红外光谱(near-infraredspectroscopy,nirs)以其分析速度快,效率高,样品不需预处理,分析成本低,无污染,操作简便等优点,成为食品安全与质量控制领域的研究热点。在市场流通中,面粉供应商出于各种各样的因素考虑,均有可能在市售的小麦粉中加入食品添加剂、改良剂或营养强化剂,以达到增减筋力、增白、强化营养素等效果。而面粉中其他物质的添加也必然引起面粉红外光谱的变化,有研究发现面粉中加入过氧化钙、氢氧化钙等,其近红外光谱在7083cm-1处会出现吸收峰,并且经过二阶导数处理后尤为明显。支持向量机(supportvectormachine,svm)是一种基于统计学习理论的数据挖掘的方法,是1995年vapnik等在统计学习理论基础上提出的。许多研究表明,支持向量机在解决小样本、非线性样品分类及高维模式识别中表现出许多特有的优势,并且对样本异常值及噪音具有很强的鲁棒性,因此,采用近红外光谱结合支持向量机技术,使得对市场上琳琅满目的小麦粉商品进行快速、准确的品质检测成为了可能。



技术实现要素:

本发明提供了一种基于近红外光谱及支持向量机的小麦粉蛋白质及湿面筋含量快速检测方法,该方法采用近红外光谱结合联合区间变量筛选方法,建立联合区间支持向量机检测模型,从而对小麦粉中蛋白质及湿面筋含量进行快速检测。该方法操作简单,准确率高,适用于工业生产。

为达到上述目的,本发明提供的一种小麦粉蛋白质及湿面筋含量快速检测方法,包括以下步骤:

(1)样品收集及近红外光谱采集:收集一定数量的有代表性的小麦粉样品,使用近红外光谱仪对小麦粉的近红外光谱进行采集,并进行光谱预处理;

(2)采用国标法测定小麦粉的蛋白质及湿面筋含量;

(3)采用联合区间法筛选光谱变量区间,并建立基于联合区间支持向量机的小麦粉蛋白质及湿面筋含量预测模型,同时采用二次网格优化法对支持向量机模型进行优化;

(4)根据所得到的模型,对未知样品的蛋白质及湿面筋含量进行预测。

进一步,步骤(1)中,小麦粉样品的数量不少于80个,并随机划分为校正集与验证集。

进一步,步骤(1)中,近红外光谱扫描范围为12500~3300cm-1,分辨率8cm-1,扫描次数16次。仪器使用前需预热1h,扫描过程中保持室温25℃,并严格控制室内湿度,保持环境一致。

进一步,步骤(1)中,在模型校正前,光谱数据应经过预处理,光谱预处理可以使用一阶导数、二阶导数、平滑处理、标准正态变量变换、多元散射校正中的一种或多种联用。

进一步,步骤(3)中建立基于联合区间支持向量机预测模型的步骤为:将近红外光谱划分成2~20个光谱子区间,采用联合区间变量筛选法筛选最优的光谱特征区间,并构建支持向量机预测模型。即,在每种不同的光谱子区间划分条件下,对可能产生的所有区间组合,均建立支持向量机模型,并进行外部验证,比较各子区间组合模型的rmsep值,rmsep最小者即为最优模型,其对应的子区间组合就是最佳光谱变量区间组合。经筛选,对于蛋白质含量预测,近红外光谱特征区间范围为12493.3~10711.3cm-1和7139.6~3598.7cm-1,对于湿面筋含量预测,近红外光谱特征区间为10703.6~9816.4cm-1和8026.7~7147.3cm-1

进一步,步骤(3)中,支持向量机模型使用libsvm及rbf核函数构建,采用网格搜索法对模型惩罚参数c和rbf核函数参数g进行搜索,搜索范围设置为[2-9,29],参数移动步长为20.4,以5折交互验证均方误差最小时对应的c和g值为最佳参数,确定最佳c和g值后,再进行二次网格搜索优化,二次网格搜索c值搜索范围设定为[2c-12c+1],g值搜索范围设定为[2g-12g+1],搜索步长设定为20.025,以5折交互验证均方误差最小时对应的c和g值为二次网格搜索优化后的最优模型参数。

进一步,经二次网格搜索优化,对于蛋白质含量预测,模型最优参数c=8.5742,g=0.0022;对于湿面筋含量预测,模型最优参数c=5.8563,g=0.9330。

进一步,步骤(4)中,对于未知样品的预测,其光谱采集采用步骤(1)相同的仪器与参数,预测时采用步骤(3)中确定的光谱特征区间。

本发明的有益效果在于:将联合区间支持向量机与近红外光谱分析相结合,并通过二次网格搜索方法优化预测模型,该方法操作简单,准确率高,当模型建成后,基本不需要增加资金投入,节约了测试费用,节约了能源,具有一定的经济效益。

附图说明

图1是支持向量机预测模型的构建及未知样品预测流程图;

图2是未知样品蛋白质含量的预测值与参考值对比图;

图3是未知样品湿面筋含量的预测值与参考值对比图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。

实施例

一种小麦粉蛋白质及湿面筋含量快速检测方法,按如下步骤进行:

(1)样品收集、化学参考值测定与光谱采集

采集不同产地、品种的小麦粉样品96份,按照我国国家标准《谷物和豆类氮含量测定和粗蛋白含量计算凯氏法》(gb/t5511-2008)和《小麦和小麦粉面筋含量第2部分:仪器法测定湿面筋》(gb/t5506.2-2008)规定的方法,分别测定样品蛋白质和湿面筋含量。样品近红外光谱采用布鲁克mpa近红外光谱仪(德国bruker公司)测定。小麦粉样品在室温中平衡温度后,放入石英样品杯中,采用样品杯旋转式扫描,扫描范围为12500~3300cm-1,分辨率8cm-1,扫描次数16次,pbs检测器,光谱使用自带的opus7.0采集。仪器使用前需预热1h,扫描过程中保持室温25℃,并严格控制室内湿度,保持环境的一致性。采集到的光谱采用一阶导数与标准正态变量变换进行预处理。

(2)模型的建立及光谱特征区间的确定

96个样品删除离群值后,随机挑选72个样品作为模型校正集,剩余样品作为验证集。支持向量机模型(svr)在matlab2014a(美国mathworks公司)软件环境中采用lib-svm工具箱建立,模型采用rbf核函数,使用网格搜索法对模型参数c(惩罚参数)和g(rbf核函数参数)进行搜索,搜索范围设置为[2-9,29],参数移动步长为20.4,以5折交互验证均方误差最小时对应的c和g值为最佳参数。

采用联合区间法筛选光谱特征变量区间,首先将光谱划分成10个等宽度的光谱子区间,在每个子区间上建立svr模型,从而得到10个局部模型。然后,在10个子区间中,任意挑选1至9个子区间组合进行建模,比较全光谱模型及各联合区间模型的rmsep值,rmsep最小者即为最优模型,其对应的子区间组合就是最佳光谱变量区间组合。

经过联合区间算法筛选,对于蛋白质含量预测,模型所使用的近红外光谱特征区间范围为12493.3~10711.3cm-1和7139.6~3598.7cm-1,对于湿面筋含量预测,模型近红外光谱特征区间为10703.6~9816.4cm-1和8026.7~7147.3cm-1

(3)基于二次网格搜索的模型优化

二次网格搜索是在经过上述步骤的模型优化之后获得的最佳模型参数c和g附近区域,以更小的搜索步长进行二次搜索,以进一步优化模型预测精度。根据上一步的结果,蛋白质svr模型参数经初次搜索后,最佳c值为10.5561(即23.4),最佳g值为0.0020(即2-9),因此,二次网格搜索c值搜索范围设定为[22,24],g值搜索范围设定为[2-10,2-8],搜索步长设定为20.025,在此范围内进行二次网格搜索后,得到的最优c值为8.5742,最优g值为0.0022。

湿面筋svr模型参数经初次搜索后,最佳c值为6.0629(即22.6),最佳g值为0.8706(即2-0.2),因此,二次网格搜索c值搜索范围设定为[21,23],g值搜索范围设定为[2-1,21],搜索步长设定为20.025。在此范围内进行二次网格搜索。二次网格搜索后得到的最优c值为5.8563,最优g值为0.9330。

(4)模型预测

采集验证集样品的近红外光谱并进行预处理,并输入上步构建的预测模型,可以得到验证集样品的蛋白质和湿面筋含量预测值。模型预测效果通过预测均方根误差(rootmeansquareerrorofprediction,rmsep)和预测相关系数(correlationcoefficient,rp)来评价。通常,模型精度越高,模型rmsep值越小,相应的rp值越大。计算公式如下:

其中,验证集第i个样品的预测值,ypi代表其对应的参考值,表示验证集所有样品参考值的平均值,n代表验证集样品数量。

采用该方法构建的蛋白质近红外光谱预测模型的rp和rmsep分别为0.98和0.230,湿面筋近红外光谱预测模型的rp和rmsep分别为0.96和0.735,达到了较高的预测精度。预测值和参考值之间的关系见图2和图3。

最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了描述,但本领域的普通技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本发明的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1