一种基于近红外光谱的小麦粉粉质特性预测方法

文档序号:36638686发布日期:2024-01-06 23:24阅读:19来源:国知局
一种基于近红外光谱的小麦粉粉质特性预测方法

本发明涉及一种基于近红外光谱的小麦粉粉质特性预测方法,属于农产品品质检测领域。


背景技术:

1、小麦粉是世界人民日常饮食的重要粮食原料,小麦粉品质可以由面团流变学参数特征具体反映出来,这些流变学指标在测量过程中主要通过绘制粉质曲线充分表达,因此,粉质曲线为面团品质提供了可靠的评价指标,其中最重要的四个粉质特性参数是:吸水率(water absorption)、形成时间(development time)、稳定时间(stability time)、弱化度(degree of softening)。

2、由于粉质特性直接影响了小麦粉的用途,因此许多学者致力于对粉质特性的预测研究,其中利用近红外技术检测小麦粉品质是一个重要方法。许多学者利用近红外光谱同时检测小麦粉品质和在发酵、烘焙过程中的理化性质,daba等人同时检测了吸水率、稳定时间、混合时间、面包体积等参数,zardetto等人研究了小麦粉品质与颜色和硬度的关系,张霞等人给出了小麦吸水率、籽粒硬度、湿面筋含量、面团稳定时间、形成时间、延展性等属性之间的相关性分析结果。

3、近红外光谱结合化学计量学在小麦粉品质的定量检测中也发挥了显著作用,陈嘉等人基于pls建立了小麦粉品质指标的近红外光谱模型,研究采用向前区间筛选算法选择光谱波段的最佳区间组合,赖立群对一个种类多样、品质丰富的面粉数据集展开近红外光谱建模分析,研究中对比了pls模型和bp神经网络模型对面粉品质参数的预测能力,johannes等人对一个包含415个小麦样本的多样化数据集进行了建模分析,实验建立了关于蛋白质、湿面筋、面包体积、吸水率等参数的多种回归模型。虽然这些方法能够实现小麦粉粉质参数的预测功能,但是在小麦粉样本种类丰富,组成数据复杂的情况下,为了保证预测精度,模型构建需要大量的训练数据集,并且随着样本数据复杂度的进一步提升,数据量和计算量随之不断增加,同时预测精度也会受到很大的影响。此外,小麦粉红外光谱采集的过程中,原始光谱会受到无关信息和噪声的干扰,如杂散光、电噪声以及基线漂移等,这些因素会进一步影响预测精度。


技术实现思路

1、为了提升小麦粉粉质特性预测效率和预测准确度,本发明提供了一种基于近红外光谱的小麦粉粉质特性预测方法,所述技术方案如下:

2、步骤1:采集小麦粉近红外光谱数据,并进行预处理,抑制噪声干扰;

3、步骤2:采用降维方法对预处理后的小麦粉近红外光谱数据进行降维;

4、步骤3:采用k-means算法对降维后的近红外光谱数据进行聚类,将数据分为多个簇;

5、步骤4:对每一簇建立不同的plsr预测模型,利用所述plsr模型分别对各簇内的小麦粉近红外光谱数据进行回归分析,得到所述小麦粉粉质特性的预测结果。

6、可选的,所述步骤1中的预处理包括:采用标准正态变换snv和加入了一阶导数的savitzky-golay平滑法sav-gol d1对小麦粉近红外光谱数据进行处理。

7、可选的,所述标准正态变换snv的处理过程包括:

8、对于近红外光谱数据集x,snv分别处理每条光谱数据,公式为:

9、

10、式中,xi同样代表第i条光谱,形式为xi=(ai1,ai2,…,aij);代表第i条光谱平均值,形式为ai,k代表第i条光谱的第k个特征值,j为每条光谱特征值的数量。

11、可选的,所述sav-gol d1的处理过程包括:

12、首先设定过程的超参数移动窗口宽度,令其为2ω+1,对于第i条光谱xi,设窗口内的数据点为s(x),则x的取值为[-ω,…,0,…,ω],窗口内数据为[s(-ω),…,0,…,s(ω)],此时窗口内数据拟合成一个n阶多项式,n≤2ω+1,形式为:

13、

14、式中,[c0 c1 … cn]t为多项式待定系数;

15、最小二乘拟合残差e的形式为:

16、

17、当最小二乘拟合残差e对各个多项式系数的导数为0时,其值最小,则:

18、

19、根据上述的等式关系得到:

20、

21、其中,在sav-gol过程中,给定了数据点ω、阶数n,和待拟合数据[s(ω),…,0,…,s(ω)],将其代入上式中,先后得到fr和pk+r从而确定多项式系数[c0 c1 … cn]t;此多项式在窗口中心点的值即为第i条光谱xi此刻经过平滑的结果,随数据窗口的移动,sav-gol过程会得到连续的平滑结果。

22、可选的,所述步骤2中的降维方法包括:主成分分析法、t分布随机邻近嵌入法。

23、可选的,所述步骤3将近红外光谱数据分成3簇。

24、可选的,所述步骤4中采用校正均方根误差、交叉验证均方根误差和预测均方根误差作为评估指标用来评估模型的预测精确度。

25、可选的,预测模型的加权均方根误差公式为:

26、

27、式中,n1,n2,n3是每个簇包含的样品数据量,n=n1+n2+n3,rmse1,rmse2,rmse3是每个簇模型的均方根误差。

28、可选的,所述小麦粉近红外光谱数据的光谱采集范围为850nm~1650nm。

29、可选的,所述小麦粉粉质特性包括:吸水率、形成时间、稳定时间、弱化度。

30、本发明有益效果是:

31、本发明的小麦粉粉质特性预测方法,引入了聚类分析的方法,在进行回归分析之前,现将小麦粉红外光谱数据进行分簇,然后在每个簇内基于plsr模型进行小麦粉粉质的预测。相比于现有的预测方法,本发明在样本种类丰富,组成复杂的红外光谱数据集上获得了更高的预测精度。

32、分簇后每个簇内的红外光谱数据具备更多的共性,因此在每个簇内分别建立plsr模型,不仅减少了模型构建需要的数据量和计算量,且实验结果证明,分簇后构建后的plsr模型性能得到了有效的提升,进一步提升了小麦粉粉质特性的预测精度,同时有效地降低了计算量和计算复杂度,提高了预测效率。

33、在本发明的一种实施方式中,可以采用标准正态变换(snv)和加入了一阶导数的savitzky-golay平滑法(sav-gol d1)对光谱进行预处理,实验结果证明,该预处理的步骤有效地抑制了杂散光、电噪声以及基线漂移等无关因素的干扰,可以进一步提升小麦粉粉质特性的预测精度。



技术特征:

1.一种基于近红外光谱的小麦粉粉质特性预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于近红外光谱的小麦粉粉质特性预测方法,其特征在于,所述步骤1中的预处理包括:采用标准正态变换snv和加入了一阶导数的savitzky-golay平滑法sav-gol d1对小麦粉近红外光谱数据进行处理。

3.根据权利要求2所述的基于近红外光谱的小麦粉粉质特性预测方法,其特征在于,所述标准正态变换snv的处理过程包括:

4.根据权利要求2所述的基于近红外光谱的小麦粉粉质特性预测方法,其特征在于,所述sav-gol d1的处理过程包括:

5.根据权利要求1所述的基于近红外光谱的小麦粉粉质特性预测方法,其特征在于,所述步骤2中的降维方法包括:主成分分析法、t分布随机邻近嵌入法。

6.根据权利要求1所述的基于近红外光谱的小麦粉粉质特性预测方法,其特征在于,所述步骤3将近红外光谱数据分成3个簇。

7.根据权利要求1所述的基于近红外光谱的小麦粉粉质特性预测方法,其特征在于,所述步骤4中采用校正均方根误差、交叉验证均方根误差和预测均方根误差作为评估指标用来评估模型的预测精确度。

8.根据权利要求6所述的基于近红外光谱的小麦粉粉质特性预测方法,其特征在于,预测模型的加权均方根误差公式为:

9.根据权利要求1所述的基于近红外光谱的小麦粉粉质特性预测方法,其特征在于,所述小麦粉近红外光谱数据的光谱采集范围为850nm~1650nm。

10.根据权利要求1所述的基于近红外光谱的小麦粉粉质特性预测方法,其特征在于,所述小麦粉粉质特性包括:吸水率、形成时间、稳定时间、弱化度。


技术总结
本发明公开了一种基于近红外光谱的小麦粉粉质特性预测方法,属于农产品品质检测领域。本发明的小麦粉粉质特性预测方法,引入了聚类分析的方法,在进行回归分析之前,现将小麦粉红外光谱数据进行分簇,然后在每个簇内基于PLSR模型进行小麦粉粉质的预测。相比于现有的预测方法,本发明在样本种类丰富,组成复杂的红外光谱数据集上获得了更高的预测精度。此外,在每个簇内分别建立PLSR模型,不仅减少了模型构建需要的数据量和计算量,且实验结果证明,分簇后构建后的PLSR模型性能得到了有效的提升,进一步提升了小麦粉粉质特性的预测精度,同时有效地降低了计算量和计算复杂度,提高了预测效率。

技术研发人员:左文娟,周德强,朱琦,陈嘉伟,盛卫锋,崔晨昊
受保护的技术使用者:江南大学
技术研发日:
技术公布日:2024/1/5
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1