一种青砖茶原料渥堆时间的数字化预测方法

文档序号:33698575发布日期:2023-03-31 17:22阅读:30来源:国知局
一种青砖茶原料渥堆时间的数字化预测方法

1.本发明属于青砖茶加工技术领域,具体涉及一种青砖茶原料渥堆时间的预测方法,更具体的说涉及一种基于近红外光谱技术的青砖茶原料渥堆时间的数字化预测方法。


背景技术:

2.青砖茶是湖北省的特产,而渥堆是青砖茶加工过程中的一道特殊发酵工艺,是将晒青毛茶堆放成2m左右高度后进行人工洒水,在一定的温度、湿度作用下进行20余天的发酵,发酵过程中辅以多次人工翻堆,促进茶多酚等内含物质发生氧化、络合等化学反应,最后将渥堆结束后的原料经过一系列的加工后制作为青砖茶。渥堆是形成青砖茶特有品质的关键工序,青砖茶的品质随着渥堆时间的不同而呈现显著地差异。当渥堆时间较短时,青砖茶汤色浅淡,滋味淡薄,不利于其品质的形成;当渥堆时间适宜时,则呈现出青砖茶特有的汤色红亮、陈香足等品质风味;当渥堆时间过长时,则会茶汤带酸味,导致青砖茶品质下降,因此在实际生产中需精准地掌握青砖茶原料的渥堆时间,及时把控原料的渥堆进度,才能生产出高品质的青砖茶。
3.目前,通常采用人工方法来评估青砖茶原料的渥堆时间,这种方法是依靠个人感官器官灵敏度和经验阅历来预测原料渥堆时间,具有较大的主观性,极易出现误判。为有效提高渥堆时间预测的准确度,亟需建立一种快速准确地预测青砖茶原料渥堆时间的方法,来确保青砖茶原料渥堆时间的可靠性,以便达到最优的渥堆原料品质。近红外光谱技术是一种准确、便捷的数字化无损检测技术,基于近红外光谱技术的数字化快速预测青砖茶原料渥堆时间的方法尚未有报道,因此非常迫切研发一种青砖茶原料渥堆时间的数字化预测方法来解决当前存在的问题。


技术实现要素:

4.针对上述背景技术所提出的问题,本发明的目的是:旨在提供一种青砖茶原料渥堆时间的数字化预测方法,收集6类不同渥堆时间的青砖茶原料,应用近红外光谱仪扫描获得样品的近红外光谱,应用移动窗口方法动态筛选光谱数据信息,应用组合方法得到全部可能的预处理方法和光谱数据的建模组合,达到同时剔除噪声信息和优选建模光谱数据的目的;以最佳建模预处理方法和光谱数据组合为输入值,应用偏最小二乘方法建立6类不同渥堆时间青砖茶原料样品的近红外光谱预测模型,通过不断调整维数、相关系数、交互验证均方根方差和相对分析误差等参数,建立青砖茶原料渥堆时间的数字化快速预测方法。
5.为实现上述技术目的,本发明采用的技术方案如下:
6.一种青砖茶原料渥堆时间的数字化预测方法,包括以下步骤,
7.s1:茶样品收集与分类;
8.收集6类不同渥堆时间的茶样品,依据样品等级不同,将每类不同渥堆时间的样品按照3:1比例划分为校正集和验证集两个集合,其中校正集样品用于建立预测模型,验证集样品用于检验预测模型效果;
9.s2:近红外光谱扫描;
10.应用近红外光谱仪扫描获得全部6类不同渥堆时间样品的近红外光谱,光谱扫描范围4000~10000cm-1
、分辨率8cm-1
、检测器为ingaas,每个样品采集3次光谱、每次扫描64次,然后对3次采集的光谱进行平均,以平均光谱作为该样品的最终光谱用于后续建立模型;
11.s3:光谱预处理与建模光谱数据的组合筛选;
12.s31:光谱预处理;
13.对s2扫描得到的不同渥堆时间样品的近红外光谱进行预处理,其预处理方法为无光谱预处理、消除常数偏移量、减去一条直线、矢量归一化、最小最大归一化、多元散射校正、一阶导数、二阶导数、一阶导数+减去一条直线或一阶导数+矢量归一化;
14.s32:应用移动窗口方法动态选择建模的光谱数据,通过不断动态调整窗口的大小,不拘于所选择光谱区间所含的具体数据点数量,不均等划分光谱区间数据点,根据预测模型结果来筛选光谱区间所包含的数据信息,精准筛选反映不同渥堆时间青砖茶原料的光谱信息,用于后续建立预测模型;
15.s33:应用数学中的组合方法得到全部可能的光谱预处理方法与光谱数据的建模组合,筛选得到较佳的光谱预处理方法与特征光谱数据的组合,达到同时剔除噪声信息和优化建模光谱数据的目的;
16.s4:校正集预测模型建立;
17.应用偏最小二乘方法建立青砖茶原料不同渥堆时间的近红外光谱预测模型,比较维数、相对分析误差(relative percent deviation,rpd)、相关系数(correlation coefficient of calibration,rc)、交互验证均方根误差(root mean square error of cross validation,rmsecv)和概率p值;其中,当rc最大、rmsecv最小时,表示此时建立的校正集模型结果最佳,为得到的最佳预测模型;
18.其中,rmsecv计算公式为:
19.rc计算公式为:
20.式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,y为样品集中第i个样品的实测值的平均值,式中i≤n;
21.rpd=stdev/rmsecv
22.其中,stdev为校正集样品的标准差;
23.s5:模型稳健性检验;
24.应用全部验证集样品对不同渥堆时间的青砖茶原料样品的偏最小二乘法预测模型效果进行检验,所得结果用维数、相对分析误差(relative percent deviation,rpd)、相关系数(correlation coefficient of prediction,rp)、预测均方根误差(root mean square error of prediction,rmsep)和概率p表示;其中rp越大、rmsep越小则表示模型稳健性越好,可以准确的预测青砖茶原料的渥堆时间;
25.其中rmsep计算公式为:
26.rp计算公式为:
27.式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,式中i≤n;
28.s6:未知原料渥堆时间预测;
29.扫描待测茶叶样品的近红外光谱,采用与s3相同的光谱预处理方法和光谱数据变量,然后代入校正集预测模型,用于预测未知样品的渥堆时间。
30.作为本发明的一种优选方案,所述s1中,每类样品由1芽5叶和1芽6叶部位组成或者更老的芽叶部位组成;其中1芽5叶样品由单芽、第一叶、第二叶、第三叶、第四叶、第五叶和长梗组成;1芽6叶样品由单芽、第一叶、第二叶、第三叶、第四叶、第五叶、第六叶和更长梗组成。
31.作为本发明的一种优选方案,所述s1中根据样品渥堆时间不同分别进行赋值:渥堆时间为0天,赋值为1.000;渥堆时间为4天,赋值为2.000;渥堆时间为10天,赋值为3.000;渥堆时间为14天,赋值为4.000;渥堆时间为19天,赋值为5.000;渥堆时间为23天,赋值为6.000。
32.作为本发明的一种优选方案,所述s3中,预处理方法:一阶导数+多元散射校正;光谱数据:6101.7~5449.8cm-1
+4601.3-4246.5cm-1

33.作为本发明的一种优选方案,所述s32中的光谱数据为:9403.2~7497.9cm-1
,7501.7~6097.8cm-1
,9403.2~6097.8cm-1
,6101.7~5449.8cm-1
,7501.7~5449.8cm-1
,9403.2~5449.8cm-1
,5453.7~4597.5cm-1
,6101.7~4597.5cm-1
,7501.7~4597.5cm-1
,9403.2~4597.5cm-1
,4601.3~4246.5cm-1
,5453.7~4246.5cm-1
,9403.2~4246.5cm-1
,6101.7~4246.5cm-1

34.作为本发明的一种优选方案,所述的s4中最佳维数为7。
35.与现有技术相比,本发明具有如下有益效果:
36.1、本发明应用移动窗口方法动态筛选光谱数据信息,而不是将光谱数据进行均分,能够更佳精准的反映原料渥堆时间的光谱信息;应用数学中的组合方法,得到全部可能的光谱预处理方法和光谱数据的建模组合,再同时优选建模的最佳光谱预处理方法和光谱数据,增加了预处理方法和光谱数据的选择范围,提高了筛选的精准度和效率,能够同时得到最佳的建模光谱预处理方法和光谱数据,再以此为输入值,应用偏最小二乘法建立青砖茶原料不同渥堆时间的预测模型,实现了对青砖茶原料渥堆时间的快速、准确、客观地数字化预测,起到减少建模时间、降低建模成本和增强模型稳健性和实用性的目的。
37.2、优选得到的光谱数据:6101.7-5449.8cm-1
+4601.3-4246.5cm-1
,共有263个数据点,占全部光谱数据的比例为16.9%,不仅降低了模型的输入变量,还提高了建模速率和预测效果,建模时间为15.6秒,比先进行光谱预处理再筛选建模光谱数据的方式节省建模时间15.2秒,建立的最佳预测模型维数为7,rc2为0.9563,rmsecv为0.0375,rpd为52.4,真值
与预测值之间的p值为0.5429(》0.05),没有显著性统计学差异,模型预测准确率极高。
38.3、本发明将近红外光谱技术、移动窗口方法、数学中的组合方法、显著性统计学检验方法和偏最小二乘方法相结合,完美实现了对青砖茶原料渥堆时间的数字化快速精准预测,预测集和验证集准确率均为100%,|偏差|《0.15,样品真值和预测值间均无显著性统计学差异(p》0.05)。
39.4、本发明的方法基于近红外光谱技术,直接对茶叶固体样品进行分析,不消耗溶剂,具有快速、准确、绿色环保等优点,克服了现有方法的不足,能够满足快速、准确预测大批量青砖茶原料样品渥堆时间的产业实际需求,能够解决产业中的青砖茶原料渥堆时间的预测难题。
附图说明
40.本发明可以通过附图给出的非限定性实施例进一步说明;
41.图1是原料样品的近红外光谱;
42.图2是校正集模型rmsecv-维数关系;
43.图3是校正集模型样品真值-预测值结果;
44.图4是验证集模型样品真值-预测值结果。
具体实施方式
45.为了使本领域的技术人员可以更好地理解本发明,下面结合附图和实施例对本发明技术方案进一步说明。
46.一种青砖茶原料渥堆时间的数字化预测方法,包括以下步骤,
47.s1:茶样品收集与分类;
48.收集6类(渥堆0天、4天、10天、14天、19天和23天)不同渥堆时间的青砖茶原料样品72个,依据样品渥堆时间不同,将样品按照3:1比例划分为校正集和验证集2个集合,其中校正集54个样品,验证集18个样品,用于检验校正集模型的稳健性。其中,渥堆时间为0天,赋值为1.000;渥堆时间为4天,赋值为2.000;渥堆时间为10天,赋值为3.000;渥堆时间为14天,赋值为4.000;渥堆时间为19天,赋值为5.000;渥堆时间为23天,赋值为6.000;每类样品由1芽5叶和1芽6叶部位组成或者更老的芽叶部位组成;其中1芽5叶样品由单芽、第一叶、第二叶、第三叶、第四叶、第五叶和长梗组成;1芽6叶样品由单芽、第一叶、第二叶、第三叶、第四叶、第五叶、第六叶和更长梗组成;
49.s2:近红外光谱扫描;
50.应用美国赛默飞.世尔antarisⅱ型傅里叶变换近红外光谱仪(ft-nir)、选用积分球漫反射光学平台扫描获得全部6类不同渥堆时间青砖茶原料样品的近红外光谱,光谱扫描范围4000~10000cm-1
、分辨率8cm-1
、检测器为ingaas,每个样品采集3次光谱、每次扫描64次,然后对3次采集的光谱进行平均,以平均光谱作为该样品的最终光谱用于后续建立模型;
51.在扫描样品光谱前,将该近红外光谱仪预热30分钟,保持室内温度和湿度基本一致后,再将样品装入与仪器配套的旋转杯中进行光谱扫描,每次样品的装样厚度保持一致,保证近红外光无法穿透样品,全部6类不同渥堆时间青砖茶原料样品光谱参见图1。
52.s3:光谱预处理与建模光谱数据的组合筛选;
53.s31:光谱预处理;
54.对s2扫描得到的不同渥堆时间样品的近红外光谱进行预处理,分别应用11种光谱预处理方法对不同渥堆时间的青砖茶原料光谱进行预处理,分别为:无光谱预处理,消除常数偏移量,减去一条直线,矢量归一化,最小-最大归一化,多元散射校正,一阶导数,二阶导数,一阶导数+减去一条直线,一阶导数+矢量归一化,一阶导数+多元散射校正;
55.s32:应用移动窗口方法动态选择建模的光谱数据,通过不断动态调整窗口的大小,不拘于所选择光谱区间所含的具体数据点数量,不均等划分光谱区间数据点,根据预测模型结果来筛选光谱区间所包含的数据信息,精准筛选反映不同渥堆时间青砖茶原料的光谱信息;应用移动窗口方法优选与不同渥堆时间原料密切相关的建模光谱数据,得到的特征光谱数据为:9403.2~7497.9cm-1
,7501.7~6097.8cm-1
,9403.2~6097.8cm-1
,6101.7~5449.8cm-1
,7501.7~5449.8cm-1
,9403.2~5449.8cm-1
,5453.7~4597.5cm-1
,6101.7~4597.5cm-1
,7501.7~4597.5cm-1
,9403.2~4597.5cm-1
,4601.3~4246.5cm-1
,5453.7~4246.5cm-1
,9403.2~4246.5cm-1
,6101.7~4246.5cm-1
,以及上述光谱数据的区间组合;
56.应用数学中的组合方法将光谱预处理方法与光谱数据间进行组合,最终得到355种组合方式,11种最佳的预处理方法和建模光谱数据的组合结果见表1:
57.表1 355种组合方式及其最佳的11种(预处理方法+光谱数据)组合的结果
[0058][0059]
从表1可以看出,在全部的355种组合方式中,从每种组合中选出1种最佳的组合方法结果,共有11个最佳组合结果,其中二阶导数+6101.7~4246.5cm-1
的组合方法结果最差,rmsecv最大为0.0545;有7种组合方法的rmsecv值在0.0400~0.0500之间,有3种组合方法的rmsecv值在0.0300~0.0400之间,其中以一阶导数+多元散射校正为预处理方法,光谱数据为6101.7~5449.8cm-1
+4601.3~4246.5cm-1
时,得到的结果最佳(rmsecv为0.0375);得
到的最佳组合为:一阶导数+多元散射校正预为处理方法,6101.7~5449.8cm-1
+4601.3~4246.5cm-1
为建模光谱数据,仅占全部光谱数据的16.9%。
[0060]
s4:校正集预测模型建立;
[0061]
应用偏最小二乘方法建立青砖茶原料不同渥堆时间的近红外光谱预测模型,比较维数、相对分析误差(relative percent deviation,rpd)、相关系数(correlation coefficient of calibration,rc)、交互验证均方根误差(root mean square error of cross validation,rmsecv)和概率p值;其中,当rc最大、rmsecv最小时,表示此时建立的校正集模型结果最佳,为得到的最佳预测模型;
[0062]
其中,rmsecv计算公式为:
[0063]
rc计算公式为:
[0064]
式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,y为样品集中第i个样品的实测值的平均值,式中i≤n;
[0065]
rpd=stdev/rmsecv
[0066]
其中,stdev为校正集样品的标准差;
[0067]
s3中优选的预处理方法和建模光谱数据的组合作为输入值,以不同渥堆时间原料样品赋值为输出值(渥堆时间为0天,赋值为1.000;渥堆时间为4天,赋值为2.000;渥堆时间为10天,赋值为3.000;渥堆时间为14天,赋值为4.000;渥堆时间为19天,赋值为5.000;渥堆时间为23天,赋值为6.000),应用偏最小二乘方法建立不同渥堆时间样品的预测模型,经多次优化模型的维数值(比较了1-12维的效果)、相关系数值和rmsecv值,当维数为7时(图2),此时rmsecv最小,为0.0375;rc2最大,为0.9563;rpd为52.4,真值与预测值之间的p值为0.5429(》0.05),没有显著性统计学差异,此时得到最佳的校正集预测模型如图3所示;
[0068]
表2 1-12维数下校正集预测模型结果
[0069][0070]
在建立预测模型时,由于维数选择的不同会直接影响模型的预测效果,因此,为了得到最佳的预测效果,比较在1-12维情况下模型的结果,具体结果见表2;从表2可以看出,随着维数的不断增加,r2、rmsecv和rpd均呈先增加后减少的趋势,当最佳维数为7时,rc2最大为0.9563,rmsecv最小为0.0375,rpd最大为52.4,即此时建立的校正集预测模型结果最佳;
[0071]
从图3可以看出,最佳预测模型样品的|偏差|《0.15,样品真值和预测值间几乎完全重合,表明模型具有极高的预测准确度,可以精准的数字化预测原料样品的渥堆时间,所得结果可以进一步佐证预测模型具有极高的预测精准度;
[0072]
s5:模型稳健性检验;
[0073]
防止出现过拟合现象,应用验证集18个样品对校正集预测模型效果进行检验,所得结果用维数、相关系数和rmsep、rpd和概率p表示;当维数为7时,验证集模型rp2最大为0.9483,rmsep最小为0.0698,rpd为24.5,真值与预测值之间的p值为0.5845(》0.05),没有显著性差异,得到最佳的验证集模型如图4所示;
[0074]
当维数为7、rc2为0.9563、rmsecv为0.0375时建立的不同渥堆时间的最佳pls校正集模型,对18个验证集样品的渥堆时间进行预测,预测结果见表3;从表3可以看出,6类不同渥堆时间的青砖茶原料样品的真值和预测值间的|偏差|《0.15,表明模型对所有样品的渥堆时间预测正确,准确率为100%;可见,当应用7个维数、rc2为0.9563、rmsecv为0.0375时建立的不同渥堆时间青砖茶原料的偏最小二乘法预测模型实现了对青砖茶原料渥堆时间的快速、准确、数字化预测;
[0075]
表3 18个验证集样品真值和预测值结果
5449.8cm-1
+4601.3-4246.5cm-1
为建模光谱数据,占全部光谱数据的比例为16.9%;以最佳预处理方法和建模光谱数据的组合为输入值,建立不同渥堆时间青砖茶原料样品的偏最小二乘法预测模型,经反复比较模型的结果,最终当维数为7时,建模时间仅需15.6秒,建立的最佳预测模型rc2为0.9563,rmsecv为0.0375,rpd为52.4,真值与预测值之间的p值为0.5429(》0.05),没有显著性统计学差异,模型预测准确率极高;应用验证集样品检验校正集模型的稳健性,当维数为7时,rp2最大为0.9483,rmsep最小为0.0698,rpd为24.5,真值与预测值之间的p值为0.5845(》0.05),没有显著性差异,模型对验证集原料样品渥堆时间的预测结果全部正确,为100%。因此,本发明应用近红外光谱技术分别结合移动窗口方法、组合方法、统计学方法和偏最小二乘方法,精准实现了对青砖茶原料渥堆时间的数字化快速、无损预测(|偏差|全部《0.15,预测准确率为100%),建立的预测模型不仅达到大大降低模型运算量、简化模型和缩短建模时间的目的,同时还起到提高模型的预测准确度和增强模型实用性的目的。
[0080]
上述实施例仅示例性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1