基于高光谱图像技术的窖泥水分预测模型建立的方法与流程

文档序号:19125238发布日期:2019-11-13 02:03阅读:747来源:国知局
基于高光谱图像技术的窖泥水分预测模型建立的方法与流程

本发明涉及一种基于高光谱图像技术的窖泥水分预测模型建立的方法,属于固态发酵指标检测技术领域。



背景技术:

固态发酵技术在我国有着悠久的历史,也是我国特有的酿造工艺。在白酒酿造行业中,窖泥是发酵的基础,其中以己酸菌为主的有益微生物菌群,利用糟醅中的营养物质进行产酸产酯,己酸乙酯是浓香型白酒的主体香味成分,因此窖泥在生产过程中对浓香型白酒质量起着决定性作用,评价窖泥好坏就显得比较重要。没有好的窖泥,就不能生产上乘的优质酒。

水是窖泥中有益微生物菌群赖以生存的基础。目前常用的水分检测方法是烘干法,此方法耗时耗力,影响因素众多,并且温度过高还会造成窖泥表面板结,内部水分不容易蒸发,导致误差偏大。针对此问题,有学者研究用其他方法进行检测,如专利:高光谱图像技术定量检测固态发酵水分分布均匀性的方法(cn201510642049),采集可见光波段下的高光谱图像;提取感兴趣区域的光谱反射值;筛选n个特征波长;结合特征波长下的光谱反射值和水分含量实测值建立水分含量的预测模型关系式;利用关系式检测醋醅光谱图像中每个像素点对应的水分含量,描绘水分含量的二维分布图;计算水分分布方差值来检测发酵基质水分分布均匀性。该方法实现了快速定量检测发酵基质水分分布均匀性。专利:高光谱图像技术定量检测固态发酵指标分布差异的方法(cn201510641747),采集镇江香醋醋醅的全波段高光谱图像,筛选最优特征波数,建立含量预测模型;计算每个像素点对应的ph值;绘制含量分布图;计算目标区域所有像素点ph均值、标准差、nu值,以此定量分析指标含量分布图像的分布差异。

以上专利的不足之处为:仅采集了可见光区域的图像和光谱信息,而经前期预实验以及资料查询发现,水分在可见光和近红外波段都有明显吸收,且对后者的吸收更强;未做全光谱与特征光谱的比较,直接筛选特征波长对应的光谱信息作为模型的输入变量,容易漏掉重要信息;未进行预处理去噪,易将非样本信号纳入计算;建模方式单一。



技术实现要素:

本发明的目的是提供一种基于高光谱图像技术的窖泥水分预测模型建立的方法。通过搭建高光谱数据采集系统,采集不同窖龄不同层次窖泥的光谱数据,对其进行校正处理,提取具有代表性的感兴趣区域每个像素点的平均光谱反射率,利用近红外以及可见光、未处理以及snv、全光谱以及特征光谱,结合不同的建模方式,建立窖泥水分的预测模型,根据模型在训练集和测试集数据上的表现性能,筛选最优模型。本发明为各大白酒酿造企业快速评价窖泥质量,实现人工养窖护窖提供理论依据及技术支持,为白酒酿造产业化的转型升级以及数字化、智能化在线实时监测窖泥发酵状态提供技术保障。

本发明采取的技术方案是:

基于高光谱图像技术的窖泥水分预测模型的建立方法,包括以下步骤:

步骤一、光谱采样标定:为了消除光照不均匀等因素引起的误差,需要在采样之前,通过标定板对样品光谱数据进行黑白校正;

标定板颜色要与样品接近,否则容易干扰对样品光谱数据的采集,且反射性能要略优于样品的标定板才能实现对样品原始光谱的校正,此外,样品在可见光和近红外区域下的光谱反射性能不同,因此需要选择不同颜色的标定板,才能获取接下来可分析的数据信息。

针对近红外(900~1700nm)和可见光(400~1000nm)波段的差异,在可见光下选择灰色标定板,近红外光下选择米黄色标定板,同时对两个波段的标定分别进行参数设置,所述参数包括打光峰值、曝光频率、时间、平台移动速度;参数设置详见表格。

步骤二、高光谱数据采集:在设置好的参数下,分别采集n份窖泥样本在近红外和可见光波段的全光谱数据,通过envi软件进行黑白校正并将原始光谱信息转化成光谱反射率,提取感兴趣区域(roi),保证能代表样本绝大部分信息;

全光谱数据指的是近红外波段下的224个波长对应的光谱数据和可见光波段下的448个波长对应的光谱数据,而原始光谱信息指的是未经过任何处理的光谱数据。

步骤三、水分含量的测定:参考gb5009.3-2016中直接干燥法对样品水分进行检测,同时,为提高模型预测效果,水分的测定区域与提取的感兴趣区域对应;

步骤四、预处理:考虑到数据采集过程中的噪音、基线漂移等因素可能影响模型精度,将步骤二提取出的光谱信息经过snv预处理后,得到用于后续分析的数据,同时做未处理对照;

步骤五、数据分集:将近红外以及可见光范围内的窖泥样本分别通过k-s算法分为训练集和测试集;

训练集数据主要用于模型的建立,测试集数据主要用于检验模型的预测效果。

步骤六、筛选特征光谱:运用spa算法分别从近红外以及可见光的全光谱数据中筛选出与水分这项表征指标紧密相关的特征光谱,其与全光谱相对应;因可见光和近红外,不做处理的和snv预处理得到的用于后续分析的光谱数据不同,经过spa筛选分别得到4组特征波长。

步骤七、建模:选取近红外区域(900~1700nm)的前180个波长、可见光区域全部波长(400~1000nm)的光谱信息,分别基于全光谱和特征光谱对训练集样本建立不同的定量预测模型(plsr、svm、bp),共计24种模型,通过训练集和测试集的决定系数和均方根误差来评价并筛选出最优预测模型,从而建立一种快速预测窖泥水分含量的方法。

其中,通过前期机理方面寻找到水分特征波长在1440nm以内,经查阅文献得以验证,因此,进行如上波段的选取。

进一步的,训练集和测试集按照一定的比例进行划分,最终近红外训练集样本72个,测试集样本33个;可见光训练集样本72个,测试集样本36个。

本发明的有益效果:

1)首次将高光谱成像技术与窖泥水分实测值相结合,建立一种新型、快速、高效的窖泥水分检测方法,为白酒产业数字化在线监控提供强有力的技术支持。

2)经过预实验以及前期资料查询发现,水分在可见光和近红外波段均有很强的吸收,甚至可以干扰和掩盖其他化合物的信号。为筛选与水分密切相关的特征波段,本发明在可见光(400~1000nm)和近红外(900~1700nm)波段下分别采集窖泥水分光谱信息,用于后续分析,力争建立窖泥水分预测的最佳模型。

3)在前期进行采样标定时,本发明针对特定样品,选择与之相近的,并在光谱反射性能上略优于样品的标定板。此外,考虑近红外和可见光波段的差异,本发明在可见光下选择灰色标定板,近红外下选择米黄色标定板。

4)考虑到玻璃器皿较强的反光性能,本发明优先选用石英材质的器具用于样本光谱数据的采集,提高模型的精度。

5)为获得窖泥水分预测的最优模型,后期分析做了大量工作,包括未处理以及snv预处理,全光谱以及特征光谱、不同建模方法等。

可见光和近红外隶属于两个不同的光谱区域,同一样品对这两个区域的反射性能也不同,因此需要分别设置不同的参数值,否则没法进行下一步分析。

附图说明

图1最优模型建立流程图;

图2不同窖泥近红外光谱反射率曲线图;

图3不同窖泥可见光光谱反射率曲线图;

图4近红外光谱训练集模型水分指标检测效果图;

图5近红外光谱测试集模型水分指标检测效果图;

图6可见光光谱训练集模型水分指标检测效果图;

图7可见光光谱测试集模型水分指标检测效果图。

具体实施方式

窖泥水分定量预测模型建立的工艺流程如图1所示。

(1)窖泥样本采集:样本采自四川省宜宾市某知名酒厂,采样时工人刨开遗漏的酒糟,以黄水为分界线,用铁铲收集同一水平面四周的窖泥,将其用取样袋封好即成一个样本,同一窖池的采样部位包括窖帽、黄水中和窖底泥三层,共3个样。以此方式获得不同窖龄的窖泥总计108份。

(2)高光谱采集系统:采用芬兰specimfx17系列高光谱相机,2组160w的y型光纤卤素灯作为光源,利用lumoscanner软件控制相机和精密电控载物台进行光谱数据采集。

(3)参数设置及光谱数据采集:通过调节电动载物台运行速率,使其与相机图像扫描频率相匹配,设置高光谱近红外相机的曝光时间为4.02ms,采集频率为50hz,载物台的移动速度为16.42mm/sec;高光谱可见光相机的曝光时间为8.00ms,采集频率为50hz,载物台的移动速度为10.79mm/sec。将装好窖泥并铺平的石英器皿放置于载物台中心位置,在400~1000nm和900~1700nm波段下分别采集108份和105份窖泥样本的高光谱原始图像信息,通过envi软件手动提取像素为100x100的矩形感兴趣区域(roi),并进行校正处理转化为每个像素点的平均光谱反射率,从而分别得到近红外波段105条包含224个波长下的光谱数据以及可见光范围108条包含448个波长的光谱数据。为方便观察,本发明以两个窖池的窖泥为例,阐述不同窖龄窖泥在近红外和可见光波段下光谱反射率曲线的差异,选取了6条分别包含近红外全波段(224个波长)以及可见光全波段(448个波长)的光谱反射率曲线,如图2、3所示,图中一个是6年的新窖,一个是30年的老窖,30年的窖泥光谱反射率普遍高于6年的光谱反射率。不同层级的窖泥光谱反射率曲线也不同,说明高光谱可以对不同年份不同层级的窖泥进行识别。

(4)窖泥水分检测:取样部位与感兴趣区域对应,水分的测定方法参考gb5009.3-2016中直接干燥法。

(5)光谱数据预处理:光谱数据包含大量的噪声信号,需要对其去噪,经前期大量分析工作发现,标准变量变换(snv)能有效去除高频噪音、防止基线漂移,优化光谱信号,因此本发明采用的光谱预处理方法是snv。

(6)样本分集:在数据建模前,通常会将数据集划分为训练集和测试集,训练集数据主要用于模型的建立,测试集数据主要用于检验模型的预测效果,根据预测效果筛选最优模型。通过k-s算法将样本数据划分为训练集和测试集。训练集和测试集按照一定的比例进行划分,最终近红外训练集样本72个,测试集样本33个;可见光训练集样本72个,测试集样本36个。

(7)特征光谱的筛选:水分对光谱的吸收具有选择性,窖泥内部存在多种化合物对光能的吸收,会造成相关波长的波谷或波峰的叠加,为提高模型的稳健性和预测效果,需寻找与水分紧密相关的特征波长,剔除不相关波长。本发明采用spa算法筛选特征波长。因未处理和snv预处理得到的用于后续分析的光谱数据不一致,经过spa筛选分别得到4组特征波长,如表1所示。

表1特征波长统计表

(8)预测模型的建立:为比较获得最佳预测模型,将近红外、可见光、不做处理及预处理、全波长及特征波长得到的光谱数据分别结合窖泥水分实测值建立plsr、ls-svm、bp三种模型,通过最终模型的训练集和测试集均方根误差比较获得最优模型。需要注意的是,因前期从机理方面,寻找到水分特征波长在1440nm以内,经查阅文献得以验证,因此近红外光谱数据的建模,全光谱选取的是前180个波长对应的光谱信息。鉴于经过不同处理的拟合模型较多,本发明以snv-spa-plsr(指利用snv先预处理、再用spa算法筛选出特征波长,然后以偏最小二乘回归法建立的模型)。

基于近红外和可见光的偏最小二乘模型,近红外的训练集和测试集模型的水分检测效果如图4、5所示,训练集的决定系数r2=0.9927,均方根误差rmse=0.0032;测试集的决定系数r2=0.9721,均方根误差rmse=0.0069。可见光的训练集和测试集模型的水分检测效果如图6、7所示,训练集的决定系数r2=0.9985,均方根误差rmse=0.0015;测试集的决定系数r2=0.9902,均方根误差rmse=0.0039。说明在所选取的两种建模方式中,基于可见光的snv-spa-plsr模型要优于近红外,在模型的稳健性和泛化性能方面更好,抗干扰能力更强,更适合应用于窖泥水分的快速检测。经过不同处理的拟合模型在训练集和测试集上的表现性能如表2所示,从表2可以得出,与其他两种模型相比,ls-svm效果最好。可见光波段下,基于未处理全光谱的svr模型训练集拟合效果最好,但是在测试集上性能相对较差。而在近红外波段下,经过snv预处理之后的光谱数据基于全光谱和特征光谱建立的svr预测模型,精度都非常高,并且模型的稳健性和泛化性能也特别好,抗干扰能力强。但是考虑到全光谱建模数据量较大,处理困难,需要大型服务器供应,因此在保证模型精度的条件下,优先考虑筛选特征变量建模,减少计算量,提高工作效率。从表2也可以看出,snv预处理后的光谱数据不仅容量小,模型精度也略高于全光谱建模。因此,最终获得窖泥水分定量预测的最佳模型为基于近红外光谱下的snv-spa-svr模型。

表2各拟合模型在训练集和测试集上的表现性能统计表

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1