本发明涉及卷烟生产,更具体地,涉及一种烤烟片烟产区识别方法、系统、电子设备及存储介质。
背景技术:
1、目前,烤烟片烟的产地对烤烟香型具有至关重要的因素,是卷烟配方设计中需要参考的重要依据,但在是由于同一产地烤烟片烟的质量参差不齐,有些片烟并不具有该产区烤烟片烟所具有的一些特性,很难满足卷烟工业生产的需求,并为原料检验提供便利性。
2、因此,如何提供一种烤烟片烟产区识别方法、系统、电子设备及存储介质成为本领域亟需解决的技术难题。
技术实现思路
1、本发明的目的是提供一种烤烟片烟产区识别方法、系统、电子设备及存储介质。
2、本发明第一方面公开了一种烤烟片烟产区识别方法;所述方法包括:
3、步骤s1、采集各产区的烤烟片烟样本,并烤烟片烟样本的产区进行标识;
4、步骤s2、检测烤烟片烟样本的物质成分,构成片烟样本的基础数据库;
5、步骤s3、利用随机森林算法的特征重要性排序及逆向思维从烤烟片烟样本的物质成分的数据中提取最优特征,构成最优特征集;
6、步骤s4、应用最优特征集和烤烟片烟样本的产区标识对机器学习分类模型进行分类训练;
7、步骤s5、将未知产区的烤烟片烟的物质成分数据输入随机森林算法,得到最优特征,再将所述最优特征输入训练好的机器学习分类模型,进行烤烟片烟的产区分类。
8、根据本发明第一方面的方法,在所述步骤s1中,所述采集各产区的烤烟片烟样本,并烤烟片烟样本的产区进行标识的方法包括:
9、针对各产区的烤烟,采用五点取样法在烤烟烟叶各点分别取80g~100g,混合后装入样品袋,并标识烤烟片烟产区;
10、对同一产区同一等级的样品混合后装袋密封,得到烤烟片烟样本;不同产区的同一等级的烤烟片烟不得相互混合。
11、根据本发明第一方面的方法,在所述步骤s2中,所述物质成分包括:常规化学成分、微量粒子、氨基酸、ph值和amador化合物。
12、根据本发明第一方面的方法,在所述步骤s2中,所述检测烤烟片烟样本的物质成分,构成片烟样本的基础数据库的方法包括:
13、将采集到的烤烟片烟样本分别装入样本杯中,分别检测各个片烟样本的物质成分数据,作为各片烟样本的基础数据库;
14、每个样本分别重复装样测定两次,计算其两次检测结果的平均结果,作为样本的物质成分数据。
15、根据本发明第一方面的方法,在所述步骤s3中,所述利用随机森林算法的特征重要性排序及逆向思维从烤烟片烟样本的物质成分的数据中提取最优特征的方法包括:
16、设烤烟片烟的物质成分的指标共有m个,样本量为t的数据集,每次随机有放回的抽出n个样本来进行训练;
17、从所述数据集中的所有m个特征属性中等概率选出m个特征属性作为候选特征属性,其中m≤m;利用等概率选出的m个候选特征属性构建决策树,并且使每棵树不进行剪枝地完整生长,得到n棵完整的决策树,每棵决策树都对输出变量做出分类,最终得到n个分类结果;
18、根据得到的n个分类结果,对输出变量的最终分类进行投票,得票最多的类别为输出变量的最终类别,再根据输出变量的最终类别的平均误差率,得到最优特征。
19、本发明第二方面公开了一种烤烟片烟产区识别系统;所述系统包括:
20、第一处理模块,被配置为,采集各产区的烤烟片烟样本,并烤烟片烟样本的产区进行标识;
21、第二处理模块,被配置为,检测烤烟片烟样本的物质成分,构成片烟样本的基础数据库;
22、第三处理模块,被配置为,利用随机森林算法的特征重要性排序及逆向思维从烤烟片烟样本的物质成分的数据中提取最优特征,构成最优特征集;
23、第四处理模块,被配置为,应用最优特征集和烤烟片烟样本的产区标识对机器学习分类模型进行分类训练;
24、第五处理模块,被配置为,将未知产区的烤烟片烟的物质成分数据输入随机森林算法,得到最优特征,再将所述最优特征输入训练好的机器学习分类模型,进行烤烟片烟的产区分类。
25、本发明第三方面公开了一种电子设备。电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时,实现本公开第一方面中任一项的一种烤烟片烟产区识别方法中的步骤。
26、本发明第四方面公开了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本公开第一方面中任一项的一种烤烟片烟产区识别方法中的步骤。
27、根据本发明公开的技术内容,具有如下有益效果:能够通过本方法来筛选出该地区不符合的片烟或者筛选出其他地区可以用来代替的烤烟片烟,这将在很大程度上提升烟叶的利用效率,在一定程度上也解决原料不足的问题。
28、通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
1.一种烤烟片烟产区识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种烤烟片烟产区识别方法,其特征在于,在所述步骤s1中,所述采集各产区的烤烟片烟样本,并烤烟片烟样本的产区进行标识的方法包括:
3.根据权利要求1所述的一种烤烟片烟产区识别方法,其特征在于,在所述步骤s2中,所述物质成分包括:常规化学成分、微量粒子、氨基酸、ph值和amador化合物。
4.根据权利要求1所述的一种烤烟片烟产区识别方法,其特征在于,在所述步骤s2中,所述检测烤烟片烟样本的物质成分,构成片烟样本的基础数据库的方法包括:
5.根据权利要求1所述的一种烤烟片烟产区识别方法,其特征在于,在所述步骤s3中,所述利用随机森林算法的特征重要性排序及逆向思维从烤烟片烟样本的物质成分的数据中提取最优特征的方法包括:
6.一种用于烤烟片烟产区识别系统,其特征在于,所述系统包括:
7.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时,实现权利要求1至5中任一项所述的一种烤烟片烟产区识别方法中的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1至5中任一项所述的一种烤烟片烟产区识别方法中的步骤。