一种辅助叶组配方平衡替换的方法与流程

文档序号：12906617阅读：305来源：国知局

本发明涉及一种辅助叶组配方平衡替换的方法，属于卷烟叶组配方技术领域。

背景技术：

烟草作为一种农产品，受本身遗传基因、栽培措施、土壤条件、气候因素及调制方法等多方面的影响，不同品种、不同地区甚至同一植株不同部位的烟叶，在品质及风格上都存在着较大差异。因此，烟叶的各种优良品质因素，不可能仅存在于同一种或少数几种烟叶中。一个品种的烟叶，其品质因素往往是互相矛盾的。如某些烟叶香气充足，但杂气较重、刺激性较大；某些烟叶劲头适中，但香气不够足。使用单一品种或单一等级的烟叶制成的卷烟，有无法克服的质量缺陷。即使是高等级的烟叶，也难以获得令人完全满意的效果。这就需要利用各种烟叶的不同特性，选取最佳的叶组配方组合，使参与配方的各种烟叶能扬长避短、互相补充，并协调一致地发挥各自的作用。

我国在叶组配方设计方面做了大量研究与应用，但未得到切实的应用，还是依赖于设计师的传统经验来设计卷烟产品，这种传统经验认为：可以根据相同区域、相同品种、相同部位、不同等级的烟叶进行混配；也可以对不同区域、相同品种、相同部位、适配性较强的烟叶混配等。但实践证明，这种传统式经验配方不利于卷烟新产品的开发，所以在经验设计的基础上，研究算法设计卷烟产品是卷烟发展的必然趋势。

技术实现要素：

本发明的目的在于针对现有技术的不足，提供一种辅助叶组配方平衡替换的方法，以解决传统原料叶组配方平衡替换方法过程复杂，综合影响因素需结合考虑，测试结果准确率波动较大、费时费力的问题。

本发明采用如下技术方案：一种辅助叶组配方平衡替换的方法，是通过大批量的历史数据和当前生产数据，包括原料、配方、内在质量评价等相关数据，对数据清洗并抽取关联关系进行研究，以原料变化对配方调整的影响角度分析，同时分析原料配方变化，记录分析配方变化后为保持内质的不变，香精香料、烟用材料和生产工艺参数调整对于内质评价的正反影响算法应用，最后找到原料品质信息对原料叶组平衡替换方法。具体包括以下步骤：

（1）基于规则的原料分类：将原料历史替换的所有数据进行汇总，对比分析历史替换数据中各个属性变更的频次，根据频次得到库存信息和原料属性身份信息对原料可替换的重要性程度的排序；再根据重要性程度的排序，建立决策树，将第一重要属性作为对预测效果改进的最大的自变量，被首先用于拆分节点，随后又将第二重要属性进行第二次拆分，以此类推，最终找到可替换的原料；

（2）基于聚类算法的原料分类：整理归纳现有可用库存原料，建立多维空间体系，以原料的特征身份信息作为维度，每一条原料根据不同特征属性的维度生成多个空间坐标点，坐标点相互之间维度越相近，原料的特征属性则越相近，被替换的准确性越高；通过聚类算法在现存原料的特征属性中挑选多维度特征近似趋同的原料作为可替换备选；然后利用历史替换记录修正聚类偏差，获得部分可替换原料；

（3）基于机器学习算法的评价预测：将步骤（1）与步骤（2）中的可替换原料结果结合取正交集合，所得集合即为最终的可替换原料列表。

所述步骤（1）的频次中频次越高的，则该属性特征对原料替换的影响程度越低，重要性也低。

所述步骤（1）的库存信息是指是否拥有库存。库存是影响替换的决定性因素，毫无疑问跟实际情况相符，在没有库存的情况下，是根本无法进行原料替换的。

所述步骤（1）的原料属性身份信息包括是否关联牌号、品种信息、原料二级产地、年份、原料三级产地和价格。

其中，是否关联牌号是根据原料关联的牌号生成的数据，原料可用于多个牌号生产，则为关联牌号；原料只供一个牌号卷烟的生产，则不关联。其次是物料牌号关联的影响，如果替换的某条原料跟其他多个牌号有关联，在替换时考虑到其他牌号优先使用的情况下尽量不发生替换；第三是品种替换的因素，某些品种之间原料属性存在一定的相似性，在替换时应给予适当选择；当然产地、年份和价格的影响也不可忽视，相邻或相近产地原料品质较为近似，替换是也可优先考虑。

所述步骤（2）的原料的特征身份信息包括年份、产地、等级、部位等。

所述的步骤（2）的聚类算法指多维空间体系算法，这种多维空间体系算法是一种模糊、快速的算法；具体算法为：以配方替换所需原料的特征身份信息（年份、部位、产地等）作为不同纬度离散点，对离散数据点给定分组数进行同纬度下的集合划分，形成不规则立体图，并在同纬度下的数据集中随机抽取一个数值点k，计算k到下一个随机数值距离的中心点，并将该中心点设为k；以局部加权的形式随机抽取出下一个点（第三个点），计算k到新点的中心点ko；依次计算k到所有非中点的距离和l以及ko到所有非中点的距离和lo；若l>lo，则将ko赋予k(k=ko)，当对所有集合完成计算，各个集合最终回归得到一个中点并保存，最后每个维度的中心点对应反馈回各维度定义的特征身份信息，根据算出的中心值在库存原料遍历搜寻相同或最近似的值，综合各维度的特征身份信息给出可能存在库存原料，或与计算结果中特征因子最相近的库存原料，并根据相近值进行排序。

所述步骤（3）的所得集合代入完整配方替换需求的环境中，对应替换过原料的卷烟配方进行专业评价分值比较，进行验证；或者，结合历史数据，采用步骤（2）中聚类算法，对所得集合纳入算法进行不断地循环验证，用以确定配方平衡替换方法的准确性和稳定性，并在替换的过程中以机器学习的方式不断总结替换规则，优化替换的方法模型，提升辅助叶组配方平衡替换方法的准确与可靠性。

本发明的有益效果：本发明在现有库存中挑选、分析、评价预测，优化筛选出最优选择范围。为工作人员提供了直观的替换选择，为配方替换、配方维护和配方研发提供科学化、信息化的数据预测支撑，解决了盲目性、效率低下等问题，提高了配方原料的使用效率，进而优化了叶组配方的设计，从而达到了优化提升卷烟内在质量的目的。

附图说明

图1为实施例1的原料替换变量重要性预测图；

图2为实施例1的原料替换变量频次预测图；

图3为实施例1的决策树；

图4是实施例1的规格a、1号模组人工经验原料替换实例；

图5是实施例1步骤（3）的取正交集合的示意图；

图6为实施例2的原料替换变量重要性预测图；

图7为实施例2的原料替换变量频次预测图；

图8为实施例2的决策树；

图9是实施例2的规格b、1号模组人工经验原料替换实例。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明，但实施例并不是对本发明技术方案的限定。

实施例1

以xx卷烟厂规格a，1号模组中“2013烤烟/昆明2/红大/wbbsf/fl/p/”原料替换为例进行说明：

横向对分析：把原料历史替换的所有数据进行汇总，对比分析历史替换数据中各个属性变更的频次，替换频次越高，说明该属性特征对原料替换的影响程度越低，重要性低。

分析结果：库存信息和原料属性身份信息对原料可替换的重要性程度依次为拥有库存、是否关联牌号、品种信息、原料二级产地、年份、原料三级产地和价格，其中是否关联牌号是系统根据原料关联的牌号生成的数据，原料可用于多个牌号生产，则为关联牌号；原料只供一个牌号卷烟的生产，则不关联。其中库存是影响替换的决定性因素，毫无疑问跟实际情况相符，在没有库存的情况下，是根本无法进行原料替换的；其次是物料牌号关联的影响，如果替换的某条原料跟其他多个牌号有关联，在替换时考虑到其他牌号优先使用的情况下尽量不发生替换；第三是品种替换的因素，某些品种之间原料属性存在一定的相似性，在替换时应给予适当选择；当然产地、年份和价格的影响也不可忽视，相邻或相近产地原料品质较为近似，替换是也可优先考虑。如图1和2。

得出结论：在发生替换时年份替换是相对优先考虑的因素，其次是品种和三级产地的替换，最后当其他情况都不能满足时才考虑替换原料的二级产地。

建立决策树预测模型：通过对历史人为替换经验的分析，按照原料属性对替换的影响程度大小排序，建立决策树（如图3）：拥有库存作为对预测效果改进的最大的自变量，被首先用于拆分节点；随后又按照是否关联其他牌号进行第二次拆分，紧接着又对二级产地进行第三次拆分，最终找到了可替换的原料。可见该原料替换时优先考虑的因素分别是库存、牌号关联信息和二级产地，按照这样的方式层层进行筛选，将人为替换经验转化为可替换的原料变更规则，筛选出部分可替换物料。

如图4所示，为人为经验替换。被替换原料与替换原料对比如下：

可见，此次人工替换选择的是同一品种、同一等级、同一产地，不同年份的原料进行替换。而一种辅助叶组配方平衡替换的方法，就以类似的人工替换经验为规则，参考历史的替换记录，得到部分可选的替换材料。

（2）基于聚类算法的原料分类：整理归纳现有可用库存原料，建立多维空间体系，以原料的特征身份信息（年份、产地、等级、部位等）作为维度，每一条原料根据不同特征属性的维度生成多个空间坐标点，坐标点相互之间维度越相近，原料的特征属性则越相近，被替换的准确性越高；如年份是一条维度，等级是一条维度，部位又是一条维度等。而这些原料特征属性的具体信息就是这条维度上的刻度，即在年份维度上的刻度为2009年、2010年、2012年…，部位维度的刻度有上部、中部、下部…。

特别说明，多维空间体系中的维度并不是横纵坐标，若非要表示为横纵坐标，那么多维空间体系中任何一个维度都可以是横坐标，也可以是纵坐标。也就是说，多维空间体系中，横纵坐标是相对的，只要两个维度垂直，那么这两个维度就可以作为那一面上的x,y轴。

空间中的点：选取一条原料，其身份信息的具体描述会根据不同刻度生成空间中一个点，这个点表示的就是这条原料。

通过聚类算法在现存原料的特征属性中挑选多维度特征近似趋同的原料作为可替换备选；然后利用历史替换记录修正聚类偏差，获得部分可替换原料；即，通过建立多维空间体系，确定了满足生产库存要求的原料在空间中的位置，然后通过计算空间中两个不同点的最短距离，来判断原料的相似度。

令同纬度（同年份、同部分等）的坐标点作为一个集合，随机抽取一个数值点k，计算k到下一个随机数据距离中心点，并将该中心点设为k；以局部加权的形式随机抽取出下一个点（第三个点），计算k到新点的中心点ko；依次计算k到所有非中点的距离和l以及ko到所有非中点的距离和lo。若l>lo，则赋予k=ko；若l<lo，则k=k。也就是说，取距离和最小的中心点作为该集合的相对中心点k。

最后得出结论：当所有集合完成计算得出中心点，就开始计算这些中心点的距离，得到新的中心点。不断重复直到最终回归得到较为集中的集合，这个集合所表示的原料信息就是基于聚类算法的原料分类方法筛选出的部分可替换物料。

（3）基于机器学习算法的评价预测：将步骤（1）与步骤（2）中的可替换原料结果结合取正交集合，如图5，所得集合即为最终的可替换原料列表。

通过经验规则与机器学习算法相结合测算得出可替换原料，并和其替换原料的专业评价建立分值比较，其中专业评价的来源为内部专业评吸师进行日常评吸工作，评吸结果通过专业评吸软件将结果数据进行记录并上传。将可被替换原料评吸数据与实际替换后的评吸结果数据进行分数对比，用以验证配方平衡替换方法的准确性和稳定性。如下表：

可见，通过一种辅助叶组配方平衡替换的方法筛选出的可替换原料中出现了图4所示人工经验替换的原料，且其优选序排在第二，说明这种辅助叶组配方平衡替换的方法具有一定的准确性。

实施例2

以xx卷烟厂规格b，1号模组中“2014烤烟/曲靖2/k326/wdc3f/fw/p/”原料替换为例进行说明：

横向对分析：把配方的原料历史替换记录中的所有被替换原料数据进行汇总，对比分析历史替换数据中各个属性变更的频次，即替换原料后，原料属性发生变更的频率次数，所替换频次越高，说明该属性特征对原料替换的影响程度越低，重要性低。

得出结论：在发生替换时年份替换是相对优先考虑的因素，其次是品种和三级产地的替换，最后当其他情况都不能满足时才考虑替换原料的二级产地。

建立决策树预测模型：通过对历史人为替换经验的分析，按照原料属性对替换的影响程度大小排序，建立决策树（如图8）：拥有库存作为对预测效果改进的最大的自变量，被首先用于拆分节点；随后又按照是否关联其他牌号进行第二次拆分，紧接着又对二级产地进行第三次拆分，最终找到了可替换的原料。可见该原料替换时优先考虑的因素分别是库存、牌号关联信息和二级产地，按照这样的方式层层进行筛选，将人为替换经验转化为可替换的原料变更规则，筛选出部分可替换物料。

如图9所示，为人经验替换。被替换原料与替换原料对比如下：

可见，此次人工替换选择的是同一品种、同一等级、同一年份，不同产地的原料进行替换。而一种辅助叶组配方平衡替换的方法，就以类似的人工替换经验为规则，参考历史的替换记录，得到部分可选的替换材料。

空间中的点：选取一条原料，其身份信息的具体描述会根据不同刻度生成空间中一个点，这个点表示的就是这条原料。

（3）基于机器学习算法的评价预测：将步骤（1）与步骤（2）中的可替换原料结果结合取正交集合，所得集合即为最终的可替换原料列表。

可见，通过一种辅助叶组配方平衡替换的方法筛选出的可替换原料中出现了图9所示人工经验替换的原料，且其优选序排在第一，说明这种辅助叶组配方平衡替换的方法具有一定的准确性。

总体来看，人工经验替换主要是从产地、年份等方来进行。而本发明结合人工替换经验规则和聚类算法，再加上机器学习预测分析的方法，为企业提供了多个可替换原料优选排序。同时，筛选出的可替换原料通过与人工替换经验对比验证，发现人工替换的原料在筛选出的可替换原料排序中均在前三，且一种辅助叶组配方平衡替换的方法通过机器学习预测的分数大约是实际分数的80%—90%，说明一种辅助叶组配方平衡替换的方法准确性较高。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨乾栩;王春瑞;唐军;凌军;陈剑明;张天栋;马骥
技术所有人：云南中烟工业有限责任公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。