一种基于近红外光谱的烟叶以及卷烟叶组配方的替代方法与流程

文档序号:18086444发布日期:2019-07-06 10:33阅读:175来源:国知局
一种基于近红外光谱的烟叶以及卷烟叶组配方的替代方法与流程
本发明属于卷烟叶组配方领域,具体涉及卷烟产品叶组配方维护,利用片烟近红外光谱数据及光谱相似度分析辅助卷烟叶组配方维护及产品开发;本发明提出一种基于近红外光谱的烟叶相似度特征光谱提取,
背景技术
:卷烟的风格品质是产品设计人员通过对不同产地、品种、等级的烟叶进行配比而形成的。在某种原料用完后,需通过单料烟评吸筛选、配方维护小样制作及评吸确认等环节来确定替代烟叶,完成配方维护。烟叶替代及配方维护主要依赖于配方人员的经验积累及评吸判断,工作强度大、主观性强。若能通过仪器检测方法,利用客观数据来辅助配方,对减少评吸人员的抽烟量和提高卷烟质量稳定性有重要意义。近年来很多人在研究卷烟配方辅助技术,专利申请cn200810237699公开了建立一种基于关联规则的卷烟配方维护数据挖掘系统及方法,通过挖掘历史配方中烟叶组合规律,应用关联规则原理指导实际配方维护;历史规律是经验的总结,应用过程中要求同产地、或者同部位烟叶年度间风格品质基本稳定,但是烟叶是田间作物,待选用烟叶或者烟叶组合的品质风格很有可能和历史用的同产地、同部位的烟叶发生重大变化,所以指导实际配方很有可能发生偏离,况且利用传统配方经验,对评吸人员的稳定性要求较高,数据分析难度大。专利申请cn201610380743公开了一种用于卷烟配方归类的方法,通过热重分析研究烟草在热解燃烧过程中的特征变化,把失重曲线相似的单等级片烟原料归为抽吸口感接近的一类。是从燃烧这一物理过程评判烟叶的接近程度。专利申请cn201811305657提供一种基于非负矩阵分解的智能卷烟配方维护方法,将配方数据转换成实际的二进制配方矩阵y,将单料烟组转换成二进制配方向量作为模型输入构建模型,实现单料烟替代和配方维护;专利申请cn201210344034公开了一种基于近红外光谱信息的simca辅助卷烟配方的方法,通过比对待替代烟叶的近红外光谱和数据库中保存的烟叶近红外光谱马氏距离,距离越小代表烟叶越相似,并通过感官确认最终筛选出可替代烟叶。在一定程度上反应烟叶的接近程度,但是近红外光谱包含了烟叶的大量物质信息,但也包含很多背景,仪器、温湿度等外部干扰因素,仅仅通过光谱投影的马氏距离来表达光谱相似并推广到烟叶相似,并不客观准确。并且该方法仅仅从烟叶一对一替代的角度分析,并不能反应烟叶配方组合后“配伍性”的特点。技术实现要素:本发明的目的在于提供一种基于光谱相似的辅助卷烟叶组配方维护方法,通过一种局部校正的光谱预处理方法及集成的光谱相似度算法,排除了光谱中的基线、散射等干扰因素,实现从光谱相似到烟叶相似的转化,实现辅助卷烟叶组配方维护过程中的烟叶替代的方法,减少配方维护人员的评吸量,同时也避免了感官评吸过程的主观性和不稳定性。为了实现上述发明目的,本发明采用以下技术方案:步骤1)采集片烟样品的红外光谱数据:按照产区、部位等级、年份分布状况选取烟叶样本,采集上述烟叶样本的近红外光谱;步骤2)光谱预处理:采用一阶导数结合局部校正lsnv(localizedstandardnormalvariation)模型对步骤1)得到的近红外光谱进行预处理,其中所述的局部校正模型可以表示为:其中xj代表第j个波段的吸光度值,aj代表第j个波段的吸光度值的平均值,bj代表第j个波段的吸光度值的标准偏差,j=1,2……k;步骤3)构建光谱相似度模型:光谱相关映射spectralcorrelationmeasure(scm)光谱相关映射以相关系数的形式计算两条光谱的相似度:其中n为光谱变量数,xi,yi表示两条光谱对应的第i波数的吸光度值,表示两条光谱吸光度值的平均值,i=1,2,3……n;欧几里得距离euclideandistancemeasure(edm)其中n为光谱变量数,xi,yi表示两条光谱对应的第i波数的吸光度值,i=1,2,3……n;光谱信息散度spectralinformationdivergence(sid)首先,计算每个点的信息熵,然后使用以下公式测量光谱向量的相似性:sid(x,y)=d(x||y)+d(y||x)其中n为光谱变量数(即光谱长度),xi,yi表示两条光谱对应的第i波数的吸光度值,i=1,2,3……n;采用涵盖上述三种度量的方式表征相似度(spectralsimilarity,ss):ss(x,y)=sid(x,y)*edm(x,y)*scm(x,y)(5)步骤4)筛选出可替代的相似烟叶准备若干个备选片烟,确认需要被替换的目标烟叶,通过步骤1)、2)、3)建立的光谱相似的方法计算各个备选片烟与目标烟叶的光谱相似度,按照光谱相似度从备选片烟筛选出相似烟叶。作为优选,所述步骤1)中采集上述片烟样本的近红外光谱的具体过程为:按照产区、部位等级、年份分布状况选取库存烟叶样本,在低于50℃下烘干,使含水率达到10%~12%,磨粉,样本粉末过筛,取适量烟末放入样品杯中,自然压实后进行近红外扫描;光谱扫描范围为12000-4000cm-1,分辨率为8cm-1,扫描次数72次,对各个样本采集近红外光谱,分为同样本同一时间重复扫描、隔6个月重复扫描、12个月重复扫描得到建模样本光谱;通过同片烟相同时间、不同时间重复扫描光谱相似来消除仪器、环境等外界干扰因素的影响,从光谱相似角度客观描述烟叶相似。作为优选,所述步骤4)具体包括如下步骤:确定烟叶相似性阈值;备选烟叶样品及近红外光谱数据获取:按照步骤1)2)把库存中烟叶扫描近红外光谱,获取库存烟叶光谱数据,为代烟筛选做准备;根据卷烟生产计划,测算各个产品配方在用片烟模块的资源保障情况,确定需要替换的目标;根据建立的光谱相似度模型,筛选出目标片烟相似性在阈值内的的相似片烟。第二方面,本发明提供一种辅助卷烟叶组配方维护方法,包括如下步骤:第一步:对于由多个片烟组成的被替代的目标叶组,针对目标叶组中的每一个目标片烟,采用权利要求1或2所述的方法从若干个备选片烟中筛选出用于替代目标片烟的片烟候选集,所述片烟候选集包含至少一个与目标片烟相似的相似片烟,通过以上方法获得了与目标叶组中目前片烟个数等数的片烟候选集;第二步:从各个片烟候选集中选出至少一个相似片烟,所述的至少一个相似片烟的比例与目标叶组中对应的目标烟叶比例相同,通过排列组合的方式形成多个模拟配方,通过光谱拟合方式获取多个模拟配方与目标叶组的近红外光谱数据,然后按照相似度模型计算多个模拟配方与目标叶组的相似度,选出至少一组用于替代目标叶组的相似叶组,所述的相似度模型如式(5)所示,ss(x,y)=sid(x,y)*edm(x,y)*scm(x,y)(5)其中,scm以相关系数的形式计算两条光谱的相似度:其中n为光谱变量数(即光谱长度),xi,yi表示两条光谱对应的第i波数的吸光度值,表示两条光谱吸光度值的平均值,i=1,2,3……n;其中n为光谱变量数(即光谱长度),xi,yi表示两条光谱对应的第i波数的吸光度值,i=1,2,3……n;sid(x,y)=d(x||y)+d(y||x)其中n为光谱变量数(即光谱长度),xi,yi表示两条光谱对应的第i波数的吸光度值,i=1,2,3……n。作为优选,包括如下步骤:所述的第二步中,通过光谱拟合的方式获取多个模拟配方与目标叶组的近红外光谱数据,后按照相似度模型计算多个模拟配方与目标叶组的相似度,选出至少一组用于替代目标叶组的相似叶组。作为优选,所述的第二步中,选出多组用于替代目标叶组的相似叶组供专业评吸人员进行评吸以选出最佳可替代的相似叶组。作为优选,所述的光谱拟合方法为根据单个片烟的光谱及其在叶组中的比例进行叠加。与现有技术相比,本发明具有以下有益效果:1.本发明中提出从光谱角度刻画烟叶相似,在相似度的计算过程中不引入感官评吸这一主观感受,避免评吸人员因身体、心情、环境、评吸主观喜好等导致的结果不稳定或者误差等,基于近红外光谱包含了烟叶的物质信息的原理,客观描述烟叶相似。2.本发明从光谱相关映射(scm),表征距离类的欧几里得距离(ed)以及基于信息熵理论的光谱信息散度方法(sid)三个角度综合刻画光谱相似。scm表征了光谱形态的相似性;edm衡量了光谱间的吸光度差异;sid将光谱看做是概率分布,用统计矩描述光谱特征。相关性、距离和散度是相似性度量的几种不同的表现形式,通过研究,我们采用涵盖三种度量的方式表征相似度(spectralsimilarity,ss),利用该相似度模型实现从光谱相似到烟叶相似的转化;目标烟叶与相似烟叶的产地、部位符合度达到82.0%、75.7%,总糖、烟碱等主要化学成分的平均差异小于5%,所选择的替代配方在化学、感官方面与原配方无显著差异。3.本发明在辅助配方过程时,采用第一步先一对一代烟筛选,遵循了配方中的一个常用原则‘相似替代’;对于目标中的每个片烟,都以光谱相似的形式,约束了其候选样本在化学、部位、香型等方面与目标片烟的差异程度,从而保障了目标叶组与替代叶组在产地、等级结构等方面的近程度;第二步把筛选出的代烟模拟不同组合,采用本发明提供的相似度模型计算和目标组合的相似程度,根据相似程度制作配方小样,然后通过感官确认最佳组合,在一定程度上满足配方维护中“配伍性”的原则。4.本发明可以大幅减少评吸人员的抽烟数量,降低身体疲劳,更有利于感官灵敏度的保持,提升评吸质量。附图说明图1示出了局部校正算法后的近红外光谱。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。实施例1本实施例提供一种基于近红外光谱相似度的烟叶替代方法,包括如下步骤:步骤1)采集片烟样品的红外光谱数据:样本制作:片烟样本取样后在低于50℃下烘4h,使含水率达到10%~12%,利用旋风磨(fosscyclotec)进行磨粉,样本粉末过60目筛;近红外光谱数据采集:取适量烟末放入样品杯中,取一固定质量砝码放置在样品上方,使其自然压实后进行近红外扫描;近红外光谱由美国theromfisher公司antaris型傅里叶变换近红外光谱仪采集,采集范围为10000~4000cm-1,光谱分辨率为8cm-1;扫描次数为72次;对各个样本采集近红外光谱,分为同样本同一时间重复扫描、隔6个月重复扫描、12个月重复扫描得到建模样本光谱;步骤2)光谱预处理:仪器采集的近红外光谱含有基线、散射等影响,需进行适当的预处理才可计算光谱相似度;常用的预处理方法有导数法,多元散射校正(multiplicativescattercorrection,msc),和标准正态变量校正(standardnormalvariatecorrection,snv)等算法;一阶导数谱(1stderivative)和二阶导数谱(2ndderivative)是红外光谱预处理中的常用方法。通过求一阶导数可以消除光谱中的常数项差异,例如常数性基线;二阶导数谱可以消除光谱的一次项差异。msc和snv方法是常用的散射校正算法;两种方法假定光谱中含有一个乘性的和一个加性的干扰项,通过全谱来估计校正参数;这类方法的缺点是光谱中由于物质含量变化导致的光谱形变同样被引入到校正参数的估计中,致使参数估计的不准确。为解决这个问题,我们使用局部校正(localizedstandardnormalvariatecorrection,lsnv)来估计校正参数,从而得到更灵活的模型和更好的校正效果;局部校正模型可以表示为:其中,xj代表第j个波段的吸光度值,aj代表第j个波段的吸光度值的平均值,bj代表第j个波段的吸光度值的标准偏差,j=1,2……k;步骤3)构建光谱相似度模型:相似度的度量有多种,如表征相关类的光谱角映射器(sam)、光谱相关映射(scm),表征距离类的欧几里得距离(ed)以及基于信息熵理论的光谱信息散度方法;光谱相关映射spectralcorrelationmeasure(scm):光谱相关映射以相关系数的形式计算两条光谱的相似度:其中n为光谱变量数(即光谱长度),xi,yi表示两条光谱对应的第i波数的吸光度值,表示两条光谱吸光度值的平均值,i=1,2,3……n;欧几里得距离euclideandistancemeasure(edm):欧几里得距离直接计算了欧氏空间中两条光谱的距离:其中n为光谱变量数,xi,yi表示两条光谱对应的第i波数的吸光度值,i=1,2,3……n;光谱信息散度spectralinformationdivergence(sid):散度源自于信息熵理论,它可以用来度量变量的相似性和可分性。首先,计算每个点的信息熵,然后使用以下公式测量光谱向量的相似性:sid(x,y)=d(x||y)+d(y||x)其中n为光谱变量数(即光谱长度),xi,yi表示两条光谱对应的第i波数的吸光度值,i=1,2,3……n;上述述及的相似度度量模型中,scm表征了光谱形态的相似性;edm衡量了光谱间的吸光度差异;sid将光谱看做是概率分布,用统计矩描述光谱特征。相关性、距离和散度是相似性度量的几种不同的表现形式,通过研究,我们采用涵盖三种度量的方式表征相似度(spectralsimilarity,ss):ss(x,y)=sid(x,y)*edm(x,y)*scm(x,y)(5)步骤4)筛选出可替代的相似烟叶准备若干个备选片烟,确认需要被替换的目标烟叶,通过步骤1)、2)、3)建立的光谱相似的方法计算各个备选片烟与目标烟叶的光谱相似度,按照光谱相似度从备选片烟筛选出相似烟叶。在本发明一个实施例中,考察光谱预处理方法对相似片烟与目标片烟相似度的影响;具体地,首先考察在不同预处理方式下,光谱相似与烟叶相似间的关系。对库存片烟进行相似度的计算,利用公式(5),对任意一个片烟,计算其与库存所有片烟的光谱相似度。然后将计算结果按相似度大小排序,统计与目标片烟最接近的片烟在产地、部位、化学等指标的相似程度。表1不同预处理方法下光谱相似与烟叶相似的关系从表1中可以看出,在不进行任何预处理时,相似片烟与目标片烟的产地、部位符合度分别只有57.3%和52.3%。主要化学成分总糖和烟碱的平均绝对偏差分别为1.82和0.24。几项指标的差异性都高于人的感官差异阈值。经过预处理后,在相似度算法在各项指标中都有提升,其中,如图1所示,使用一阶导+局部校正lsnv的预处理方法结果最好。产地与部位符合度分别达到82.0%和75.7%,经分析发现,产地不匹配的样本常分布于云南、四川、贵州交界处,部位不匹配的样本常由c4f等级构成,其相似片烟为下部模块。在化学方面,所提出的方法计算的相似片烟与目标片烟差异最小,因此,经过一阶导+局部校正lsnv预处理和计算,光谱相似可以在产地、部位、常规化学等方面表征烟叶相似。实施例2单一烟叶替代过程将实施例1得到的光谱相似度模型计算应用于烟叶替代过程中;具体地,对某季度二类卷烟牌号a进行消耗/库存测算后,确定7个需要替代的片烟(配方占比为35%)。对于每一个目标片烟,分别计算库存每片烟与其的光谱相似度,按相似度的大小进行排序,分别给出一定数量的片烟候选集合;表2目标片烟及筛选出的相似片烟注1:片烟代码中的前两位字母代表产地gz贵州,yn云南,sc四川,hb湖北,cq重庆,gx广西,us美国,zw津巴布韦;注2:片烟代码中的数字代表生产年份;注3:片烟代码中第5位为部位代码(外国片烟除外),6、7位为识别码,无明确含义;通过设定一个经验的相似度阈值,可以筛选出每个目标片烟所选出的相似片烟。由于云南,贵州等地片烟较多,经验表明,7个备选片烟基本能满足替代要求。因此在相似片烟多于7个时,仅选择相似度最高的7个片烟作为候选。经统计,与目标片烟产地相符的比例为52.9%,部位相符的比例为76.5%。对于产地不符的相似片烟,往往来自于目标产地的相邻省份。相邻省份有着相近地理及气候,在风格及品质上较为接近,表明光谱相似是一种综合性的评价指标。具体的,观察到zw15tls所选择的相似片烟分别为2017年和2015年的津巴布韦片烟。通过调查发现,2016年津巴布韦由于气候异常,导致烟叶生产异常,烟碱偏高,香气减弱刺激增大;因此,在相似度筛选中,算法判定2016年津巴布韦烟叶与目标烟叶不在相似范围内;对于相似度算法筛选出的跨产区(省份)烟叶,如gz14cde的备选烟叶cq14caq。通过查阅片烟配方发现,gz14cde烟叶主要来自贵州省德江县,cq14caq烟叶主要来自重庆酉阳县,两个县区相距仅150km,在环境气候等方面较为相似;上述例子从侧面反映了光谱相似具有合理性;此外,片烟相似的推荐形式也给予了配方人员一定的判断、筛选和调整的自由度。例如,在yn16cdc选出的第一相似片烟为广西片烟gx17xbi,通过评吸发现,除劲头和烟气浓度外,在香气量,香气质等方面,两个样本均有一定的差异。此外,鉴于两个样本的产区、部位跨度较大,因此,在配方人员的建议下,将gx17xbi从推荐列表中删除。实施例3辅助卷烟叶组配方一个卷烟配方的风格和品质是由其组配的各个烟叶共同形成的,即便撇除‘配伍性’等非线性因素,配方叶组(此处指的是卷烟叶组配方)相似与片烟相似仍是不完全等同的;因此,有必要通过计算机模拟,对不同片烟组合形成多个模拟配方,并与目标片烟组合进行对比。为了获得与目标叶组相似的相似叶组,利用光谱相似进行烟叶替代分为两个步骤,具体为:第一步:对于由多个片烟组成的被替代的目标叶组,不是直接求解一个多片烟拟合光谱与目标光谱相似,而是针对目标中的每一个片烟,用光谱相似的方式确定若干个备选片烟,再通过拟合光谱的方式找出与目标最相似的组合:这种方式的优点在于遵循了配方中的一个常用原则‘相似替代’;对于目标中的每个片烟,都以光谱相似的形式,约束了其候选样本在化学、部位、香型等方面与目标片烟的差异程度,从而保障了目标叶组与替代的相似叶组在烟叶‘配伍性’等方面的接近程度,最大限度的避免了计算相似,感官评价不相似的问题。第二步:通过计算机可以根据各个片烟候选集模拟出大量配方,再以相似度为目标筛选出与目标叶组最接近的相似叶组。基于以上发明构思,本实施例接续采用实施例2筛选出的目标叶组中各个目标片烟的相似片烟结构进行模拟配方及筛选:本实施例对表2中的相似片烟按与配方目标片烟的相同比例进行模拟,在形成多个模拟配方后,按公式(5)计算模拟配方与目标叶组间的相似度并排序,获得4组替代组合配方(表1),从表1中发现单一片烟中相似度排序第一的候选片烟在片烟组合中并没有出现在最接近的替代组合中;从结果看,除zw15tls出现了多个候选外,其他片烟的候选基本确定且产地、部位与目标较为接近。其中,cq14caq替代gz14cde的原因已经在上文分析;sc16cde主要构成为四川凉山烟叶,其备选的yn16cha主要构成为云南烟叶,gz17ceq主要构成为贵州毕节烟叶;目标及备选烟叶产区相邻,且都呈现清香型风格。从主要的化学成分看,参见表3,目标叶组与替代组合的化学成分均较为接近,在总糖、烟碱、钾、氯等指标上基本相同,仅在还原糖上略有差异。表3目标烟叶及筛选出的替代组合表4目标烟叶及筛选出的替代组合的主要化学成分差异总糖烟碱还原糖氯钾总氮替代1vs目标0.30.00.50.00.10.0替代2vs目标0.00.00.40.00.10.0替代3vs目标0.00.10.60.00.10.0替代4vs目标0.10.00.60.00.10.0实施例4专业人员评吸结果本实施例采用多种评吸方法,具体包括:三点评吸方法(triangulartest):由十位从事烟叶原料及配方工作的评吸人员组成评价小组(10人均为男性,年龄分布为26-38岁,5年以上的卷烟评吸经验);通过人工打制卷烟,在平衡箱内平衡24小时后进行评价;三点检验是一种差别检验,用以确定两种产品之间是否存在细微的差别。为每一位评吸员准备三个试样,其中两个相同,一个不同。要求评吸员指出两个相同者。无论评吸员是否明确识别两个相同样本,都必须给出评价结果。描述评价方法:采用企业烟叶质量评价方法,由评价小组采用定量打分和文字描述相结合的方法对香气质、香气量、刺激性、余味、成团性、杂气、柔和性等方面进行评价打分,评分范围为0-10分。在每个样本评价结束后,以10人评价小组的平均值作为该样本各指标的分值。感官评价:综合考虑相似度排序及化学差异,选取了表3中近红外模拟配方中与目标最接近的替代组合1号和替代组合2号,分别于对照样进行三点评价。三点评价中的原假设为:不可能根据特性强度来区别这两种试样。在这种情况下正确识别出单个试样的概率为p=1/3。备择假设:可以根据特性强度来区别这两种试样。在这种情况下正确识别出单个试样的概率为p>1/3。在两组实验中,正确识别出两个相同样本的人数均为3人,利用二项式模型计算p值为0.701,远大于0.05。因此,接受原假设,认为评吸小组无法识别2个样本间的差异。对目标样本及两个替代配方进行描述评价,评价结果表明:1号、2号样品与对照样品相比,感官质量基本保持一致。在个别指标中略有变化,相比目标样本,1号样本在香气质、香气量上略有提升,柔和性略欠;2号样本在香气量上略欠但成团性和柔和性较好。两个样本的差异均在感官质量管控范围内,这个结果也与三点评价的结果相符。表5三点评吸验证结果编号人数正确识别人数p值推翻原假设所需人数1号vs对照1030.70172号vs对照1030.7017表6描述评价分析结果如表5与表6所示,目标烟叶与相似烟叶的产地、部位符合度分别为82.0%、75.7%,总糖、烟碱等主要化学成分的平均差异小于5%。基于上述算法,提出一种片烟相似+组合相似的卷烟配方维护方法,结果表明,所选择的替代配方在化学、感官方面与原配方无显著差异。下一步的工作包括引入配方过程中人的先验信息,使得计算机辅助配方更有方向性,并从整体相似细化到单一指标相似。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1