加热卷烟烟叶原料定量筛选方法及其装置与流程

文档序号:33476289发布日期:2023-03-15 10:25阅读:129来源:国知局
加热卷烟烟叶原料定量筛选方法及其装置与流程

1.本技术涉及烟叶选用技术领域,特别是一种加热卷烟烟叶原料定量筛选方法及其装置。


背景技术:

2.加热卷烟再造烟叶以烟草原料为主要原料加工而成,其中常添加部分天然植物纤维物质。由于原料并非纯烟叶,导致其中呈味物质成分复杂,且最终呈味效果与所用原料烟叶息息相关。
3.现有针对加热卷烟再造烟叶原料烟叶的研究主要集中于烟草原料内部的甘油分子的分子扩散和对流传质过程研究,并未对原料中所含关键化学物质含量进行研究。
4.现有对于加热卷烟原料烟叶的原料烟叶筛选指标是常规化学成分,例如总糖、还原糖、蛋白质、氨基酸、烟碱、总氮等,存在关联性不强导致模型无法构建或者模型判别准确不高等问题。缺乏对加热卷烟再造烟叶感官评价的考量,使得所选烟叶无法有效改善感官评价结果。
5.如需增加感官评价结果,需要将各原料分别制成可抽吸卷烟制品后,分批次进行试吸评价,操作繁琐,尤其面对众多原料时,无法从众多的烟叶原料中快速准确的筛选出具有较优感官评价结果的原料。这也导致现有加热卷烟再造烟叶的感官评价结果较其他常规类型卷烟差。


技术实现要素:

6.本技术提供了一种加热卷烟烟叶原料定量筛选方法,用于解决现有技术中存在的加热卷烟再造烟叶原料烟叶筛选指标单一,无法快速、准确重大量的原料烟叶中筛选出具有较优感官评价结果的原料烟叶的技术问题。
7.本技术提供方法基于热裂解-气相色谱-质谱法(pyrolysis gas chromatography mass spectrometry,py-gc-ms)开发检测加热卷烟再造烟叶原料化学成分的分析方法,对加热卷烟原料进行化学表征。采用mzmine软件包对py-gc-ms数据进行处理,获得含有强度信息的特征峰表。分别以样品的特征峰表和感官评价得分作为自变量和因变量,采用随机森林(random forest,rf)回归算法建立加热卷烟再造烟叶原料适用性模型,采用该模型可快速分析筛选出具有较高感官评价结果的加热卷烟再造烟叶原料烟叶。
8.本技术提供了一种加热卷烟烟叶原料定量筛选方法,包括以下步骤:
9.步骤s1:获取加热卷烟烟叶原料样品的py-gc-ms原始数据;
10.步骤s2:处理py-gc-ms原始数据得到含有强度信息的样品特征峰表;
11.步骤s3:以样品特征峰表作为自变量,以各样品的感官评价得分作为因变量,采用随机森林回归算法建立加热卷烟再造烟叶原料适用性模型;
12.步骤s4:获取待测加热卷烟再造烟叶原料的py-gc-ms原始数据,并对py-gc-ms原始数据进行处理后得到待测加热卷烟再造烟叶原料的待测特征峰表,将待测特征峰表输入
加热卷烟再造烟叶原料适用性模型得到该原料对应的感官评价得分。
13.优选地,步骤s2包括以下步骤:
14.步骤s21:提取离子流色谱图;
15.步骤s22:利用连续小波变换对质谱的谱峰寻峰得到eic峰;
16.步骤s23:采用多元曲线分辨对eic峰数据进行解卷积,得到卷积峰;
17.步骤s24:基于组分对对卷积峰校准后输出具有质荷比、保留时间和强度信息的特征峰表。
18.优选地,步骤s23中解卷积包括以下步骤:

确定解卷积窗口;

通过多元曲线分辨在每个解卷积窗口中构建模型峰;

将解卷积窗口中构建的每个eic峰分解为模型峰的线性组合,从mzmine中将已构建的质谱数据以msp格式导出,导入nist 2017库中进行检索定性。
19.优选地,其特征在于,步骤s21具体包括以下步骤:
20.(1)将数据文件中的所有数据点按其强度进行排序,并删除低于强度阈值的点;
21.(2)从最密集数据点开始,创建第一个eic;
22.(3)对于第一个eic,建立不可变的m/z范围,m/z范围为m/z
±

m/z
,∈
m/z
为m/z容差参数;
23.(4)如果现有eic的m/z值在m/z范围内,那么下一个数据点为下一个最密集的数据点;
24.(5)如果下一个数据点不在m/z范围内,则创建一个新的eic的m/z范围,当点满足用户设定的最小启动强度要求时,创建新的eic,调整边界;
25.(6)重复步骤4~5,直到所有数据都处理完毕。
26.优选地,步骤s22包括以下步骤:小波系数计算为eic和小波在不同尺度和位置上的内积,通过脊线检测和局部最小搜索确定峰的位置和边界;以墨西哥帽函数为小波母函数。
27.优选地,步骤s3包括以下步骤:
28.步骤s31:以gini指数作为评价指标来衡量样品中化学成分的特征重要性评分,计算公式见下式。将所有决策树上每个特征的gini指数降低值相加,即可获得每个化学成分的特征重要性评分。
[0029][0030]
式中:为结点t中j类的类频率。特征在结点t的重要性,即gini指数的变化量,是一个结点与两个子结点的gini指数加权和之差。
[0031]
步骤s32:将数据集划分为训练集和测试集,采用k折交叉验证对模型参数:森林中树的个数(n_estimators)、每棵树随机选择的特征数目(max_features)和树的最大深度(max_depth)进行优化。在一具体实施例中,当k为10时,结果得n_estimators=20,max_features=21,max_depth=6。
[0032]
优选地,py-gc-ms检测中样品用量为0.90mg。
[0033]
优选地,py-gc-ms检测所用样品裂解温度为350℃。
[0034]
本技术的另一方面还提供了一种加热卷烟烟叶原料定量筛选装置,包括:
[0035]
色谱检测模块,用于获取加热卷烟烟叶原料样品的py-gc-ms原始数据;
[0036]
特征峰提取模块,用于处理py-gc-ms原始数据得到含有强度信息的样品特征峰表;
[0037]
建模模块,用于以样品特征峰表作为自变量,以各样品的感官评价得分作为因变量,采用随机森林回归算法建立加热卷烟再造烟叶原料适用性模型;
[0038]
估算模块,用于获取待测加热卷烟再造烟叶原料的py-gc-ms原始数据,并对py-gc-ms原始数据进行处理后得到待测加热卷烟再造烟叶原料的待测特征峰表,将待测特征峰表输入加热卷烟再造烟叶原料适用性模型得到该原料对应的感官评价得分。
[0039]
本技术能产生的有益效果包括:
[0040]
1)本技术所提供的加热卷烟烟叶原料定量筛选方法,通过获取多个样本原料烟叶的py-gc-ms原始数据,提取所得数据的特征峰后,通过re算法构件加热卷烟再造烟叶原料适用性模型后,即可通过输入待测定加热卷烟再造烟叶原料的py-gc-ms原始数据,得到该烟叶对应的感官评价结果,有效提高对多种原料的筛选效率,无需将原料制成加热卷烟再造烟叶制品,即可得到所需感官结果,提高对原料的筛选效率。
附图说明
[0041]
图1为本技术提供的加热卷烟烟叶原料定量筛选方法流程示意图;
[0042]
图2为本技术实施例中所用墨西哥帽函数示意图;
[0043]
图3为本技术实施例中基于mcr解卷积流程示意图;
[0044]
图4为本技术实施例中所用随机森林算法示意图;
[0045]
图5为本技术实施例中不同裂解温度下卷烟热裂解gc-ms总离子流色谱图各图所用裂解温度分别为(a):150℃;(b):200℃;(c):250℃;(d):300℃;(e):350℃;
[0046]
图6为本技术实施例中温度对裂解产物数量的影响结果图;
[0047]
图7为本技术实施例中德宏香料烟样品中各个化合物相对含量随温度变化的趋势变化图;
[0048]
图8为本技术实施例中样品量选择所得总离子流色谱图;
[0049]
图9为本技术实施例中评吸值与rf、pls模型预测值之间的关系图,左侧为rf所得结果图;右侧为pls所得结果图;
[0050]
图10为本技术实施例中rf模型各特征物质重要性的度量结果图。
具体实施方式
[0051]
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。通常在此处附图中描述和示出的本发明实施方式的组件可以以各种不同的配置来布置和设计。
[0052]
因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明
保护的范围。
[0053]
并不用于解决本技术技术问题的技术特征,均按现有技术中常用方法设置或安装,在此不累述。
[0054]
参见图1,本技术提供的加热卷烟烟叶原料定量筛选方法,包括以下步骤:
[0055]
步骤s1:获取加热卷烟烟叶原料样品的py-gc-ms原始数据;
[0056]
步骤s2:处理py-gc-ms原始数据得到含有强度信息的样品特征峰表;
[0057]
步骤s3:以样品特征峰表作为自变量,以各样品的感官评价得分作为因变量,采用随机森林回归算法建立加热卷烟再造烟叶原料适用性模型;
[0058]
步骤s4:获取待测加热卷烟再造烟叶原料的py-gc-ms原始数据,并对py-gc-ms原始数据进行处理后得到待测加热卷烟再造烟叶原料的待测特征峰表,将待测特征峰表输入加热卷烟再造烟叶原料适用性模型得到该原料对应的加热卷烟再造烟叶感官评价得分。
[0059]
本技术提供方法采用re算法以样品特征峰表作为自变量,以各样品的感官评价得分作为因变量,建立加热卷烟再造烟叶原料适用性模型,用于对加热卷烟原料烟叶的感官评价结果快速输出,便于对众多原料烟叶进行筛选,提高原料筛选处理效率。
[0060]
其中所用py-gc-ms数据按现有py-gc-ms测量方法进行逐一测量后得到,所用测量方法与现有通用方法相同,在此不累述。
[0061]
优选地,步骤s2包括以下步骤:
[0062]
步骤s21:提取离子流色谱图;
[0063]
步骤s22:利用连续小波变换对质谱的谱峰寻峰得到eic峰;
[0064]
步骤s23:采用多元曲线分辨对eic峰数据进行解卷积,得到卷积峰;
[0065]
步骤s24:基于组分对对卷积峰校准后输出具有质荷比、保留时间和强度信息的特征峰表。
[0066]
优选地,步骤s23中解卷积包括以下步骤:

确定解卷积窗口;

通过多元曲线分辨在每个解卷积窗口中构建模型峰;

将解卷积窗口中构建的每个eic峰分解为模型峰的线性组合,从mzmine中将已构建的质谱数据以msp格式导出,导入nist 2017库中进行检索定性。
[0067]
优选地,步骤s21具体包括以下步骤:
[0068]
(1)将数据文件中的所有数据点按其强度进行排序,并删除低于强度阈值的点;
[0069]
(2)从最密集数据点开始,创建第一个eic;
[0070][0071]
容差参数;
[0072]
(4)如果现有eic的m/z值在m/z范围内,那么下一个数据点为下一个最密集的数据点;
[0073]
(5)如果下一个数据点不在m/z范围内,则创建一个新的eic的m/z范围,当点满足用户设定的最小启动强度要求时,创建新的eic,调整边界;
[0074]
(6)重复步骤4~5,直到所有数据都处理完毕。
[0075]
优选地,步骤s22包括以下步骤:小波系数计算为eic和小波在不同尺度和位置上的内积,通过脊线检测和局部最小搜索确定峰的位置和边界;以墨西哥帽函数为小波母函
数。
[0076]
优选地,峰校准操作包括:根据样本的质谱相似性确定样本中的相同组分,确定组分特定的时间变化,并最终相应地对齐组分。
[0077]
优选地,步骤s3包括以下步骤:
[0078]
步骤s31:以gini指数作为评价指标来衡量样品中化学成分的特征重要性评分,计算公式见下式。将所有决策树上每个特征的gini指数降低值相加,即可获得每个化学成分的特征重要性评分。
[0079][0080]
式中:为结点t中j类的类频率。特征在结点t的重要性,即gini指数的变化量,是一个结点与两个子结点的gini指数加权和之差。
[0081]
步骤s32:将数据集划分为训练集和测试集,采用k折交叉验证对模型参数:森林中树的个数(n_estimators)、每棵树随机选择的特征数目(max_features)和树的最大深度(max_depth)进行优化。在一具体实施例中,当k为10时,结果得n_estimators=20,max_features=21,max_depth=6。
[0082]
优选地,py-gc-ms检测中样品用量为0.90mg。按此量进样能避免色谱柱残留,污染仪器,提高测试结果准确性,进而提高所得模型的预测结果准确性。
[0083]
优选地,py-gc-ms检测所用样品裂解温度为350℃。采用该裂解温度能有效满足用户使用加热卷烟时烟叶的裂解温度,获得能有效刺激用户感官感受释放物质,且该裂解温度下能充分释放烟叶中所含各类物质,提高模型输出结果的准确性。
[0084]
本技术的另一方面还提供了一种加热卷烟烟叶原料定量筛选装置,色谱检测模块,用于获取加热卷烟烟叶原料样品的py-gc-ms原始数据;
[0085]
特征峰提取模块,用于处理py-gc-ms原始数据得到含有强度信息的样品特征峰表;
[0086]
建模模块,用于以样品特征峰表作为自变量,以各样品的感官评价得分作为因变量,采用随机森林回归算法建立加热卷烟再造烟叶原料适用性模型;
[0087]
估算模块,用于获取待测加热卷烟再造烟叶原料的py-gc-ms原始数据,并对py-gc-ms原始数据进行处理后得到待测加热卷烟再造烟叶原料的待测特征峰表,将待测特征峰表输入加热卷烟再造烟叶原料适用性模型得到该原料对应的感官评价得分。
[0088]
采用该装置可有效实现对加热燃烧卷烟所用原料烟叶中具有较高感官评分结果的烟叶原料进行高效有效筛选。
[0089]
实施例
[0090]
以下实施例中所用一起和原料,如无特殊说明均为商业渠道获得。
[0091]
1、所用仪器和样品
[0092]
仪器:py-3030d热裂解仪(frontier laboratories ltd.,koriyama,japan);gcms-qp2010 ultra型气相色谱-质谱联用仪(shimadzu,japan);mettler toledo mx5型电子天平(toledo,americe)。
[0093]
所用样品:用于试验研究的28种不同类型的加热卷烟样品均源于云南产区,使用
scikit-learn软件包(版本1.0)中的train_test_split函数随机划分训练集和测试集,样品具体信息见表1:
[0094]
表1加热卷烟样品信息
[0095]
样号样品名称产地数据集样号样品名称产地数据集1德宏香料烟德宏训练集x5云烟87上部临沧训练集2德宏晒黄烟德宏测试集x6k326中部曲靖测试集3滇中k326滇中测试集x7k326上部曲靖训练集4曲靖旱烟曲靖训练集x8云烟87中部曲靖测试集5红河刀烟红河训练集x9云烟87中部丽江测试集6大理天登烟大理测试集x10k326中部昆明训练集7德宏生切烟丝德宏测试集x11云烟87中部昆明训练集8德宏krk26 c3f德宏训练集x12k326中部楚雄训练集9德宏krk26 c1f德宏训练集x13云烟87中部楚雄训练集10德宏krk26 cx1k德宏训练集x14红大中部保山测试集x1k326中部红河训练集x15云烟87中部大理训练集x2云烟87中部红河训练集x16红大中部大理训练集x3红大中部红河测试集x17k326中部(晒烟)大理训练集x4云烟87中部临沧训练集x18k326中部(明火熏蒸烟)大理训练集
[0096]
2、样品制备
[0097]
将卷烟切开,取出烟丝。烟丝经液氮冷冻研磨后置于烘箱内,于40℃干燥,然后过0.18mm(80目)筛。所制得的烟末试样供热裂解实验。
[0098]
实施例1获取加热卷烟样品的py-gc-ms数据
[0099]
将各样品按上述方法进行处理后,按以下步骤进行热裂解-气相色谱-质谱法(pyrolysis gas chromatography mass spectrometry,py-gc-ms)分析,并得到各样品的py-gc-ms数据:
[0100]
a.实验方法:称取0.7mg粉末样品于样品杯中,将样品杯固定于进样杆后,装入气相色谱仪进样口上方的裂解器。待仪器温度达到设定温度并稳定后,按下进样按钮,样品杯通过自由落体迅速掉入裂解炉炉心。在氦气(he)氛围中,挥发性成分瞬间气化,由载气带入气相色谱柱中进行分离,最后通过质谱鉴定,从而得到总离子流色谱图。
[0101]
b.仪器工作条件:
[0102]
热裂解条件:裂解温度350℃;接口温度300℃。
[0103]
色谱条件:db-5ms毛细管色谱柱柱(30m
×
0.25mm,0.25μm);进样口温度300℃;分流比50:1;载气为氦气,流量1ml
·
min-1。柱升温程序:初始温度50℃,以10℃/min速率升温至300℃,保持10min。
[0104]
质谱条件:电子轰击离子(ei)源;离子源温度230℃,传输线温度300℃;电离能量70ev;检测器电压0.8kv;全扫描模式;扫描范围质荷比(m/z)29~800。
[0105]
确定py-gc-ms检测的裂解温度:加热卷烟电加热温度一般低于350℃。我们考察了温度对裂解产物的影响,分别在150、200、250、300、350℃下,考察了裂解产物随温度变化的情况,同时控制进样量,使得每次进样量为0.70(
±
0.01)mg,减少因进样量带来的影响。以
德宏香料烟样品为代表检测不同裂解温度下卷烟的py-gc-ms色谱图示于图5。
[0106]
同时获取德宏香料烟样品不同裂解温度下的裂解产物数量,结果如图6所示。获取德宏香料烟样品各主要化合物相对含量随温度变化的趋势,结果如图7所示。
[0107]
由图5可以发现裂解温度对裂解产物有显著影响,随着温度升高,裂解产物数量呈现上升趋势(如图6),在150、200、250、300和350℃下出峰数目分别为33、47、54、70、77个,说明裂解程度随温度升高而升高,产物也相当复杂。由图7可以发现,在200℃以下温度时,随着裂解温度升高,烟气中尼古丁、5-羟甲基糠醛的释放量呈现增加趋势。300℃之后裂解物产生量增速放缓,苯酚、邻苯二酚、对苯二酚等有害物质含量明显增多。
[0108]
现有的加热器具(iqos 3duo)通过加热棒芯片,将陶瓷加热片达到350℃加热烘烤专用烟弹从而产生烟雾。根据所提供的加热器具以及对于裂解温度的考察,最终确定以350℃为裂解温度,获得后续模型开发的数据。
[0109]
确定py-gc-ms检测的样品量:样品量太大会导致色谱柱残留,污染仪器,影响结果重现性;样品量过少,会导致色谱峰的强度下降,数量减少,有些低含量化学组分检测不到。分别取样品10.70,0.90,1.10mg,进行检测,所得总离子流色谱图见图8。
[0110]
由图8可知:当保留时间为6~10min时,基线漂移严重,这是由于样品中丙三醇含量较高、极性较强;当样品量为0.70mg时,少数含量较低的组分未被检测到;当样品量为0.90,1.10mg时,裂解产物的数量较多,色谱峰强度适中,分离度良好,并且两者的色谱峰个数和强度无明显差别。因此,选择的py-gc-ms检测的样品用量为0.90mg。
[0111]
按以上方法和参数,分别获取表1中各样品的py-gc-ms原始数据。
[0112]
实施例2加热卷烟样品py-gc-ms数据预处理
[0113]
按以下步骤对实施例1中所得各样品的py-gc-ms原始数据进行处理:
[0114]
1、获取eic值:
[0115]
从gcmssolution2.5工作站中以netcdf格式导出py-gc-ms数据,然后导入mzmine软件包(版本2.53)进行数据处理,包括构建提取离子流色谱图(extract ion chromatograpy,eic)、检测eic峰、解卷积和峰校准,以获得具有质荷比、保留时间和强度信息的特征峰表。其中解卷积是数据预处理的重要步骤,采用多元曲线分辨(mcr)进行,包括3个步骤:

解卷积窗口的确定;

通过mcr在每个解卷积窗口中构建模型峰;

将解卷积窗口中构建的每个eic峰分解为模型峰的线性组合。从mzmine中将已构建的质谱数据以msp格式导出,然后导入nist 2017库中进行检索定性。
[0116]
提取离子流色谱图(eic):从整个数据文件中最大的强度数据点到最小的。其原因是,以较大的强度数据点开始eic是有益的,因为它们的m/z值往往更准确。定义∈_(m/z)为m/z容差参数。这个过程包括以下顺序步骤:
[0117]
(1)将数据文件中的所有数据点按其强度进行排序,并删除那些低于一定强度阈值的点(主要是噪声)。
[0118]
(2)从最密集的数据点开始,创建第一个eic。
[0119]
(3)对于这个eic,建立一个不可变的m/z范围,即数据点的m/z
±

m/z
,其中∈
m/z
由用户指定。
[0120]
(4)如果现有eic的m/z值在m/z范围内,那么下一个数据点将是下一个最密集的数据点。
[0121]
(5)如果下一个数据点不在eic m/z范围内,则创建一个新的eic。只有当点满足用户设定的最小启动强度要求时,才会创建新的eic。
[0122]
(6)新eic的m/z范围的创建方法与第3步相同,只是边界将被调整以避免与已存在的eic重叠。例如,考虑∈_(m/z)=0.01的m/z范围(100.000,100.020)的现有eic。如果新的eic是用m/z值为100.025的数据点初始化的,那么这个新的eic的m/z范围将设置为(100.020,100.035)而不是(100.015,100.035)。
[0123]
(7)重复步骤4-6,直到所有数据都处理完毕。
[0124]
最后,实现了一个后处理步骤。只有用户定义的连续点数量超过用户定义的强度阈值的eics才被保留。
[0125]
2、检测eic峰:
[0126]
使用连续小波变换(continuous wavelet transform,cwt)方法检测经过预处理得到的eic峰,小波系数计算为eic和小波在不同尺度和位置上的内积。随后,通过脊线检测和简单的局部最小搜索确定峰的位置和边界。小波变换是在傅里叶变换基础上提出的,它可将时域信号分解为一组小波函数,构建良好时域和频域的局部时频信号用来观察信号的任意细节。在数学上连续小波变换表示如式(1)所示:
[0127][0128]
在式中,c为小波系数,是用来表示小波母函数与信号的相似度的,c越大说明小波母函数与信号的相似度越大。f(t)为信号,ψ
a,b
(t)为小波母函数,a表示与频率相关的伸缩变化,是尺度参数。b表示与时间相关的位置,是平移参数。
[0129]
在利用连续小波变换对质谱的谱峰寻峰之前,需要对小波母函数进行选择。选择小波母函数有两个要求,一是要求该函数是对称函数,二是要求函数的波形与待检测的数据的峰型较为类似。墨西哥帽函数是一个对称性的函数,可以不需要对质谱数据进行基线去除;波形与待测质谱的峰型也较为类似。基于以上两点,选择了墨西哥帽函数作为小波母函数。它的计算方式如式(2),波形图如图2所示。
[0130][0131]
通过脊线检测和简单的局部最小搜索确定峰的位置和边界。eic中的一个真实峰值会在多个尺度上产生一个小波系数的局部极大值。小波尺度中与峰值形状最接近的小波尺度,即最佳的小波尺度,将产生最大的系数。接近最佳尺度的尺度也应该有与峰值相当相似的形状,因此在这些尺度之间创建相邻的最大值。脊线是小波系数在不同尺度上的连通局部极大值序列,它代表一个真实的峰值。峰值位置和边界的确定,峰值的位置取脊线上系数最大的保留时间(rt)。取峰的左(右)边界为峰的rt减(加)去最佳尺度乘以扫描间隔时间。峰值边界应接近局部最小值。然而,上面确定的边界往往不符合局部极小值。因此将边界修正为eic两边的第一个局部最小值。
[0132]
3、解卷积:
[0133]
是预处理复杂样品数据的重要步骤,计算分离出质谱相同但属于未被色谱完全分离的共流出化合物的离子。解卷积的数学原理如式(3)。设m为每个eic的时间点总数,n为
eic峰总数。设m/z矩阵x代表所有检测到的eic峰,其中一列是对应于特定m/z的eic峰的洗脱曲线。解卷积的任务是找到m
×
l矩阵c和l
×
n矩阵s。
[0134]
x≈c
×
s(3)
[0135]
矩阵c的每列是组分的模型峰值,矩阵s的每一行是组分的纯质谱,l是组分总数(也是纯质谱的总数)。由于式(3)中的质谱反转换,每个eic峰值x[:,j]分解为组分模型峰值c[:,i]的线性组合,如下式所示:
[0136]
x[:,j]≈c[:,1]s
1j
+c[:,2]s
2j
+

+c[:,l]s
lj
,j=1,

,n
ꢀꢀꢀ
(4)
[0137]
采用多元曲线分辨(multivariate curve resolution,mcr)方法进行解卷积,图3显示了解卷积的流程。与传统方法相比,mcr方法有两个固有的优势。第一个优点是,mcr避免了传统方法中选择eic峰作为组分模型峰的挑战性任务。一个eic峰必须是由单个组分产生的,才能成为一个模型峰。然而,传统方法选择的模型峰实际上可能是由两种或多种共流出组分产生的,这将导致所有涉及的共流出化合物的质谱不正确,最终导致库匹配误差或低可信度和相对定量不准确。mcr方法的第二个优势在于高估组分的数量。传统方法需要组分的数量来选择模型峰,而mcr方法需要它来构建模型峰。当组分数高估时,mcr方法构建的质谱受到的影响较小,得到的库匹配结果可信度较高。
[0138]
4、峰校准:
[0139]
基于组分对峰进行校准后获得含有强度信息的特征峰。根据样本的质谱相似性确定样本中的相同组分,确定组分特定的时间变化,并最终相应地对齐组分。为了在样品中寻找相同的组分,需要定义一种可信度的度量,它同时考虑了两个组分之间的质谱相似性和保留时间相似性。这个度量是:
[0140]
score
total
(si,sj)=0.9score
spec
(si,sj)+0.1score
rt
(si,sj)
ꢀꢀꢀ
(5)
[0141]
其中si和sj表示两个质谱。scorespec是amdis中使用的质谱相似性度量,是纯和非纯分数的线性加权组合。scorert的计算公式为:
[0142]
score
rt
=1-|δrt|/w
ꢀꢀꢀ
(6)
[0143]
其中,δrt为它们的顶点保留时间之差,w为同一组分在特定实验中可接受的最大保留时移。保留时间相差超过w的组分应视为不同组分。最终的分数总和按比例缩放,使其介于0和999之间。这与nist库搜索使用的数字比例相同。
[0144]
得到各样品的特征峰如下表所示:
[0145]
表2各样品特征峰信息
[0146]
[0147]
[0148]
[0149]
determination,r2)作为模型的评价指标,计算公式见式(8)和(9)。rmse用于衡量模型在预测中产生的误差。r2表示预测值对实际值的解释程度,越接近于1,说明预测效果越好;越接近于0,说明预测效果越差;负值时说明预测效果非常差。
[0161][0162][0163]
式中:为样本i的预测值;yi为样本i的评吸值;为yi的平均值。
[0164]
对rf模型性能影响较大的参数是森林中树的个数(n_estimators)、每棵树随机选择的特征数目(max_features)和树的最大深度(max_depth)。增加n_estimators可减小误差并提高预测的稳定性,但同时训练rf时间随着n_estimators的增加显著延长,增加了时间成本;适当减少每棵树随机选择的特征数目(max_features)可降低每棵树之间的相关性,有助于提高rf模型的准确度;树的深度越深,模型越复杂,增加了训练的时间成本。将数据集划分为训练集和测试集,采用k折交叉验证对参数进行优化。当k为10时,结果得n_estimators=20,max_features=21,max_depth=6。
[0165]
对比例
[0166]
与实施例3的区别在于:建模所用方法为偏最小二乘(partial least squares,pls),并得到对比模型。
[0167]
加热卷烟感官评价的评吸值与rf、pls模型预测值之间的关系如图9所示,rf(实施例3)、pls模型(对比例)的评价指标如表3所示。
[0168]
表3rf、pls模型的评价指标
[0169][0170]
从图9训练集结果来看,rf模型具有良好的预测能力,并且由表3结果可知rf模型在测试集上的r2显著高于pls模型在测试集上的,rf模型在测试集上的rmse显著低于pls模型在测试集上的,表明rf模型预测效果较好,具有良好的泛化能力。通过py-gc-ms采集某一类型加热卷烟的化学成分信息,用mzmine对py-gc-ms数据进行处理,获得化学成分特征信息,将特征信息输入rf模型,从而得到加热卷烟的感官评价得分预测值。
[0171]
实施例4加热卷烟烟叶原料的关键成分确定
[0172]
表4化学成分的特征重要性评分(c1-c20)
[0173][0174]
c14奎宁酸0.01243c152-氨基-3-羟基吡啶0.01000c162e-十三碳烯当归酯0.00995c17六氢-3-(苯甲基)-吡咯并[1,2-a]吡嗪-1,4-二酮0.00844c182-呋喃甲醇0.00797c19环丁醇0.00796c203-呋喃甲醇0.00761
[0175]
表4和图10展示了特征重要性评分较高的前20个成分,由nist 2017库进行定性,其中包括2个酸性成分,4个碱性成分,其余均为中性成分。酸性成分可以调节烟气的酸碱平衡、柔和烟气,对卷烟的香气和吃味具有积极影响;碱性成分中7-羟基-6-甲氧基香豆素具有弱甜味,特征重要性评分最高,并且杂环类化合物也是卷烟烟气中的重要香气物质;中性成分中,除了醇类、脂类等香味物质具有较高的评分外,烃类物质(2-甲基十八烷、正十七烷、2-甲基二十八烷)并不属于香味成分,也具有较高的评分,这是由于烃类物质可以调节烟叶表面的水平衡,水分的变化也是影响其感官品质的重要因素。
[0176]
其中新植二烯是烟草香味物质的重要前体物,有一种弱的令人愉快的气味,可直接进入烟气,具有减少烟气刺激性和醇和烟气的作用;另外,新植二烯可在醇化过程中进一步反应,分解转化为低分子量的致香成分,如植物呋喃等。
[0177]
实施例5对大理州弥渡烟区红花大金元中部烟叶原料的感官评价结果预估
[0178]
将大理州弥渡烟区红花大金元中部烟叶按上述方法所得的特征峰,输入上述实施例中所得模型中,得到预估感官评价结果为81.4分。
[0179]
以本实施例中所用同批次烟叶为原料制成加热卷烟后,组织具有评吸资质的评价小组进行评价,每次参与评价的组员不少于7人,采用九分制评价方法进行评价,所得结果
平均得分为82分。
[0180]
由上可知,该模型对烟叶原料制成的加热卷烟的感官评价结果准确性较高。误差较小,可有效提高对原料筛选的效率。
[0181]
尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1