一种基于烟叶化学成分的相似烟叶搜索方法

文档序号:5953649阅读:213来源:国知局

专利名称::一种基于烟叶化学成分的相似烟叶搜索方法
技术领域
:本发明涉及一种烟草行业中可用于相似烟叶搜索的方法,利用烟叶的主要化学成分数据计算未知烟叶与多种目标烟叶的相似程度得到搜索结果。
背景技术
:烟叶的内在质量受气候条件、种植地域、种植管理、调制加工等因素的影响,各产地、品种的烟叶原料主要根据外观质量分类成不同等级,而烟叶外观质量与内在质量的对应关系并不确切,因此烟叶原料在烟草加工企业进行配方设计和工业生产利用之前,需要通过人工评吸来确定其内在质量特性。产品设计涉及到的烟叶来源复杂,按产地、品种和等级细分有数百上千种之多,由于人工评吸的效率难以提高,而且得到的数据具有模糊性和非量化的特征,并且一定程度上受主观因素的影响,为了评价烟叶的可替代性,维护成品内在质量的稳定,大量的烟叶样品评吸给产品配方人员带来很大挑战,并给配方人员的身体健康带来压力。定义烟叶的质量和其对烟气质量的影响是非常复杂的问题。陈景云等研究了用烟叶化学成分评价烟叶品质的方法,利用烟叶中还原糖、烟碱、总氮和总挥发碱含量数据建立了烟叶化学成分一品质物元模型,把烟叶品质分为"较好"、"一般"和"较差"三级。胡建军等用模糊综合评定法评价烟叶感观质量品质,利用多个感观质量评价指标用模糊关系模型计算综合评价得分。蔡健荣等用计算机模拟人的视觉,建立人工神经网络模型对烟叶进行分级分类。谭仲夏等用灰色关联法对不同品种的烟叶内在质量进行了分析,通过灰色关联分析寻找影响烟草质量的主导因子。黎妍妍等对河南烟区193种烤烟样品的烟叶质量可用性进行了评价,利用模糊数学理论计算6种化学指标的隶属度,通过确定隶属函数的上下限和最优值来进行烟叶可用性的综合评价。蔡宪杰等研究了烤烟外观指标量化分析的方法,并考察了外观质量指标间的相关性。V.Nicolova为了研究地域因素对烤烟质量的影响,用烟叶化学成分、烟气成分和物理指标对烟叶质量进行评价。这些研究的目的是试图对烟叶的品质水平进行准确表达,努力把结果回归到外观质量因素和感官质量因素上。目前这些技术尚处于探索阶段,还难以得到稳定可靠的符合工业企业实际要求的结果。烟叶中各种化学成分的含量反映了烟叶的质量状态,烟叶中总糖、还原糖、总氮、总碱、氯、钾等化学成分因为对烟叶质量有重要影响而成为烟草行业日常开展的检测指标,一般称作"烟叶常规化学成分"。目前烟草企业普遍应用的是使用烟叶常规化学成分来给烟叶的可替代性评价作参考,由于烟叶常规化学成分不能充分表达烟叶的品质信息,局限性很大,对烟叶的可替代性的评价仍然依赖于感官评吸。在其他行业,如中药,已有用药材提取物的液相色谱指纹图谱进行质量判定的应用,而烟草内在品质因素范围广,许多内在质量指标找不到确切对应的有效成分,烟叶相似性的评价远比中药质量判定复杂。本发明利用更多、更全面的烟叶化学成分指标,通过计算未知烟叶化学成分与不同目标烟叶化学成分间的马氏距离来评价烟叶间的相似程度,得到量化的、能反映烟叶间可替代性的数据。本专利方法同时考虑目标烟叶的平均水平和波动水平,相似烟叶搜索结果具有较高的可用性。
发明内容本发明的目的是利用烟叶的多项化学成分检测数据来计算未知烟叶与各种具有一定波动水平的目标烟叶间的距离,通过对距离计算结果的排序,搜索到与未知烟叶相似的目标烟叶。本发明通过以下技术方案实现首先对每种目标烟叶进行分布式取样;然后检测目标烟叶样品的多种主要化学成分指标;然后检测未知烟叶与目标烟叶相同的化学成分指标,计算未知烟叶化学成分值与目标烟叶多个样品的化学成分值之间的马氏距离,距离越小则相似度越高;最后,比较未知烟叶与各个目标烟叶的距离,按距离的大小排序,距离最小的为最相似的烟叶,得到相似烟叶搜索结果。本发明的步骤包括(1)所述的目标烟叶进行分布式取样是指根据目标烟叶的批量大小取样至少10个,取样应按均匀的间隔进行,取样数量应大于化学成分检测指标数量;设有n种目标烟叶CiCn,第/种目标烟叶的取样数量为A^(2)由目标烟叶样品的多种主要化学成分指标的检测值构成了目标烟叶化学成分值矩阵,设矩阵A为目标烟叶/的化学成分值矩阵;(3)检测未知烟叶与目标烟叶相同化学成分指标,得到未知烟叶化学成分值向量f。(4)计算未知烟叶化学成分值向量/与目标烟叶/化学成分值矩阵^的马氏距离a)计算目标烟叶i化学成分值矩阵A的均值中心向量fl,对矩阵4进行均值中心化处理得到中心化矩阵M4,-;<formula>formulaseeoriginaldocumentpage5</formula>(5)重复步骤"(4)",直至得到未知烟叶与所有n种目标烟叶的距离D/D";(6)对距离按从小到大的顺序排序,距离越小表明相似度越高。本发明的具体实现步骤如下1.取样和样品前处理对每种目标烟叶进行分布式取样,根据目标烟叶的批量大小取样1050个,取样应按均匀的间隔进行,取样数量应大于化学成分检测指标数量。烟叶经粉碎处理制成烟末样品,如果烟叶未去梗,则需在制样之前去除烟叶主脉。设有n种目标烟叶C/C",第/种目标烟叶的取样数量为Af,。2.检测目标烟叶各样品的主要化学成分含量,化学成分指标可以从总糖、还原糖、总植物碱、总氮、氯、钾、淀粉、蛋白质、纤维素、灰分、总挥发酸、总挥发碱、多酚、石油醚提取物总量中选择6项到14项。目标烟叶各样品的多个指标检测值构成了目标烟叶化学成分值矩阵,设矩阵A为目标烟叶z'的化学成分值矩阵。3.检测未知烟叶主要化学成分含量,检测指标与目标烟叶一致,得到未知烟叶化学成分值4.计算未知烟叶化学成分值向量<与目标烟叶z'化学成分值矩阵4的马氏距离c)计算目标烟叶/化学成分值矩阵^的均值中心向量fl,用A中每个行向量减去此均值中心向量fl,对矩阵/4,进行均值中心化处理得到中心化矩阵M4,-;d)计算马氏距离<formula>formulaseeoriginaldocumentpage5</formula>5.重复步骤"4",直至得到未知烟叶与所有n种目标烟叶的距离D;D";6.对距离Z)/D"按从小到大的顺序排序,距离越小表明相似度越高。距离值D既可用作未知烟叶与不同目标烟叶间相似程度高低的相对比较,也可用来衡量未知烟叶与某一特定的目标烟叶的相似程度。根据本发明所述计算方式,可认为距离iK20为很相似,2(KZK50为较相似,50<£<100为弱相似,D>100为不相似。具体实施方式以下实施例旨在说明本发明而不是以本发明的进一步限定。实施例1在115种目标烟叶(C1C115)中每种取1550个共取样3073个,检测样品IO项化学成分总糖、总植物碱、总氮、氯、淀粉、纤维素、灰分、总挥发碱、多酚、石油醚提取物总量。在目标烟叶C1C10中各另取1个共10个独立检验样品(T1T10)作为未知烟叶,检测与目标烟叶相同的10项化学成分指标,按本发明方法计算这10个未知烟叶与各目标烟叶的距离。以未知烟叶T1与目标烟叶C1的距离计算为例,表l为未知烟叶T1以及目标烟叶C1的27个样品(71^=27)的化学成分检测数据,Tl与目标烟叶C1的距离计算过程如下设^为未知烟叶T1的化学成分检测数据向量《7=[7.270.2658.490.390.5315.43.452.495.7422.5]目标烟叶Cl的化学成分值矩阵A由27个样品(CUC1,27)的化学成分检测数据向量构成A=[c/./;...;计算目标烟叶化学成分值矩阵均值中心向量fl:fl=mean(/1》=[7.040.3278.190.390.4616.33.302.475.6121.8]计算目标烟叶化学成分值中心化矩阵M/4/=a;c人2-…;cj.27-a]计算0与4的马氏距离A=-)x(M4/xM47)-1x&-0'x(27-1)=18.05表1未知烟叶Tl与目标烟叶Cl的10项化学成分检测数据<table>tableseeoriginaldocumentpage6</column></row><table><table>tableseeoriginaldocumentpage7</column></row><table>表2列出了搜索到的与10个未知烟叶样品T1T10最相似的前7种目标烟叶。表2相似烟叶搜索结果——与未知烟叶T1~T10最相似的7种目标烟叶<table>tableseeoriginaldocumentpage7</column></row><table>*括号内的数值为未知烟叶与目标烟叶的距离计算结果。实施例2在115种目标烟叶(C1C115)中每种取1550个共取样3073个,检测样品14项化学成分总糖、还原糖、总植物碱、总氮、氯、钾、淀粉、蛋白质、纤维素、灰分、总挥发酸、总挥发碱、多酚、石油醚提取物总量。在目标烟叶C51C60中各另取1个共10个独立检验样品(T51T60)作为未知烟叶,检测与目标烟叶相同的14项化学成分指标,按本发明方法搜索与这10个未知烟叶最相似的目标烟叶。表3列出了与10个未知烟叶样品T51T60最相似的前7种目标烟叶。表3相似烟叶搜索结果——与未知烟叶T51T60最相似的7种目标烟叶<table>tableseeoriginaldocumentpage8</column></row><table>*括号内的数值为未知烟叶与目标烟叶的距离计算结果。实施例3在115种目标烟叶(C1C115)中每种取1050个共取样2989个,检测样品6项化学成分还原糖、总植物碱、淀粉、纤维素、多酚、石油醚提取物总量。在目标烟叶C71C80中各另取1个共10个独立检验样品(T71T80)作为未知烟叶,检测与目标烟叶相同的10项化学成分指标,按本发明方法搜索与这10个未知烟叶最相似的目标烟叶。表4列出了与IO个未知烟叶样品T71T80最相似的前7种目标烟叶。表4相似烟叶搜索结果——与未知烟叶T41T50最相似的7种目标烟叶<table>tableseeoriginaldocumentpage8</column></row><table>*括号内的数值为未知烟叶与目标烟叶的距离计算结果。权利要求1.一种基于烟叶化学成分的相似烟叶搜索方法,其特征在于首先对每种目标烟叶进行分布式取样,检测目标烟叶样品的多种主要化学成分指标;然后检测未知烟叶与目标烟叶相同的化学成分指标,计算未知烟叶化学成分值与目标烟叶多个样品的化学成分值之间的马氏距离,距离越小则相似度越高;最后,比较未知烟叶与各个目标烟叶的距离,按距离的大小排序,距离最小的为最相似的烟叶,得到相似烟叶搜索结果。2.根据权利要求1所述的一种基于烟叶化学成分的相似烟叶搜索方法,其特征在于-(1)所述的目标烟叶进行分布式取样是指根据目标烟叶的批量大小取样至少IO个,取样应按均匀的间隔进行,取样数量应大于化学成分检测指标数量;设有w种目标烟叶C7C,第/种目标烟叶的取样数量为A^(2)目标烟叶样品的多种主要化学成分指标的检测值构成了目标烟叶化学成分值矩阵,设矩阵A为目标烟叶/的化学成分值矩阵;(3)检测未知烟叶与目标烟叶相同化学成分指标,得到未知烟叶化学成分值向量r。(4)计算未知烟叶化学成分值向量/与目标烟叶/化学成分值矩阵A的马氏距离a)计算目标烟叶/化学成分值矩阵^的均值中心向量",对矩阵^进行均值中心化处理得到中心化矩阵M4j;b)计算马氏距离Z)/=("fl)x(M4/xM4,〕'1x("a)'x(M-1)(5)重复步骤"(4)",直至得到未知烟叶与所有n种目标烟叶的距离;(6)对距离Z)/D"按从小到大的顺序排序,距离越小表明相似度越高。3.根据权利要求2所述的一种基于烟叶化学成分的相似烟叶搜索方法,其特征在于距离值D用作未知烟叶与不同目标烟叶间相似程度高低的相对比较,或是用来衡量未知烟叶与某一特定的目标烟叶的相似程度;距离ZK20为很相似,20<ZK50为较相似,50<ZK100为弱相似,£100为不相似。4.根据权利要求2所述的一种基于烟叶化学成分的相似烟叶搜索方法,其特征是对每种目标烟叶进行1050次的分布式取样。5.根据权利要求1或2所述的相似烟叶搜索方法,其特征是所述的多种化学成分指标是指选择总糖、还原糖、总植物碱、总氮、氯、钾、淀粉、蛋白质、纤维素、灰分、总挥发酸、总挥发碱、多酚、石油醚提取物总量中的6项14项。全文摘要一种基于烟叶化学成分的相似烟叶搜索方法,所用的基础数据是烟叶的化学成分检测数据。首先对每种目标烟叶进行分布式取样,检测烟叶样品的主要化学成分;然后检测未知烟叶相同化学成分指标,计算未知烟叶化学成分值与目标烟叶多个样品的化学成分值之间的马氏距离,距离越小则相似度越高;最后,比较未知烟叶与各个目标烟叶的距离,按距离的大小排序,得到相似烟叶搜索结果。文档编号G01N33/00GK101251523SQ200810030798公开日2008年8月27日申请日期2008年3月12日优先权日2008年3月12日发明者任建新,易建华,曹继红,文杜,谭新良,钱晓春申请人:湖南中烟工业有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1