一种使用近红外光谱技术快速鉴别茶叶品种的方法

文档序号:9429970阅读:864来源:国知局
一种使用近红外光谱技术快速鉴别茶叶品种的方法
【技术领域】
[0001] 本发明涉及一种茶叶品种鉴别方法的技术领域,具体涉及一种使用近红外光谱技 术快速鉴别茶叶品种的方法。
【背景技术】
[0002] 茶叶是世界三大饮料之一,它含有茶多酚、蛋白质和氨基酸等有机物质,也含有 钾、钙和镁等无机物质,具有安神,明目和清热等功效,常饮茶有益于人的身体健康。乐山竹 叶青是乐山地区特有的茶叶品牌,但是在茶叶市场上存在以次充好现象,而普通消费者无 法辨认优质名茶和劣质茶叶,往往会受骗上当。另外,以次充好的劣质茶叶损害了名优茶的 品牌信誉,侵害了消费者权益,给名优茶的市场推广带来困扰。所以研究一种方法简单、易 于操作、检测速度快的茶叶品种的鉴别方法是非常必要的。
[0003] 近红外光谱检测技术作为一种快速无损检测技术,近年来应用于茶叶品质的检测 分析中。张龙等用近红外光谱技术,主成分分析和典则判别分析对非发酵茶,半发酵茶和发 酵茶进行分类研究。宁井铭等用近红外光谱技术和神经网络区分三种不同发酵程度的普洱 茶。Huang等用近红外光谱技术和蚁群优化模型检测花茶的总花青素含量。Ren等用近红 外光谱技术检测红茶的化学组成成分和识别茶叶的溯源地。He等用近红外光谱技术,偏最 小二乘判别分析和欧式距离法检测茶叶的溯源地。Xiong等用近红外光谱技术和多光谱图 像系统检测铁观音茶的总多酚含量。
[0004] 模糊C-均值聚类(FCM)是著名的模糊聚类算法,其应用非常广泛,但是FCM对噪 声数据敏感。噪声聚类是一种模糊聚类算法,它适用于处理含噪声数据的聚类分析,噪声聚 类将噪声数据看做一个类别进行处理,但是噪声聚类对参数具有依赖性,同时,噪声聚类的 目标函数均是建立在样本到类中心矢量的欧式距离的平方基础上,它们在聚类拓扑结构比 较复杂的数据时准确率往往不是很理想。
[0005] 用近红外光谱仪采集到的茶叶近红外漫反射光谱数据是一种高维数据,经过维数 压缩和特征提取后数据的簇拓扑结构比较复杂,若采用噪声聚类进行数据聚类时,由于噪 声聚类采用的欧式距离来度量数据,则聚类效果不理想。

【发明内容】

[0006] 本发明针对现有技术中噪声聚类方法的缺陷和不足的问题,提出了一种检测速度 快,鉴别准确率高,绿色环保,可实现茶叶品种的准确鉴别的一种使用近红外光谱技术快速 鉴别茶叶品种的方法;从而解决了噪声聚类方法只能聚类拓扑结构简单的数据问题,提高 了噪声聚类的准确率。
[0007] 本发明的目的是通过以下技术手段实现的:一种使用近红外光谱技术快速鉴别茶 叶品种的方法,其特征在于包括以下步骤:
[0008] 步骤一、茶叶样本近红外光谱的采集:用近红外光谱仪采集不同品种的茶叶样本, 获取茶叶样本的近红外漫反射光谱;
[0009] 步骤二、对茶叶样本近红外光谱进行降维处理:采用主成分分析方法(PCA)将茶 叶样本近红外光谱从高维数据变换为低维数据;
[0010] 步骤三、提取茶叶样本近红外光谱的鉴别信息:采用线性判别分析(LDA)提取茶 叶样本近红外光谱的鉴别信息;
[0011] 步骤四、运行模糊C-均值聚类以得到初始聚类中心;
[0012] 步骤五、用一种广义噪声聚类方法进行茶叶品种的鉴别:根据步骤四的初始聚类 中心运行广义噪声聚类方法得到模糊隶属度,根据模糊隶属度可实现茶叶品种的鉴别。
[0013] 步骤一、二、三中所述的近红外漫反射光谱,因不同的茶叶样本的近红外漫反射光 谱包含了茶叶的不同的内部品质信息,品种不同的茶叶其内部品质不同,所对应的近红外 漫反射光谱也不相同,此为本发明的原理。
[0014] 所述步骤五中的广义噪声聚类方法采用基于欧式距离的P次方的广义噪声聚类 进行茶叶品种的分类,具体如下:
[0015] (1).初始化
[0016] 设置茶叶近红外光谱样本数目n(+ η > 1),样本类别数目c(n > C > 1),权 重指数m(+ > m > 1)和p (+ °° > p > 1),初始迭代次数r = 1,最大迭代数rmax,误差上 限值ε,初始化类中心Vli。;
[0017] (2).计算参数 aik:
[0019] 这里〇 2是样本的方差;a ik为第i (i = 1,2,......,c)类别的第k (k = 1,2,......, η)个样本的参数;Dlk^= I I X k-Vv i I I是Xk-V1 ^ i的欧式距离,X k为第k个样本,V V 1为第 r - 1次迭代时第i类的类中心矢量;Djkif= I I X k-v.j,r i I I是Xk-Vjif满欧式距尚,V 为 第r 一 1次迭代时第j类的类中心矢量;?为总体样本均值,X]为第j个样本;
[0020] (3) ·计算第r次迭代时的模糊隶属度值U11^;
[0022] 这里隶属度值U11^表示第r次迭代计算时第k个样本隶属于第i类的模糊隶属度 值;Dik^= I I X k_Vm I I,Vi, i为第r - 1次迭代时第i类的类中心矢量;
[0023] (4).计算第r次迭代时的类中心Viil^
[0025] 当Hiaxi I I Viil-ViJ丨I I < ε或者r = r_时,迭代终止;否贝lj,r = r+Ι,返回步骤 (2)继续迭代计算。
[0026] 与现有技术相比本发明具有以下明显的优点:
[0027] 1、本发明采用基于欧式距离的p次方的广义噪声聚类进行茶叶品种的分类;从而 解决了噪声聚类方法只能聚类拓扑结构简单的数据问题,提高了噪声聚类的准确率。2、本 发明方法用近红外光谱仪采集茶叶的近红外漫反射光谱,再用主成分分析(PCA)对茶叶的 高维近红外光谱进行降维处理,用线性判别分析(LDA)进行茶叶光谱数据的品种类别信息 的提取,最后利用一种新的广义噪声聚类方法进行茶叶品种的鉴别分析。3、本发明具有检 测速度快,鉴别准确率高,绿色环保,可实现茶叶品种的准确鉴别。
【附图说明】
[0028] 图1为本发明的流程示意图;
[0029] 图2为本发明中茶叶样本的漫反射近红外光谱图;
[0030] 图3为本发明中线性判别分析特征提取后得到的二维数据图;
[0031] 图4为本发明方法的模糊隶属度图;
[0032] 图5为本发明方法实现茶叶品种鉴别的聚类准确率图。
【具体实施方式】
[0033] 以下结合【附图说明】和【具体实施方式】对本发明作进一步的详细描述:本发明的一种 广义噪声聚类的近红外光谱茶叶品种鉴别方法适用于茶叶品种的鉴别分析,本发明的实施 流程如图1所示。
[0034] 实施例
[0035] 步骤一、茶叶样本近红外光谱的采集:用近红外光谱仪采集不同品种的茶叶样本, 获取茶叶样本的近红外漫反射光谱。
[0036] 采集优质乐山竹叶青、劣质乐山竹叶青和峨眉山毛峰三种茶叶,每种茶叶的样本 数为32,合计96个样本。所有茶叶样本被研磨粉粹后经40目筛过滤,每个样本取0. 5g分 别与溴化钾按1:100均匀混合后取混合物Ig进行压膜处理。在进行采集近红外光谱时实验 室温度约25°C,相对湿度在50%左右,FTIR-7600型傅里叶近红外光谱分析仪开机预热1小 时。光谱分析仪扫描每个茶叶样本32次,光谱扫描的波数范围为4001. 569~401. 1211 cm 1, 扫描间隔为I. 9285cm 1,每个茶叶样本的近红外光谱是1868维的高维数据。每个样本采样 3次,取其平均值作为后续模型建立的实验数据。茶叶样本的近红外光谱图如图2所示。
[0037] 步骤二、对茶叶样本近红外光谱进行降维处理:采用主成分分析方法(PCA)将茶 叶样本近红外光谱从高维数据变换为低维数据。
[0038] 采用主成分分析将96个样本的近红外光谱数据压缩为20维的数据。
[0039] 步骤三、提取茶叶样本近红外光谱的鉴别信息:采用线性判别分析(LDA)提取茶 叶样本近红外光谱的鉴别信息。
[0040] 从每种茶叶样本中选取13个样本组成茶叶样本训练集,则训练集样本总数为39 个,剩余的样本组成茶叶样本测试集,则测试集样本总数为57个。通过运行LDA计算
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1