本发明属于人工智能技术领域,尤其是一种模糊kohonen鉴别聚类网络的茶叶红外光谱分类方法。
背景技术:
茶叶是我国主要的作物之一,茶叶的采后处理、品质判断及检测一直是茶叶品质保证的重要手段。目前中国的茶叶市场由于缺乏有效的茶叶鉴别方法所以在茶叶市场中贴牌现象,以次充好和以假乱真现象比较严重,因此茶叶品种的鉴别变得越来越重要,而研究一种简单快速的茶叶品种鉴别方法是非常必要的。
红外光谱技术具有检测速度快,可同时检测多种成分等优点。不同品种的茶叶,其组分及含量往往存在差别,那么在不同品种的茶叶上获得的漫反射光谱是有差异的,利用这个原理,可以实现不同品种的茶叶分类。
模糊kohonen聚类网络是一种无监督的学习方法(tsaoec,bezdekjc,palnr.fuzzykohonenclusteringnetworks.patternrecognition,1994,27(5):757–764.)。模糊kohonen聚类网络是将模糊c-均值聚类(fcm)引入到kohonen聚类网络的学习速率和更新策略中。作为一种无监督的聚类方法,模糊kohonen聚类网络只能实现对数据的模糊聚类,而无法在模糊聚类过程中提取数据的鉴别信息,从而无法得到高的聚类准确率。
技术实现要素:
针对上述现有的模糊kohonen聚类网络存在的缺陷和不足,本发明的目的是提出一种模糊kohonen鉴别聚类网络的茶叶红外光谱分类方法。该方法用红外光谱技术获取茶叶的红外光谱,用主成分分析对茶叶的红外光谱进行降维处理,用线性判别方法进行光谱信息的特征提取,运行模糊c-均值聚类以得到初始聚类中心,用一种模糊kohonen鉴别聚类网络方法进行茶叶品种的分类。
根据上述原理,采用的技术方案包括以下步骤:
步骤一、在恒温恒湿环境下采集茶叶样本的红外光谱:针对不同品种的茶叶样本,用红外光谱仪对这些茶叶样本做采集红外光谱实验,获取茶叶样本的红外漫反射光谱信息,将光谱信息存储在计算机里。
步骤二、对茶叶样本红外光谱预处理:用多元散射校正(msc)对茶叶样本红外光谱进行预处理。
步骤三、对茶叶样本红外光谱进行降维处理:采用主成分分析方法(pca)将茶叶样本红外光谱从高维数据降到相对较低的低维数据,并保存这些数据,再用线性判别方法进一步提取特征和降维。
步骤四、模糊c-均值聚类以得到初始聚类中心:对降维后的茶叶红外数据运行模糊c-均值聚类,得到初始的聚类中心。
步骤五、用一种模糊kohonen鉴别聚类网络方法进行茶叶品种的分类:根据步骤四的初始的聚类中心运行一种模糊kohonen鉴别聚类网络方法得到模糊隶属度,根据模糊隶属度可将不同品种茶叶进行分类。
所述步骤五中的一种模糊kohonen鉴别聚类网络方法如下:
1.初始化
固定茶叶红外光谱样本类别数c和权重指数m0的值,n为样本数,n>c>1,+∞>m0>1,设置最大迭代次数tmax和误差上限的值ε,设置初始聚类中心vi,0(i=1,2,…c)。设置特征向量数为q;
2.计算第t(t=1,2,…,tmax)次迭代时的学习速率αik,t
其中mt=m0-tδm,t为迭代次数,δm=(m0-1)/tmaxuik,t表示第t次迭代计算时第k个样本隶属于第i类的模糊隶属度值。uik,t计算如下:
xk为第k个茶叶红外光谱样本,xk∈rp,即xk的维数为p。vi,t为第t次迭代计算时第i类的类中心,vj,t为第t次迭代计算时第j类的类中心。
3.计算第t次迭代时的类中心vi,t
vi,t-1为第t-1次迭代计算时第i类的类中心。
4.计算模糊类间散射矩阵sfb模糊总体散射矩阵sft
5.根据式:
6.将样本xk投影到q个特征向量ψ1,ψ2,...,ψq上得到
xk′=xkt[ψ1,ψ2,...,ψq]
将类中心vi,t投影到q个特征向量ψ1,ψ2,...,ψq上得到
vi,t′=vi,t[ψ1,ψ2,...,ψq]
7.若maxi||v′i,t-v′i,t-1||<ε或者t>tmax,迭代结束,否则,t=t+1,将xk′的值赋给xk,vi,t′的值赋给vi,t,返回步骤2继续迭代计算。
本发明的有益效果:
本发明解决了模糊kohonen聚类网络在对数据进行模糊聚类过程中无法提取数据的鉴别信息,导致聚类准确率不高的问题。本发明可实现在聚类过程中动态提取茶叶光谱数据的鉴别信息,茶叶分类准确率高。
附图说明
图1是本发明的流程图;
图2是茶叶样本的红外光谱图;
图3是茶叶红外光谱经过msc预处理后的光谱图;
图4是线性判别方法处理后得到的二维图;
图5是一种模糊kohonen鉴别聚类网络方法产生的模糊隶属度图。
具体实施方式
下面结合附图以及具体实施例对本发明作进一步的说明,但本发明的保护范围并不限于此。
本发明适用于不同品种茶叶的品种分类,实施流程如图1所示,具体实施如下:
实施例:
步骤一、茶叶样本红外光谱采集:采集优质乐山竹叶青、劣质乐山竹叶青和峨眉山毛峰三种茶叶,每种茶叶的样本数为32,合计96个样本。所有茶叶样本被研磨粉粹后经40目筛过滤,每个样本取0.5g分别与溴化钾按1:100均匀混合后取混合物1g进行压膜处理。在采集茶叶红外光谱时,实验室温度和相对湿度保持恒定,ftir-7600型傅里叶红外光谱分析仪开机预热1h。光谱分析仪扫描每个茶叶样本32次,光谱扫描的波数范围为4001.569~401.1211cm-1,扫描间隔为1.9285cm-1,每个茶叶样本的红外光谱是1868维的高维数据。每个样本采样3次,取其平均值作为后续模型建立的实验数据。每种样本选取22个为测试集,则测试样本数n为66。剩余10个样本为训练集,则训练样本数nr为30。测试集为待鉴别的茶叶样本,训练集为已知的优劣茶叶样本。设置类别数c=3。茶叶样本的红外光谱图如图2所示。
步骤二、对茶叶样本红外光谱预处理:用多元散射校正(msc)对茶叶样本红外光谱进行预处理。预处理后的茶叶红外光谱图如图3所示。
步骤三、茶叶样本红外光谱的降维处理:采用主成分分析方法将茶叶样本红外光谱从1868维降到14维数据,并保存这些数据。再用线性判别方法进一步提取特征,将数据降维到二维,该二维数据如图4所示。
步骤四、模糊c-均值聚类以得到初始聚类中心:对步骤三的二维数据运行模糊c-均值聚类(fcm),fcm迭代终止后的聚类中心作为一种模糊kohonen鉴别聚类网络方法初始聚类中心vi,0。
步骤五、采用一种模糊kohonen鉴别聚类网络方法进行茶叶品种的分类:根据步骤四的初始的聚类中心运行一种模糊kohonen鉴别聚类网络方法得到模糊隶属度,根据模糊隶属度可将不同品种茶叶进行分类。
所述步骤五中的一种模糊kohonen鉴别聚类网络方法如下:
1.初始化
固定茶叶红外光谱样本类别数c=3和权重指数m0=2,n为样本数,n>c>1,+∞>m0>1,设置最大迭代次数tmax=100和误差上限的值ε=0.00001,设置初始聚类中心vi,0(i=1,2,3)如步骤四所示。设置特征向量数为q=2;
2.计算第t(t=1,2,…,tmax)次迭代时的学习速率αik,t
xk为第k个茶叶红外光谱样本,xk∈rp,即xk的维数为p。vi,t为第t次迭代计算时第i类的类中心,vj,t为第t次迭代计算时第j类的类中心。
3.计算第t次迭代时的类中心vi,t:
其中,vi,t-1为第t-1次迭代计算时第i类的类中心。
4.计算模糊类间散射矩阵sfb、模糊总体散射矩阵sft;
其中,
5.根据式:
6.将样本xk投影到q个特征向量ψ1,ψ2,...,ψq上得到
xk′=xkt[ψ1,ψ2,...,ψq]
将类中心vi,t投影到q个特征向量ψ1,ψ2,...,ψq上得到vi,t′=vi,t[ψ1,ψ2,...,ψq]。
7.若maxi||v′i,t-v′i,t-1||<ε或者t>tmax,迭代结束,否则,t=t+1,将xk′的值赋给xk,vi,t′的值赋给vi,t,返回步骤2继续迭代计算。
计算结果:迭代终止后的模糊隶属度如图5所示,根据模糊隶属度得到茶叶品种的分类准确率为93.9%。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。