广义模糊k调和均值聚类的生菜贮藏时间判定方法

文档序号:8259606阅读:270来源:国知局
广义模糊k调和均值聚类的生菜贮藏时间判定方法
【技术领域】
[0001] 本发明涉及一种生菜贮藏时间判定方法,具体涉及一种广义模糊K调和均值聚类 方法和近红外光谱技术的生菜贮藏时间判定方法。
【背景技术】
[0002] 生菜中含有丰富的营养物质,它是人们经常食用的蔬菜之一。随着人们生活水平 的不断提高,对生菜的品质要求越来越高。另一方面,随着社会的进步,工作繁忙的人们没 有时间买菜,喜欢一次买很多蔬菜放在冰箱里慢慢吃,但是随着贮藏时间的增加,生菜中的 亚硝酸盐和微生物会递增从而破坏了生菜品质而导致不能食用。所以贮藏时间是影响生菜 品质的重要因素,因此研究一种简单、快速、非破坏的生菜贮藏时间的判定方法是非常必要 的。
[0003] 近红外光谱技术是根据样品内有机官能团(0-H、C-H、N-H、S-H)的自身振动吸收 近红外光谱区相应波长的能量,从而在光谱中产生能量跃迁的表现。近红外光谱分析技术 源起于20世纪70年代,是一种高效、快速的现代分析技术。其综合运用了光谱技术、计算 机技术和化学计量学等多个学科的最新研究成果,因其独特的优点从而广泛应用于多个领 域,特别是在农产品和食品的无损检测领域。
[0004] 在近红外光谱定性建模分析中,偏最小二乘判别分析(PLSDA)是常用的定性建模 分析方法。然而PLSDA是利用全光谱区域建立定性模型,这就导致在建模过程中容易受到 光谱中的噪声信息以及其他一些冗余信息的干扰,这些无关信息在预处理中很难全部消 除,最终影响了预测模型的预测准确度。
[0005] 模糊K调和均值聚类(赵恒,杨万海,张高煜.模糊K-Harmonic Means聚类算 法,西安电子科技大学学报(自然科学版),2005,32(4):603-606.)是将模糊的概念应用到 K调和均值聚类(B. Zhang, M. Hsu, U. Dayal, K-harmonic means - a data clustering algorithm, Technical Report HPL-1999-124, Hewlett-Packard Laboratories, 1999.),保留了 K调和均值聚类对初始值不敏感的优点,同时提高了聚类准确度。模糊K调 和均值聚类采用欧式距离作为度量方式,欧式距离适合簇形状是超椭球,对于有锐角的"盒 状"族则聚类效果不理想(Bobrowski L, Bezedek JC. C-means clustering with the h and 1"〇 norms. IEEE Trans, on SMC, 1991,21(3): 545~554. )〇
[0006] 在生菜检测时获取的近红外光谱一般为高维数据,经过维数压缩和特征提取后数 据的簇拓扑结构不一定满足超椭球形状,若用模糊K调和均值聚类进行数据分类时还用欧 式距离来度量则聚类效果欠佳。

【发明内容】

[0007] 针对上述现有的模糊K调和均值聚类方法的缺陷以及现有生菜检测技术的不足, 本发明提出一种基于广义模糊K调和均值聚类和近红外光谱的生菜贮藏时间判定方法,采 用后向间隔偏最小二乘判别分析进行光谱波段优选,采用基于P范数距离的广义模糊K调 和均值聚类进行生菜近红外数据的分类,以解决偏最小二乘判别分析的冗余信息干扰问题 以及模糊K调和均值聚类方法只能聚类超椭球簇的问题,扩展模糊K调和均值聚类方法的 数据适用范围。
[0008]本发明采用的技术方案是包括以下步骤: 1) 将每个贮藏时间的生菜样本分为训练样本和测试样本,用近红外光谱仪获取训练样 本和测试样本的近红外漫反射光谱; 2) 建立训练样本类别信息矩阵,将训练样本的近红外光谱平均地划分为若干个等宽的 子光谱区域,每次去除1个子光谱区域,使剩余的光谱区域中的训练样本光谱值与类别信 息矩阵进行偏最小二乘回归所得交互验证均方根误差最小,最后1个子光谱区域;根据均 方根误差最小原则选取训练样本的数个子光谱区域,测试样本选取的数个子光谱区域和训 练样本选取的数个子光谱区域相同;将选取的子光谱区域的训练样本光谱值与类别信息矩 阵进行偏最小二乘回归得到特征向量,将选取的子光谱区域的测试样本投影到特征向量后 得到光谱波段优选和维数降低的测试样本; 3) 采用线性判别分析提取经过光谱波段选择和降维处理后的生菜样本近红外光谱的 生菜不同储藏时间的鉴别信息; 4) 对鉴别信息运行模糊C-均值聚类以得到初始聚类中心; 5) 根据初始聚类中心运行广义模糊K调和均值聚类方法得到在第r次迭代终止时的模 糊隶属度"丨^ I,根据第i个样本中模糊隶属度W I的最大值所对应的7值,即判定 第i个样本属于第J类,以此实现生菜贮藏时间的判定;i=l,2,……。/7,户1,2,……, 么是生菜近红外漫反射光谱样本数,A是样本类别数。
[0009]本发明用近红外光谱技术获取生菜的近红外光谱,用后向间隔偏最小二乘判别分 析进行光谱波段选择和降维处理,用线性判别分析提取鉴别信息,运行模糊C-均值聚类以 得到初始聚类中心,用广义模糊K调和均值聚类方法进行生菜贮藏时间的判定。本发明可 实现生菜C藏时间的准确判定,具有检测速度快,判定准确率高,无污染,对生菜不造成损 坏等优点。
【附图说明】
[0010] 图1是本发明的流程图; 图2是生菜样本的漫反射近红外光谱图; 图3是后向间隔偏最小二乘判别分析选择的子光谱区域; 图4是LDA特征提取后得到的二维数据图。
[0011] 图5是广义模糊K调和均值聚类的模糊隶属度图。
【具体实施方式】
[0012] 生菜的近红外漫反射光谱包含了生菜内部品质信息,贮藏时间不同的生菜其内部 品质不同,所对应的近红外漫反射光谱也不相同。参见图1,本发明首先用近红外光谱仪采 集不同贮藏期的生菜样本的近红外光谱,然后用后向间隔偏最小二乘判别分析进行光谱波 段选择和降维处理,再用线性判别分析提取近红外光谱的鉴别信息,对鉴别信息运行模糊 C-均值聚类得到初始聚类中心,最后用广义模糊K调和均值聚类方法对生菜贮藏时间进行 判定。具体如下: 生菜样本近红外光谱的采集:采集不同贮藏时间的生菜样本,将每个贮藏时间的生菜 样本分为训练样本和测试样本,用近红外光谱仪获取训练样本和测试样本的近红外漫反射 光谱。
[0013] 用后向间隔偏最小二乘判别分析进行光谱波段选择和降维处理。具体是: 1. 用标准正态变量变换(SNV)预处理方法对生菜样本的近红外漫反射光谱进行预处 理 2. 建立训练样本类别信息矩阵:
【主权项】
1. 一种广义模糊K调和均值聚类的生菜贮藏时间判定方法,其特征是包括以下步骤: 1) 将每个贮藏时间的生菜样本分为训练样本和测试样本,用近红外光谱仪获取训练样 本和测试样本的近红外漫反射光谱; 2) 建立训练样本类别信息矩阵,将训练样本的近红外光谱平均地划分为若干个等宽的 子光谱区域,每次去除1个子光谱区域,使剩余的光谱区域中的训练样本光谱值与类别信 息矩阵进行偏最小二乘回归所得交互验证均方根误差最小,最后1个子光谱区域;根据均 方根误差最小原则选取训练样本的数个子光谱区域,测试样本选取的数个子光谱区域和训 练样本选取的数个子光谱区域相同;将选取的子光谱区域的训练样本光谱值与类别信息矩 阵进行偏最小二乘回归得到特征向量,将选取的子光谱区域的测试样本投影到特征向量后 得到光谱波段优选和维数降低的测试样本; 3) 采用线性判别分析提取经过光谱波段选择和降维处理后的生菜样本近红外光谱的 生菜不同储藏时间的鉴别信息; 4) 对鉴别信息运行模糊C-均值聚类以得到初始聚类中心; 5) 根据初始聚类中心运行广义模糊K调和均值聚类方法得到在第r次迭代终止时的模 糊隶属度&^^I,根据第i个样本中模糊隶属度WI的最大值所对应的7值,即判定 第i个样本属于第J类,以此实现生菜贮藏时间的判定;i=l,2,……,/7,户1,2,……, 么是生菜近红外漫反射光谱样本数,A是样本类别数。
2. 根据权利要求1所述生菜贮藏时间判定方法,其特征是:步骤5)中, 第r次迭代时的模糊隶属度
,第r次迭 代时的类中心
;当
距离,jtj为第i个样本,为第/~一1次迭代时第j类的类中心,为第r一 1次迭代时第7类的类中心;7=1,2,……,釦m是权重指数,Gnax是最大迭代数,£是误 差上限值。
3. 根据权利要求1所述生菜贮藏时间判定方法,其特征是:步骤2)中,训练样本类别 信息矩阵是:
为训练样本数,为样 本类别数,Ytrain (i,j)= 1表示第i个样本属于第j类,Ytrain (i,j)= 0表示第i个 样本不属于第j类。
4. 根据权利要求1所述生菜贮藏时间判定方法,其特征是:步骤3)中,先对训练样本 光谱进行线性判别分析得到LDA的鉴别矢量集,然后将经过光谱波段选择和降维处理后的 测试样本光谱投影到LDA的鉴别矢量集得到测试样本的鉴别信息。
5. 根据权利要求1所述生菜贮藏时间判定方法,其特征是:步骤4)中,模糊C-均值聚 类的参数为:类别数为3,权重指数为2,最大迭代数为100次,误差上限为0. 00001。
【专利摘要】本发明公开一种广义模糊K调和均值聚类的生菜贮藏时间判定方法,首先用近红外光谱仪采集不同贮藏期的生菜样本的近红外光谱,然后用后向间隔偏最小二乘判别分析进行光谱波段选择和降维处理,再用线性判别分析提取近红外光谱的鉴别信息,对鉴别信息运行模糊C-均值聚类得到初始聚类中心,最后用广义模糊K调和均值聚类方法对生菜贮藏时间进行判定,具有检测速度快,判定准确率高,无污染,对生菜不造成损坏等优点。
【IPC分类】G06K9-66, G06K9-46
【公开号】CN104573739
【申请号】CN201410745142
【发明人】武小红, 武斌, 嵇港, 孙俊
【申请人】江苏大学
【公开日】2015年4月29日
【申请日】2014年12月9日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1