一种苹果霉心病多因子无损检测判别模型及其建立方法_2

文档序号:9249373阅读:来源:国知局
92. 73%,实现了对苹果霉屯、病的快速、无损、精准检测。
【附图说明】
[0043] 图1是本发明所用透射光谱采集平台的结构示意图。
【具体实施方式】
[0044] 下面结合附图和实施例详细说明本发明的实施方式。
[0045] 本发明苹果霉屯、病多因子无损检测判别模型的建立方法如下:
[004引 1、样品
[0047] 试验用苹果品种为红富±,样本于2014年10月中旬采摘于陕西省苹果的代表地 延安市洛川县。在洛川随机挑选一个果园,自由采摘一批苹果。获得样本后采用标签编码 对样本进行逐个编号。最终选择无缺陷、损伤或污染物的苹果220个进行试验,试验过程保 持实验室温湿度基本不变(20°C,相对湿度30% )。样本的直径数据和光谱图像采集完成后 将苹果沿茎轴处切开W判定是否为霉屯、病果。
[0048] 2、透射光谱采集平台
[0049] 本发明所用的苹果透射光谱采集平台如图1所示。该系统主要由光谱仪3、载物台 6、检测暗室7、支架5、光源4、计算机1等组成。
[0050] 光源4、支架5和载物台6都位于检测暗室7中,光源4位于载物台6的正上方, 通过支架5相连,载物台6上有遮光材料8,光谱仪3通过光纤9端部的光纤探针接收透射 过载物台6中苹果的光,透射数据再通过数据传输线传递至计算机1。
[0051] 光谱仪3采用的是USB2000+,其接收透射光谱范围是200nm-1025nm,光谱分辨率 为0. 43nm。搭建的检测暗室7为60cmX40cmX100cm长方形箱体,支架5高60畑1,在40cm 处安装光,4,光源4由4个50W面素灯成圆形阵列,直对着安装在载物台6下面位置的光纤 探针,每个面素灯泡距放置6载物台的中屯、距离为12畑1。在支架5的20cm高处安装载物台 6,在载物台6上面放置遮光材料8,遮光材料8为双层遮光海绵,确保只有透过苹果的光能 够进入光谱检测系统。
[0052] 3、数据采集
[0053] 采用美国海洋光学公司生产的USB2000+光纤光谱仪分别对每个苹果样本进行光 谱照射测量,从每个苹果的从平行于茎轴的方向开始每隔120度的=个方向进行采集,每 个方向采集5次,对样本光谱数据进行粗大误差分析和滤除后,平均输出保存,获得样品光 谱数据集。
[0054] 使用电子游标卡尺(分辨率为0. 01cm)分别从垂直于茎轴和平行于茎轴的两个方 向采集苹果的近似直径di和d2。建立苹果直径的样品数据集。
[00巧]使用电子天平(分辨率为0.Ig)直接测量苹果的重量,建立苹果重量的样本数据 集;
[0056] 4、上述S个步骤之后,按数量3:1的比例,采用随机样本生成法将220个苹果样本 划分为建模集和检验集。建模集中共有样本162个(正常果110个,霉屯、病果52个);检 验集中共有样本58个(正常果42个,霉屯、病果16个)。在实际检测过程中将正常果样本 记为"1",霉屯、病苹果样本记为"0"。
[0057] 之后先对所采集的多维数据进行预处理,再采用主成分分析法对数据做降维处 理,继而进行Fisher判别分析,建立霉屯、病判别模型。具体步骤如下:
[005引4. 1数据预处理
[0059] 4. 1. 1苹果样本原始光谱分析
[0060] 正常果与霉屯、病果在200nm-1050nm波长范围的原始光谱曲线中,正常果与霉 屯、病果的光谱曲线存在较明显差异。整个光谱曲线在710nm附近有明显的透过峰,在 680nm-735nm附近差异最大,正常果在此波段光谱曲线明显偏高。该可能是由于内部霉屯、对 苹果组织结构产生了一定程度的影响所造成的。
[0061] 4. 1.2光谱预处理
[0062] 由于采集系统电噪声、杂散光和样本背景等因素会对原始光谱产生一定影响,因 此需要对苹果原始光谱进行预处理W减少或消除对有用信息的干扰,提高模型预测能力和 稳定性。光谱数据预处理包括去除暗噪声、非线性校正、杂散光校正=种方法,通过比较与 分析获取适合苹果霉屯、病检测的最优处理方法。
[0063] 4. 2主成分分析
[0064] 对于整个光谱曲线,选取与苹果霉屯、病相关性最大的680nm-735nm波段,每隔近 似5皿的波长。对于直径,选取较大的直径d,对于重量,直接由天平获得共14维数据进行 试验数据分析。
[0065] 在进行主成分分析前先对实验数据进行Z-score归一化。Z-score归一化是给原 始数据的均值(mean)和标准差(standarddeviation)进行数据的标准化。使各指标处于 同一数量级,从而进行综合对比评价。经过处理的数据符合标准正态分布,即均值为0,标准 差为1,转化函数为:
[0066]
(1)
[0067] 其中X为所采集的14维直径、重量和光强值实验数据,y为14维实验数据的均 值,0为14维实验数据的标准差;X为归一化后的实验数据。
[0068] 主成分分析(principalcomponentanalysis,简称PCA)是一种数据压缩和特征 信息提取技术。利用该方法对数据进行处理,可有效地消除高维数据组之间的相关性,使数 据降维,简化数据结构同时在简化过程中,将多个相
[0069] 关变量W尽可能少的信息损失为基本原则。
[0070] 通过公式(2)
[0071]
[0072] 计算经过归一化后的协方差矩阵R
[0073]
[0074] 和R对应的特征值Ai(i= 1,2, 3,……p)。并使其按大小顺序排列入i>入… > 然后分别求出对应于特征值Ai的特征向量ei(i= 1,2,…,P)。
[007引第k个主成分Yk的方差贡献量为V,V可W用公式(4)表示: (4)
[0076]
[0077] 若取m(m<p)个主成分,主成分Yi,Y2,…,Ym的方差累计贡献量C可用公式巧) 表不:
[0078]
(5)
[0079] 对建模集中的162个样本所提取的光谱和直径、重量数据归一化样本集经过主成 分分析,可得出各主成分的特征值、方差贡献量、方差累计贡献量,如表1所示:
[0080]表1
[0081]
[0083] 则主成分可W用原始数据矩阵X(经过归一化后的162个样本的14维光强数据和 直径数据、重量数据所组成的原始数据矩阵)的P个变量Xi,X2,…,Xp作线性组合Y=AX, 即:
[0084]
[00财选取累计贡献率超过90%的前四个主成分Yi,Y2,Ys,Y4对于各主成分对应的特征 值入1= 9. 674,A2= 1. 859,A3= 0. 995,A4= 0. 413,求出公式(Y-AiE)X= 0 的非零 解,即特征向量ei,62,63,e"要求
[0086]
[0087] 由;?(2,.^.)=為唔(*' =1,2,3,4,/=1,2,-.,幻-计算出各变量又1,又2,......,x。在各主成分z 上的主成分载荷矩阵?(2。义^,再由。&'=^〇' =1,2,3,4^ =1,2,一,口)计算出主成分¥与各光强 和直径、重量的14维数据X的相关系数aii-a^,如表2所示。其中,Ai为主成分所对应的 特征值,eu表示向量ei的第j个分量。
[008引表2主成分与各变量之间的相关系数
[0089]
[0090] 将表2中的各光谱强度数据和直径数据代入式化)中的a11-3414即可得到进而得 出一组新的数据集(7),用于后续模型的建立,如下所示:
[0091]
[0092] 4. 3Fisher判别分析
[0093] Fisher判别分析基本思想是将k组p维数据投影到某个方向,使数据的投影组与 组之间尽可能分开该方法利用一元方差分析的思想建立线性判别函数,其判别函数中各变 量按照类内方差尽量小类间发差尽量大的准则来确定其系数,然后依据判别函数来预测待 判样本的分类。
[0094] 通过对由PCA得到的式(7)中的4个主成分,Yi,Y2,Ys,Y进行Fisher判别分析
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1