基于多光谱散射图像的苹果硬度预测方法

文档序号:6460206阅读:195来源:国知局

专利名称::基于多光谱散射图像的苹果硬度预测方法
技术领域
:本发明属于农产品无损检测领域,特别涉及一种基于多光谱散射图像的苹果硬度预测方法。技术背景硬度是苹果内部属性的一项重要指标,该指标会随着诸如气候状况、文化差异、收获时间或成熟度,以及收后处理方法和实际储藏方式等的不同具有很大的差异。标准的仪器式硬度测量方法在测试过程中会损坏水果样本,因此,不能采用该方法对水果分选和分级。新的无损检测技术的研究能够克服传统方法的缺点,有较大的应用价值。在水果硬度无损检测技术方面已有了大量的研究。多光谱散射图像技术是非破坏性水果硬度测量技术之一。研究表明在水果硬度检测方面,多光谱散射技术是有用的,并优于近红外光谱分析技术。
发明内容本发明的目的是提出一种基于多光谱散射图像的苹果硬度预测方法。其特征在于,采用不同的回归方法用于预测一组样本。即开发了一种通过增加新样本来更新现有的最小二乘法预测模型;并提出一种能够获得较好的水果硬度预测结果的样本增加方法,使新模型可以有效的预测水果硬度。最后用同一时间采集但具有不同收后储存时间的两组不同的苹果样本集来测试该模型对苹果的硬度预测效果,并与采用以往预测方法的水果硬度预测结果进行比较。具体步骤如下(1)苹果样本材料的选取试验开始前,需要选取合适苹果样本,并将其放置在室温下至少15小时,试验时将苹果样本分成两组组i和组n。(2)数据采集与处理数据采集是使用袖珍型、装有液晶可调谐滤波器(LCTF)的多光谱图像系统分别采集组I和组II的苹果样本获得其光谱散射图像,获得每个苹果样本在8个波长(650,680,700,740,820,880,910,和9卯nm)下的8幅散射图像。数据处理,使用修正的洛伦兹分布函数(MLD)来计算每一个散射图像的轮廓参数<formula>formulaseeoriginaldocumentpage6</formula>上式中,R是以CCD灰度数表示的光密度;Z是散射距离;^为光密度不对称值,"2为散射轮廓峰值;"3为半最大峰值对应的满散射宽度(FWHM);a4为FWHM周围的散射斜坡。采集完光谱散射图像后,使用标准的MT硬度测试仪测量每个水果的硬度值,在与采集图像相同的环绕每个水果赤道的区域,以2mm/s的落下速度将直径为llmm的探针刺入去皮水果9.0mm测量其硬度值。(3)回归预测模型的步骤水果硬度回归预测模型共包含以下5步1)按组I和组II分为两个独立的样本集,样本按硬度值大小降序排列。每四个苹果中的前三个用于校准,第四个用于验证。该过程最终使从组I和组II分别提取出两个验证集和两个校准集。2)在不同的波长下对每一个样本采用非线性回归分析拟合图像散射轮廓,从而确定方程一中它们的MLD参数。从每个样本可获得一套共32个MLD参数(4参数*8波长)。进一步,将水果样本的MLD参数除以与Teflon参考标准对应的参数,以校正从苹果样本获取散射图像的试验过程中光源波动带来的影响。3)采用多元线性回归(MLR)计算组I校准集和组II校准集中样本MT硬度和MLD硬度两者间的r值和校准标准差(SEC),采用MLR方法分别建立起组I和组II的8波长预测模型,接着分别用它们各自的验证集对其进行验证。验证结果用作与后续所述新的模型更新方法所获模型的验证结果进行比较。组I的水果硬度预测模型可用方程2来表示i7=c0十Ct。,+c2a2H-----hc"a"二Z。a^.(2)其中,F为以N表示的MT预测硬度;》(/=1,2,...,";"=32)为MLD参数;下标/表示每一个参数;C/为每个波长下与4个MLD参数中的每个参数相联系的回归系数;co为以N为单位的截距。4)用从组II校准集选取的样本校正由组I校准集所建预测模型,接着用组II验证集验证该更新模型,更新算法由下列过程导出。加入新样本后预测模型(方程l)的回归系数c将变为。+A。.,可表示为F+AF=(c0十Ac。)+(c,+Ac、)a+(c2+Ac2)a2十…+(c"0"=S。(3)户o户o其中AF为预测硬度的校正值,假定新样本的MLD参数和MT硬度为"11"12^21"2222w,、(4)其中,为新加入样本的MT硬度;(/=l,2,...,m)代表每个样本;m为新加入样本的数量。更新的模型必须确保新加入样本的预测值(F,+AF,)和参考值乂之间的最小差异,即利用方程(5)的最小二乘求取更新预测模型的Acy值。J(《+a^-/;)(5)根据最小二乘方法,通过求取对Ag'的一阶微分可导出下面的方程:<formula>formulaseeoriginaldocumentpage8</formula>1=1d加入新样本后回归系数c^的校正值A(^可由方程6导出。将Aq插入方程3可导出更新预测模型。5)从组II校准集选择样本有以下四种方法a)随机选择,b)仅从'软'水果组选取;C)仅从'硬'水果组选取;d)同时从'软'水果组和'硬'水果组选取.组II中所有的样本均根据MT硬度值按降序排列。'软'水果样本从l开始按向前顺序选取;'硬'水果样本从最后一个样本按向后顺序选取;将按以上四种选择方法选取的样本分别加入到由组I校准集所得预测模型,以更新该预测模型。最后,用组II验证集验证所更新模型。本发明的有益效果是采用不同的回归方法更新现有模型以用于预测新一组样本。即开发了一种通过增加新样本来更新现有预测模型的回归最小二乘方法;并提出一种能够获得较好的水果硬度预测结果的样本增加方法,使更新后的模型可以有效的预测水果的硬度。最后用同一时间采集但具有不同收后储存时间的两组不同的苹果样本集来测试该模型对苹果的硬度预测效果,并与采用以往预测方法的水果硬度预测结果进行比较,本文的模型更新方法连同多光谱散射技术可以用来对来自不同收获季节和不同地方的苹果的硬度进行实时预测。图l为苹果原始径向散射图像轮廓图,图l(a)为一个有代表性的苹果原始散射图像。图l(b)为从图l(a)所示散射图像提取的一个一维散射轮廓图。图2组I的MT硬度和估计硬度的关系(a)组I的校准集;(b)组I的验证集。图3II的MT硬度和估计硬度的关系(a)组II的校准集(b)组II的验证集。图4由组I所建预测模型用于组II的验证集。图5使用四种不同的样本加入方法将新样本加入组I水果校正集所建模型预测组II苹果硬度的相关系数。具体实施方式本发明提出一种基于多光谱散射图像的苹果硬度预测模型更新方法。采用不同的回归方法更新现有模型以用于预测新一组样本。即开发了一秒通过增加新样本来更新现有预测模型的回归最小二乘方法;并提出一种能够获得较好的水果硬度预测结果的样本增加方法,使更新后的模型可以有效的预测水果硬度。首先使用袖珍型、装有液晶可调谐滤波器(LCTF)的多光谱图像系统分别采集组I和组II的苹果样本获得其光谱散射图像,获得每个苹果样本在8个波长(650,680,700:740,820,880,910,和990nm)下的针对每个波长的8幅散射图像(如图l所示),图l(a)为一个有代表性的苹果原始散射图像。图l(b)为从图l(a)所示散射图像提取的一个一维散射轮廓图。另外,对应于每100个苹果,都有一个白色聚四氟乙烯圆盘,其散射图像被用作校正光源波动影响的参考图像。对上述采集的光谱散射图像数据进行处理,使用修正的洛伦兹分布函数(MLD)来计算每一个散射图像的轮廓参数其中,R是以CCD灰度数表示的光密度;z是散射距离;^为光密度不对称值,化为散射轮廓峰值;"3为半最大峰值对应的满散射宽度(FWHM);^为FWHM周围的散射斜坡.采集完光谱散射图像后,使用标准的MT硬度测试仪测量每个水果的硬度值,在与采集图像相同的环绕每个水果赤道的区域,以2mm/s的落下速度将直径为llmm的探针刺入去皮水果9.0mm测量其硬度值。水果硬度回归预测模型共包含以下5步1)按组I和组II每组450个苹果样本,各自均被分为两个独立的样本集,样本按硬度值大小降序排列。每四个苹果中的前三个用于校准,第四个用于验证。该过程最终使从组I和组II分别提取出两个验证集和两个校准集。2)在不同的波长下对每一个样本采用非线性回归分析拟合图像散射轮廓,从而确定方程一中它们的MLD参数。从每个样本可获得一套共32个MLD参数(4参数*8波长)。进一步,将水果样本的MLD参数除以与Teflon参考标准对应的参数,以校正从苹果样本获取散射图像的试验过程中光源波动带来的影响。3)采用多元线性回归(MLR)计算组I校准集和组II校准集中样本MT硬度和MLD硬度两者间的r值和校准标准差(SEC),采用MLR方法分别建立起组I和组II的8波长预测模型,接着分别用它们各自的验证集对其进行验证。验证结果用作与后续所述新的模型更新方法所获模型的验证结果进行比较。组I的水果硬度预测模型可用方程2来表示<formula>formulaseeoriginaldocumentpage10</formula>其中,F为以N表示的MT预测硬度;aj(/=l,2,...,";"=32)为MLD参数;下标7'表示每一个参数;&为每个波长下与4个MLD参数中的每个参数相联系的回归系数;co为以N为单位的截距。4)用从组II校准集选取的样本校正由组I校准集所建预测模型,接着用组II验证集验证该更新模型,更新算法由下列过程导出。加入新样本后预测模型(方程l)的回归系数c将变为^+A。,可表示为<formula>formulaseeoriginaldocumentpage10</formula>其中AF为预测硬度的校正值,假定新样本的MLD参数和MT硬度为<formula>formulaseeoriginaldocumentpage11</formula>其中乂为新加入样本的MT硬度;(/=l,2,...,m)代表每个样本;m为新加入样本的数量。更新的模型必须确保新加入样本的预测值(^+AF,)和参考值,之间的最小差异,即利用方程(5)的最小二乘求取更新预测模型的A。值。<formula>formulaseeoriginaldocumentpage11</formula>根据最小二乘方法,通过求取对Aq/的一阶微分可导出下面的方程<formula>formulaseeoriginaldocumentpage11</formula>加入新样本后回归系数Cy的校正值Acv可由方程6导出。将Acy插入方程(3)可导出更新预测模型。5)从组II校准集选择样本有以下四种方法a)随机选择,b)仅从'软,水果组选取;c)仅从'硬'水果组选取;d)同时从'软'水果组和'硬'水果组选取.组II中所有的样本均根据MT硬度值按降序排列。'软'水果样本从l开始按向前顺序选取;'硬,水果样本从最后一个样本按向后顺序选取;将按以上四种选择方法选取的样本分别加入到由组I校准集所得预测模型,以更新该预测模型。最后,用组II验证集验证所更新模型。上述步骤以列举应用实例予以说明。1组内预测图2(a)表明,组I的校准样本的MT硬度值和估计硬度值之间的!^0.89,SEC=5.74N。对于验证样本集,模型预测苹果硬度值具有r=0.89,SEP=6.04N(图2(b))。这些结果表明基于散射图像MLD参数的MLR预测模型可以很方便的被用于预测当年的苹果样本。类似的,组II校准集用于建立校准模型,组II验证集用作验证模型。MT硬度值和在8个波长下的并利用校正集样本回归得出MLD参数。图3(a)和(b)分别为校准和验证的结果。结果表明该模型对于校准样本i^0.87和SEC:5.91N,对于验证样本r-0.87,SEP=6.07N,是-一个好的预测模型。图2(a)和图3(a)看起来好像相似,但是,由组I组建的预测模型不能够直接用于预测组II中的样本(图4),这是因为两个样本集具有不同的水果条件,因此这两组的特性差异将会有很大不同。这样,基于某一组中校正样本所建立的苹果硬度预测模型对本组的验证样本可取得良好的预测结果,但针对另一组的预测性能不佳。因此为确保所建模型对新组的预测性能,必须通过加入新族中的样本对该模型予以更新。2跨年度预测表l所示为采用不同方式从组n校准集取样本并将其加入到组I校准集用于预测水果硬度的比较结果。表l第一列表示加入的新样本数。表1中从第二列到第17列每四列分别表示选取增加样本的每种方式的预测结果,即随机选取、仅从'软'水果组选取;仅从'硬'水果组选取;同时从'软'水果组和'硬'水果组选取。表l给出了针对每一种样本选择方法的校正和验证结果。比较表l中第2,4,6,8,10th,12,14和th列的相关系数(r)值,或者比较第3,5,7,9,11,13,15和17列的标准差数值,可以看到,交替的从'软'水果组和'硬'水果组选取样本的方式具有最好的模型效果。表i从组n校准集中选择样本加入组i校准集的四种样本选择方法对预测组n水果硬度的比较<table>tableseeoriginaldocumentpage13</column></row><table>图5所示为随所加样本数目的变化苹果硬度的预测r值相应于四种不同样本选择方式下的变化曲线。随着样本数目的增多r值表现出增长趋势,但在随机选择样本用于更新校正模型这种方式下,曲线的增长趋势并不稳定;仅从'软'水果组或仅从'硬'水果组选取样本的方式具有较好和更为稳定模型预测结果,随着所加样本数目的增多r值稳定、持续增大。而交替的从'软'水果组和'硬'水果组选取样本的方式下可获得最好的模型预测结果。随着所加样本数目的增多r值稳定增长,当所加样本数为148时r值到达稳定值0.86,预测标准差SEP=6.11N(表1和图5)。对组II预测结果与针对当年样本的预测结果r=0.87,SEP=6.07N相近,后者所用预测模型建立在由组II组的338个校正样本基础上。使用四种不同的样本加入方法将新样本加入组I水果校正集所建模型预测组II苹果硬度的相关系数(r)研究结果表明,若要取得相近的预测结果,该模型更新方法相比依托新组大量样本重新建立模型的方法,所需新样本数少得多。进一步,本研究对更新预测模型的四种样本悬着方式进行了比较,研究结果表明,这四种方式在苹果硬度预测结果方面具有很大的差异,在这四种方式中,交替的从'软'水果组和'硬'水果组选取样本的方式具有最好的模型更新效果。采用本文的模型更新方法,使得为组I所建预测模型可以用来预测组II组苹果样本的硬度,2005年的测试结果是相关系数r-0.86,预测标准差为6.11N,这一结果已与依靠组II组内大量校正样本所建模型的预测结果相近。因此,本文的模型更新方法连同多光谱散射技术可以用来对来自不同收获季节和不同地方的苹果的硬度进行实时预测。权利要求1.一种基于多光谱散射图像的苹果硬度预测模型新方法,其特征在于,采用不同的回归方法更新现有模型以用于预测新一组样本,即开发了一种通过增加新样本来更新现有预测模型的回归最小二乘方法;并提出一种能够获得较好的水果硬度预测结果的样本增加方法,使更新后的模型可以有效的预测水果的硬度,最后用同一时间采集但具有不同收后储存时间的两组不同的苹果样本集来测试该模型对苹果的硬度预测效果,并与采用以往预测方法的水果硬度预测结果进行比较。2.根据权利要求l所述基于多光谱散射图像的苹果硬度预测模型更新方法,其特征在于,所述苹果硬度预测模型更新方法具体步骤如下(1)苹果样本材料的选取试验开始前,需要选取合适苹果样本,并将其放置在室温下至少15小时,试验时选取了两组苹果样本;(2)数据采集与处理数据采集是使用袖珍型、装有液晶可调谐滤波器(LCTF)的多光谱图像系统分别采集组I和组II的苹果样本获得其光谱散射图像,获得每个苹果样本在8个波长下的8幅散射图像;数据处理,使用修正的洛伦兹分布函数(MLD)来计算每一个散射图像的轮廓参<formula>formulaseeoriginaldocumentpage2</formula>上式中,R是以CCD灰度数表示的光密度;Z是散射距离;A为光密度不对称值,^为散射轮廓峰值;"3为半最大峰值对应的满散射宽度(FWHM);^为FWHM周围的散射斜坡;采集完光谱散射图像后,使用标准的MT硬度测试仪测量每个水果的硬度值,在与采集图像相同的环绕每个水果赤道的区域,以2mm/s的落下速度将直径为llmm的探针刺入去皮水果9.0mm测量其硬度值;(3)回归预测模型的步骤,水果硬度回归预测模型共包含以下5步1)按组I和组II每组450个苹果样本,各自均被分为两个独立的样本集,样本按硬度值大小降序排列,每四个苹果中的前三个用于校准,第四个用于验证,该过程最终使从组i和组n分别提取出两个验证集和两个校准集;2)在不同的波长下对每一个样本采用非线性回归分析拟合图像散射轮廓,从而确定方程一中它们的MLD参数,从每个样本可获得一套共32个MLD参数^4参数*8波长;进一步将水果样本的MLD参数除以与Teflon参考标准对应的参数,以校正从苹果样本获取散射图像的试验过程中光源波动带来的影响;3)采用多元线性回归(MLR)计算组I校准集和组II校准集中样本MT硬度和MLD硬度两者间的r值和校准标准差(SEC),采用MLR方法分别建立起组I和组II的8波长预测模型,接着分别用它们各自的验证集对其进行验证,验证结果用作与后续所述新的模型更新方法所获模型的验证结果进行比较,组I的水果硬度预测模型可用方程(2)来表示<formula>formulaseeoriginaldocumentpage3</formula>(2)其中,F为以N表示的MT预测硬度;a,(/=l,2,…,";"=32)为MLD参数;下标y表示每一个参数;C/为每个波长下与4个MLD参数中的每个参数相联系的回归系数;CO为以N为单位的截距;4)用从组II校准集选取的样本校正由组I校准集所建预测模型,接着用组II验证集验证该更新模型,更新算法由下列过程导出,加入新样本后预测模型(方程1)的回归系数C将变为。+AC/,可表示为<formula>formulaseeoriginaldocumentpage3</formula>其中AF为预测硬度的校正值,假定新样本的MLD参数和MT硬度为2"、(4)其中乂为新加入样本的MT硬度;(/=l,2,...,m)代表每个样本;AW为新加入样本的数量。更新的模型必须确保新加入样本的预测值(^+A^)和参考值,之间的最小差异,即利用方程(5)的最小二乘求取更新预测模型的As值,+(5)'=1根据最小二乘方法,通过求取对Ag'的一阶微分可导出下面的方程a2la,2w/2V(6)加入新样本后回归系数(V的校正值Ac^可由方程6导出。将Ac,插入方程3可导出更新预测模型;5)从组II校准集选择样本有以下四种方法a)随机选择,b)仅从'软,水果组选取;c)仅从'硬'水果组选取;d)同时从'软'水果组和'硬,水果组选取.组II中所有的样本均根据MT硬度值按降序排列。'软'水果样本从l开始按向前顺序选取;'硬,水果样本从最后一个样本按向后顺序选取;将按以上四种选择方法选取的样本分别加入到由组I校准集所得预测模型,以更新该预测模型,最后,用组II验证集验证所更新模型。3.根据权利要求l所述基于多光谱散射图像的苹果硬度预测模型更新方法,其特征在于,所述8个波长为650,680,700,740,820,880,910,和990nm。全文摘要本发明属于农产品无损检测的一种基于多光谱散射图像的苹果硬度预测模型更新方法。采用不同的回归方法更新现有模型以用于预测新一组样本。即开发了一种通过增加新样本来更新现有预测模型的回归最小二乘方法;并提出一种能够获得较好的水果硬度预测结果的样本增加方法,使更新后的模型可以有效的预测水果的硬度。最后用同一时间采集但具有不同收后储存时间的两组不同的苹果样本集来测试该模型对苹果的硬度预测效果,所需新样本数少得多。进一步,本研究对更新预测模型的四种样本悬着方式进行了比较,研究结果表明本文的模型更新方法连同多光谱散射技术可以用来对来自不同收获季节和不同地方的苹果的硬度进行实时预测。文档编号G06F19/00GK101226146SQ20081005685公开日2008年7月23日申请日期2008年1月25日优先权日2008年1月25日发明者彭彦昆申请人:中国农业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1