一种用于茶叶外形品质检测的高光谱特征波段优化方法与流程

文档序号:18235921发布日期:2019-07-24 08:42阅读:263来源:国知局
一种用于茶叶外形品质检测的高光谱特征波段优化方法与流程

本发明属于农业农产品无损检测与控制领域,具体涉及一种用于茶叶外形品质检测的 高光谱特征波段优化方法。



背景技术:

茶叶是一种有益于人体健康的天然保健饮料,目前已成为世界上消费量最大的饮料之 一。茶叶内含有人体所必需的蛋白质、氨基酸、维生素等多种营养成分,还含有茶多酚、 咖啡碱等多种成分。茶叶品质的好坏,直接跟茶叶内这些成分含量及比例有关。而其内部 成分的信息可通过高光谱数据中的光谱信息来体现;而其图像信息又能充分反映茶叶的色 泽和外形等品质特征。因此,可利用高光谱成像技术对茶叶的内部和外部品质进行客观分 析。

随着现代光学精密仪器的发展,高光谱图像数据越来越庞大,一个样本数据甚至高达 10GB。如此庞大的数据给高光谱图像的分类、识别带来了很大困难。因此,减少数据量、 节省资源的降维处理非常有必要,波段选择和特征提取是高光谱图像的两种主要降维方法, 各有利弊。本发明提出一种集成波段选择和特征提取于一体的高光谱图像特征优化新方法, 可有效提高茶叶高光谱图像特征提取的效率和准确度。



技术实现要素:

本发明的目的是提供一种用于茶叶外形品质检测的高光谱特征波段优化方法,可用作 茶叶高光谱特征图像筛选,以解决常规高光谱图像分析数据量大、共线性信息多、计算成 本高等问题。

本发明所采用的技术方案是:一种用于茶叶外形品质检测的高光谱特征波段优化方法 包括以下步骤:

步骤1、从茶叶高光谱图像中截取500×500像素图像作为感兴趣区域,从感兴趣区域 50×50像素内提取可见/近红外平均光谱,并利用离散小波变换对提取的可见/近红外光谱 进行预处理,以消除噪声信息;

步骤2、设计特征波段组合分析(feature wavenumber combination analysis,FWCA)算 法筛选可见/近红外光谱的特征波段,再提取优选特征波段下的高光谱图像,实现高光谱图 像数据的初步压缩;

步骤3、对初步压缩后的高光谱图像数据进行主成分分析(principal component analysis, PCA),并根据PCA统计结果确定最终高光谱特征波段。

进一步,步骤1中所述离散小波变换,其小波基函数采用db系列(db2-db6),原始信 号分解层次取3层或4层,选用“heursure”软阈值模式对分解后的高频系数进行滤噪,最 后利用滤噪后的高频系数结合分解的低频系数进行信号重构,获得离散小波滤噪后的可见/ 近红外光谱。

进一步,步骤2中所述FWCA算法是以自然对数衰减函数(natural logarithmic decay function,NLDF)来压缩变量空间,决定每一次迭代后要保留变量个数;在NLDF迭代过程 中采用的采样准则为二进制矩阵抽样(binary matrix sampling,BMS),BMS可以保证所有 变量有相同的机会被采样;此外,偏最小二乘判别分析(partial least squares discriminant analysis,PLS-DA)作为FWCA算法优化变量子集的分类器,采用交叉验证(cross-validation, CV)法,以最高分类识别率作为目标函数确定最佳变量子集。

进一步,FWCA算法的具体实现过程如下:

①给定光谱数据集X(m×n,m为样本数、n为变量数);BMS运行次数p,取100; NLDF运行次数N,取100。

②当i≤N,生成一个二进制矩阵Y(p×n),每列中值为“1”和“0”的个数相等,且 随机分布;对于Y,每一行代表一次采样运行,每一列代表光谱矩阵X的一个变量,当Y 中的值为“1”时,表明采用运行时对应X中相应变量被选中;相反,若Y中的值为“0”, 表明所对应X中的变量在采样运行时未选中。

③当j≤p,计算第j次BMS采样运行时,建立在获得的变量子集上的所有PLS-DA分 类器的正确识别率。

④将步骤③中获得的PLS-DA分类器按识别率高低进行排序,依据最高识别率获得最 佳子模型建立所用变量子集,并计算获得变量子集中波长变量出现的频次。

⑤按NLDF(ri=lnαi)计算保留变量比率,基于步骤④中计算的波长变量频次,按频 次高低保留变量个数n=n×ri,得到新的n。返回步骤②。

⑥算法N次运行后,只有少数几个波长变量被保留,计算所有可能变量组合情况下, 采用CV法来优化PLS-DA分类器的识别率,并将识别率最高的模型所用的波长变量保留 下来,作为FWCA优选的最优变量子集。

进一步,步骤3中所述PCA统计结果是指将第一主成分的载荷系数最大正值或最大负 值对应的波段定义为特征波段。具体实现过程如下:首先提取由FWCA算法优选特征波段 下的所有图像信息,并对其进行PCA;根据PCA原理可知,第一主成分PC1通常包含了 原始数据的绝大多数有用信息,其表达式为PC1=a1x1+a2x2+…+anxn(ai为载荷系数,xi为 波段图像信息,该表达式中下标i的取值范围为1≤i≤n),若ai绝对值越大,则其对PC1 的影响也就越大。若ai值为正的最大,说明该波段图像对PC1的正相关性贡献最大;若ai值为负的最大,说明该波段图像对PC1的负相关性贡献最大。因此,我们将ai最大正值和 最大负值所对应的波段定义为特征波段。最后,通过对比分析多个不同样本,以最终确定 高光谱特征波段。

本发明有益效果为:

本发明提出的高光谱特征波段优化方法主要分为两个阶段,第一阶段是获取可见/近红 外光谱数据,通过设计的FWCA算法筛选光谱特征波段,初步压缩高光谱图像数据;相比 其他专利方法优化高光谱特征波段而言,可大大提升数据压缩效率,同一计算机硬件系统 下,大大减少CPU处理时间。第二阶段是对初步压缩压缩后的高光谱图像数据进行PCA, 进一步精细优化高光谱特征波段;相比于其他专利方法优化高光谱特征波段而言,对目标 属性贡献大的特征波段被选择的概率是随机的,而本发明提出的方法从粗选(可增加特征 波段被选择的机会)到细选(可增加相关性较大的特征波段被选择的概率),可保证特征波 段选择的稳定性。

附图说明

图1黄山毛峰高光谱数据中提取的原始光谱

图2经离散小波预处理后的光谱

图3FWCA算法50次运行后被选择的变量数和识别率

图4FWCA算法50迭代运行后被选用变量的累积频次图

图5四个特征波段下的灰度图像

具体实施方式

本发明的一种用于茶叶外形品质检测的高光谱特征波段优化方法,包括以下步骤:

步骤1、从茶叶高光谱图像中截取一定像素图像作为感兴趣区域,从感兴趣区域一定像 素内提取可见/近红外平均光谱,并利用离散小波变换对提取的可见/近红外光谱进行预处 理,以消除噪声信息;

步骤2、设计特征波段组合分析FWCA算法筛选可见/近红外光谱的特征波段,再提取优 选特征波段下的高光谱图像,实现高光谱图像数据的初步压缩;

步骤3、对初步压缩后的高光谱图像数据进行主成分分析PCA,并根据PCA统计结果确 定最终高光谱特征波段。

步骤1中,从茶叶高光谱图像中截取500×500像素图像作为感兴趣区域,从感兴趣区 域50×50像素内提取可见/近红外平均光谱。

步骤1中所述离散小波变换,其小波基函数采用db系列,即db2-db6系列,原始信号 分解层次取3层或4层,选用heursure软阈值模式对分解后的高频系数进行滤噪,最后利 用滤噪后的高频系数结合分解的低频系数进行信号重构,获得离散小波滤噪后的可见/近红 外光谱。

步骤2中所述FWCA算法是以自然对数衰减函数NLDF来压缩变量空间,决定每一次迭 代后要保留变量个数;在NLDF迭代过程中采用的采样准则为二进制矩阵抽样BMS,此外, 采用偏最小二乘判别分析PLS-DA作为FWCA算法优化变量子集的分类器,采用交叉验证CV 法,以最高分类识别率作为目标函数确定最佳变量子集。

FWCA算法的具体实现过程如下:

①给定光谱数据集X(m×n),m为样本数、n为变量数;BMS运行次数p,取100;NLDF 运行次数N,取100;

②当i≤N,生成一个二进制矩阵Y(p×n),每列中值为“1”和“0”的个数相等, 且随机分布;对于Y,每一行代表一次采样运行,每一列代表光谱矩阵X的一个变量,当Y 中的值为“1”时,表明采用运行时对应X中相应变量被选中;相反,若Y中的值为“0”, 表明所对应X中的变量在采样运行时未选中;

③当j≤p,计算第j次BMS采样运行时,建立在获得的变量子集上的所有PLS-DA分 类器的正确识别率;

④将步骤③中获得的PLS-DA分类器按识别率高低进行排序,依据最高识别率获得最 佳子模型建立所用变量子集,并计算获得变量子集中波长变量出现的频次;

⑤按NLDF(ri=lnαi)计算保留变量比率,基于步骤④中计算的波长变量频次,按频 次高低保留变量个数n=n×ri,得到新的n,返回步骤②;

⑥算法N次运行后,只有少数几个波长变量被保留,计算所有可能变量组合情况下, 采用CV法来优化PLS-DA分类器的识别率,并将识别率最高的模型所用的波长变量保留下 来,作为FWCA优选的最优变量子集。

步骤3中所述PCA统计结果是指将第一主成分的载荷系数最大正值或最大负值对应的 波段定义为特征波段。PCA统计结果具体实现过程如下:首先提取由FWCA算法优选特征波 段下的所有图像信息,并对其进行PCA;根据PCA原理可知,第一主成分PC1通常包含了 原始数据的绝大多数有用信息,其表达式为PC1=a1x1+a2x2+…+anxn,ai为载荷系数,xi为波 段图像信息,该表达式中下标i的取值范围为1≤i≤n,若ai绝对值越大,则其对PC1的 影响也就越大;若ai值为正的最大,说明该波段图像对PC1的正相关性贡献最大;若ai值 为负的最大,说明该波段图像对PC1的负相关性贡献最大,因此,我们将ai最大正值和最 大负值所对应的波段定义为特征波段;最后,通过对比分析多个不同样本,以最终确定高 光谱特征波段。

以黄山毛峰茶叶的高光谱图像特征优化为例。

(1)从茶叶高光谱图像中截取500×500像素图像作为感兴趣区域,从感兴趣区域50 ×50像素内提取可见/近红外平均光谱,如图1所示,每条光谱包含618个波长变量。从图 1中可以看出,光谱的首尾两端包含一定噪声,采用离散小波变换对可见/近红外光谱进行 预处理,通过尝试优化,选定db6小波基函数,通过“heursure”软阈值模式对分解后的高 频系数进行滤噪,再利用滤噪后的高频系数结合分解的低频系数进行信号重构,获得离散 小波滤噪后的可见/近红外光谱,如图2所示。从图2中可以看出,首尾两端的大部分噪声 都被消除。

(2)利用本发明提出的FWCA算法对离散小波预处理的光谱进行特征波段筛选,初步 压缩高光谱图像数据。由于该方法在数据初始化的时候具有一定的随机性。因此,在进行 具体实施时进行了50单独运行,以消除随机性对最终结果的影响。图3所示为FWCA算 法经50次迭代运行后,每一次选择的变量数和建立在这些变量上的PLS-DA模型的识别率。 图4所示为FWCA算法经50次迭代运行后,被选择波长变量的累积频次图。为了不失一 般性,将FWCA算法经50次迭代运行后所有选中的波长变量全部提取,它们分别是: 463.39-467.55nm,502.69-505.21nm,612.15-613.87nm,637.04nm,637.90nm,653.39nm, 656.84-667.19nm,668.91-682.74nm,720.00-726.95nm,857.08nm,924.67-933.46nm,共 67个波长变量。

(3)提取经FWCA算法筛选的67个波段下的二位图像,并对其进行PCA。选取第一 主成分PC1中载荷系数绝对值最大的波段作为最终入选的特征波段。通过对比分析黄山毛 峰多个独立样本的PCA分析后的PC1发现,特征波段基本集中在465.05nm、504.37nm、 674.96nm和722.61nm。图5所示为一个黄山毛峰样本在四个特征波段下的灰度图像。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示 例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结 构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语 的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或 者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离 本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发 明的范围由权利要求及其等同物限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1