一种基于高光谱图像和深度学习算法的烟叶分级方法与流程

文档序号:12601622阅读:509来源:国知局
一种基于高光谱图像和深度学习算法的烟叶分级方法与流程

本发明涉及一种烟叶分级方法,特别涉及一种基于高光谱图像和深度学习算法的烟叶分级方法。



背景技术:

目前,大多数人利用红外或近红外光谱来进行烟叶分级,但是还没有见过利用高光谱图像结合深度学习的方法来进行烟叶分级技术的研究。

在《计算机应用研究》刘建伟等的文献中,我们知道深度学习架构由多层非线性运算单元组成,每个较低层的输出作为更高层的输入,可以从大量输入数据中学习有效的特征表示,学习到的高阶表示中包含输入数据的许多结构信息,是一种从数据中提取表示的好方法,能够用于分类、回归和信息检索等特定问题中。基于这种思想,我们尝试用深度学习方法进行烟叶分级。

深度学习的概念由Hinton等人于2006年提出。在文献《A Fast Learning Algorithm for Deep Belief Nets》中,基于深度信念网络(DBN),提出非监督贪婪逐层训练算法,为解决深层结构相关的优化难题带来希望。本文就采用这种方法进行特征提取。

同机器学习方法一样,深度机器学习方法也有监督学习与无监督学习之分,不同的学习框架下建立的学习模型很是不同。深度信念网络(Deep Belief Nets,简称DBNs)就是一种无监督学习下的机器学习模型。

一个典型的深度信念网络就是一个高度复杂的有向无环图,它是由一系列的限制性玻尔兹曼机(RBM)堆叠组成。训练深度信念网络需要通过自下而上的逐层训练这些限制玻尔兹曼机来实现,因为限制玻尔兹曼机可以采用分层对比散度算法进行快速训练,所以通过训练限制玻尔兹曼机可以避免从整体上训练深度信念网络的高度复杂性,简化为逐个训练限制玻尔兹曼机的过程。大量研究证明,深度信念网络可以解决传统反向传播算法训练多层神经网络收敛速度慢,容易陷入局部最优等问题。



技术实现要素:

有鉴于此,本发明的目的是提供一种利用高光谱图像技术,并联合深度学习对烟叶进行智能化、无损分组、分色和分级的方法。

本发明的目的是以下述方式实现的:

一种基于高光谱图像和深度学习算法的烟叶分级方法,所述方法包括以下步骤:

步骤1、获取待测烟叶样本的高光谱图像数据;高光谱成像系统的硬件平台包括光源、分光模组、面阵CCD侦测器和装有图像采集卡的计算机;利用成像系统进行图像信息采集的时候可同时获得光谱信息,不用分开采集,缩短时间;

步骤2、对图像进行高层特征提取,对数据进行降维,本步骤中先利用卷积神经网络进行预处理,然后利用深度信念网络进行特征提取;

步骤3、对获取的图像信息和光谱信息进行分类:然后在其顶层添加一个Softmax层,将得到的特征输入softmax回归分类器实现分类。

所述步骤1中的高光谱图像数据包括图像与光谱。

所述步骤2中利用BP算法对网络进行微调。

所述步骤2具体包括如下步骤:

201、先利用卷积神经网络进行图像分割(2层的神经网络);

202、分割之后,继续利用卷积神经网络进行图像去噪(2层的神经网络);

203、去噪后的图像作为输入,赋给深度信念网的第一个RBM(限制性玻尔兹曼机)的可见层(6层);深度信念网由3个RBM(限制性玻尔兹曼机)组成,每层RBM有1个隐藏层,1个可见层,总共6层,输入层(可见层)的维度为m维,隐藏层维度分别为n1,n2,n3,深度信念网络的训练流程如下:

(a)初次提取特征:训练第一个RBM网络,即用输入层m维和第一个隐藏层n1维构成的RBM网络。输入为原始的输入数据,训练第一个RBM,并得到训练样本在隐藏层的输出值(看作初次提取的特征),以及相应的权值和偏置。

(b)去相关,进行特征筛选:利用步骤(a)中隐藏层的输出值作为第2个RBM网络训练的输入值,用第一个RBM的输出与第二层隐藏层构成输入层为n1维和隐藏层为n2维的RBM网络,但是固定步骤(a)的权值和偏置不变。同步骤(a)中的方法,计算出隐藏层的输出值、权值和偏置。依次类推,用同样的方法训练接下来的第3个RBM网络。第3个RBM的输出作为优化以后的特征。

204、优化:利用BP算法(反向传播算法)对网络参数进行微调,从而使模型收敛到局部最优点,保证最后取到的特征是最优的。

205、优化过后,将最终得到的网络的权值和偏置,赋给从卷积神经网络开始的原始输入数据到深度信念网的最后一个RBM网络构成的网络中,这样便完成了特征的提取过程,深度信念网中最后一个RBM的输出便为最优提取的特征。

所述步骤(a)中对于一个RBM网络,只有输入输出,在训练RBM时,可见单元的个数为原始的输入数据,RBM的训练过程以及权值的更新如下:

(1)随机初始化权值矩阵w和可见层的偏置向量a,隐藏层的偏置向量b;

(2)将原始的输入数据输入到可见层单元,输入矩阵x正向传播,利用公式:

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>j</mi> </msub> <mo>=</mo> <mn>1</mn> <mo>|</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>+</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>x</mi> <mi>i</mi> </msub> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>h</mi> <mo>|</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Pi;</mo> <mi>j</mi> <mi>m</mi> </munderover> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>j</mi> </msub> <mo>|</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

计算出隐藏层单元的二值状态;

(3)在所有隐层单元的状态确定以后,按反方向传播,利用公式:

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>1</mn> <mo>|</mo> <mi>h</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>+</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msub> <mi>h</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>|</mo> <mi>h</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Pi;</mo> <mi>i</mi> <mi>n</mi> </munderover> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>|</mo> <mi>h</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

其中,激活函数计算出可见层矩阵x'的激活概率,x'是可见层的一个重构;

(5)再对x'进行正向传播,根据公式(1)(2)计算出隐藏层的矩阵h'的二值状态、h'的激活概率,h'为隐藏层的一个重构;

(6)用步骤(2)中得到的隐藏层h的激活概率p(h|x)减去步骤(5)中得到h'的激活概率,其结果作为隐藏层h对应的偏置b的增量,用可见层x的激活概率减去x'的激活概率,其结果作为可见层x对应的偏置a,用步骤(2)中得到的正向传播的概率向量减去步骤(5)中得到的反向传播的概率向量,其结果作为输入层和输出层之间的权值增量。每次迭代中,权值的更新和偏置的更新都是同时进行的,所以应该是同时收敛的。结合其对应的学习率,根据公式更新权值和偏置:

Wt=Wt-1+ε(x·p(h|x)-x'·p(h'|x'))

bt=bt-1+ε(x·p(h|x)-x'·p(h'|x'))

at=at-1+ε(x·p(h|x)-x'·p(h'|x'))

其中,ε为学习率;

(7)重复计算步骤(2)到(6),直至收敛或者达到最大迭代次数。如此,便完成了一个RBM的训练。

相对于现有技术,本发明:

1、提出基于深度信念网络的特征提取方法,尝试用深度学习的方法来进行烟叶分级,相对于之前很多人所用的浅层学习的方法有了很大的改进。

2、提出基于图像特征的烟叶智能分级的算法和模型。算法模型致力于提高分组分色分级速度和正确识别率(吻合率)。

3、采用或部分采用深度学习的无监督算法,以提高系统的推广泛化能力。

采用上述技术方案的本发明,能最大限度的做到无损分级、能准确的划分烟叶等级,确保收购的各方利益不受损失。

附图说明

图1为深度信念网的原理框图。

图2为高光谱成像系统通用结构图。

图3为RBM的结构示意图。

图4是一个烟叶等级B1K光谱图像实施例示意图。

具体实施方式

本实施例中,高光谱图像联合深度学习进行烟叶分级的方法,包括以下步骤:

步骤1、实时获取待测烟叶的图像信息和光谱信息。如图2所示,高光谱成像系统的硬件平台包括光源、分光模组、面阵CCD侦测器和装有图像采集卡的计算机;利用成像系统进行图像信息采集的时候可同时获得光谱信息,不用分开采集,缩短时间。本实施例中利用光谱仪完成图像信息采集,存储于计算机,上述的图像信息指的是烟叶为整片烟叶的图像;且采集的烟叶图像既可以同时利用烟叶的透射和反射两种图像,或者也可以仅利用透射图像。需要指出的是,本实施例中可以利用图像采集卡的二次开发功能,实时控制采集的图像信息并存储于计算机,便于实时识别分组(分部位)、分色和分级和再次学习。并且,本实施例中利用高光谱仪进行光谱信息采集,其采集范围可以为200-2500nm或其中任意部分。一个烟叶等级B1K光谱图像示意图如图4所示。

步骤2、对获取的图像信息和光谱信息进行特征提取:(假设使用10层神经网络)

201、先利用卷积神经网络进行图像分割(使用2层的神经网络);

202、分割之后,继续利用卷积神经网络进行图像去噪(使用2层的神经网络);

203、去噪后的图像作为输入,赋给深度信念网的第一个RBM(限制性玻尔兹曼机)的可见层(一共为6层);

深度信念网由3个RBM(限制性玻尔兹曼机)组成,每层RBM有1个隐藏层,1个可见层,总共6层,输入层(可见层)的维度为m维,隐藏层维度分别为n1,n2,n3,深度信念网络的训练流程如下:

(a)初次提取特征:训练第一个RBM网络,(每个RBM的形式如图3所示)即用输入层m维和第一个隐藏层n1维构成的RBM网络。输入为原始的输入数据,训练第一个RBM,并得到训练样本在隐藏层的输出值(看作初次提取的特征),以及相应的权值和偏置。

一个RBM的训练过程如下:

对于一个RBM(限制性玻尔兹曼机)网络,只有输入输出,在训练RBM时,可见单元的个数也就是原始的输入数据的个数,即图像的像素。RBM的训练过程以及权值的更新如下:

(1)随机初始化权值矩阵w和可见层的偏置向量a,隐藏层的偏置向量b。

(2)将原始的输入数据输入到可见层单元,输入矩阵x正向传播,利用公式:

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>j</mi> </msub> <mo>=</mo> <mn>1</mn> <mo>|</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>+</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>x</mi> <mi>i</mi> </msub> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>h</mi> <mo>|</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Pi;</mo> <mi>j</mi> <mi>m</mi> </munderover> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>j</mi> </msub> <mo>|</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

计算出隐藏层单元的二值状态。

(3)在所有隐层单元的状态确定以后,按反方向传播,利用公式:

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>1</mn> <mo>|</mo> <mi>h</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>+</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msub> <mi>h</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>|</mo> <mi>h</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Pi;</mo> <mi>i</mi> <mi>n</mi> </munderover> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>|</mo> <mi>h</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

其中,激活函数计算出可见层矩阵x'的激活概率,x'也是可见层的一个重构。

(5)再对x'进行正向传播,根据公式(1)(2)计算出隐藏层的矩阵h'(隐藏层的一个重构)的二值状态、h'的激活概率。

(6)用步骤(2)中得到的隐藏层h的激活概率p(h|x)减去步骤(5)中得到h'的激活概率,其结果作为隐藏层h对应的偏置b的增量,用可见层x的激活概率减去x'的激活概率,其结果作为可见层x对应的偏置a,用步骤(2)中得到的正向传播的概率向量减去步骤(5)中得到的反向传播的概率向量,其结果作为输入层和输出层之间的权值增量。每次迭代中,权值的更新和偏置的更新都是同时进行的,所以应该是同时收敛的。结合其对应的学习率,根据公式更新权值和偏置:

Wt=Wt-1+ε(x·p(h|x)-x'·p(h'|x'))

bt=bt-1+ε(x·p(h|x)-x'·p(h'|x'))

at=at-1+ε(x·p(h|x)-x'·p(h'|x'))

其中,ε为学习率。

(7)重复计算步骤(2)到(6),直至收敛或者达到最大迭代次数。如此,便完成了一个RBM的训练。

(b)去相关,进行特征筛选:利用步骤(a)中隐藏层的输出值作为第2个RBM网络训练的输入值,用第一个RBM的输出与第二层隐藏层构成输入层为n1维和隐藏层为n2维的RBM网络,但是固定步骤(a)的权值和偏置不变。同步骤(a)中的方法,计算出隐藏层的输出值、权值和偏置。依次类推,用同样的方法训练接下来的第3个RBM网络。第3个RBM的输出作为优化以后的特征。

204、优化:利用BP算法(反向传播算法)对网络参数进行微调,从而使模型收敛到局部最优点,保证最后取到的特征是最优的。

205、优化过后,将最终得到的网络的权值和偏置,赋给从卷积神经网络开始的原始输入数据到深度信念网的最后一个RBM网络构成的网络中,至此,完成了烟叶图像的特征提取过程,深度信念网中最后一个RBM的输出就是烟叶图像中用于分类的最优特征。

步骤3、对获取的图像信息和光谱信息进行分类:特征提取之后,进行分类时,在其顶层添加一个Softmax层,将得到的特征输入到softmax回归分类器来进行分类。

以上所述的仅是本发明的优选实施方式,应当指出,对于本领域的技术人员来说,在不脱离本发明整体构思前提下,还可以作出若干改变和改进,这些也应该视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1