一种基于深度学习的高光谱图像分类方法与流程

文档序号:12670804阅读:3068来源:国知局
一种基于深度学习的高光谱图像分类方法与流程

本发明涉及一种基于深度学习的高光谱图像分类方法,属于遥感与测绘、计算机视觉与模式识别技术,适用于任何成像光谱仪获取的高光谱数据。



背景技术:

高光谱图像的精细分类是高光谱遥感技术应用的核心内容之一,是计算机视觉与模式识别、遥感与测绘领域十分关注的问题。已有的分类方法存在降维过程中造成高光谱图像中非线性信息的损失和在利用图像的空间特征时需要人为的设计空间特征的不足,导致分类精度较差,导致高光谱图像分类的不确定性,进而影响其在实际中的应用。



技术实现要素:

本发明要解决的技术问题为:克服现有的高光谱图像分类方法的两方面的不足:(1)现有的线性降维方法在降维过程中会造成高光谱图像中非线性信息的损失;(2)在利用图像的空间特征时需要人为的设计空间特征。

本发明解决上述技术问题采用的技术方案为:一种基于深度学习的高光谱图像分类方法,包括以下步骤:

步骤(1)输入高光谱遥感图像数据,每个像素即样本用光谱特征向量表示,样本的特征维数为d,将样本集合归一化到0~1之间,所有归一化的样本构成样本集,其中xi为第i个样本,N为样本总个数;

步骤(2)对自编码网络的基本组成单位——自动编码机进行自下而上的逐层训练;

步骤2a)首先初始化自动编码的的网络参数θ={W1,W2,b1,b2},W1和b1是输入层到隐层的权重和偏置,W2和b2是隐层到重构层的权重和偏置,初始化b1和b2分别为全零的m维和n维的向量,W1=rand(m,n)×2e-e,W2=rand(n,m)×2e-e,其中,rand(m,n)和rand(n,m)分别是从0到1间随机取值的m×n和n×m矩阵;

步骤2b)调整自动编码机的网络参数θ,使得输入层和重构层的差距达到最小;

步骤2c)最底层的自动编码机训练完毕后,将下一层自动编码机的隐藏层输出作为上一层的输入层的输入,逐层训练自动编码机,最终得到整个自编码网络的初始化参数;

步骤(3)展开的深度自编码网络采用BP算法对预训练得到的初始权值进一步调整,进一步减少误差,BP算法的目标函数采用交叉熵函数:

其中,xi是自编码网络输入向量的第i个分量,yi代表经过自编码网络重构后的数据的第i个分量。m代表自编码网络输入数据的维度及重构后数据的维度,二者维度相等;

步骤(4)使用训练完毕的自编码网络对高光谱数据进行降维处理,获得降维后的图像;

步骤(5)输入降维后的高光谱图像以及对应的分类参考图,取待分类像元邻域内的数据立方体为卷积神经网络的输入,分类参考图中像元对应的地物种类为卷积神经网络的期望输出,使用随机梯度下降算法训练卷积神经网络,训练完毕后将卷积神经网络作用与整幅图像,获得最终的分类结果。

其中,所述步骤(5)中的卷积神经网络的结构图如下:

卷积神经网络一般由卷积层,池化层,全连接层和softmax分类层组成,卷积神经网络的输入大小为7×7×N,其中N是降维后高光谱图像的维数,7×7是像元邻域的大小,卷积神经网络的输入的空间维数不高,因此无需进行空间域的池化降维操作;

卷积神经网络包含三个卷积层,一个全连接层和一个softmax分类层,每一个卷积层的包含N个大小为3×3的卷积核,全连接层的输入为N,输出为30,softmax分类层的输入大小为30,输出大小为高光谱图像的地物种类数。

本发明与现有技术相比的优点在于:

(1)在降维方面,传统的降维方式如PCA,ICA,NWFE等方法均属于线性降维方法,在降维过程中损失掉了高光谱图像数据在光谱维上的非线性的细节信息,限制了分类精度。本发明采用深度自编码网络对高光谱数据进行降维,深度自编码网络在降维方面有两个优势:一方面,高光谱图像数据中无标签的数据样本相对来说容易获得,而有标签的数据样本不易获得,而深度自编码网络的训练采用非监督的训练方式,使用无标签的数据即可;另一方面,深度自编码网络属于非线性降维方式,能够有效的保留数据样本中的高维度上的非线性信息,从而有效提升了分类精度。

(2)在结合空间特征方面,传统的结合空间特征的高光谱图像分类方法需要人工设计并提取空间特征,如纹理特征,形态学特征,形状特征等,人工设计并提取空间特征依赖于人的知识或经验,分类的结果相当程度上取决于特征设计的好坏,而且并不能保证提取到的特征对所有的分类结果都有利,可能在某一数据集上表现良好的特征,在另外一个数据集上表现不佳。本方法受到卷积神经网络在图像识别等应用的启发,设计了一种用于光谱空间联合分类的卷积神经网络,能够自动从高光谱图像中提取对分类有利的空间特征,免去了人工设计并提取空间特征的过程。

附图说明

图1为本发明的方法实现流程图;

图2为本发明的卷积神经网络的结构图及分类过程示意图;

图3为本发明仿真实验图,其中,图3(a)为本发明仿真实验中Indian Pines高光谱图像数据;图3(b)为本发明仿真实验中Indian Pines高光谱图像数据的标记模板;图3(c)~图3(g)为本发明仿真实验中各种算法的分类结果对比((a)假彩色图像,(b)为分类参考图,(c)PCA-SVM:80.47%,(d)Autoencoder-SVM:85.48%,(e)PCA-MOR-SVM:91.13%,(f)PCA-CNN:%95.27,(g)Autoencoder-CNN:98.64%);

图4为本发明仿真实验中Indian Pines数据分类结果中使用各种方面进行分类后,每一种地物的精度。

具体实施方式

下面结合附图以及具体实施方式进一步说明本发明。

如图1所示,本发明包括以下两个步骤:基于自动编码网络的降维以及基于卷积神经网络的空谱联合分类。其中,自动编码网络的训练使用无标签的数据进行无监督分类,而卷积神经网络的训练使用有标签的数据进行监督分类。

现有待分类高光谱图像数据Indian Pines,Indian Pines为AVIRIS采集的农业区高光谱图像,图像大小为145×145像素,共包含220个波段,去掉其中的20个水吸收严重的波段,得到包含200个波段的高光谱数据。Indian Pines以及Pavia University数据的假彩色图以及标记模板分别如图3,4所示,本发明的具体实施步骤如下:

(1)输入高光谱图像数据,每个像素即样本用高光谱特征向量表示,样本的维数为m,将样本归一化到0~1之间,所有归一化的样本构成样本集合,其中xi为第i个样本,N为样本总数。

(2)自动编码机的训练使用无标签的数据样本。自动编码网络的训练共包含参数预训练和微调两个步骤,自编码网络的结构为200-120-80-60-40,自编码网络共有5层,降维后的光谱维维度是40。

2a)预训练过程。随机初始化自编码网络的参数后,逐层训练组成自编码网络的多个自动编码机,下层自动编码机的隐藏层单元的输出作为其上层的输入参与训练。

2b)微调过程。预训练完成后,展开的自动编码网络采用BP算法对预训练得到的初始权值进一步调整,进一步减少误差。BP算法的目标函数采用交叉熵函数。

(3)使用(2)已经训练好的自动编码网络对Indian Pines高光谱数据进行降维,降维后的光谱维度为40。

(4)输入降维后的高光谱数据以及对应的地物标记图,在已经标记的数据中选取30%作为训练样本,其余70%作为测试样本。本方法使用的卷积神经网络结构如图所示,输入的数据为以待分类像元为中心的矩形区域内的数据立方体,取矩形大小为7×7,因此卷积神经网络的输入大小为7×7×40。卷积神经网络的期望输出为对应的待分类像元对应的地物种类。卷积神经网络包含3个卷积层,一个全连接层和一个softmax分类层。每个卷积层都包含40个大小为3×3的卷积核,全连接层的输入大小为40,输出大小为30,softmax分类层的输入大小为30,输出大小为Indian Pines高光谱数据的地物种类数目,即16。本方法中的卷积神经网络通过使用随机梯度下降算法最小化损失函数来实现训练。损失函数如下:

其中,L为卷积神经网络的损失函数,M为随机梯度下降算法中每一批训练样本中含有样本的个数,ti是第i个样本对应的卷积神经网络的输出,而yi代表第i个样本对应的卷积神经网络的期望输出,即样本对应的标签。

(5)在步骤(4)中完成了卷积神经网络的训练之后,将其作用于整幅高光谱图像,得到最终的分类结果。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1