一种基于稀疏表达图的高光谱图像半监督分类方法与流程

文档序号:15272814发布日期:2018-08-28 22:38阅读:170来源:国知局

本发明属于模式识别技术领域,更具体地,涉及一种基于稀疏表达图的高光谱图像半监督分类方法。



背景技术:

高光谱遥感是具有高的光谱分辨率的遥感科学和技术,它具有“图谱合一”特性,将代表地物性质的光谱和确定地物空间的图像结合在一起,能够获取地球表面丰富的光谱和空间信息,使得在传统多光谱遥感中不可识别的地物,在高光谱中能够被识别。因此,高光谱遥感可以获取地物丰富的细节信息,鉴别地物间微小的差别,凭借其对地物属性的准确描述成功应用于地物的精细分类。对于有监督高光谱图像分类,需要足够数量的标记样本,但是对高光谱图像获取类别标记数据,是一项耗时耗力,成本高昂的工作。针对上述问题,能利用少量标记样本和大量未标记样本的半监督学习方法被提出来解决上述问题。这些方法大概被分成以下三类:1)生成模型;2)低密度分隔算法;3)基于图的算法。在这些方法中,由于具有更优的数学模型和闭式解,基于图的半监督学习方法得到了学术界的广泛研究。

基于图的半监督学习算法的核心是图的构造。基于图的半监督方法一般包含两步,首先构造一个图,其中顶点集由标记样本和未标记样本组成,边表示样本间的相似性,然后在图中通过成对样本间的相似性将标记从有标记样本传播到未标记样本。尽管许多不同的目标函数被用来刻画标记传播过程,但是它们大多采用聚类假设,也就是说位于同一个流形或结构的样本很有可能拥有相同的标记。而这个潜在的流形结构是可以用图结构来近似表示。因而,图构造是基于图的半监督学习算法中非常关键的步骤。

目前存在的图构造方法大体可以分为三类:1)基于欧式距离的方法。这类方法通常是利用k近邻准则来获得局部近邻,然后是采用二进制权重或者高斯核权重来编码样本的相似性;2)基于局部自我表达模型的方法。这类方法通过将每个样本表示为局部邻域的线性组合来获得权重;3)基于全局自我表达模型的方法。他们将每个样本表示为所有其它样本的线性组合来得到权重,例如,基于稀疏表达的方法和基于低秩表达的方法。基于欧式距离的方法和基于局部自我表达的模型取决于局部邻域参数(例如k),通常对噪声和误差很敏感,而且要手动设置参数不能产生自适应的邻域。针对干扰数据,基于全局的自我表达模型采用一些正则项来约束数据和表示矩阵,从而能够对噪声和局部误差有很好的鲁棒性。然而,这类方法在实际应用中也存在一些问题。在理想的情况下,基于全局的自我表达模型希望得到的线性系数是结构稀疏的,也就是说,只有那些和目标样本属于同类的样本点才有非零的系数值。不幸的是,这样的假设通常只有在如下条件下才能成立:所有的样本点位于独立的、不相连的子空间。换句话说,如果存在相互依赖的的子空间、非线性子空间,这种方法很可能就选择不同类别的样本点来表达某个样本,从而使得表示矩阵缺乏判别性。

由此可见,现有技术存在对噪声敏感、需手动设置参数、判别性不够的技术问题。



技术实现要素:

针对现有技术的以上缺陷或改进需求,本发明提供了一种基于稀疏表达图的高光谱图像半监督分类方法,由此解决现有技术存在对噪声敏感、需手动设置参数、判别性不够的技术问题。

为实现上述目的,按照本发明的一个方面,提供了一种基于稀疏表达图的高光谱图像半监督分类方法,包括:

(1)根据高光谱图像的像元数据,得到类别概率矩阵,所述像元数据包括标记类别的像元数据和未标记类别的像元数据;

(2)利用类别概率矩阵和像元数据的空域信息构建正则项,根据正则项得到有约束的稀疏表达目标函数,利用稀疏表达目标函数得到稀疏表达图的相似性权值矩阵;

(3)根据相似性权值矩阵,利用标记传播得到高光谱图像的每个像元的类别。

进一步地,像元数据为BOT数据、INDPINE数据或者KSC数据。

进一步地,步骤(1)的具体实现方式为:

根据标记类别的像元数据构造标记类别概率矩阵,对于未标记类别的像元数据利用稀疏表达式得到未标记类别的像元数据在标记类别的像元数据中的稀疏表达系数,根据稀疏表达系数和标记类别概率矩阵得到未标记类别概率矩阵,将标记类别概率矩阵和未标记类别概率矩阵组合得到类别概率矩阵。

进一步地,稀疏表达式为:

其中,a为稀疏表达系数,xk为未标记类别的像元数据中的一个像元数据,Xl为标记类别的像元数据,λ为稀疏项权重。

进一步地,步骤(2)的具体实现方式为:

利用类别概率矩阵和像元数据的空域信息构建正则项,根据正则项得到有约束的稀疏表达目标函数,在稀疏表达目标函数中引入辅助变量,得到无约束条件的目标函数,将无约束条件的目标函数分解成3个子目标函数,利用3个子目标函数得到稀疏表达图的相似性权值矩阵。

进一步地,有约束的稀疏表达目标函数为:

其中,L0为有约束的稀疏表达目标函数,X为高光谱图像的像元数据,M表示类别概率矩阵中两个类别概率向量的欧式距离,λ1为第一惩罚系数,λ2为第二惩罚系数,n为高光谱图像的像元数据总数,W为相似性权值矩阵,wi为第i个高光谱图像的像元数据的稀疏表达系数,wj为第j个高光谱图像的像元数据的稀疏表达系数,Cij表示空域信息,diag表示对角矩阵。

进一步地,空域信息Cij为0或1,当第i个高光谱图像的像元数据属于第j个高光谱图像的像元数据的邻域或者第j个高光谱图像的像元数据属于第i个高光谱图像的像元数据的邻域时,空域信息Cij为1,否则空域信息Cij为0。

进一步地,无约束条件的目标函数为:

其中,L为无约束条件的目标函数,X为高光谱图像的像元数据,M表示类别概率矩阵中两个类别概率向量的欧式距离,λ1为第一惩罚系数,λ2为第二惩罚系数,W为相似性权值矩阵,J为辅助变量,Λ为拉格朗日乘子,μ为正则项的权重,tr表示迹函数。

进一步地,3个子目标函数包括第一子目标函数、第二子目标函数和第三子目标函数,所述第一子目标函数为:

所述第二子目标函数为:

所述第三子目标函数为:Λ=Λ+μ(J-W)。

进一步地,步骤(3)的具体实现方式为:

根据相似性权值矩阵W构造拉普拉斯矩阵Lw=D-W,其中,D表示W的对角矩阵,通过求解下式来得到最终的分类结果:

其中,Yl为标记类别的像元数据的类别,Fu为所有未标记类别的像元数据的预测标记矩阵,l为标记类别的像元数据的个数,u为未标记类别的像元数据的个数,c为标记类别的像元数据的个数,为第i0个未标记类别的像元数据的预测类别,Fu(i0,j0)为第i0个未标记类别的像元数据属于第j0标记类别的像元数据的类别的概率。

总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:

(1)本发明利用类别概率矩阵和像元数据的空域信息构建正则项,根据正则项得到有约束的稀疏表达目标函数,使得不同类的像元间的权重变小,增加了图的判别性。

(2)本发明将空域信息融入稀疏表达中,使得空域上相邻的像元点、尽可能具有相似的表达系数,可以有效地解决高光谱图像分类中存在的椒盐噪声的问题。

(3)本发明在稀疏表达目标函数中引入辅助变量,得到无约束条件的目标函数,将无约束条件的目标函数分解成3个子目标函数进行优化求解,进一步提升了算法的收敛速度,且更加简洁清楚,无需手动设置参数,因此本发明尤其适用于高光谱图像半监督分类领域。

附图说明

图1是本发明实施例提供的总流程图;

图2是本发明实施例提供的得到相似性权值矩阵的流程图;

图3(a)是本发明实施例提供的SCSSR图和其它图结构在BOT数据类别Riparian和类别Woodlands上的分类曲线图;

图3(b)是本发明实施例提供的SCSSR图和其它图结构在BOT数据所有9类的分类曲线图;

图3(c)是本发明实施例提供的SCSSR图和其它图结构在IND PINE数据类别Corn-Min till和类别Soy-clean上的分类曲线图;

图3(d)是本发明实施例提供的SCSSR图和其它图结构在IND PINE数据所有16类的分类曲线图;

图3(e)是本发明实施例提供的SCSSR图和其它图结构在KSC数据类别Cabbage palm hammock和类别Oak/broadleaf hammock上的分类曲线图;

图3(f)是本发明实施例提供的SCSSR图和其它图结构在KSC数据所有13类的分类曲线图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

如图1所示,为本发明方法的总流程图,本发明方法具体包括以下步骤:

(1)根据标记类别的像元数据构造标记类别概率矩阵,对于未标记类别的像元数据利用稀疏表达式得到未标记类别的像元数据在标记类别的像元数据中的稀疏表达系数,根据稀疏表达系数和标记类别概率矩阵得到未标记类别概率矩阵,将标记类别概率矩阵和未标记类别概率矩阵组合得到类别概率矩阵。稀疏表达式为:

其中,a为稀疏表达系数,xk为未标记类别的像元数据中的一个像元数据,Xl为标记类别的像元数据,λ为稀疏项权重。

(2)如图2所示本发明采用交错方向乘子法来求解所述模型,利用类别概率矩阵和像元数据的空域信息构建正则项,根据正则项得到有约束的稀疏表达目标函数,在稀疏表达目标函数中引入辅助变量,得到无约束条件的目标函数,将无约束条件的目标函数分解成3个子目标函数,利用3个子目标函数得到稀疏表达图的相似性权值矩阵。有约束的稀疏表达目标函数为:

其中,L0为有约束的稀疏表达目标函数,X为高光谱图像的像元数据,M表示类别概率矩阵中两个类别概率向量的欧式距离,λ1为第一惩罚系数,λ2为第二惩罚系数,n为高光谱图像的像元数据总数,W为相似性权值矩阵,wi为第i个高光谱图像的像元数据的稀疏表达系数,wj为第j个高光谱图像的像元数据的稀疏表达系数,Cij表示空域信息,diag表示对角矩阵。空域信息Cij为0或1,当第i个高光谱图像的像元数据属于第j个高光谱图像的像元数据的邻域或者第j个高光谱图像的像元数据属于第i个高光谱图像的像元数据的邻域时,空域信息Cij为1,否则空域信息Cij为0。无约束条件的目标函数为:

其中,L为无约束条件的目标函数,X为高光谱图像的像元数据,M表示类别概率矩阵中两个类别概率向量的欧式距离,λ1为第一惩罚系数,λ2为第二惩罚系数,W为相似性权值矩阵,J为辅助变量,Λ为拉格朗日乘子,μ为正则项的权重,tr表示迹函数。

3个子目标函数包括第一子目标函数、第二子目标函数和第三子目标函数,所述第一子目标函数为:

所述第二子目标函数为:

所述第三子目标函数为:Λ=Λ+μ(J-W)。

将目标函数对J求导,并置零,我们可得最优解满足下列等式:

J*(2λ2L)+(XTX+μI)J*=XTX+μW-Λ

W的最优解可有软阈值操作算子获得。

(3)根据相似性权值矩阵W构造拉普拉斯矩阵LW=D-W,其中,D表示W的对角矩阵,通过求解下式来得到最终的分类结果:

其中,Yl为标记类别的像元数据的类别,Fu为所有未标记类别的像元数据的预测标记矩阵,l为标记类别的像元数据的个数,u为未标记类别的像元数据的个数,c为标记类别的像元数据的个数,为第i0个未标记类别的像元数据的预测类别,Fu(i0,j0)为第i0个未标记类别的像元数据属于第j0标记类别的像元数据的类别的概率。

像元数据为BOT数据、INDPINE数据或者KSC数据。BOT数据一共有9类,类别名称和数量分别为:Water(158),Floodplain(228),Riparian(237),Firescar(178),Island Interior(183),Woodlands(199),Savanna(162),Short Mopane(124),Exposed Soils(111)。KSC数据一共有13类,类别名称和数量分别为:Scrub(761),Willow swamp(243),Cabbage palm hammock(256),Cabbage palm/oak(252),Slash pine(161),Oak/broadleaf hammock(229),Hardwood swamp(105),Graminoid marsh(431),Spartina marsh(520),Cattail marsh(404),Salt marsh(419),Mud flats(503),Water(927)。INDPINE数据一共有16类,类别名称和数量分别为:Alfalfa(54),Corn-No till(100),Com-Min till(270),Corn(234),Grass/pasture(63),Grass/trees(101),Grass/pasture-mowed(26),Hay-windrowed(489),Oats(20),Soy-No till(66),Soy-Min till(122),Soy-clean(261),Wheat(212),Woods(117),Bldg-grass-trees-drives(291),Stone-steel towers(95)。

图3(a-f)为本发明方法与其它算法在6种数据上分类曲线比较,SCSSR表示的是本发明提出的基于类别结构和空域信息约束的稀疏表达图结构。横坐标表示每类像元数据的标记数量,纵坐标表示总体分类精度,每一条曲线反映的是每个算法在不同标记数量下的总体分类精度的变化,每个图表示的是本发明方法和对比算法在每个数据集下的分类曲线,从中可以得出,在6个数据集上,本发明方法都优于其它的算法,从图3可以看出,本发明方法在不同数据集中,在不同的标记像元数据下得到的分类准确率都是优于其它算法的。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1