一种基于综合置信的高光谱图像半监督分类方法与流程

文档序号:17726796发布日期:2019-05-22 02:34阅读:161来源:国知局
一种基于综合置信的高光谱图像半监督分类方法与流程
本发明涉及高维图像处理
技术领域
,具体涉及一种基于综合置信的高光谱图像半监督分类方法。
背景技术
:高光谱图像是由高光谱传感器获取的、光谱分辨率达到纳米级的地物遥感图像。高光谱图像每个像素的光谱数据来自于不同波长的光在地物目标所处该像素位置上的反射率,光谱特征可以用于识别该像素所属的地物类别。高光谱图像有以下特点:大量的像素点、高维的光谱特征。同时,高光谱图像的“图谱合一”特性也反映了图像中空间信息较为丰富,光谱特征具有区分性。利用这些先验信息发展起来的高光谱图像分类技术相比全色图像、多光谱图像具有更加突出的地物识别能力,因此在城市规划、海洋探测、军事、天文等领域均受到广泛的关注。另外,高光谱图像分类技术仍存在标记样本代价昂贵等问题,由于高光谱数据的光谱特征维度高、标记训练样本数量少,许多分类方法难以学习到有效的模型,也无法达到令人满意的分类精度。因此,针对数据量大、样本特征维度高、标记样本少的高光谱图像,设计合适的半监督学习方法从大量无标记样本中学习出更多的可分性信息,从而实现高光谱图像分类精度的提升,是高光谱图像分类领域较为重要的研究方向之一。许多有监督分类方法如多项式逻辑回归虽然能够在不少分类问题中有不错的效果,但在半监督分类问题中,由于训练样本较少,对噪声较大的高光谱图像只能得到粗糙的分类结果;基于图的半监督分类方法虽然能够利用高光谱图像中的空间平滑性信息实现较为不错的分类结果,但该类方法的类边界区分能力十分弱。因此,已有的众多有监督、半监督学习方法在训练样本较少的情况下,对高光谱图像的分类能力有待提高。技术实现要素:本发明的目的是针对现有技术的不足,提供了一种基于综合置信的高光谱图像半监督分类方法。首先利用高光谱数据建立了空间最近邻的图连接结构,然后结合空间信息和光谱信息以及多分类器综合置信筛选机制实现了训练样本的扩增,据此设计了一种基于综合置信和训练信息迭代扩增的协同训练自学习方法,最后利用半监督图分类方法对高光谱图像分类。所述基于综合置信的自学习方法十分适用于空间信息较多的高光谱图像数据,可以在无人为干预的情况下自学习出较为可靠的训练样本,极大地提升高光谱图像分类精度。本发明的目的可以通过如下技术方案实现:一种基于综合置信的高光谱图像半监督分类方法,所述方法包括以下步骤:s1、读入三维高光谱图像立方体h(m,n,b),其中m、n表示空间像素点位置,b表示所处光谱波段位置;s2、计算高光谱数据像素点之间的去样本均值的相关系数,用于构造图权重矩阵w,权重数值可以衡量像素点间的相似度;s3、将步骤s2的权重矩阵w中每个像素点与自身以及与空间8近邻外的像素点的相似度权重值置0,即只为每个像素点与其空间8近邻内的像素点间建立图连接,得到稀疏化的权重矩阵s4、计算归一化图权重矩阵s5、获取初始训练集和候选集s6、设定协同训练的迭代次数m,并开始协同训练过程;s7、使用训练集训练多项式逻辑回归分类器;s8、使用多项式逻辑回归分类器对候选集中的样本分类,得到预测标签y1和对应的置信度p;s9、使用半监督图分类方法对候选集中的样本分类,得到预测标签y2;s10、取出候选集中预测标签y1和预测标签y2相同的样本,以及对应的预测标签ya,构成协定集da,从候选集置信度p中选出协定集样本对应的所有置信系数作为综合置信集pa;s11、筛选出协定集da对应综合置信集pa中置信系数高于99%的样本,赋予预测标签yn,构成扩增集dn,加入训练集中,得到更新的训练集s12、将s11中扩增集dn的样本从候选集中移除,得到更新的候选集s13、迭代循环s7-s12步骤的高光谱图像协同训练过程,直至协同训练迭代达到设定值m次;s14、使用半监督图分类方法和更新后的训练集分类高光谱图像验证分类精度。进一步地,步骤s2中的图权重矩阵w采用如下计算方式:其中,vi代表第i个像素点的数据特征,va代表所有像素点的数据特征均值,wij是图权重矩阵w中的元素,代表像素点i和像素点j的相似性权重值。进一步地,步骤s4中的归一化图权重矩阵的计算采用其中度矩阵d计算公式如下:进一步地,步骤s8中所述的初始候选集由整个测试集内的样本构成,通过多项式逻辑回归分类器对整个候选集样本分类,得到第一种预测标签:其中,n代表候选集样本数,代表多项式逻辑回归分类器对候选集中第i个样本的预测结果;计算多项式逻辑回归分类器对每个像素点的最大分类后验概率值,作为预测置信度p=[p1,p2,...,pn],其中pi代表候选集中第i个样本的预测置信度。进一步地,步骤s9中的半监督图分类方法采用如下计算方式:其中,α为训练参数,y(0)由训练集的样本标签构成:使用半监督图分类方法对整个候选集中的样本分类,得到第二种预测标签:其中,n代表候选集样本数,代表半监督图分类方法对候选集中第i个样本的预测结果。进一步地,步骤s10中的协定集da由候选集中预测标签y1和预测标签y2相同的样本构成:同时取出协定集样本对应的预测标签ya=y1(y1==y2),以及协定集样本对应的所有置信系数作为综合置信集pa=p(y1==y2);由于pa的确定是以两种不同的预测标签y1和y2为基础的,因此将其称为综合置信集。进一步地,步骤s11中的扩增集dn由协定集da中综合置信集pa>0.99的样本构成,扩增集dn的样本标签yn同样由ya中相应预测标签构成:yn=ya(pa>0.99)而更新的训练集由之前的训练集和扩增集构成:本发明与现有技术相比,具有如下优点和有益效果:1、本发明提供的基于综合置信的高光谱图像半监督分类方法,使用了基于空间邻域相似性假设的图分类方法和基于光谱特征学习的多项式逻辑回归分类器,同时利用了空间信息和光谱信息进行自学习,从而增强分类器的分类性能。相比传统半监督图分类方法和多项式逻辑回归分类器,本发明方法结合了两种分类方法各自的优点,从而达到了增强的分类效果。2、本发明提供的基于综合置信的高光谱图像半监督分类方法,在初始训练样本较少的情况下,通过选择多分类器决策一致的样本,自学习出更多的训练样本,增进了分类器的训练效果。再进一步筛选综合置信集中高置信系数的预测样本,使自学习的训练样本更加可靠。因此,在相同初始训练样本的条件下,相比传统方法,分类器拟合能力更强,分类精度更高,在半监督分类任务中更加有效。附图说明图1为本发明基于综合置信的高光谱图像半监督分类方法的工作流程图。图2是对于avirisindianpines图像,采用本发明的基于综合置信的高光谱图像半监督分类方法的分类精度随协同训练迭代次数增长的示意图;其中初始训练样本为对图像12类样本每类随机取6个的情况。图3是对于avirisindianpines图像,采用本发明的基于综合置信的高光谱图像半监督分类方法的分类精度在初始训练样本分别取每类2个、4个、6个、8个不同情况下的变化示意图;其中协同训练共迭代10次。图4(a)是对于avirisindianpines图像,采用半监督图分类方法的分类精度在初始训练样本分别取每类2个、4个、6个、8个不同情况下的变化示意图;图4(b)是对于avirisindianpines图像,采用多项式逻辑回归分类器的分类精度在初始训练样本分别取每类2个、4个、6个、8个不同情况下的变化示意图;其中协同训练均迭代10次。图5(a)-图5(d)是训练样本标签,图像中的像素点被分为12类,图中训练样本是对avirisindianpines图像,通过在每类分别采样2个、4个、6个、8个像素点得到的。图6(a)-图6(d)是测试样本标签,图像中的像素点被分为12类,四个图中抽取的训练样本是对avirisindianpines图像,通过在每类分别采样2个、4个、6个、8个像素点得到的。图7(a)-图7(d)是协同训练扩增后的训练样本标签,采用本发明提出的基于综合置信的自学习方法在图5(a)-图5(d)所示初始训练样本基础上对avirisindianpines图像自学习得到的扩增训练样本,四个图中的初始训练样本是通过在每类分别采样2个、4个、6个、8个像素点得到的。图8(a)-图8(d)是全体样本标签,采用本发明提出的基于综合置信的高光谱图像半监督分类方法得到对avirisindianpines图像的分类结果,图像中的像素点被分为12类,四个图中抽取的训练样本是通过在每类分别采样2个、4个、6个、8个像素点得到的。图9(a)-图9(d)是全体样本标签,采用半监督图分类方法得到对avirisindianpines图像的分类结果,图像中的像素点被分为12类,四个图中抽取的训练样本是通过在每类分别采样2个、4个、6个、8个像素点得到的。图10(a)-图10(d)是全体样本标签,采用多项式逻辑回归分类器得到对avirisindianpines图像的分类结果,图像中的像素点被分为12类,四个图中抽取的训练样本是通过在每类分别采样2个、4个、6个、8个像素点得到的。具体实施方式下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。实施例:本实施例提供了一种基于综合置信的高光谱图像半监督分类方法,所述方法的流程如图1所示,包括以下步骤:s1、读入三维高光谱图像立方体h(m,n,b),其中m、n表示空间像素点位置,b表示所处光谱波段位置;s2、计算高光谱数据像素点之间的去样本均值的相关系数,用于构造图权重矩阵w,权重数值可以衡量像素点间的相似度,计算方式如下:其中,vi代表第i个像素点的数据特征,va代表所有像素点的数据特征均值,wij是图权重矩阵w中的元素,代表像素点i和像素点j的相似性权重值;s3、将步骤s2的权重矩阵w中每个像素点与自身以及与空间8近邻外的像素点的相似度权重值置0,即只为每个像素点与其空间8近邻内的像素点间建立图连接,得到稀疏化的权重矩阵s4、计算归一化图权重矩阵其中度矩阵d计算公式如下:s5、获取初始训练集和候选集初始候选集由整个测试集内的样本构成;s6、设定协同训练的迭代次数m,并开始协同训练过程;s7、使用训练集训练多项式逻辑回归分类器;s8、使用多项式逻辑回归分类器对候选集中的样本分类,得到第一种预测标签计算多项式逻辑回归分类器对每个像素点的最大分类后验概率值,作为预测置信度p=[p1,p2,...,pn];其中,n代表候选集样本数,代表多项式逻辑回归分类器对候选集中第i个样本的预测结果,pi代表候选集中第i个样本的预测置信度;s9、使用半监督图分类方法对整个候选集中的样本分类:得到第二种预测标签:构成:s10、取出候选集中预测标签y1和预测标签y2相同的样本,以及对应的预测标签ya=y1(y1==y2),构成协定集从候选集置信度p中选出协定集样本对应的所有置信系数作为综合置信集pa=p(y1==y2);由于pa的确定是以两种不同的预测标签y1和y2为基础的,因此将其称为综合置信集;s11、筛选出协定集da对应综合置信集pa中置信系数高于99%的样本,赋予预测标签yn=ya(pa>0.99),构成扩增集dn,加入训练集中,得到更新的训练集s12、将s11中扩增集dn的样本从候选集中移除,得到更新的候选集s13、迭代循环s7-s12步骤的高光谱图像协同训练过程,直至协同训练迭代达到设定值m次。s14、使用半监督图分类方法和更新后的训练集分类高光谱图像验证分类精度。图2是对于avirisindianpines图像,采用本实施例的基于综合置信的高光谱图像半监督分类方法的分类精度随协同训练迭代次数增长的示意图,其中初始训练样本为对图像12类样本每类随机取6个的情况;图3是对于avirisindianpines图像,采用本发明的基于综合置信的高光谱图像半监督分类方法的分类精度在初始训练样本分别取每类2个、4个、6个、8个不同情况下的变化示意图,其中协同训练共迭代10次;图4(a)是对于avirisindianpines图像,采用半监督图分类方法的分类精度在初始训练样本分别取每类2个、4个、6个、8个不同情况下的变化示意图;图4(b)是对于avirisindianpines图像,采用多项式逻辑回归分类器的分类精度在初始训练样本分别取每类2个、4个、6个、8个不同情况下的变化示意图,其中协同训练均迭代10次;图5(a)-图5(d)是训练样本标签,图像中的像素点被分为12类,图中训练样本是对avirisindianpines图像,通过在每类分别采样2个、4个、6个、8个像素点得到的;图6(a)-图6(d)是测试样本标签,图像中的像素点被分为12类,四个图中抽取的训练样本是对avirisindianpines图像,通过在每类分别采样2个、4个、6个、8个像素点得到的;图7(a)-图7(d)是协同训练扩增后的训练样本标签,采用本发明提出的基于综合置信的自学习方法在图5(a)-图5(d)所示初始训练样本基础上对avirisindianpines图像自学习得到的扩增训练样本,四个图中的初始训练样本是通过在每类分别采样2个、4个、6个、8个像素点得到的。图8(a)-图8(d)是全体样本标签,采用本发明提出的基于综合置信的高光谱图像半监督分类方法得到对avirisindianpines图像的分类结果,图像中的像素点被分为12类,四个图中抽取的训练样本是通过在每类分别采样2个、4个、6个、8个像素点得到的;图9(a)-图9(d)是全体样本标签,采用半监督图分类方法得到对avirisindianpines图像的分类结果,图像中的像素点被分为12类,四个图中抽取的训练样本是通过在每类分别采样2个、4个、6个、8个像素点得到的;图10(a)-图10(d)是全体样本标签,采用多项式逻辑回归分类器得到对avirisindianpines图像的分类结果,图像中的像素点被分为12类,四个图中抽取的训练样本是通过在每类分别采样2个、4个、6个、8个像素点得到的;由图8(a)-图8(d)得到表1利用基于综合置信的高光谱图像半监督分类方法以及图5(a)-图5(d)训练样本对avirisindianpines高光谱图像测试样本分类,得到的准确率。其中,待分类的像素来自于12个类。表1每类训练样本个数2468分类准确率(%)67.2776.7483.5086.75由图9(a)-图9(d)得到表2利用半监督图分类方法以及图5(a)-图5(d)训练样本对avirisindianpines高光谱图像测试样本分类,得到的准确率。其中,待分类的像素来自于12个类。表2每类训练样本个数2468分类准确率(%)59.7564.2468.9974.70由图10(a)-图10(d)得到表3利用多项式逻辑回归分类器以及图5(a)-图5(d)训练样本对avirisindianpines高光谱图像测试样本分类,得到的准确率。其中,待分类的像素来自于12个类。表3每类训练样本个数2468分类准确率(%)37.0652.9056.4957.94本实施例所述方法的优势如下:(1)更加符合高光谱图像数据特性:高光谱图像像素点是否属于同类不仅与光谱特征相似度有关,而且与空间位置的距离有关。光谱特征越相似的两个像素点越可能属于同一类,空间近邻的两个像素点也极有可能属于同一类。基于空间最近邻连接的半监督图分类方法虽然能够利用空间信息使空间邻接的像素产生图连接,从而得到空间上均匀成块分布的分类结果,但是这种方法缺乏了不同区域像素点之间的图连接,使得光谱特征极为接近但空间位置较远的像素点之间相关性不大。而基于光谱特征的判别式分类方法如多项式逻辑回归分类器却未利用空间信息,导致分类结果噪点明显。本发明提出的基于综合置信的高光谱图像半监督分类方法在距离初始训练样本较远的区域产生了更多较高综合置信度预测样本,并用于增强先验信息,相当于在原本只有空间近邻连接的图上新增了更多“远距离”连接。本发明提出的方法通过扩增更多训练样本的方式,将原本过分依赖空间信息的半监督图分类方法进行了增强,使改进后的图连接方式更加符合高光谱图像的数据特性。(2)自学习挖掘出分类器的最大潜力:在半监督分类问题中,由于先验信息极少,连接测度的改进极难提升传统图分类方法的分类精度,也难以设计出优秀的图连接方式。因此,单纯靠半监督图分类方法,高光谱图像半监督分类任务仍十分受限于初始训练样本的数量和质量。本发明提出的基于综合置信的高光谱图像半监督分类方法利用协同训练的思想,通过半监督图分类方法和多项式逻辑回归分类器共同挑选新训练样本的扩增方式,实现了机器的自学习和分类效果的逐步提升。即使在初始训练样本极少的情况下,本发明方法仍旧能够找到更多益于分类的训练样本,挖掘出图分类方法和多项式逻辑回归分类器的最大潜力。(3)协同训练效率较高:本发明的训练样本扩增过程采用两种互补的分类器,半监督图分类方法基于空间信息,预测的样本标签分布均匀成块,而多项式逻辑回归分类器基于光谱信息,预测的样本标签分布噪声较大但预测结果更符合样本的光谱特征分布。两种分类器预测意见一致的样本既能满足光谱特征分布,也能满足空间位置分布。再通过综合置信度做进一步筛选以保证扩增集的预测可靠性,这样的扩增集样本能够较为明显地改善半监督图分类方法的分类性能,进而提升协同训练过程的自学习效率。以上所述,仅为本发明专利较佳的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1