一种基于非线性降维及稀疏表示的遥感图像检索方法与流程

文档序号:17774176发布日期:2019-05-28 19:50阅读:2141来源:国知局
一种基于非线性降维及稀疏表示的遥感图像检索方法与流程

本发明属于图像检索技术,具体涉及一种基于非线性降维及稀疏表示的遥感图像检索方法。



背景技术:

遥感图像与普通图像相比,图像内容更丰富,图像数据更为庞大,且有一部分内容不能准确的描述,单幅遥感图像的大小已经是普通图像几倍大甚至几十倍大,并会包含很多元数据信息,所以,在特征的选取以及相似性匹配等诸多方面,均需要进行改进与提升。遥感图像检索一直是图像检索中的重点、难点和热点问题,随着遥感技术的发展以及用户的需求日益多样化,当基于内容的遥感图像检索的检索效果及检索精度达不到当前发展的要求时,需要提升遥感图像检索技术。



技术实现要素:

基于以上技术不足,本发明提出一种基于非线性降维及稀疏表示的遥感图像检索方法,具体流程如下:

步骤1:获取遥感图像,作为训练样本;

步骤2:对遥感图像通过去雾增强msr及色彩恢复进行预处理,得到预处理后遥感图像;在msr算法的基础上添加色彩恢复因子c,具体过程如下:

其中,ri(x,y)是retinex算法的输出图像,i∈r,g,b表示3个颜色谱带,f(x,y)是高斯滤波函数,wn表示尺度的权重因子,n表示使用尺度的个数,当n=3时,其表示的是彩色图像,i∈r,g,b。当n=1时,其表示的便为灰度图像。ci表示第i个通道的色彩恢复系数,作用是用来调节3个通道颜色的比例,f(·)表示的是颜色空间的映射函数。

步骤3:使用卷积神经网络模型中的vgg-16模型,对预处理后遥感图像进行特征提取,得到卷积神经网络图像特征;

步骤4:对卷积神经网络图像特征进行线性与非线性降维,用pca进行线性降维,用t-sne进行非线性降维,得到降维后图像特征;

步骤5:采用同步正交匹配追踪somp算法,求解稀疏系数矩阵x;

步骤6:使用k-svd稀疏编码算法进行字典学习,对降维后图像特征进行处理,得到最优稀疏系数矩阵x及一个过完备字典矩阵d,同时进行重构图像,具体步骤为:

步骤6.1:初始化字典dr,稀疏系数矩阵,残差变量r0,索引集z,迭代计数器k=1;初始化字典dr具体为:将降维后图像特征归一化,得到归一化的结果赋值于字典dr,dr的每一列便是归一化过的向量,也称之为原子;

步骤6.2:使用somp算法计算稀疏系数;

步骤6.3:使用svd算法更新字典原子;

步骤6.4:找到內积最大的原子,即找到最接近残差的原子索引,且利用最接近残差的原子索引更新索引集z,计算概率p且确定残差;內积最大的原子,说明该原子和残差最接近;

步骤6.5:判断是否更新完所有原子,若更新完所有原子,则转到步骤6.6,否则转到步骤6.3,继续更新未更新完的原子;

步骤6.6:判断是否达到迭代次数,若达到迭代次数则得到更新字典和更新的稀疏编码,即最优稀疏系数矩阵x和过完备字典d;

步骤6.7:使用更新的编码即稀疏系数矩阵重构图像,对图像进行加权叠加得到去燥后图像。

步骤7:基于过完备字典矩阵,构建分类准则。具体为:将中心像素的空间域中的四个最近邻像素也纳入到稀疏模型中,即将上下文信息纳入到稀疏模型中,令i表示遥感图像,假设x1是i中的中心像素,x2~x5是x1在空间域的四个最近邻像素,其中,将x1处进行拉普拉斯约束,得到拉普拉斯向量bt,定义为q维向量,即:

为了使整个相邻像素平滑,将拉普拉斯算子在x1处强制变成0,以这种方式将训练样本x1被迫重建为与其四个最近邻像素具有相似的特征,其中便为所求的稀疏向量。在式(5)中,第一组线性约束使得重构的图像向量bt进行拉普拉斯变换为0,使得重建的相邻像素具有相似的特征,第二组约束使得重构误差降至最小,即应用最小重构误差分类判别准则:

第一组线性约束的优化问题可以写成最小化式(6):

其中,定义λ>0,λ为控制平滑约束与重构精度之间的权重因子。可以表示为:

所以,此时定义作为像素的一种新的表示形式,即像素在过完备字典矩阵d上的稀疏表示的特征向量。

步骤8:使用随机森林作为分类器,随机森林构造是所述稀疏表示的特征向量构造随机森林,并利用多数投票策略,完成遥感图像特征向量分类,得到分类后的稀疏表示的特征向量每棵树训练集不同且含有重复的训练样本,当决策树构造之后,便是待选特征的随机选取过程,在所述选取过程中随机选出m个特征子集,每次树进行分裂操作时,会选择出最优的特征;最终利用多数投票策略,完成遥感图像特征向量分类;

步骤9:获取遥感图像,作为测试样本;

步骤10:通过步骤2预处理、步骤3特性提取、步骤4线性与非线性降维,对测试样本进行处理,得到降维后的测试样本图像特征;

步骤11:用欧式距离进行特征匹配,得到遥感图像检索结果:将降维后的测试样本图像特征向量与分类后的稀疏表示的特征向量计算欧式距离,得到欧式距离的计算结果,将欧式距离的结果由小到大排序,得出遥感图像检索结果。

有益技术效果:

利用深度学习卷积神经网络模型对内容丰富的遥感图像进行更复杂且更深层次的特征提取,并通过线性及非线性降维方式结合,对高维特征进行有效降维,使得特征低维度时图像内容能够有效且准确的表达,这能够使得图像在进行检索时保证检索精度,并利用结合最近邻空间域像素的稀疏分类,使得数据集分类准确,能达到有效减少检索时间的目的,尽可能满足用户进行检索时的体验。经过最终的实验结果验证,证明该方案可以解决遥感图像检索中效率低下和精度不高的问题。

附图说明

图1为本发明实施例的一种基于非线性降维及稀疏表示的遥感图像检索方法流程图;

图2为本发明实施例预处理后对比效果图;其中,图2(a)为原始图像;图2(b)为msr处理后图像;图2(c)为加入色彩恢复因子c处理后图像;

图3为本发明实施例的各降维方法同本发明降维方法准确度对比可视化图;

图4为本发明实施例的稀疏分类方法框架图;

图5本发明实施例的k-svd算法的工作过程;

图6本发明实施例的x1空间域中最近邻像素;

图7本发明实施例的遥感图像数据集部分实例图;

图8本发明实施例的曲线结果分析;其中,8(a)为查全率曲线;8(b)为查准率曲线8(c)为p-r曲线。

具体实施方式

下面结合附图和具体实施实例对发明做进一步说明,本实验选用ucmercedlandusedataset遥感图像数据集来验证其检索性能,其中包含21个类别,每个类别有100个像素为256*256的遥感图像,其中21个类别中包含农田,飞机,以及高尔夫球场等。随机选出1000个图像作为训练集,其余则做为测试集。如图7为数据集中部分图像示例。

一种基于非线性降维及稀疏表示的遥感图像检索方法,其重点在于,通过对遥感图像进行合适的处理使得能够得到准确的特征向量并最终提升检索精度的目的,所述遥感图像检索方法的步骤如下:

1)应用去雾并添加颜色恢复因子对遥感图像进行特征强调。

2)运用深度学习中的卷积神经网络对遥感图像进行特征提取,提出将线性降维与非线性降维相结合的方式对图像特征进行特征降维,保证降维后图像特征的准确性。

3)对于图像分类选择稀疏表示的方法对图像进行分类,在分类过程中应用经典算法进行字典的学习并利用联系上下文信息的方法进行稀疏向量的求取,最后提出利用随机森林完成图像的分类过程。

4)对最后的特征向量进行汉明距离计算,完成相似性匹配,得到比较精准的图像检索结果。

一种基于非线性降维及稀疏表示的遥感图像检索方法,如图1所示,具体步骤如下:

步骤1:获取遥感图像,作为训练样本;

步骤2:对遥感图像通过去雾增强msr及色彩恢复进行预处理,得到预处理后遥感图像;在msr算法的基础上添加色彩恢复因子c,多尺度retinex算法(multiscalescaleretinex,msr),该算法既突出了图像的细节信息,同时在一定程度上体现了原图像该有的色调,但在增强过程中,会因增加了噪声使图像局部色彩失真,使物体颜色效果不能完全表达出来,造成图像整体视觉效果不能达到理想的效果。因此,本文将在msr算法的基础上添加色彩恢复因子c,由于加入了色彩恢复因子,会使图像的颜色效果更加真实,使得遥感图像的一些不能从视觉便于识别的内容可以完整的呈现出来。具体过程如下:

其中,ri(x,y)是retinex算法的输出图像,(x,y)为遥感图像,i∈r,g,b表示3个颜色谱带,f(x,y)是高斯滤波函数,wn表示尺度的权重因子,n表示使用尺度的个数,当n=3时,其表示的是彩色图像,i∈r,g,b。当n=1时,其表示的便为灰度图像。ci表示第i个通道的色彩恢复系数,作用是用来调节3个通道颜色的比例,f(·)表示的是颜色空间的映射函数。如图2所示,图2(a)为原始图像;图2(b)为msr处理后图像;图2(c)为加入色彩恢复因子c处理后图像,可以看出增加彩色因子后图像更逼真,图像内容表达更丰富。

步骤3:使用卷积神经网络模型中的vgg-16模型,对预处理后遥感图像进行特征提取,得到卷积神经网络图像特征;

步骤4:对卷积神经网络图像特征进行线性与非线性降维,用pca进行线性降维,用t-sne进行非线性降维,得到降维后图像特征;

采用深度学习中卷积神经网络模型中的vgg-16模型对遥感图像进行特征提取,vgg-16模型是一个非常好的图像特征提取器,可提取到更深层次的特征,并且其网络模型结构稳定且均匀,因此选择vgg-16作为图像深度特征提取的工具。因利用高维度的特征向量进行图像检索效率是非常低的,所以,在提升检索的精度的同时仍然要保证图像检索的效率。将图像的高维特征空间映射到低维特征空间后能够尽量保证图像特征向量之间距离保持不变,才能保证图像特征的准确性。所以,本文将pca和t-sne相结合的方式作为最终特征维度的降维方法,如图3所示,得出不同的降维方法在将特征向量降维至2维时,利用可视化观察降维的精度,证明pca+t-sne可以作为降维方法。

步骤5:采用同步正交匹配追踪somp算法,求解稀疏系数矩阵x;

在进行迭代时,计算lp范数,然后选择与最大lp范数相一致的行索引来增大支撑集,当残差足够小或达到期望的稀疏程度时,该算法停止,而此过程由迭代的次数控制。计算关联矩阵c,在somp算法中,需计算lp范数,然后选择与最大lp范数相一致的行索引来增大支撑集;

采用同步正交匹配追踪somp算法,基于过完备字典矩阵,求解稀疏系数,遥感图像的特点是复杂、信息量大、空间结构复杂、数据维度大,因此,传统的分类方法对遥感图像进行分类时,效果难以达到理想的分类效果,且在一定程度上对遥感图像的应用进行了限制,而对遥感图像进行检索处理时,如何更好的分类是最终准确完成检索的应有过程,所以,选择具有简化复杂信号处理和能够精确恢复信号及良好的抵抗噪声的稀疏表示分类方法。

利用稀疏表示对遥感图像进行分类时,要对遥感图像进行特征提取,字典学习以及稀疏系数的求解,最后进行分类器的选择,对遥感图像完成最终的分类。如图4所示,为整个稀疏分类的过程。

字典训练选择了k-svd算法,工作过程是经过k次迭代,且每一次迭代都要使用svd分解。算法虽很经典有很好的训练效果。字典学习也可以简称为稀疏编码,从矩阵分解角度来看,字典的学习过程便是给定一个样本数据集y,并定义y的每一列表示为一个样本,字典学习的目标是将y分解为字典d以及系数矩阵x之间的相互关系,而d的每一列便是归一化过的向量,也称之为原子,x也应尽可能稀疏。k-svd算法,本质上可以理解为是k-means算法的一种扩展,而字典的每一列就相当于k-means算法的聚类中心。使用k-svd算法的目的是构造一个过完备字典矩阵,选择的最稀疏的系数解能够使得矩阵对其训练集相似的目标向量进行稀疏表示。具体流程如图5所示。

稀疏系数求解,选择somp算法,它是omp算法的进一步优化,该算法把不同源图像进行稀疏表示时使用相同过完备字典原子,并使其稀疏系数不同。为了解决非线性问题,解决方案的支撑就要按顺序更新,即字典中的原子是按顺序挑选出来的,在每次迭代中,原子的数量是最近似于所有被挑选出来的残差向量,与此同时,在第k次迭代时,计算关联矩阵c,在somp算法中,需计算lp范数,然后选择与最大lp范数相一致的行索引来增大支撑集,当残差足够小或达到期望的稀疏程度时,该算法停止,而此过程由迭代的次数控制。在此过程中,训练字典中的原子都进行了归一化。

步骤6:使用k-svd稀疏编码算法进行字典学习,目的是将给定的训练样本数据集y分解为过完备字典矩阵d以及稀疏稀疏矩阵x之间的相互关系。对降维后图像特征进行处理,利用k-svd算法更新字典原子,最终得到更新后过完备字典矩阵d和更新后的稀疏稀疏矩阵x,同时可以进行重构图像;

步骤6.1:初始化字典dr,稀疏系数矩阵,残差变量r0,索引集z,迭代计数器k=1;初始化字典dr具体为:将降维后图像特征归一化,得到归一化的结果赋值于字典dr,dr的每一列便是归一化过的向量,也称之为原子;

步骤6.2:使用somp算法计算稀疏系数;

步骤6.3:使用svd算法更新字典原子;

步骤6.4:找到內积最大的原子,即找到最接近残差的原子索引,且利用最接近残差的原子索引更新索引集z,计算概率p且确定残差;內积最大的原子,说明该原子和残差最接近;

步骤6.5:判断是否更新完所有原子,若更新完所有原子,则转到步骤6.6,否则转到步骤6.3,继续更新未更新完的原子;

步骤6.6:判断是否达到迭代次数,若达到迭代次数则得到更新字典和更新的稀疏编码,即最优稀疏系数矩阵x和过完备字典d;

步骤6.7:使用更新的编码即稀疏系数矩阵重构图像,对图像进行加权叠加得到去燥后图像。

步骤7:基于过完备字典矩阵,构建分类准则,当考虑像素间相关性时,分类精度可以得到显著提高。具体为:将中心像素的空间域中的四个最近邻像素也纳入到稀疏模型中,即将上下文信息纳入到稀疏模型中,如图6所示,令i表示遥感图像,假设x1是i中的中心像素,x2~x5是x1在空间域的四个最近邻像素,其中,将x1处进行拉普拉斯约束,得到拉普拉斯向量bt,定义为q维向量,即:

为了使整个相邻像素平滑,将拉普拉斯算子在x1处强制变成0,以这种方式将训练样本x1被迫重建为与其四个最近邻像素具有相似的特征,其中便为所求的稀疏向量。在式(5)中,第一组线性约束使得重构的图像向量bt进行拉普拉斯变换为0,使得重建的相邻像素具有相似的特征,第二组约束使得重构误差降至最小,即应用最小重构误差分类判别准则:

第一组线性约束的优化问题可以写成最小化式(6):

其中,定义λ>0,λ为控制平滑约束与重构精度之间的权重因子。可以表示为:

所以,此时定义作为像素的一种新的表示形式,即像素在过完备字典矩阵d上的稀疏表示的特征向量。

步骤8:使用随机森林作为分类器,随机森林构造是所述稀疏表示的特征向量构造随机森林,并利用多数投票策略,完成遥感图像特征向量分类,得到分类后的稀疏表示的特征向量每棵树训练集不同且含有重复的训练样本,当决策树构造之后,便是待选特征的随机选取过程,在所述选取过程中随机选出m个特征子集,每次树进行分裂操作时,会选择出最优的特征;最终利用多数投票策略,完成遥感图像特征向量分类;

步骤9:获取遥感图像,作为测试样本;

步骤10:通过步骤2预处理、步骤3特性提取、步骤4线性与非线性降维,对测试样本进行处理,得到降维后的测试样本图像特征;

步骤11:用欧式距离进行特征匹配,得到遥感图像检索结果:将降维后的测试样本图像特征向量与分类后的稀疏表示的特征向量计算欧式距离,得到欧式距离的计算结果,将欧式距离的结果由小到大排序,得出遥感图像检索结果。

1使用总体平均查全率及查准率验证实验稳定性:

为了验证本方法的稳定性,选取飞机,船舶,海滩,灌木等8个类别的遥感图像进行检索,每次返回12、48、96幅图像,每类遥感图像随机选取6次检索结果,并计算出每类图像进行检索后的查全率、查准率,最后,将总体的平均查全率和查准率作为验证本文方法稳定性的标准,如表1所示:

表1不同检索方法下总体的平均查全率及查准率对比结果

2使用查全率、查准率及p-r曲线判别检索准确性和可行性:

为验证本文算法的可行性和准确度,选取利用cnn进行特征提取,并应用除本文降维算法之外的四种经典降维方法对提取到的图像特征进行降维,其中线性降维方法为:线性判别分析(lineardiscriminantanalysis,lda)、因子分析(factoranalysis,fa),非线性降维方法为:局部线性嵌入(locallylinearembedding,lle)和多维缩放(multidimensionalscaling,mds)算法。选择将上述四种降维方法和应用somp算法作为分类算法的图像检索方法作为本方案的对比算法,并采用查全率(recall)、查准率(precision)及p-r(precision-recall,p-r)曲线作为评价指标。

利用查全率来判定本文方法的可行性,与对比算法的比较如图8(a)所示。随着查询图像的返回数量可以看出本文算法的曲线成上升趋势。因此本文算法是可行的,与对比算法的曲线相比也比较稳定。查准率顾名思义为已被检索样本的准确率。所以利用查准率来判定本文方法的准确度,与对比算法的比较如图8(b)所示,可以观察到本文方法相对其他图像检索算法,检索精度提升较好,准确度提升较高。p-r曲线是曲线的高低和算法的准确率是正相关关系,因此,利用p-r曲线仍然可以观察出本文算法相对其他算法较稳定的优势。如图8(c)所示。

3使用其他分类方法与本实验分类方法比较验证分类方法的可行性与准确性:

本实验方法与其他的分类算法在准确率上进行了比较。将基于稀疏表示的其他三种算法:正交匹配追踪(orthogonalmctchingpursuit,omp)、联合正交匹配追踪(simultaneousorthogonalmctchingpursuit,somp)和联合子空间追踪(simultaneoussubspacepursuit,ssp)及本文算法与传统的支持向量机(supportvectormachine,svm)算法进行比较,并选取本文数据集中的八种分类作为实验数据,实验对比结果如表2所示:

表2分类算法精度(%)比较

由表2可知,加上本文方法共4种稀疏重构算法进行的稀疏表示方法均比svm方法分类总体精度高。其中稀疏表示各类方法中,本文算法的总体精度最高,为95.36%,omp算法精度最低,为92.47%,各类别中高尔夫球场和及棒球场分类效果较差。高尔夫球场和棒球场由于特征相近,且相互错分较多,所以效果并不好。飞机和海滩及森林效果很好,主要由于遥感图像中这三类地物特征明显。因此,分类精度较高。本文算法相对于其他三种稀疏表示算法总体精度高,这说明将结合空间域最近邻像素的稀疏表示方法进行遥感图像分类是行之有效的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1