基于低秩表示的高光谱图像波段选择方法

文档序号:9327449阅读:551来源:国知局
基于低秩表示的高光谱图像波段选择方法
【技术领域】
[0001] 本发明属于图像处理技术领域,涉及对高光谱图像波段选择,可应用于高光谱数 据的维数约减,降低数据处理的计算复杂度。
【背景技术】
[0002] 高光谱遥感技术是上个世纪20年代发展起来的一种重要遥感技术。高光谱成像 仪可以在多波段、窄间距的条件下获得几乎连续的地物波谱图像,使得高光谱图像具有了 相比传统的遥感图像更高的空间分辨率和光谱分辨率,并在农业、地质、沿海和内陆水域环 境、大气研究、全球环境研究等领域得到了广泛的应用。但成百乃至上千的波段也带来了数 据量大、"维数灾难"、信息冗余、存在噪声波段的问题,给高光谱图像的存储、传输和处理带 来了很多困难。因此,如何有效地降低高光谱图像的维数成为高光谱图像处理需要解决的 一个重要问题。
[0003] 传统的降维方法有两种,一种是特征提取,另一种是特征选择。为了保留高光谱图 像中特定波段的物理意义,一般采取特征选择的方法。
[0004] 在机器学习中,特征选择可以被定义为:给定一个特征集合,从中选择出一个特征 子集,使得评价标准达到最优。该定义可表述为:
[0005] 对于给定的特征集合X,其中包含η个特征,Xl,x2, ...,Xn,假设经过特征选择后得 到一个特征子集Xcipt,当Xcipt使给定的评价准则达到最大值时,则X _为最终选择的特征子 集。
[0006] 经典的特征选择的过程一般包含四个步骤:子集生成、子集评价、停止准则、结果 验证。子集的生成是通过搜索实现的。通过给定的搜索算法得到特征子集,然后根据评价 准则评价特征子集的好坏,更新现有的特征子集,并对其进行评价,直到满足停止准则,最 后输出最优的特征子集。
[0007] 特征选择是机器学习领域的困难之一。通常情况下,寻找最优的特征子集在实际 的应用中是非常困难的,许多与特征选择相关的问题均为NP-hard问题。搜索得到使评价 准则最优的最小特征子集被证明是一个NP-hard问题。通常情况下,通过采用如序列向前 搜索SFS、浮动序列向前搜索SFFS的启发式搜索算法可以在运行效率和得到特征子集质量 中间寻找一个折中点,这也是SFS被众多特征选择算法所采用的原因。
[0008] 序列向前选择算法SFS :首先初始化一个空的特征集合,然后每次在特征集合中 加入一个新的特征,确保每次新加入的特征是最优的,依次加入特征直到满足需要的特征 个数。该算法采用贪婪的策略,选择使评价准则最大的特征加入特征集合。尽管SFS的计 算量较小,但是由于没有充分的考虑特征之间的统计相关性,使得每次迭代都是选择使评 价准则达到最大的那个特征,在下一步的迭代中,选出的特征是对上一步选择的特征的一 个补充,所以特征被选择的过程中,选择的通常是共享率较大的特征子集,很难得到最优的 特征子集。
[0009] 序列后向选择算法SBS :与SFS相对应,SBS是一种自上而下的方法。首先将整个 特征集合作为初始选择的特征子集,在算法的每一次迭代中,去除对评价准则贡献最小的 特征,直到剩下的特征个数满足需要的特征个数。由于SBS是从全部的特征集合开始计算 的,所以计算量会比SFS稍大。相对SFS来说,其更加充分的考虑了特征之间的统计相关性, 因而在相同的评价准则下,其效果要略微好于SFS,但是其仍然存在与SFS相似的缺点,比 如一个特征被去除后就再也不可能被考虑,而被去除的特征可能是一些比较重要的特征。
[0010] 广义序列后向选择算法GSBS :作为SBS的加速算法,该算法在每次迭代中,根据评 价准则一次性去除r个特征,使得评价准则最优,直到剩下的特征个数满足需要的特征个 数。这个算法的优点是速度相对来说更快,相比SBS有更大的搜索范围,性能也是相对比较 好。但是仍然会导致重要特征的丢失。
[0011] 以上方法均由于只考虑特征的整体结构性,而没有充分考虑到特征之间相关性, 所以无法选择出最优的特征子集,导致分类精度较低。

【发明内容】

[0012] 本发明的目的在于针对上述已有技术的不足,提出一种基于低秩表示的高光谱图 像波段选择方法,以选择出最优的波段子集,提高高光谱图像分类精度,降低数据处理的计 算复杂度。
[0013] 本发明的技术思路是:考虑到高光谱波段之间的相关性,对高光谱波段进行低秩 表示,选择出的波段子集尽可能地充分表示原始波段数据,同时也要降低波段之间的冗余 信息,即在选择少量波段的同时,选择出包含信息量最大的波段子集,以有利于后面的分 类。其实现步骤如下:
[0014] 1、一种基于低秩表示的高光谱图像波段选择方法,包括如下步骤:
[0015] (1)输入高光谱图像Y e RtixS其中,Q为像素点个数,L表示波段数目,该高光谱 图像包含C类像素点,图像的每一个像素点为一个样本,R表示实数域;
[0016] (2)对高光谱数据进行归一化处理,得到归一化后高光谱数据X e RtixS
[0017] (3)对归一化后的高光谱数据X = [X1, X2,…,Xi, Xj,…,xj e Rqxl进行低秩表 示并求解,得到X的低秩表示系数矩阵Z = [Z1, Z2, ...,Zi, ...,zj e R1^,其中Xi, χ,分别 表示所有像素在第i,和第j个波段上的光谱强度组成的向量,Z1表示数据在第i个波段的 表示系数向量,i, j = 1,2,. . .,L ;
[0018] (4)根据⑶得到的低秩表示系数矩阵Z e R^,对波段进行聚类:依次分别对每 一个波段Xi, i = 1,...,L,利用其低秩表示系数向量Zi, i = 1,...,L进行重构,计算重构 结果与其余每个波段的残差:
[0020] 从中找出产生最小残差对应的波段xk,k e {1,2,一,Lhk辛i,则第k个波段与 第i个波段具有较强的相关性,将第k个波段与第i个波段合并组成一个聚类,若其中一个 波段已与其他波段组成聚类,则将另一个并入已有聚类;
[0021] (5)计算每个聚类的聚类中心,并从每个聚类中选择出离聚类中心最近的波段作 为该聚类最具代表性波段,所有聚类的代表性波段组成最终选择的波段子集;
[0022] (6)根据最终选择的波段,对所有样本提取所选波段组成新的样本集合Xse Rtixs, 其中S表示所选波段的数目;
[0023] (7)根据波段选择后的新样本集合Xs对高光谱数据进行分类:从X s中每类选择 10 %的样本作为训练样本集Xp,其余90 %的样本作为测试样本集Xq,将训练样本集Xp输入 到支撑矢量机SVM中进行训练,学习出一个分类器,将测试样本集X q输入到这个分类器中, 得到测试样本Xq的分类标签向量Y s,标签向量\即是高光谱图像的分类结果。
[0024] 本发明与现有技术相比,具有以下优点:
[0025] 1、本发明对高光谱数据进行低秩表示,由于噪声会提高高光谱数据的秩,因此在 低秩的约束下自然就去掉了噪声的干扰,提高了对噪声的抗干扰能力;
[0026] 2、本发明通过对波段进行选择,不仅除了波段之间的冗余信息,而且在大幅度降 低波段数目的同时保留了有用的信息,降低了数据的处理复杂度。
[0027] 3,本发明通过聚类选择波段,选择出相关性低,包含信息量大的波段子集,因此提 高了分类精度;
【附图说明】
[0028] 图1是本发明的实现流程图;
[0029] 图2是本发明实验中所用Indian Pines Scene数据集的可视化图像;
[0030] 图3是本发明实验中所用Pavia University Scene数据集的可视化图像;
[0031] 图4是本发明实验中所用Salinas Scene数据集的可视化图像;
【具体实施方式】
[0032] 参照图1,本发明主要包括三个部分:高光谱数据的低秩表示、高光谱数据波段选 择和对选择波段的分类。下面分别介绍这三部分的实施步骤:
[0033] -.高光谱数据的低秩表示
[0034] 步骤1 :将高光谱数据转化为二维矩阵Y。
[0035] 输入原始的高光谱数据D e Rmxnx^由于高光谱数据是三维矩阵,为了便于后续的 处理,则要将高光谱数据转化为二维矩阵Y e ,其中MXN表示像素点数目,L表示波段 数目,Q = MXΝ,该高光谱图像包含c类像素点,图像的每一个像素点为一个样本,R表示实 数域。
[0036] 步骤2 :对二维矩阵Y进行归一化,得到高光谱矩阵X e Rtix匕
[0037] 对转换的二维矩阵Y e RtjM进行数据的归一化,是将Y e RtjM中的像素点归一化 为0-1之间的值,得到归一化后的高光谱矩阵X e Rqx匕
[0038] 步骤3 :对高光谱数据X进行低秩表示。
[0039] 通常情况下,低秩表示的基本模型为:
[0041] 其中:Z e 为低秩表示系数矩阵,C表示字典
I2il范数,[E] ^表示噪声系数矩阵E第i行,第j列的值,I I ·| I $表示矩阵的核范数,λ表 示平衡参数,E表示噪声系数矩阵;
[0042] 本发明中使用高光谱数据X作为字典,即用高光谱数据X代替公式中的字典C,将 高光谱数据X低秩表示的模型变为:
[0044] 其中:Z e Rlxl为低秩表示系数矩阵
称为l2,i范数,
[ELi j表示噪声系数矩阵E第i行,第j列的值,I I · I I $表示矩阵的核范数,λ表示平衡 参数,E表示噪声系数矩阵。
[0045] 步骤4 :求解低秩表示系数矩阵Ζ。
[0046] 求解低秩表示系数矩阵的现有的常用方法有:QR分解法、LU分解法和增强拉格朗
日乘子ALM算法。本发明实例利用增强拉格朗日乘I ALM算法对高光谱数据X的低秩表示 模型进行优化求解,得到低秩表示系数矩阵Z = [Z1, z2, . . .,Zi, . . .,zj e R1^,其中2;表 示第i个波段的低秩表示系数,i = 1,...,L。
[0047] 二.高光谱数据波段选择
[0048] 步骤5 :通过低秩表示系数矩阵Z对波段进行聚类。
[0049] 本步骤是根据层次聚类的思想,将每一个波段初始化为一个聚类,再利用低秩表 示系数矩阵Z,对波段进行聚类,其步骤如下:
[0050] (5a)通过第i个波段的表示系数&重构出第i个波段Xz i,根据以下公式计算重 构出的波段Xzi
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1