一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法

文档序号:6515488阅读:299来源:国知局
一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法
【专利摘要】一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法,属于高光谱遥感图像处理方法。本发明针对源高光谱数据和目标高光谱数据来自不同分布时,很多先进的基于机器学习的高光谱数据分类算法的分类性能变差。首先,根据一种能自动获得包含判别信息的成对约束样本,提出成对约束判别分析;然后,设计一种非负稀疏散度准则来构建不同分布的源领域和目标领域高光谱数据之间的桥梁;最后,结合这两部分,实现源高光谱数据到目标高光谱数据的知识迁移。优点:解决不同时间、不同地域或不同传感器获得高光谱数据间的知识迁移;能够有效地利用源领域高光谱数据的信息去分析目标领域高光谱数据并获得较高的整体分类精度和Kappa系数。
【专利说明】一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法
【技术领域】
[0001]本发明涉及一种高光谱遥感图像处理方法,具体涉及一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法。
【背景技术】
[0002]随着高光谱传感器的发展,能够获得大量密集且连续的光谱波段并广泛应用于观察地球表面。高光谱数据分类过程的复杂性通常取决于所获得数据的波段数,而密集连续的光谱波段间的高相关性,同时会使波段冗余度提高及产生Hughes现象。因此,为了保留尽可能多的有用信息同时减少高光谱数据分类的复杂性,有必要将高维数据转化到低维子空间,从而使高光谱数据更高效的分类。
[0003]随着卫星遥感技术的发展,未来高光谱数据处理面临的一个主要挑战是那些未知的但相关的新数据集。例如,相同星载传感器定期对同一地区不同时间或不同地区相似地物收集数据集,不同星载传感器对不同地区相似地物收集数据集,从而使多时相分析,多角度研究,多模态变化检测成为可能。AVIRIS、Hyperion或QuickBird等卫星几乎每天都能获取新的高光谱数据,如果对这些新的高光谱数据进行监督分类,就需要对每类高光谱数据收集足够数量的标记训练样本,这不仅费时耗力,且成本很高,是不现实的。因此,研究者必须经常依靠单次采集的数据来处理一系列数据。然而,由于多种原因,如不同时间的大气条件、不同的采集系统状态、不同层次的土壤水分、不同的反射率和照明条件等,可能导致新数据的概率分布发生变化。在这些情况下,直接利用旧数据来处理新数据的分类或回归,可能会导致灾难性的结果。因此,找到一个有效的概率分布匹配策略,成为新一代高光谱数据处理的一项紧迫而复杂的任务。
[0004]近几年,很多机器学习算法已经成功地应用到高光谱数据处理中。在机器学习中,上面的问题可以通过领域自适应或迁移学习来解决。迁移学习的目的是解决当来自一个或多个源领域的训练样本和来自目标领域的测试样本属于不同分布或是不同特征空间表示时的问题。迁移学习的关键思想是:虽然源和目标领域之间的分布不同,但是仍然存在一些共同的跨领域知识结构,可以利用这些结构来作为知识迁移的桥梁。迁移学习大体可以分为下面四种:基于实例的迁移学习、基于参数的迁移学习、基于关联规则的迁移学习和基于特征的迁移学习。
[0005]基于特征的迁移学习(也称为特征迁移学习)的直观想法是为目标领域学习一个“好”的特征表示。源领域的知识通过特征表示迁移到目标领域,在该特征表示下,目标领域的学习性能能得到明显的提升。基于特征的迁移学习可以解决维数灾问题和不同分布问题,因此可以考虑利用其来解决高光谱数据的降维问题。流形学习在研究数据的内在结构中有很多重要的发现,常被用来研究高维数据的低维特征表示,其优点在于能够在低维空间中准确反映出数据的高维结构。Pan等提出最大平均差异嵌入(maximum meandiscrepancy embedding, MMDE)算法,通过学习一个低维子空间来降低不同领域直推迁移学习间的分布差异。经过这种处理后的数据可以直接利用传统分类器对数据进行训练和泛化。由于MMDE的计算开销较大,Pan等在此基础上,提出了一个有效的快速特征提取算法:迁移成分分析(transfer component analysis, TCA)。Wang等结合线性判别分析和聚类划分的思想,提出了迁移判别分析TDA (transferred discriminate analysis,TDA)。TDA首先使用聚类方法产生无标签数据的伪标签,然后利用判别保持的降维方法对源领域目标数据和带标签的数据进行降维,对这两个步骤迭代进行直到结果标签不再变化。利用上述特征迁移学习算法得到的特征投影矩阵均没有考虑到稀疏约束,当利用有限的训练样本处理大量测试样本集时,易于出现过拟合现象。为此,引入稀疏约束,Yang等提出迁移稀疏子空间学习-最大平均差异(transfer sparse subspace learning -maximummean discrepancy, TSSL-MMD)和迁移稀疏子空间学习-布雷格曼散度(transfer sparsesubspace learning-bregman divergence, TSSL-BD), Zhang 等提出稀疏迁移流形嵌入(sparse transfer manifold embedding, STME)。TSSL-MMD 需要求取源领域和目标领域样本的核矩阵,当将其用于处理像高光谱数据这类样本量非常大的数据时,TSSL-MMD的计算开销较大;另外,依据MMD准则得到的核矩阵不具有判别信息,从而会导致迁移效率降低。STME中判别流形嵌入部分将背景样本和目标样本全部考虑进去了,从而无法避免冗余的、含噪声的这些影响算法效率的样本。

【发明内容】

[0006]发明目的:针对上述现有技术,提出一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法,解决不同时间、不同地域或不同传感器获得高光谱数据间的知识迁移,实现在没有人工干预下自动获得成对约束样本,并避免冗余的、含噪声的样本选入;同时,避免数据降维出现过拟合现象,使得高光谱数据处理具有自然的判别能力,减少了专家标记工作。
[0007]技术方案:为解决上述技术问题,一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法,具体步骤如下:
[0008]步骤1,选择需进行分析的源领域和目标领域高光谱数据,根据需求将这些高光谱数据分成源训练样本,目标训练样本和目标测试样本;通过降维算法使所述高光谱数据从高维空间投影至一个低维子空间;
[0009]步骤2,通过成对约束将所述源训练样本和目标训练样本划分成正关联约束样本和负关联约束样本,利用所述正负关联约束样本和补丁校准框架,进行成对约束判别分析;
[0010]步骤3,利用非负稀疏表示方法计算源领域内、目标领域内和交叉域间的样本非负稀疏表示,并通过非负稀疏散度准则构建不同分布的源领域和目标领域高光谱数据之间的桥梁;
[0011]步骤4,结合所述成对约束判别分析和非负稀疏散度准则,实现不同分布高光谱数据间的特征迁移学习。
[0012]作为本发明的优选方案,所述步骤I中,输入的高光谱数据共有3个部分:
[0013]I)源领域高光谱数据的源训练样本
【权利要求】
1.一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法,其特征在于, 具体步骤如下: 步骤1,选择需进行分析的源领域和目标领域高光谱数据,根据需求将这些高光谱数据分成源训练样本,目标训练样本和目标测试样本;通过降维算法使所述高光谱数据从高维空间投影至一个低维子空间; 步骤2,通过成对约束将所述源训练样本和目标训练样本划分成正关联约束样本和负关联约束样本,利用所述正负关联约束样本和补丁校准框架,进行成对约束判别分析; 步骤3,利用非负稀疏表示方法计算源领域内、目标领域内和交叉域间的样本非负稀疏表示,并通过非负稀疏散度准则构建不同分布的源领域和目标领域高光谱数据之间的桥梁; 步骤4,结合所述成对约束判别分析和非负稀疏散度准则,实现不同分布高光谱数据间的特征迁移学习。
2.根据权利要求1所述一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法,其特征在于:所述步骤I中,输入的高光谱数据共有3个部分: 1)源领域高光谱数据的源训练样本,
3.根据权利要求2所述的一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法,其特征在于:所述步骤2中,所述成对约束判别分析方法,其目标函数定义为:
4.根据权利要求3所述一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法,其特征在于:所述步骤3中,所述非负稀疏散度准则: 令Dist(Z〖,Z=)表示在低维子空间中源领域和目标领域间不同分布的距离估计,通过最小化如下式的目标函数,实现估计不同分布样本间的距离:
5.根据权利要求4所述一种基于成对约束判别分析-非负稀疏散度的高光谱数据降维方法,其特征在于:所述步骤4中特征迁移学习步骤如下: 为能从源领域到目标领域迁移样本的判别信息,将成对约束判别分析和非负稀疏分布散度准则的潜在的特征空间结构,通过权衡参数β e [0,1]连接起来;同时增加正则约束WtW=I来避免广义特征分解的秩亏现象,则有:
【文档编号】G06K9/62GK103544507SQ201310482378
【公开日】2014年1月29日 申请日期:2013年10月15日 优先权日:2013年10月15日
【发明者】王雪松, 高阳, 程玉虎 申请人:中国矿业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1