一种基于分块低秩张量分析的高光谱图像降维和分类方法

文档序号:6379306阅读:449来源:国知局
专利名称:一种基于分块低秩张量分析的高光谱图像降维和分类方法
技术领域
本发明属于遥感图像处理技术领域,具体涉及一种基于分块的张量分析理论,解决高光谱遥感数据降维和分类问题的方法。
背景技术
遥感是本世纪六十年代发展起来的新兴综合技术,与空间、电子光学、计算机、地理学等科学技术紧密相关,是研究地球资源环境的最有力的技术手段之一。近年来,随着高光谱成像技术的发展,高光谱遥感已经成为遥感领域一个快速发展的分支。作为一种多维信息获取技术,它将成像技术和光谱技术相结合,在电磁波谱的数十至数百个非常窄而且连续的光谱区间内同时获取信息,从而得到高光谱分辨率的连续、窄波段的图像数据,且每一个图像像元都可以提取一条完整连续的光谱曲线,大大扩展了图像解释地物的能力[I]。 然而,由于高光谱图像(Hyperspectral Imagery, HSI)的相邻波段之间的波长差异往往只在纳米数量级,它们之间的相关系数一般都非常高。也就是说,在邻近的波段之间存在大量的冗余信息,很明显这会造成存储和处理能力的浪费。为了减少运算量、降低计算复杂度以及改善分类效率、提高分类精度,对HSI图像进行降维处理显得十分必要[2]。当前应用广泛的主成分分析方法(Principal Component Analysis, PCA),虽然易于实现,但必须将HSI每一个波段的二维图像化成向量,从而破坏了原图的空间分布特性,忽略了空间和光谱间的相互联系。该缺陷普遍存在于只能处理向量或者一维样本排列成的矩阵的降维方法。要从根本上解决上述问题,就应该使降维方法契合HSI的数据结构,采用基于张量分析的降维方法。首先,用一个三阶张量存储高光谱数据,其中两个维度表示像素空间分布,余下的维度代表光谱分布,保存了 HSI的空间分布特性,维护了空间和光谱间的关联性。其次,一个用于构建降维算法、与降维目的相适应的张量,不仅能挖掘物理意义明确的分量,更能充分利用空间和光谱间的关联性,将张量的价值最大化,从而提升降维效果。基于张量分析的降维方法中,最具代表性的是Renard等人[2]的低秩张量分析法(Lower Rank Tensor Analysis, LRTA)。LRTA 是 PCA 在张量形式上的推广,建立在 Tucker张量分解模型[3]的基础之上,将HSI投影到一个低秩的子空间进行降维,维护了原图的空间分布特性,在一定程度上利用了空间和光谱间的相互联系。该方法虽然考虑了空间与光谱间的相互作用,但它的局限性也很明显。首先,LRTA对于空间相关程度较弱的HSI并不奏效,只有强烈的空间相关性才能凸显出LRTA相对于PCA的优越性。而且,LRTA降维后的分类精度受子空间的影响非常大,现有的子空间估计方法(如HySime、AIC、MDL[4-10]^PF可靠,往往不能找出使LRTA的性能达到最优的最佳子空间。本发明是一种基于分块的低秩张量分析法(Subtensor based Lower Rank TensorAnalysis, S-LRTA),弥补了 LRTA的缺陷。S-LRTA保持原来的光谱数据不变,将空间维划分成许多相同大小的子区域,每一子区域对应一个子张量,对每个子张量分别进行LRTA降维、分类,最终提高图像的整体分类精确度。分块的思想基于两点事实在小范围的空间区域内,HSI对应的地物类别单一,像素相似,空间相关性尤为明显;而一般的HSI波段数目众多、波段宽度狭窄,光谱相关性非常明显。所以,只要将HSI张量的空间区域分块而无需改变原张量的光谱维,就可以最大限度地利用区域空间相关性和光谱间相关性。经S-LRTA降维后,每一子张量的子空间维度对分类精度的影响力度大为下降,从而无须在子空间的估计上耗费大量精力。即使是对整体空间相关性较弱的HSI,S-LRTA也能得到比LRTA更高的分类精度。下面介绍与本发明相关的一些概念
I. 张量
张量即多维数组, 可记为leRi、¥M—rM ,其中义,规=1,M称为维度或模式,V表示阶数,7 表示实数。向量与
矩阵分别为一阶和二阶张量,乃张量的特例。 2.张量的模式η展开
对张量进行模式η展开(mode-n unfolding)即把张量矩阵化。已知一个三阶张量
Le,做模式η展开得到展开矩阵,元素的位置坐标由变为
(h’J),其中行坐标: 保持不变,列坐行的计算规则如下
模式1:/ = 12+03 — 1)13(I)
模式 2 :/ = I1 + (J3-IJI1(2)
模式3 = J = V(I2-I)I1(3)。3.张量和矩阵的模式d乘法
一个张量He Rn^-xnM和一个矩阵溢e R!d^d 在模式d上相乘(mode-n tensor matrix product), I <d <M,它们的积定义为
7 =Xxrf .4(4)
具体地,乘积中每个元素的计算规则如下
(—d, >^+1 * * M Σ (气 ” -Md ” - mM ^dnd )(5)
η
其中,[e RNl x."xNd -Ix !d xNd +i.xWM。通俗地说,求一个张量和矩阵的n阶乘积,
就是先把这个张量展开成模式n,再与矩阵相乘,然后将所得矩阵转换回张量的形式。4. Tucker张量分解模型
张量分解模型分为PARAFAC和Tucker两大类。本发明采用的是Tucker模型。已知一
个张量,对I进行Tucker模型分解,如式(6)所示
F= Xx1 Fm x7 Fm - Xm Fim + B(6)
................ ..................... 丄JiHJ..................其中是核张量;矩阵…,M可称为压缩矩阵、因
子矩阵、模式矩阵、投影矩阵等;¥表示近似误差。Tucker分解模型的特点在于它充分地利用了各模式分量的相互作用[3]。

发明内容
本发明的目的在于提出一种能够最大限度地利用区域空间相关性和光谱间相关性、不依赖降维子空间维度、与图像整体空间相关程度无关的高光谱图像降维方法。本发明提出的高光谱图像降维方法,是一种分块低秩张量分析法(Subtensorbased Lower Rank Tensor Analysis,记为 S-LRTA),即 S-LRTA 的重点在于分块处理,具体发明内容是将空间维划分成若干相同大小的子区域,每一子区域对应一个子张量,对每一子张量依次进行LRTA降维和分类。已知原高光谱图像张量e i J°lXio2Xl3,其中,第一、二维表示空间,第三维
表示光谱;已知分块尺寸为鸟,其中马, 位;已知每块子张量的降维子空间维度为( ‘巧,其中在张量分析过程中用到,而不在降维结果中体现[2]。已知地物类别的编号为0,2,…C}。具体步骤如下
步骤I、保持Ici e的第三维不变,将其第一、二维的边界分别作镜像
扩展,得到{ E .i ,使得I1 modB1 = Q,I2 mod52 = O,其中表不取余运算。步骤2、在空间上划分!E Rhxhxh ,总共得到I块大小相同的子张量,
每块子张量足 ,《 = 1,2 N,其中Ar= (/j爲)X(/2丨馬),I表示整除运算,下行表示子张量的编号。分块的方法如图I所示。步骤3、对每一子张量足=1,2-_ JV进行基于低秩张量分析的降维,得到各子张量降维结果e RBixB2xF,h = 1,2- N。步骤4、采用有监督分类器对E Rhx82xp,η =1,2…N进行分类时,具体操作如下
(a)设定一个样本个数的下限阈值T,找出训练样本个数大于既定阈值Γ的子张量e Q13Q1 = ---Jia --- τ^ },πα e Z+ ,πα < N,a - !---N13N1 < N 进行分类,
其中Q1表示已分类的子张量的编号的集合,T12表示已分类的子张量的编号, 表亍τ在
所有已分类的子张量中的序列号,Ni表示已分类的子张量的总数。(b)对于原训练样本数量不足的子张量Kn,^ e Q,q = ^r1 ---TIb -- ^ },nb e 2' < N,i> = I--JV2,N1 + N2 =F5Q3Oq = 0

其中Ω2表不未分类的子张量的编号的集合,%表不未分类的子张量的编号,b表不^在所有未分类的子张量中的序列号,I2表示未分类的子张量的总数。按照^ = P-JV2,每次取出一个未分类的子张量足Κ, =%€Ω2 ,依次考察其上、下、左、右四个方位上的子张量。如果某方位上存在分类完毕的子张量£H# = raeQi,则将待分类的子张量
Jf 5w = Jril e Ω ,与之合并后形成新的张量XX e R瑪卿h (上下两个
-Tl jQAm O
子张量合并)或、e JlB1XiB2Xl3 (左右两个子张量合并)再做低秩张量分析
降维,以分类完毕的像元作为训练样本对待分类的子张量进行分类。如图I右侧所示,深灰色的块代表将要分类的子张量(尺寸为务><乓><4 ),带星号的块表示与之相邻的子张量,如图I左侧所示,带框的两个子张量合并后形成新的子张量(尺寸变为玛χ(^*2)^3)。(C)综合(b)中当前待分类的子张量足 ,K 二 Q2的每一个像素的所有分类结果= c^ (U…C},k = I--(B1B2)3J = I…JJ < 4 (其中,表示像素的编
号,j表示与足相邻的四个方位上所有分类完毕的子张量的编号,若存在j
个分类完毕的子张量,像素ft就有/种分类结果),地物类别e出现的频率最高就将该像素划归为此类;若有几种类别的频率相同,则参考与该子张量相邻的训练样本,训练样本中类另扣出现的频率最高就将该像素划归为此类;若仍不能判决,则随机选取训练样本中出现
频率最高的地物类别中的一种作为该像素的类别;分类判决后,令邱=IV1 +1,W2 = N2 -I,将该子张量的编号巧从02中去除,并添加至。(d)重复执行(a),(b),(c),直至所有子张量都已分类完毕,即Ni = NjN2 = O。步骤5、将每一子张量的分类结果Ii M e i 4xSj ,η = 1,2-- N按其在空间上
对应的位置合并,形成整幅图像的分类结果M e。本发明的优点
本发明是一种新的基于张量分析和分块思想的降维和分类算法,不仅吸收了原张量降维方法的所有优点如保持高光谱数据的空间分布特性、挖掘空间和光谱的联系,还省去了子空间维度的估计流程,并大幅提高了分类精度。理由如下由于子张量涵盖的空间范围小、所包含的像素数少、像素的种类单一,则空间相关程度高;而且一般的HSI波段数众多、波段宽度狭窄,光谱相关性明显,无须划分原有的光谱,也能使每一子张量兼具强烈的空间相关性和谱间相关性。因此,在每一块子张量中,LRTA都能取得良好的降维效果,使得分类精度大幅提升,也就无需HSI具有明显的整体空间相关性。并且,每一子张量的子空间维度对分类精度的影响也大为下降,也就没有必要在子空间的估计上耗费精力,更何况现有的子空间估计算法本身并不可靠。仿真和实地数据实验表明,我们的算法与LRTA算法相比明显具有更高的分类精度,无论HSI有无明显的整体空间相关性,即使任意设置子空间维度,S-LRTA的分类精度依然很高。因此,该发明具有重要的实际意义。对于实际高光谱遥感数据实验,该方法也得到了理想的结果,进一步证实了方法的有效性和对于各种不同数据的适用性。


图I分块的方式及子张量的合并。图2回形仿真HSI中,(a) 9种地物的光谱曲线,(b)地物分布情况。图3回形仿真HSI中,LRTA的降维效果与整体空间相关性的关系。(a) SVM,(b)
KNN。图4 回形仿真 HSI 中,S-LRTA 的(^1, K P)设为(I, I, I),LRTA 的(A, K7, P)为Hysime,AIC或MDL算法的估计结果,比较S-LRTA和LRTA的降维效果。(a) SVM, (b) KNN。图5带宽为8个像素的回形仿真HSI中,S-LRTA和LRTA的子空间设置相同时,比较两者的降维效果。图6 Indiana数据。(a)伪彩色图;(b)地物真实分布。图7 Indiana 数据中,比较 S-LRTA、LRTA 以及 PCA 的降维效果。(a) SVM, (b)
KNN。图8 Indiana数据中,当( )为(6,6)时,S-LRTA的降维效果与子空间维度的关系。图9 Indiana数据经过S-LRTA降维、SVM分类得到的地物分布图。(AA)及相应的总体分类精度为(a) (2,2),100%, (b) (6,6), 98. 82%, (c) (10,10),92.37%。图10 Indiana数据中,(W)设为(1,I, I)时,S-LRTA的降维效果与分块尺寸的关系。
具体实施例方式通过仿真数据和真实数据实验,将本发明提议的S-LRTA与现有的LRTA和PCA降维方法进行比较,证明S-LRTA的优越性。为了量化HSI的“空间相关性”和“光谱间相关性”,本发明采用“平均相关系数”衡量相关程度,即对HSI张量在各模式上的展开矩阵分别求相关系数矩阵的平均值。这种方法简单客观。对于降维效果,则采用总体分类精度(Overall Accuracy, OA) [I]作为评判依据。已知地物真实,OA表示所有类别分类正确的样本点数量的总和的平均值,计算公式如⑵所示
权利要求
1. 一种基于分块低秩张量分析的高光谱图像降维和分类方法,其特点在于用三阶张量描述高光谱图像,将空间维划分成若干相同大小的子区域,而保持原来的光谱维不变,每一子区域对应一个子张量,对每一子张量依次进行基于低秩张量分析的降维和分类;已知原高光谱图像张量X0 E i j°ixi°2xj3,其中,第一、二维表示空间,第三维表示光谱;已知分块尺寸为马X鸟XJ3 ,其中B1II01, B2^Im ;已知每块子张量的降维子空间维度为(IT1A2J),其中4, 在张量分析过程中用到,已知地物类别的编号为{1,2,…C},具体步骤如下 步骤I、保持1(3 e Hh1xh2xh的第三维不变,将其第一、二维的边界分别作镜像扩展,得到[e Rhxhxh ,使得J1 modB1 = 0>J2 modB2 = O,其中mt>d表示取余运算;步骤2、在空间上划分Ie,总共得到ΛΓ块大小相同的子张量,每块子张·量支 , =1,2…其中I= (I1丨B1) X (J2丨S2),丨表示整除运算,下标表示子张量的编号; 步骤3、对每一子张量LJi = 1,2--N进行基于低秩张量分析的降维,得到各子张量降维结果e RBl'AB2"p,n = 1,2…N ; 步骤4、采用有监督分类器对E RSl'碼xP,n 二 1,2-N进行分类时,具体操作如下(a)设定一个样本个数的下限阈值τ,找出训练样本个数大于既定阈值T的子张量Σκ,η e Q15Q1 = {πχ —πα —πΝι}7πα e Z+,πα < N,a = I-N17N1 < N 进行分类,其中Q表示已分类的子张量的编号的集合τ表示已分类的子张量的编号表示&在所有已分类的子张量中的序列号,AT1表示已分类的子张量的总数; (b)对于原训练样本数量不足的子张量e Q2fQ2 = (/T1 --- --- },jt& e Z+,<M,b = I--Ar2,M1 + N2 = AT,O, 0= 0其中化表示未分类的子张量的编号的集合,V表示未分类的子张量的编号,d表示在所有未分类的子张量中的序列号,AT2表示未分类的子张量的总数;按=I-Af3,每次取出一个未分类的子张量支,依次考察其上、下、左、右四个方位上的子张量,如果某方位上存在分类完毕的子张量支Q1,则将待分类的子张量In 二 π、e Q2与之合并后形成新的张量Hirflff6 e R28卿'h或e p,2Bf.h再做低秩张量分析降维,以分类完毕的像元作为训练样本对待分类的子张量进行分类;(c)综合(b)中当前待分类的子张量圣 的每一个像素的所有分类结果 ·4,其中,k 表不像素的编号,j 表不与KnA = ^ Q2相邻的四个方位上所有分类完毕的子张量的编号,若存在』个分类完毕的子张量,像素ft就有J种分类结果,地物类别C出现的频率最高就将该像素划归为此类;若有几种类别的频率相同,则参考与该子张量相邻的训练样本,训练样本中类别-出现的频率最高就将该像素划归为此类;若仍不能判决,则随机选取训练样本中出现频率最高的地物类别中的一种作为该像素的类别;分类判决后,令= ^+!,F2 = M2-I ,将该子张量的编号%从02中去除,并添加至q ; (d)重复执行(a),(b),(c),直至所有子张量都已分类完毕,即N1=N, N2 = Q ; 步骤5、将每一子张量的分类结果e 按其在空间上对应的位置合并,形成整幅图像的分类结果M E Λ11'"2。
全文摘要
本发明属于遥感图像处理技术领域,具体为一种基于分块的低秩张量分析的高光谱图像降维和分类方法。本发明根据高光谱图像的三维数据结构及其强烈的光谱特性和局部空间相关特性,将分块思想引入基于低秩张量分析的高光谱图像降维方法中,克服了图像的整体空间相关性较弱以及降维子空间维度的设定对降维效果的负面影响,最终得到一种能够大幅提高图像总体分类精度的新型降维方法——分块低秩张量分析法。该算法对各种不同的高光谱数据(包括仿真数据和实际数据集)都表现出良好的适用性。在基于高光谱遥感图像的高精度的地物分类方面具有重要的应用价值。
文档编号G06K9/62GK102938072SQ20121040336
公开日2013年2月20日 申请日期2012年10月20日 优先权日2012年10月20日
发明者陈昭, 王斌, 张立明 申请人:复旦大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1