一种基于因子分析模型的高光谱数据降维方法

文档序号:6150780阅读:239来源:国知局
专利名称:一种基于因子分析模型的高光谱数据降维方法
技术领域
本发明涉及一种基于因子分析模型的高光谱数据降维方法,属于高光谱 数据处理方法与应用技术领域,适用于高光谱数据降维的理论方法和应用技 术研咒。
背景技术
高光谱成像仪是一种新型的遥感载荷,其光谱具有紧密、连续的特点, 可以同时记录被测同一地物的光谱和空间信息特征,因此,高光谱数据维数
高且数据量大;由于光谱分辨率较高,各个波段之间具有较高的相关性,存 在了大量的冗余信息。并且随着波段数据的增加,数据处理量呈指数上升。 因此,如何将高光谱数据降维,消除波段间的相关性,成为数据处理的关键 环节。
目前针对高光谱数据降维已经提出了很多方法,主要分为波段选择和特 征提取两大类。波段选择的目的是将n维高光语数据用具有代表意义的m 维(m<n)数据子集代替,该类方法的问题是虽然较好的保留了原图像数据 的特性,但是损失了高光谱数据的信息量以及光谱细节信息;特征提取的目 的是将n维高光谱数据压缩到m维(m<n)模式空间中,使类别间的可分 性最大。因此,该类方法在数据降维的同时突出了图像数据间的差异性,但 改变了数据的原有特性。目前数据降维方法主要存在的问题是不能很好的 保留数据提供的所有有用信息,不能将相同类型地物特征表示在相同的波段 中。

发明内容
本发明的目的是针对现有高光谱数据降维方法损失数据信息等不足提 出 一种基于因子分析模型的高光语数据降维方法。本发明的技术解决方案是本发明一种基于因子分析模型的高光谱数据
降维方法,具体是指 一种因子分析模型将高光谱高维空间数据降到表征高光 谱数据本征特性的低维空间的方法。该方法主要是利用因子分析模型,并通 过计算因子载荷矩阵、基于方差最大的因子载荷旋转、计算因子得分得到表 征高光谱数据的本征维数,从而实现高光谱数据降维。
本发明 一种基于因子分析模型的高光谱数据降维方法,其步骤如下 (1 )高光谱遥感数据读入;
(2) 建立高光谱数据降维的因子分析模型;
(3) 计算高光谱数据的均值、协方差矩阵以及相关矩阵;
(4) 计算数据相关矩阵的特征值和标准化特征向量;
(5) 由主成分解方法进行因子载荷矩阵的求解;
(6) 计算因子分析模型中特殊因子的方差矩阵和数据变量的共同度;
(7) 计算基于方差最大的因子载荷旋转矩阵;
(8) 利用基于加权最小二乘方法计算因子得分;
(9) 得到表征高光语数据的本征维数,实现高光谱数据降维。 其中,步骤(2)中所述的"建立高光谱数据降维的因子分析模型",
其因子分析模型为
式中,火=(^^,...,、)'是可观测的随机变量,均值// = £(", X的公共因子 F = (^,F2,...,Fm)' (m<p)是不可观测的随机变量,且满足均值£(尸)=0、方差 D(F) = Im (即F各个分量方差为l且互不相关),特殊因子£ = (£,2,..., )'与
F互不相关,且满足均值£(。 = 0、方差D(f)^Aag(a,2,c722,…,a/):^:Z);公共因
子一般对X每一个分量都起作用,而特殊因子只对X的某一分量起作用, 而且特殊因子之间以及特殊因子与公共因子之间互不相关;因子载荷矩阵 ^二( )p^是待估计的系数矩阵,在因子分析中,特殊因子起残差或噪声的 作用。其中,步骤(3)所迷的"计算高光谱数据的均值、协方差矩阵以及相
关矩阵",其计算方法如下
<formula>formula see original document page 8</formula>式中,Jf为数据的均值;r为协方差矩阵;i 为相关矩阵;"表示像元数目; A,)表示第f个像元。
其中,步骤(4)中所述的"计算数据相关矩阵的特征值和标准化特征
向量,,,其含义说明如下计算相关矩阵/ 的特征值为;i^;^^.々;ip20,以
及各个特征值对应的施密特正交化的特征向量A,^,…,/p。
其中,步骤(5)中所述的"由主成分解方法进行因子载荷矩阵的求解", 其i十算方法:^下
首先根据,+^ +…"附^0.9的最小整数,确定公共因子个数m; A +…+义m+…、
然后利用主成分解的方法求解因子载荷矩阵利用步骤(4)中计算得
到的相关矩阵i 的特征值为;i^;^^.々;ip^),对应的施密特正交化后的特征
向量为H..力,则利用相关矩阵/ 的谱分解/ = ^义,/,/:,得到因子分析模
型的一个解h(V^,…,V^O( U。
其中,步骤(6)中所述的"计算因子分析模型中特殊因子的方差矩阵 和数据变量的共同度",其含义说明如下因子分析模型中特殊因子的方差
为c7,2 = l-|>,;,(/ = 1,2".,,P),变量x,的共同度V估计为/^IX(hl,2,…,p)。 其中,步骤(7)中所述的"计算基于方差最大的因子载荷旋转矩阵",右乘正交矩阵r,使得」r具有更鲜明的意义,旋转后的公共因子向量为 F、r'F,它的各个分量K,《,…,《也是互不相关的公共因子;根据正交矩
阵r的不同选取方式,将构造出不同的正交旋转方法,本发明中采用的方法 是最大方差的旋转方法;具体实现过程如下
令Z:^^(《)p^,《.=《//z,,《=丄尤《,则」'的第j列元素平方的相
对方差可以定义为&=丄力(《-《)2 ,式中,取《是为了消除《符号不同
的影响;用除以/z,是为了消除各个原始变量I,对公共因子依赖程度不同的 影响;最大方差旋转方法就是选择正交矩阵r,使,所有m列元素平方的相 对方差V达到最大r = ^+K2+... + 、;逐次对每两个公共因子进行上述旋转, 对公共因子巧和F;旋转,就是对A矩阵的第l列和第k列进行正交变换,使 这两列的元素平方的相对方差之和最大,而其余列不变,旋转矩阵G可以表 示为
一l
一sin^
sin^
式中,^是巧和《的旋转角度,矩阵其余元素为0;求^使V达到最大: 由微积分中求极值的方法,将V对P求导,并令其为0:
r^+^+…+^^丄l:(《-《)2+…+丄t(《—
w 、, 山^ A ,曰 ^ M —2W/; 戶斤以,由一 =0, 4亏tan46> =-^——
,式中"=2>,, K = |>,
/-1『=!>,2-v'2), M = 2^>,v,, ",=(,)2+(,)2, v,=2^, ",i、 ",2是因子
'=1 …1 A A A
载荷矩阵中的元素,V是变量x,的共同度。
第一轮旋转后的因子载荷矩阵为』",然后开始下一轮的旋转,得到一 系列的因子载荷矩阵为Z1)3(2),...,#、),...,则必有"^r(2)么.^F"、…, rw为^w各列元素平方的相对方差之和,实际应用中,当r"-「w^s时,
即可停止;5走转。
其中,步骤(8)中所述的"利用基于加权最小二乘方法计算因子得分", 其含义说明如下在得到A和D的基础上,采用加权最小二乘对F进行求 解# =(》力-^)-M'ZT'L即得到了 F的加权最小二乘估计,式中,i是估计 得到的因子载荷矩阵,力是估计得到的特殊因子方差矩阵,X是读入数据。
其中,步骤(9)中所述的"得到表征高光谱数据的本征维数,实现高 光谱数据降维",其含义说明如下利用因子得分估计即可得到表征高光谱 数据的本征维数,从而实现了高光谱数据降维。
本发明与现有技术相比的优点在于克服了现有高光谱数据降维方法损 失数据信息、无法保留数据原有特性等局限,本方法利用了因子分析模型, 并采用了基于方差最大的因子矩阵的正交旋转,得到了表征高光谱数据的本 征维数,实现了高光谱数据降维。它具有以下的优点M)利用因子分析 模型对高光谱数据进行建模求得反映高光谱数据结构与特征的本征维数,消 除波段间的相关性的同时简化了数据结构,较好的保持了数据原有特性; (2)利用了基于方差最大的因子载荷旋转,易于各个因子所代表含义的解 释,且每种地物只在一个因子中起主导作用,最大程度的增大了不同类型地 物之间的可分性。


图1为本发明涉及的一种基于因子分析模型的高光谱数据降维方法的实现 流程
10
具体实施例方式
为了更好的说明本发明涉及的基于因子分析模型的高光谱数据降维方
法,利用PHI航空高光谱数据进行江苏方麓茶场地区农作物精细分类。本发 明一种基于因子分析模型的高光谱数据降维方法,实现流程如图1所示,具 体实现步骤如下
(1) 高光谱数据的读入读入方麓茶场PHI高光谱数据,去掉信噪比 低、大气吸收等波段,原数据大小为210x150x64;
(2) 建立高光谱数据降维的因子分析模型; 高光谱数据降维的因子分析模型为
式中,1 = (^乂2,...,164)'是可观测的随机变量,均值^ = £(1), x的公共因子 F =(《,F2,...,FJ' (m<64)是不可7见测的随才几变量,且满足均值£(。 = 0、方
差D(。-L (即F各个分量方差为1且互不相关),特殊因子s-(^&,.,.,sj'浙.
与F互不相关,且满足均值£(£) = 0、方差D(s)-^ag(a,2,cT22,…,cr642)-Z);公
共因子一般对X每一个分量都起作用,而特殊因子只对X的某一分量起作
用,而且特殊因子之间以及特殊因子与公共因子之间互不相关;矩阵
4 =( )^是待估计的系数矩阵,称为因子载荷矩阵,在因子分析中,特殊因
子起残差或噪声的作用;
(3) 计算高光谱数据的均值、协方差矩阵以及相关矩阵;
210xl50x64的高光语数据均值f 、协方差矩阵7、相关矩阵/ 的计算方
一1 "
x =—z%(0 =(5,72"."764)'
1 " — _ 血/
^鳴)=("^S^); (U = 1,2,…,64)式中,f为数据的均值;F为协方差矩阵;i 为相关矩阵;"=210"50表示像 元数目;x(,)表示第f个像元。
(4) 计算数据相关矩阵的特征值和标准化特征向量; 计算相关矩阵i 的特征值为^^^^.々;i6j0,对应的经施密特正交化后
的特征向量为/p^…,仏;
(5) 由主成分解方法进行因子载荷矩阵的求解;
首先根据》0.9的最小整数确定公共因子个数m=6; 然后利用主成分解的方法求解因子载荷矩阵利用步骤(4)中计算得
到的相关矩阵/ 的特征值为;i^4^.々;i64^),对应的经施密特正交化后的
64
特征向量为d…,C,则利用相关矩阵i 的谱分解^ = 得到因子分
析模型的 一 个解,^=(,…,7^/6)=k La;
(6) 计算因子分析模型中特殊因子的方差矩阵和数据变量的共同度; 因子分析模型中特殊因子的方差为—=1-1>〗,(/-1,2,...,64),变量x,的
共同度V估计为V =="…,64);
(7) 计算基于方差最大的因子载荷旋转矩阵;
使得^r具有更鲜明的意义,旋转后的公共因子向量为F、r'F,它的各个分 量《《,...,《也是互不相关的公共因子;根据正交矩阵r的不同选取方式,
将构造出不同的正交旋转方法,本发明中采用的方法是最大方差的旋转方 法;具体实现过程如下
— 1 64
令Z"r—《)64x6,",=";化,《1耳《'则Z的第j列元素平方的1
相对方差可以定义为&="^各(《-《)2 ,式中,取《是为了消除《符号
不同的影响;用《除以/z,是为了消除各个原始变量义,对公共因子依赖程度不 同的影响;选择除以/ ,是因为Z的第i行平方和
64
《2=》';2=(c'"a:)
一",",2,…,",64)rr'
64
2 《
最大方差旋转方法就是选择正交矩阵r,使Z所有6列元素平方的相对 方差V达到最大F = K + r2+ + r6;逐次对每两个公共因子进行上述旋转, 对公共因子/;和《旋转,就是对A矩阵的第l列和第k列进行正交变换,使 这两列的元素平方的相对方差之和最大,而其余列不变,旋转矩阵r^可以表 示为
一l
r议=
-sin<9
sin^
COS0
式中,^是巧和巧的旋转角度,矩阵其余元素为0;求W吏V达到最大, 由微积分中求极值的方法,将V对P求导,并令其为0:
164 一 164 一
r=K+r2十…+^=a(《-S)2十…+^^K-&)2
w 、, a 3「 八4曰 ^ M —2,64 ; 士 " ^ T/ ^
所以,由——=0, ^f亏tan46> =-;——^- , 式中t/ = yw,, 7 =
朋 『-(C/2-F2)/64 台' S '
『=1>,2-《),M = 22>,v,, ",;(+)2 + (,)2, v,=2,,《,、。。是因子
13载荷矩阵中的元素,V是变量x,的共同度。
第一轮旋转后的因子载荷矩阵为』",然后开始下一轮的旋转,得到一
系列的因子载荷矩阵为』1),^4(2),...,#、),...,则必有r")^^2)^..^^^..., 「w为jw各列元素平方的相对方差之和,实际应用中,当W-"-一、f (本发 明中f^0.00l)时,即可停止旋转;
(8) 利用基于加权最小二乘方法计算因子得分; 在得到因子载荷矩阵A和特殊因子方差矩阵D的基础上,采用加权最小二 乘对F进行求解
即得到了 F的加权最小二乘估计;
(9) 得到表征高光谱数据的本征维数,实现高光谱数据降维。
利用因子得分估计即可得到表征高光谱数据的本征维数,从而实现高光 语数据降维;得到了 6个表征所使用高光谱数据的所有信息的本征波段。
权利要求
1、一种基于因子分析模型的高光谱数据降维方法,其特征在于它包含以下步骤(1)高光谱遥感数据读入;(2)建立高光谱数据降维的因子分析模型;(3)计算高光谱数据的均值、协方差矩阵以及相关矩阵;(4)计算数据相关矩阵的特征值和标准化特征向量;(5)由主成分解方法进行因子载荷矩阵的求解;(6)计算因子分析模型中特殊因子的方差矩阵和数据变量的共同度;(7)计算基于方差最大的因子载荷旋转矩阵;(8)利用基于加权最小二乘方法计算因子得分;(9)得到表征高光谱数据的本征维数,实现高光谱数据降维。
2、 根据权利要求1所述的一种基于因子分析模型的高光谱数据降维方 法,其特征在于步骤(2)中所述的高光谱数据降维的因子分析模型为式中,义=(^乂2,...,、)'是可观测的随机变量,均值^ = £(义),X的公共因子 F = (^;,F2,...,Fm)' (m<p)是不可观测的随机变量,且满足均值五(F)-0、方差D(F)-L,特殊因子£ = (^,£2,...,£》'与F互不相关,且满足均值£(£) = 0、方刺'差Z)(s) = ^^(C7 ,C722,..., 2) = Z);因子载荷矩阵^ =( .)pxw是待估计的系数矩 阵。
3、 根据权利要求1所述的一种基于因子分析模型的高光谱数据降维方 法,其特征在于步骤(3)中所述的计算高光谱数据的均值、协方差矩阵 以及相关矩阵计算方法如下式中,f为数据的均值;F为协方差矩阵;i 为相关矩阵;"表示像元数目; X(,)表示第/个像元。
4、根据权利要求1所述的一种基于因子分析模型的高光镨数据降维方 法,其特征在于其步骤(4)中所述的计算数据相关矩阵的特征值和标准化特征向量为相关矩阵w的特征值为;i^;i2 2…》;^20,各特征值对应的施密特正交化的特征向量为H…x。
5、根据权利要求1所述的一种基于因子分析模型的高光谱数据降维方 法,其特征在于其步骤(5)中所述的由主成分解方法求解因子载荷矩阵 计算方法如下首先根据W…+ 、 ^ 0.9的最小整数确定公共因子个数m; 斗+ "/ —.^然后利用主成分解方法求解因子载荷矩阵式中,^为因子载荷矩阵,A,为相关矩阵特征值,/,为相关矩阵特征向量;
6、根据权利要求1所述的一种基于因子分析模型的高光i普数据降维方 法,其特征在于步骤(6)中所述的特殊因子的方差矩阵和数据变量的共同度分别为特殊因子的方差为cj,2=1-尤《,(/ = 1,2,...,/7),变量x,的共同 度V为A、2^,("1,2,…,/^ 。
7、根据权利要求1所述的一种基于因子分析模型的高光谱数据降维方法,其特征在于步骤(7)中所述的基于方差最大的因子栽荷旋转矩阵计 算方法如下Z:^^(《)p環,《=《/A,.,《=丄力《,则,的第j列元素平方的相对方差为^-丄力(《-《)2 ;然后选择正交矩阵r,使Z所有m列元素平 P '=方的相对方差V达到最大r = j/1+K2+ + 、;逐次对每两个公共因子进行上 述旋转,使这两列的元素平方的相对方差之和最大,而其余列不变,旋转矩 阵r&可以表示为cos 6cos^式中,0是公共因子巧和《的旋转角度,矩阵其余元素为0;求^使V达到最 大,得t』=,式中c/ = f ,, f = ^>,, ^ = f (M,2—力,M = 2^>,.v,, M,=(,)2+(,)2, v,=2,, 、",2是因子载荷矩阵中的元素, ;=i & A 勿,.V是变量x,的共同度;第一轮旋转后的因子载荷矩阵为』'、然后开始下一轮的旋转,得到一系列的因子载荷矩阵为^",J(",...,#、 ),...,则必有r0^F(2、...sr(、)s...,为力w各列元素平方的相对方差之和,当- rw s s时停止旋转。
8、根据权利要求1所述的一种基于因子分析模型的高光谱数据降维方法,其特征在于步骤(8)中所述的利用基于加权最小二乘方法的因子得分计 算方法如下采用加权最小二乘对F进行求解,得到了 F的加权最小二乘估 计F-(》》-^)-Vn,式中,^是估计得到的因子载荷矩阵,D是估计得 到的特殊因子方差矩阵,I是读入数据。
全文摘要
一种基于因子分析模型的高光谱数据降维方法,其步骤如下(1)高光谱数据读入;(2)建立高光谱数据降维的因子分析模型;(3)计算数据的均值、协方差矩阵以及相关矩阵;(4)计算数据相关矩阵的特征值和标准化特征向量;(5)由参数估计方法进行因子载荷矩阵的求解;(6)计算因子分析模型中特殊因子的协方差和数据变量的共同度;(7)计算基于方差最大的因子载荷旋转矩阵;(8)利用基于加权最小二乘方法计算因子得分;(9)得到表征高光谱数据的本征维数,实现高光谱数据降维。该方法是一种自动的高光谱数据降维方法,能够有效的去除高光谱数据波段间的相关性、增加地物不同类别间的可分性。
文档编号G01S7/48GK101487892SQ20091007844
公开日2009年7月22日 申请日期2009年2月23日 优先权日2009年2月23日
发明者州 徐, 娜 李, 辉 蔡, 贾国瑞, 赵慧洁 申请人:北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1