一种实现高光谱地物精细分类的独立成分分析全局搜索方法

文档序号:6129097阅读:192来源:国知局
专利名称:一种实现高光谱地物精细分类的独立成分分析全局搜索方法
技术领域
本发明涉及遥感信息处理领域,具体的说是一种应用于高光谱数据特征特取和地物精细分类的基于独立成分分析的全局搜索方法,能有效的提高地物分类精度。

背景技术
高光谱成像仪是一种新型的遥感载荷,其光谱具有紧密、连续的特点,可以同时记录被测同一地物的光谱和空间信息特征,使本来在宽波段遥感中不可能探测的物质在高光谱遥感中能被探测到,因此,高光谱遥感为地物的精细分类提供了强有力的探测手段。目前,应用高光谱图像数据进行地物分类的方法主要分为两大类有监督和无监督分类方法,监督分类方法是在假设存在可靠的先验知识的情况下能得到较好的性能。然而,由于实际光谱数据易受环境影响、现有光谱数据库不够健全以及偏远和自然条件恶劣地区的地面真实测量几乎不可实现等因素,导致先验光谱信息获得成为目标监督分类算法的难点。因此,无监督分类成为国内外许多学者的研究热点 独立成分分析(Independent Component Analysis,ICA)是近几年才发展起来的一种基于信号高阶统计特性的分析方法,该方法的目的是将观察得到的数据进行某种线性分解,使其分解成统计独立的成分。正是由于这一特点,使ICA在信号处理领域受到了密切的关注,随着近年来在ICA方面研究兴趣的增加,使它在遥感等许多领域也有了非常广泛的应用。目前,ICA研究主要大致分为两大类,基于信息论准则的迭代估计方法和基于统计学的代数计算方法,从原理上讲,这两种方法都是利用了源信号的独立性和非高斯性(nongaussianity)。在基于信息论的方法研究中,各国研究者从最小化互信息、极大似然和最大化负熵(negentropy)等角度提出了一系列的估计算法,理论上这些算法在特定条件下是等价的;基于统计学的方法中主要是利用二阶累积量(Second-order cumulant)、四阶累积量等高阶累积量的方法。在利用上述各种算法采用常规数值分析方法进行求解时,普遍存在容易陷入局部最优解的问题。针对这个问题,许多学者也提出了许多的神经学习算法与ICA相结合的方法,但是算法的有效性直接受到了依赖于信号概率分布函数影响的神经元激活函数的影响。
量子遗传算法(Quantum Genetic Algorithm,QGA)是量子计算与进化计算理论相结合的产物,它是一种以量子概念和原理为基础的概率搜索算法。在QGA中,采用量子位染色体的编码方式,利用量子门作用和量子门更新策略完成进化搜索。与传统遗传算法比较,具有种群规模小而不影响算法性能、同时兼有收敛速度快和全局寻优能力强的特点。


发明内容
针对ICA算法容易陷入局部最优解、基于神经学习算法的ICA受神经元激活函数的影响,以及高光谱监督地物精细分类算法获取先验知识困难等问题,本发明提出了实现高光谱无监督地物精细分类的基于改进量子遗传算法的ICA方法,该方法克服了监督分类方法获取先验知识困难、有效的提高了ICA全局搜索能力以及高光谱地物分类的精度。
本发明的技术解决方案为以基于改进量子遗传算法的独立成分分析算法为核心实现无监督高光谱地物精细分类,量子遗传算法中增加了量子交叉和量子变异,并以四阶累积量-峰度作为量子遗传算法的适应度函数,约束条件的满足通过数据中心化和球化来实现。具体步骤如下 (1)读取观测得到的数据X; (2)建立基于峰度的ICA模型X=AS; (3)对X进行中心化和白化处理; (4)初始化种群和遗传代数t=1,并对种群中染色体进行量子位编码; (5)由编码后种群的观测态产生二进制解,得到分离矩阵,计算分离后信号,并运用适应度函数对其进行评价,同时保存最佳解; (6)方法终止条件判断如果满足终止条件,则方法结束,执行步骤(10),并保存当前的最佳解,否则继续方法; (7)执行量子交叉操作,量子旋转门更新策略,量子非门变异操作,以得到新的种群; (8)由种群的观测态产生二进制解,得到分离矩阵,并计算分离后信号,并对分离后信号进行中心化和白化操作,并运用适应度函数对其进行评价,同时保存最佳解; (9)遗传代数增加1,执行步骤(6); (10)结束迭代运算,由最优解得到分离矩阵,并计算分离信号。
(11)方法的后续处理,主要包括独立成分排序、图像二值化、地物分类。



图1为本发明实现高光谱地物精细分类的流程图。
图2为改进量子遗传操作的具体步骤。
图3为地面参考信息,参考标识C4表示水稻,V4表示红薯,V13表示香菜。
图4为本发明实现高光谱地物精细分类的结果,其中,(a)为水稻,(b)为红薯,(c)为香菜。。

具体实施例方式 如图1所示,本发明的具体实施方法如下 1.基于峰度的ICA模型建立 ICA是一种产生统计独立成分的多元变量数据分析方法,在利用其进行地物分类时,每一类别作为独立成分表示出来,因此得到了类别的可分离性最大化。设观测信号X=[x1,x2,...,xm]T是m维的随机向量,源信号S=[s1,s2,...,sn]T是n维的独立随机向量,混合矩阵A为m×n维非奇异矩阵,则它们的线性组合可以描述为 X=AS(1) (1)式称为ICA模型。ICA的实质是在源信号s和混合矩阵A未知的情况下,根据已知的观测信号X利用源信号S的统计特性,确定分离矩阵W,使Y=WX,且满足Y=[y1,y2,...,yn]T的各个变量之间尽可能的相互独立,则Y就是S的一个估计,同时可以确定混合矩阵A=W-1。
在估计ICA模型中利用的主要方法有非高斯性的最大化,互有信息的最小化和极大似然估计。由统计论中的中心极限定理一组独立随机变量和的分布比任何源信号更接近于高斯分布,因此,可以将非高斯性作为随机信号相互独立的度量。根据这一定理,本发明中采用非高斯性的最大化估计ICA模型,利用四阶累积量—峰度进行非高斯性的度量,这主要是因为峰度在理论和计算上都非常的简单,且易于实现。随机变量y的峰度定义为 kurt(y)=E{y4}-3(E{y2})2(2) 对于一个高斯分布的随机变量而言,它的峰度等于“0”,但是对于大多数的非高斯随机变量来说,峰度不等于“0”。由于峰度有正有负,因此,非高斯性的测量一般利用峰度的绝对值或是平方,值为“0”的是高斯变量,大于“0”的是非高斯变量。
2.数据的中心化、球化 采用的是最大化非高斯性进行估计ICA模型,采用峰度作为非高斯性的度量方法的前提假设条件随机变量零均值,同时满足E{yyT}=I。因此需要对待处理的信号变量以及遗传操作的每一代信号变量进行中心化和球化处理,中心化的目的是保证随机变量零均值,中心化后的信号由观测信号X减去X的均值得到;球化的目的是保证随机变量满足E{yyT}=I条件,球化处理由主成份分析(Principal Component Analysis,PCA)算法实现。
3.种群量子位编码、初始化,适应度函数选择 (1)量子位编码 量子遗传算法中最小的信息存储单元是量子位,它是基于量子位概念的概率编码方式。一个量子位染色体由一串量子位组成。一个量子位可以表示“1”状态,“0”状态,或者两个状态的线性叠加状态,其状态可以表示为|>=α|0>+β|1>,其中,α,β是两个复数,分别表示处于“0”状态和“1”状态的概率幅,|α|2,|β|2分别表示量子位为“0”状态,“1”状态的概率,并且满足归一化条件|α|2+|β|2=1。
当一个量子位染色体长度为m时,它可以表示为采用量子位的编码方式,一个量子位染色体能够表示多个状态的线性叠加,因此与传统遗传算法比较,它具有更好的种群多样性,并且具有种群规模小而不影响算法性能。
因此,采用的量子位编码方式具有保持种群的多样性和算法计算速度快等优点。本发明涉及的基于量子遗传算法的ICA方法,对分离矩阵W采用量子位编码方式,每个染色体的量子位长度为10。如果m=n=4,则分离矩阵W为4×4维方阵,对其进行量子位编码,用qit表示第t代第i个染色体个体,具体编码方式如下 (2)初始化种群 首先,设种群规模为5,即种群由5个分离矩阵组成。初始化种群时,所有的(i=1,2,...,5)中的αij0,βij0(j=1,2,...,10)应该全部都初始化为

这样在一个量子位染色体中,qi0表示的所有状态的概率相同。
(3)适应度函数选择 选择对分离后信号的估计Y=WX=[y1,y2,...,yn]T的各个变量峰度的绝对值的和作为适应度函数,表达式如下 因此,通过观测信号X和分离矩阵W,使J(Y)最大化,从而分离出各个独立成份。这个优化问题的约束条件是随机变量零均值,而且满足E{yyT}=I,通过对数据的中心化和球化来实现。在这种约束条件下,最大化峰度实现非高斯测量,即对于某一分离矩阵W,J(Y)越大,表明Y=WX=[y1,y2,...,yn]T的各个变量之间独立性越强。
4.改进量子遗传算法的量子遗传操作 本发明涉及的量子遗传算法是Dr.Han量子遗传算法的改进,增加了量子交叉操作、量子非门变异操作,执行量子交叉为了充分利用所有染色体的信息以产生更多的新模式,执行量子变异操作是为了避免出现早熟收敛。因而,改进量子遗传算法既具有快速的收敛特性,又具有良好的全局搜索能力。执行的量子遗传操作如附图2所示。具体实现如下 (1)量子交叉操作 交叉是把两个父代染色体个体的部分结构加以替换重组而生成新的染色体个体的操作,其目的是为了能够在下一代中产生新的染色体个体,通过交叉操作,遗传算法的搜索能力得以飞跃的提高,以免陷入局部极值点。本发明中利用量子的相干特性,进行量子相干交叉操作,即量子交叉操作。量子交叉操作具体实现过程如下 (a)重新排序种群的各个染色体个体。本文采用的是随机排序方式。
(b)确定第一个新染色体个体。取第一个染色体个体的第一位基因作为新染色体个体的第一位基因;取第二个染色体个体的第二位基因作为新染色体个体的第二位基因;这样循环反复,直到新染色体个体与原来的染色体个体具有相同的基因数。
(c)以此类推,确定第二个新染色体个体,第三个新染色体个体,...,直到生成的新种群与原来种群具有相同的规模。
(d)量子交叉操作结束。
(2)量子旋转门更新操作 通过形成合适的量子门U,实现更新种群的操作,以得到适应度更高的模式。量子门的种类有很多,如量子非门、量子受控非门、量子Hadamard门、量子旋转门等。量子门操作都要满足U*U=UU*,其中U*是U的共轭伴随矩阵。在本发明中采用的是量子旋转门进行种群的更新,并且定义它的形式如下 则有 其中,αi′,βi′(i=1,2,...,n)是更新后量子位染色体的取值;θi为量子旋转门旋转的角度,并且θi=s(αi,βi)·Δθi,其大小Δθi和方向s(αi,βi)的确定方法一般是事先设计好的,其原理是当前解xi向最佳解bi逐渐逼近。本发明中采用的Δθi和s(αi,βi)调整策略如表1所示。表1中,f(x)和f(b)分别表示当前解和最佳解的适应度函数值。
表1 旋转角的确定方法 (3)量子变异操作 变异的作用主要在于阻止未成熟收敛和提供算法局部搜索能力。在改进量子遗传算法中,通过量子非门设计了一种量子变异操作。量子变异操作实际上是更改了该量子比特态叠加的状态,使得原来倾向于收敛到状态“1”的变为倾向于收敛到状态“0”,或者相反。显然,该变异操作对染色体的所有叠加态均同时有效。具体方法如下 (a)以一定的概率Pm从种群中选取若干个染色体个体; (b)对选中的染色体个体按确定的概率确定变异位; (c)对选中位量子位的概率幅执行量子非门操作,即完成该量子位的变异操作。
5.独立成分排序 应用本发明涉及的基于量子遗传算法的ICA进行高光谱地物精细分类时,为了获得含有所感兴趣目标信息,需要对所获得的独立成份进行排序。采用的排序指标是k32,其中,k3表示数据的三阶累积量-偏度(skewness)。因为偏度能够直接反映高光谱数据中目标与背景在光谱空间上的偏离程度。
6.图像二值化 获得了反映目标地物的独立成份之后,采用适当的设定阈值策略将图像二值化,从而实现抑制背景,突现目标。阈值设定的方法很多,如果设定的不合适,就会引起降低分类精度,加大错分率等问题。在本发明中,阈值设定为[m-3σ,m+3σ],其中m和σ分别表示单个成份的均值和标准差。
为了更好的说明本发明涉及的实现高光谱地物精细分类的基于改进量子遗传算法的ICA方法,利用PHI航空高光谱数据进行江苏方麓茶场地区农作物精细分类,图3给出了地面参考信息,其中,参考标识C4代表水稻,V2代表红薯,V13代表香菜。图4给出了本发明涉及算法的非监督分类结果,其中,(a)为水稻,(b)为红薯,(c)为香菜,实现了在未知任何地面信息的情况下的高光谱数据农作物精细分类。通过图3与图4的比较与分析,可以看出本发明涉及方法的分类结果中不存在错分类,分类精度较高;并且该方法具有较快的收敛速度。
权利要求
1.一种基于独立成分分析的全局搜索算法的高光谱地物精细分类方法,包括如下步骤
(1)读入高光谱数据;
(2)建立基于峰度的独立成分分析模型;
(3)数据进行中心化和球化;
(4)基于量子遗传算法的独立成分分析迭代计算;
(5)独立成分排序;
(6)图像二值化;
(7)获取地物分类结果。
2.根据权利要求1所述的高光谱地物精细分类方法,基于峰度的独立成分分析模型为
设观测信号X=[x1,x2,...,xm]T是m维的随机向量,源信号S=[s1,s2,...,sn]T是n维的独立随机向量,混合矩阵A为m×n维非奇异矩阵,则独立成分分析模型可以描述为
X=AS
独立成分分析的实质是在源信号S和混合矩阵A未知的情况下,根据已知的观测信号X利用源信号S的统计特性,确定分离矩阵W,使得Y=WX,且满足Y=[y1,y2,...,yn]T的各个变量之间尽可能的相互独立,则Y就是S的一个估计,同时可以确定混合矩阵A=W-1。在独立成分分析模型参数估计中采用最大化非高斯性的方法,利用的是数据的四阶累积量-峰度(Kurtosis),随机变量yi的峰度定义如下
其中,E表示变量的均值。
3.根据权利要求1所述的高光谱地物精细分类方法,实现步骤(4)的流程如下
(1)初始化种群和遗传代数t=1,并对种群中染色体进行量子位编码;
(2)由编码后种群的观测态产生二进制解,得到分离矩阵,计算分离后信号,并运用适应度函数对其进行评价,同时保存最佳解;
(3)终止条件判断如果满足终止条件,则结束,执行步骤(7),并保存当前的最佳解,否则继续;
(4)执行量子交叉操作,量子旋转门更新策略,量子非门变异操作,以得到新的种群;
(5)由种群的观测态产生二进制解,得到分离矩阵,并计算分离后信号,并对分离后信号进行中心化和白化操作,并运用适应度函数对其进行评价,同时保存最佳解;
(6)遗传代数增加1,执行步骤(5);
(7)计算分离矩阵和分离信号,结束。
4.根据权利要求1所述的高光谱地物精细分类方法,实现步骤(5)的过程中采用的独立成分排序指标为k32,其中,k3为三阶累积量-偏度(Skewness)。
全文摘要
本发明涉及一种在无先验知识情况下实现高光谱地物精细分类的独立成分分析全局搜索方法,该方法包括读入高光谱数据,基于峰度的独立成分分析模型的建立,数据中心化,数据球化,基于量子遗传算法的迭代求解计算,独立成分排序,图像二值化,地物分类。通过本发明涉及的方法能够在不建立数据背景模型的情况下,利用数据本身的高阶统计特性实现高光谱数据的无监督地物精细分类;同时,避免了独立成分分析方法在求解过程中容易陷入局部最优解的问题,并且与传统的遗传算法比较,本发明中采用的量子遗传算法具有迭代次数少、收敛速度快、搜索效率高和全局搜索能力强等特点。
文档编号G01N21/31GK101101234SQ20071011780
公开日2008年1月9日 申请日期2007年6月25日 优先权日2007年6月25日
发明者赵慧洁, 娜 李, 贾国瑞 申请人:北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1