一种高光谱图像分类中光谱向量互相关特征的抽取方法

文档序号:6637855阅读:220来源:国知局
一种高光谱图像分类中光谱向量互相关特征的抽取方法
【专利摘要】本发明公开了一种高光谱图像分类中光谱向量互相关特征的抽取方法,包括高光谱图像数据预处理——归一化、去噪、降维等;boostrap采样和加权平均获取参考样本集;光谱信号随机过程理论假设——假设一,光谱信号是一平稳随机过程某一时刻的随机试验,假设二,每个随机试验取值的概率都相等,其次根据随机过程自相关理论对光谱信号进行抽象,得出自相关系数计算公式,最后将其组合成自相关特征向量;采用最优方向法(MOD)对相关性特征向量进行稀疏分解。本发明从随机过程互相关的角度提出高光谱分类中特征抽取方法,具有较好的抗噪性和稳定性高,能够提高高光谱分类的精度。
【专利说明】一种高光谱图像分类中光谱向量互相关特征的抽取方法

【技术领域】
[0001] 本发明属于高光谱图像处理领域,尤其涉及一种高光谱图像分类中光谱向量互相 关特征的抽取方法。

【背景技术】
[0002] 高光谱图像将传统的空间维信息和光谱维信息有机地融合和为一体,在获取场景 空间图像的同时,得到场景内所有对象的连续光谱,从而实现依据对象光谱特征分类和识 别的目标。与传统的全色、多光谱遥感相比,因其高光谱分辨率和空间分辨率,有效得结合 的光谱信息与空间信息,且数据量丰富,数据模型易于描述,高光谱图像在识别与精确分类 方面具有突出的优势。随着高光谱成像技术的发展和成熟,高光谱图像处理技术已被广泛 成功应用于医学诊断,农业检测,矿物探测,环境监测等领域中。
[0003] 高光谱图像分类问题仍然是高光谱图像分析与处理技术的所面临的一大难题。高 光谱图像本身存在很大缺陷,例如海量造成的数据冗余度过大,高空间分辨率带来的光谱 混合以及噪声的影响,大大增加了精细分类的难度。传统的高光谱特征匹配分类方法需要 大量的先验知识,对光谱特征数据库依赖性太高,而统计分类方法运算速度慢,精度受训练 样本的影响较大。已有的特征抽取和分类方法往往受限于高光谱图像自身的缺陷,表现为 算法的稳定性和鲁棒性不足。


【发明内容】

[0004] 本发明的目的就是为了解决上述问题,提供一种高光谱图像分类中光谱向量互相 关特征的抽取方法,它具有能有效应对小样本学习分类问题,且具有良好的抗噪性,能有效 提高整个分类系统的分类精确度优点。
[0005] 为了实现上述目的,本发明采用如下技术方案:
[0006] -种高光谱图像分类中光谱向量互相关特征的抽取方法,包括以下步骤:
[0007] 步骤(1):对高光谱图像原始数据进行预处理得到训练样本集合;所述预处理包 括:将三维高光谱数据转化为二维特征向量矩阵、数据归一化、采用主成分分析法进行降维 和随机抽取部分已标记样本构成训练样本集合;
[0008] 步骤(2):采取boostrap抽样法从训练样本集合中获取参考样本集,计算训练样 本集合中的训练样本与参考样本集的参考样本的互相关系数,构建互相关系数特征向量;
[0009] 步骤(3):特征选择:根据步骤(2)中构建的互相关系数特征向量,从降低计算复 杂度角度出发需要进行特征再选择,选择方法是对步骤(2)中构建的相关系数特征向量进 行稀疏表示,稀疏化相关系数特征向量得到稀疏特征向量。
[0010] 所述步骤⑴包括:
[0011] 步骤(1-1):将三维高光谱图像转换成二维特征矢量形式: _2] ImxNxK > ^LxK ⑴

【权利要求】
1. 一种高光谱图像分类中光谱向量互相关特征的抽取方法,其特征是,包括以下步 骤: 步骤(1):对高光谱图像原始数据进行预处理得到训练样本集合;所述预处理包括:将 三维高光谱数据转化为二维特征向量矩阵、数据归一化、采用主成分分析法进行降维和随 机抽取部分已标记样本构成训练样本集合; 步骤(2):采取boostrap抽样法从训练样本集合中获取参考样本集,计算训练样本集 合中的训练样本与参考样本集的参考样本的互相关系数,构建互相关系数特征向量; 步骤(3):特征选择:根据步骤(2)中构建的互相关系数特征向量,从降低计算复杂度 角度出发需要进行特征再选择,选择方法是对步骤(2)中构建的相关系数特征向量进行稀 疏表示,稀疏化相关系数特征向量得到稀疏特征向量。
2. 如权利要求1所述的一种高光谱图像分类中光谱向量互相关特征的抽取方法,其特 征是,所述将三维高光谱数据转化为二维特征向量矩阵的步骤为: 步骤(1-1):将三维高光谱图像转换成二维特征矢量形式:
其中,I是三维高光谱图像,M为图像行数,N为图像列数,K为特征数,I1是转化后的二 维特征矩阵,I1的每一行对应一个样本,每一列对应一个特征,L是像元总数,Lable是对应 于I的标签矩阵,Lable1是对应于I1的标签矩阵。
3. 如权利要求1或2所述的一种高光谱图像分类中光谱向量互相关特征的抽取方法, 其特征是,所述数据归一化的步骤为: 步骤(1-2):按照特征维,即所述步骤(1-1)中I1的列,搜索每列中的特征值的最小值Xniin、最大值Xniax,将[XniiwXniax]之间的原特征值映射到[-1,1]之间,映射关系如公式⑶所 示:
其中,ymax = 1,ymin = _i,X是Ii中原特征值,y是映射到[_1,1]之间后的特征值,用y取代X,I1经归一化后得到归一化后的图像数据12。
4. 如权利要求1所述的一种高光谱图像分类中光谱向量互相关特征的抽取方法,其特 征是,所述采用主成分分析法进行降维的步骤为: 步骤(1-3):采用主成分分析法对归一化后的图像数据I2进行主成分分析,降低图像 噪声和特征维度: 主成分分析过程如下:归一化后的图像数据I2表示成I2= (X1,X2,…,Xi,-,XJt,其中Xi为一个κχ1的列向量,表不一个样本; 样本中心化,即对I2中所有样本进行中心化操作,具体方法为将I2中所有向量减去全 局均值向量i 计算中心化后的I2的协方差矩阵Σ=Ι2Τ*Ι2,然后对协方差矩阵Σ特征分解,得到特 征值矩阵Λ和特征向量矩阵ω,对I2进行主成分变换: I3 =I2*ω(4) I3是经过PCA降维后的图像数据,I3的特征维度Kl远小于I2的特征维数Κ。
5. 如权利要求1所述的一种高光谱图像分类中光谱向量互相关特征的抽取方法,其特 征是,所述随机抽取部分已标记样本构成训练样本集合的步骤为: 步骤(1-4):随机抽取训练样本集合: 抽取方式采用随机数方法,即随机产生一组1?L之间的随机数a=(叫,a2,. ..,ai),随机数不重复,1是随机数的个数; 将生成的随机数作为行标号,从步骤(1-3)的I3中抽取对应的行组成训练样本集合train_matrix1XK1, 将生成的随机数作为行标号,从步骤(1-1)的Lableji取对应的标签,组成训练样本 类别标签集合trian_labellxl; train_matrix1XK1的每一行代表一个训练样本,对应trian_labellxl中相应行的类标 签。
6. 如权利要求1所述的一种高光谱图像分类中光谱向量互相关特征的抽取方法,其特 征是,所述步骤(2)包括: 步骤(2-1):采取boostrap抽样法构建各类别参考样本集合: 步骤(2-2):假设任意两个光谱特征向量X1=(xn, x12,-",Xiki)' x2 = (x21, X22,… ,xau)T,分别是随机过程x(t,ω)的两次不同时间t,t+τ的随机试验,则x(t,ω)= Xl,X(t+τ,ω) =X2,对于离散平稳随机过程,同一平稳随机过程不同时间随机试验的互相 关有:
RxY(τ )表示两个随机实验X(t,ω)、X(t+τ,ω)的互相关,τ为时间间隔,Ω= {ωι,ω2,…,ω。…,ωΝ}表示随机试验样本空间,N为随机试验所有可能结果的个数,Coi 是某次随机试验的结果,P(Oi)是随机试验取得Coi的概率; 当t固定时,令Χ(ω) =X(t,ω),Υ(ω) =X(t+T,ω),则公式(6)改写为:
'(τ)表示两个随机试验的互相关,Xli=X(t, (Oi)、x2i=X(t+τ,(Oi)分别对应于光 谱特征向量XpX2第i个特征值,ω?eΩ= {ω1;ω2,…,Coi,…,ωΝ},Ω表示随机试验样 本空间,N为随机试验所有可能结果的个数,且N=Kl,Coi是某次随机试验的结果,P(Coi) 是随机试验取得概率; 步骤(2-3):对步骤(2-2)的条件作进一步假设--假设所有特征取值的概率P(Coi) 相等,则能够去掉公式(7)的P(Coi),用Rxy取代Rxy(T),进一步转变得:
步骤(2-4):根据式(8)的形式,结合kernel方法,将原始数据映射到高维空间,引入RBF核函数,其结构如下式所述:
其中,k(x,r)表示RBF核函数,X表示测试样本列向量,r是参考样本列向量,〇是RBF核函数的参数,且参数σ可调; 公式(8)能够被公式(9)取代: Rxr =k(x,r) (10) Rxl?是向量X与r之间的相关系数,X表示测试样本列向量,r是参考样本列向量; 步骤(2-5):通过计算得到相关系数特征向量构成的训练样本矩阵; 步骤(2-6):通过计算得到相关系数特征向量构成的测试样本矩阵。
7. 如权利要求6所述的一种高光谱图像分类中光谱向量互相关特征的抽取方法,其特 征是,所述步骤(2-5)的步骤为: 步骤(2-5-1):对所述步骤(1-4)中训练样本集合train_matrix1XK1中任意训练样本Xi,即train_matrix1XK1中的一行数据,按照公式(9)和公式(10)计算训练样本Xi与步骤 (2-1)的总体参考样本矩阵Ref中每个参考样本的互相关系数,得到训练样本Xi与总参考 样本集合Ref所有参考样本的相关系数特征向量Cori,用Cori取代Xi作为训练样本; 步骤(2-5-2):对所述步骤(1-4)中训练样本集合train_matrix1XK1中所有训练样 本Xi,i= 1,2,…,1执行步骤(2-5-1)操作,得到相关系数特征向量构成的训练样本矩阵 train= (Cor1,cor2,…,Cor1)τ ; 所述步骤(2-6)的步骤为: 步骤(2-6-1):对所述步骤(1-3)I3中任意一个测试样本X%即I3中的一行数据,按照 公式(9)和公式(10)计算测试样本X%与步骤(2-1)的总体参考样本矩阵Ref中每个参考 样本的互相关系数,得到测试样本X%与总参考样本集合Ref所有参考样本的相关系数特征 向量cor%用cof取代X%作为测试样本; 步骤(2-6-2)对所述步骤(1-3)I3中所有测试样本<,i= 1,2,…,L,L为I3中样本数,执行步骤(2-6-1)操作,得到相关系数特征向量构成的测试样本矩阵 ie.si=(cor(,cor《,…,cor[)T 〇
8. 如权利要求1或7所述的一种高光谱图像分类中光谱向量互相关特征的抽取方法, 其特征是,所述步骤(3)特征选择的方法为: 步骤(3-1):采用稀疏分解法对步骤(2-5-2)的训练样本矩阵train中的相关系数训 练样本进行稀疏分解,同时获得稀疏字典Φ,稀疏分解后,对应于train中每一个样本Cori 会得到一个稀疏系数特征向量ai,用ai取代COTi,得到稀疏系数训练样本集合Train; 步骤(3-2):对所述步骤(2-6-2)相关系数测试样本矩阵test在步骤(3-1)的稀疏字 典Φ上进行稀疏分解,稀疏分解后,对应于test中每一个样本coif会得到一个稀疏系数特 征向量 <,用α丨取代cor;V得到稀疏系数测试样本集合Test。
9. 如权利要求6所述的一种高光谱图像分类中光谱向量互相关特征的抽取方法,其特 征是,所述步骤(2-1)的步骤为: 假设有C类,且每类参考样本数Ni ;对类别i,根据所述步骤(1-4)中训练样本类别标 签集合trian_labellxl和训练样本集合train_matrix1XK1,首先从训练样本集合train_ matrix1XK1中抽取类别标签为i的样本,构成样本子集Subi,其次从Subi中有放回抽取样本 子集Subi样本总数的80%加权平均,所述加权平均公式如下:
其中,Mfi是加权后的新样本,是一个IXKl的行向量,Xi是抽取的样本,11是抽取的 样本数; 抽取Ni次后,会得到一个新的参考样本矩阵= 汇总所有类别参考样本矩阵,得到总体参考样本矩阵Ref= (Ref1,Ref2,…,Refc)τ。
10.如权利要求8所述的一种高光谱图像分类中光谱向量互相关特征的抽取方法,其 特征是, 所述稀疏分解的方法如下,稀疏分解的基本模型为:
y是未稀疏化的特征向量,φ是稀疏字典,Ct是特征向量y在稀疏字典Φ上分解的稀 疏系数,λ是一个控制稀疏系数α变化的参数; 所述稀疏字典Φ采用最优方向法学习获得: 以步骤(2-5-2)中train的相关系数训练样本作为最优方向法的输入样本X,寻找到一 个稀疏字典Φ:
X是输入样本,A稀疏系数矩阵,βi表示A中的第i列。
【文档编号】G06K9/46GK104463247SQ201410748096
【公开日】2015年3月25日 申请日期:2014年12月9日 优先权日:2014年12月9日
【发明者】刘治, 唐波, 聂明钰, 孙育霖, 宿方琪, 肖晓燕, 张伟 申请人:山东大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1