本发明属于图像处理和模式识别领域,尤其涉及一种新的基于增强核稀疏表示的sar图像目标识别方法。
背景技术:
合成孔径雷达(syntheticapertureradar,sar)是一种高分辨率成像雷达,与光学、红外等雷达相比,它的成像受气候等条件的限制程度小,具有全天时、全天候、多视角和高分辨率等特点。基于sar图像的目标识别在各种军事和民用领域,如军事方面的战场侦察、对地攻击,民用方面的地形测绘、海洋观测、灾情预报、农作物评估等,都具有非常重要的应用,对其深入研究具有重要的理论意义和实用价值。
在现阶段,sar图像的目标识别方法通常分为三类:模板匹配法、基于模型的方法、基于特征的方法。其中,基于模板匹配的方法旨在对模板库进行搜索,以获取与待识别目标最为匹配的模板,计算目标的类别标签。该类方法最大的局限性在于很难建立完备的模板库;且当目标受背景杂波干扰时,较难获得良好的匹配结果。为此,人们提出了基于模型的方法,该类方法又分为:基于统计学模型的方法和基于物理模型的方法。前者将sar图像用参数化的统计分布模型进行表示,当模型和待识别目标的统计关系不存在时,识别易失败;后者采用三维计算机辅助设计,建立sar目标人造模型,这类方法的性能取决于模型建立的准确度,实际目标和仿真目标之间实际存在的差异会导致识别的受限。为此,后续人们又提出了基于特征的方法,该类方法包括两个关键步骤:特征提取和分类器设计。目前常见的sar图像目标特征提取方法包括基于小波的方法、非负矩阵分解、zernike矩等;而常用的sar目标分类器有基于支持向量机的方法、基于提升的方法、基于稀疏表示的方法等。
尽管现有的算法能处理sar图像目标识别问题,但是它们的性能仍有待进一步的提高:(1)现阶段sar目标识别时,缺乏完备、紧致、且具有鉴别性的特征提取方法;(2)当提取的多种类型的特征不是线性可分时,如何设计鲁棒、可靠的分类器是一个难点。
技术实现要素:
发明目的:针对以上问题,本发明提出一种新的基于增强核稀疏表示的sar图像目标识别方法。该方法基于多尺度单演信号理论对sar图像进行特征提取,学习得到的特征表现力及鲁棒性强。此外,将提取到的特征输入到增强核稀疏表示分类器中,能实现良好的分类和识别效果。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于增强核稀疏表示的sar图像目标识别方法,该方法包括如下步骤:
(1)对sar目标图像进行多尺度单演变换,求取其在不同尺度下的对应的单演信号;
(2)针对每一个尺度下的单演信号,计算sar图像目标的单演特征;
(3)基于核主成分分析和核fisher鉴别分析计算一个增强的伪变换矩阵;
(4)利用增强的伪变换矩阵,进行鉴别性特征映射,将特征在核空间中进行降维,并在核空间中构造新的字典以及待测样本向量;
(5)利用最小化l1范数计算稀疏系数,并基于稀疏重建误差进行目标分类识别。
进一步的,步骤(1)中的,对sar目标图像进行多尺度单演变换,求取其在不同尺度下的对应的单演信号的方法如下:
(1.1)给定一个二维sar目标图像x(z),其中z表示二维图像空间像素坐标,先对其进行里斯变换得到二维复信号xr(z),则x(z)对应的单演信号xm(z)可定义为x(z)与其里斯变换的xr(z)的线性组合:
xm(z)=x(z)-(i,j)xr(z);
其中,i和j表示虚部单位,(1,i,j)构成三维互相正交的基坐标;
(1.2)采用二维log-gabor滤波器hlg(z)分别与二维sar目标图像x(z)及里斯变换xr(z)进行卷积,则x(z)对应的单演信号xm(z)求解公式修改为:
xm(z)=(hlg(z)*x(z))-(i,j)(hlg(z)*xr(z))
其中,hlg(z)的频域表达式为:
其中,ω是频率变量,ω0是g(ω)的中心频率,σ表示该二维log-gabor滤波器带宽的尺度因子;
(1.3)通过修改σ即可以得到不同尺度的log-gabor滤波器,利用不同尺度log-gabor滤波器与x(z)及xr(z)进行卷积,即可计算不同尺度的单演信号
进一步的,步骤(2)中的单演特征包括:基于单演信号幅度信息的目标能量特征、基于单演信号相位信息的目标结构特征、及基于单演信号方向信息的目标几何特征。
进一步的,步骤(2)中的,针对每一个尺度下的单演信号,计算sar图像目标的单演特征的方法如下:
(2.1)针对每一个尺度下的二维单演信号xm(z)进行分解,获取其幅度、相位、和方向信息:
其中,xi(z)和xj(z)分别表示单演信号的i虚部的分量和j虚部的分量;
(2.2)由于xm(z)采用(1.2)中的形式,在求解a(z)、
(2.3)将s个尺度的单演特征进行向量化:
其中,vec(·)表示将矩阵转化为向量的操作,χ表示得到的单演特征向量。
进一步的,步骤(3)中的,基于核主成分分析和核fisher鉴别分析计算一个增强的伪变换矩阵,方法如下:
(3.1)给定一个具有c个类别的sar目标分类,设
其中,φ(x)∈rd表示图像x在空间
(3.2)给定一个测试样本图像处理后的单演特征向量xt,在核特征空间
其中,α=[α1,α2,...,αn]t为系数向量,αi为φ(xi)对应的系数,在特征空间
φ=[φ(x1),φ(x2),...,φ(xn)]∈rd×n
(3.3)基于(3.2)求得的φ(x),得到如下稀疏表示:
上式表示,在满足φ(xt)=φα的条件下,求解||α||1式子为最小值时的α,在求解α的过程中,选择l1范数,即对||α||1求最小;
(3.4)采用基于核降维的方式对(3.3)中的稀疏表示问题进行求解,设p∈rd×d为变换矩阵,基于该变换矩阵,对(3.2)中的
ptφ(xt)=ptφα;
(3.5)利用基于核主成分分析或基于核fisher鉴别分析的核降维方法,将映射向量看做
其中,pj是变换矩阵p的第j个变换向量,即:p=[p1,...,pd],βj=[βj,1,...,βj,n]t为pj对应的伪变换向量,代表的是线性表示系数,由β1,...,βd可以组成伪变换矩阵b:
b=[β1,...,βd]
基于伪变换矩阵b,变换矩阵p可以表示如下:
p=φb
(3.6)将p=φb代入步骤(3.4)中的公式ptφ(xt)=ptφα中,可得:
btk(·,xt)=btkα
其中,k(·,xt)=[k(x1,xt),...,k(xn,xt)]t=φtφ(xt),k=φtφ∈rn×n表示核格拉姆(gram)矩阵;
(3.7)基于kpca对伪变换矩阵b进行求解,首先利用kpca计算伪变换向量βj∈rn:
kβ=λβ
然后通过选择d个具有最大特征值λj的特征向量,j=1,...,d,λ1≥λ2≥…≥λd,得到基于kpca的伪变换矩阵:
b′=[β1,...,βd]∈rn×d;
(3.8)基于kfda对伪变换矩阵b进行求解:
其中,tr(·)表示一个矩阵的迹,
(3.9)建立如下增强伪变换矩阵:
b=[b′,b″]
(3.10)最终核特征空间
btk。
进一步的,步骤(4)中的,用增强的伪变换矩阵,进行鉴别性特征映射,将特征在核空间中进行降维的方法如下:先利用步骤(2)得到的单演特征向量,即训练样本xi和测试样本xt,求得映射到核空间的测试样本向量k(·,xt);再利用增强的伪变换矩阵b,实现特征在核空间中的降维以得到降维后的测试样本向量btk(·,xt)。
进一步的,步骤(5)中的,利用最小化l1范数计算稀疏系数,并基于稀疏重建误差进行目标分类识别,方法如下:
(5.1)利用降维后的测试样本向量btk(·,xt)和字典btk得到如下优化问题:
通过对上式进行求解得到稀疏系数α;
(5.2)针对测试样本对应的单演特征向量xt,计算其隶属第i类的近似,即:
btkδi
其中,δi=[δi(α1),δi(α2),...,δi(αn)]t,且
其中,i的取值范围为i∈{1,2,...,c},若假设i一定,则δi(αj)表示向量δi的第j个元素的值,而yj代表第j个训练样本对应的真实类别标签,j∈{1,2,...,n};
(5.3)针对测试样本对应的单演特征向量xt,通过最小化btk(·,xt)和btkδi的残差,即可估计测试样本对应的单演特征向量xt的类别标签:
有益效果:与现有技术相比,本发明的技术方案具有以下有益的技术效果:
(1)本发明的方法基于多尺度单演信号理论对sar图像进行特征提取,学习得到的特征表现力及鲁棒性强。
(2)本发明的方法将提取到的特征输入到增强核稀疏表示分类器中,能实现良好的分类和识别效果。
附图说明
图1是本发明提出算法的框图;
图2是具体实施例中得出的实验结果。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
本发明所采用的技术方案是:一种基于增强核稀疏表示的sar图像目标识别方法,包含sar图像目标特征提取和分类器设计两个步骤:
所述sar图像目标特征提取步骤包括以下处理:
(1)对sar目标图像进行多尺度单演变换,求取其在不同尺度下的对应的单演信号;
(2)针对每一个尺度下的单演信号,计算sar图像目标的单演特征,包括:基于单演信号幅度信息的目标能量特征、基于单演信号相位信息的目标结构特征、及基于单演信号方向信息的目标几何特征;
所述分类器设计模块包括以下步骤:
(3)基于核主成分分析(kernelprinciplecomponentanalysis,kpca)和核fisher鉴别分析(kernelfisherdiscriminantanalysis,kfda)计算一个增强的伪变换矩阵;
(4)利用增强的伪变换矩阵,进行鉴别性特征映射,将特征在核空间中进行降维,并在核空间中构造新的字典以及待测样本向量;
(5)利用最小化l1范数计算稀疏系数,并基于稀疏重建误差进行目标分类识别。
步骤(1)中的,对sar目标图像进行多尺度单演变换,求取其在不同尺度下的对应的单演信号的方法如下:
(1.1)给定一个二维sar目标图像x(z),其中z表示二维图像空间像素坐标,先对其进行里斯(riesz)变换得到二维复信号xr(z),则x(z)对应的单演信号xm(z)可定义为x(z)与其里斯(riesz)变换的xr(z)的线性组合:
xm(z)=x(z)-(i,j)xr(z)
其中,i和j表示虚部单位,(1,i,j)构成三维互相正交的基坐标;
(1.2)采用二维log-gabor滤波器hlg(z)分别与二维sar目标图像x(z)及里斯(riesz)变换xr(z)进行卷积,则x(z)对应的单演信号xm(z)求解公式修改为:
xm(z)=(hlg(z)*x(z))-(i,j)(hlg(z)*xr(z))
其中,hlg(z)的频域表达式为:
其中,ω是频率变量,ω0是g(ω)的中心频率,σ表示该二维log-gabor滤波器带宽的尺度因子;
(1.3)通过修改σ即可以得到不同尺度的log-gabor滤波器,利用不同尺度log-gabor滤波器与x(z)及xr(z)进行卷积,即可计算不同尺度的单演信号
步骤(2)中的,针对每一个尺度下的单演信号,计算sar图像目标的单演特征,包括:基于单演信号幅度信息的目标能量特征、基于单演信号相位信息的目标结构特征、及基于单演信号方向信息的目标几何特征的方法如下:
(2.1)针对每一个尺度下的二维单演信号xm(z)进行分解,获取其幅度、相位、和方向信息:
其中,xi(z)和xj(z)分别表示单演信号的i虚部的分量和j虚部的分量。
(2.2)由于xm(z)采用(1.2)中的形式,在求解a(z)、
(2.3)将s个尺度的单演特征进行向量化:
其中,vec(·)表示将矩阵转化为向量的操作,χ表示得到的单演特征向量。另外,考虑到运算量和识别率的折中,通常选取经验值s=3。
步骤(3)中的,基于核主成分分析(kernelprinciplecomponentanalysis,kpca)和核fisher鉴别分析(kernelfisherdiscriminantanalysis,kfda)计算一个增强的伪变换矩阵,方法如下:
(3.1)给定一个具有c个类别的sar目标分类识别问题,设
其中,φ(x)∈rd表示图像x在空间
(3.2)给定一个测试样本图像处理后的单演特征向量xt,在核特征空间
其中,α=[α1,α2,...,αn]t为系数向量,αi为φ(xi)对应的系数。在特征空间
φ=[φ(x1),φ(x2),...,φ(xn)]∈rd×n
(3.3)基于(3.2)求得的φ(x),得到如下稀疏表示:
上式表示,在满足φ(xt)=φα的条件下,求解||α||1式子为最小值时的α。在求解α的过程中,选择l1范数,即对||α||1求最小,目的是获得一个满足稀疏条件的解。
(3.4)采用基于核降维的方式对(3.3)中的稀疏表示问题进行求解。设p∈rd×d为变换矩阵,基于该变换矩阵,对(3.2)中的
ptφ(xt)=ptφα
(3.5)利用基于核主成分分析(kernelprinciplecomponentanalysis,kpca)或基于核fisher鉴别分析(kernelfisherdiscriminantanalysis,kfda)的核降维方法,将映射向量看做
其中,pj是变换矩阵p的第j个变换向量,即:p=[p1,...,pd]。βj=[βj,1,...,βj,n]t为pj对应的伪变换向量,代表的是线性表示系数。由β1,...,βd可以组成伪变换矩阵b:
b=[β1,...,βd]
基于伪变换矩阵b,变换矩阵p可以表示如下:
p=φb
(3.6)将p=φb代入步骤(3.4)中的公式ptφ(xt)=ptφα中,可得:
btk(·,xt)=btkα
其中,k(·,xt)=[k(x1,xt),...,k(xn,xt)]t=φtφ(xt)。k=φtφ∈rn×n表示核格拉姆(gram)矩阵。
(3.7)基于kpca对伪变换矩阵b进行求解。首先利用kpca计算伪变换向量βj∈rn:
kβ=λβ
然后通过选择d个具有最大特征值λj,j=1,...,d,λ1≥λ2≥…≥λd,的特征向量,可以得到基于kpca的伪变换矩阵:
b′=[β1,...,βd]∈rn×d。
(3.8)基于kfda对伪变换矩阵b进行求解:
其中tr(·)表示一个矩阵的迹。
(3.9)为了综合kpca和kfda的优势,建立如下增强伪变换矩阵:
b=[b′,b″]
(3.10)最终,核特征空间
btk
步骤(4)中的,用增强的伪变换矩阵,进行鉴别性特征映射,将特征在核空间中进行降维的方法如下:
(4.1)先利用步骤(2)得到的单演特征向量,即训练样本xi和测试样本xt,求得映射到核空间的测试样本向量k(·,xt);再利用增强的伪变换矩阵b,实现特征在核空间中的降维,得到降维后的测试样本向量btk(·,xt)。
步骤(5)中的,利用最小化l1范数计算稀疏系数,并基于稀疏重建误差进行目标分类识别,方法如下:
(5.1)利用降维后的测试样本向量btk(·,xt)和字典btk,可以得到如下优化问题:
通过对上式进行求解,可以得到稀疏系数α。
(5.2)针对测试样本对应的单演特征向量xt,计算其隶属第i类的近似,即:
btkδi
其中,δi=[δi(α1),δi(α2),...,δi(αn)]t,且
这里,i的取值范围为i∈{1,2,...,c},若假设i一定,则δi(αj)表示向量δi的第j个元素的值,而yj代表第j个训练样本对应的真实类别标签,这里j∈{1,2,...,n}。δi实际上是截取的稀疏系数α中只与第i类字典原子对应的系数片段。
(5.3)针对测试样本对应的单演特征向量xt,通过最小化btk(·,xt)和btkδi的残差,即可估计测试样本对应的单演特征向量xt的类别标签:
最后,本发明对公开的sar目标图像数据库(movingandstationarytargetacquisitionandrecognitiondataset,mstar))进行实验,从该数据库中选择4类sar目标:bmp2(坦克),t72(坦克),btr60(装甲车),t62(坦克),其中bmp2和t72又有几种不同的结构上的变形。对每一个目标类,获取不同的俯角17°and15°下的图像集。其中,俯角17°下的图像集用于训练,俯角15°下的图像集用于测试。
本发明选用七种不同的sar图像目标识别算法与本专利提出的方法(记为ksrc-m)进行比较,选用的比较算法是:
(1)ksrc-m1:基于单演特征和kpca核稀疏表示的分类器;
(2)ksrc-m2:基于单演特征和kfda核稀疏表示的分类器;
(3)tjsrc-m:基于单演特征和联合稀疏表示的分类器;
(4)src-m:基于单演特征和稀疏表示的分类器;
(5)svm-m:基于单演特征和支持向量机的分类器;
(6)ksrc-i:基于亮度特征和增强核稀疏表示的分类器;
(7)src-i:基于亮度特征和稀疏表示的分类器。
图2是所有的方法在随机噪声条件下的目标识别性能比较。结果表明,本发明提出的方法对sar目标识别效果更好。