拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法

文档序号:5821179阅读:199来源:国知局
专利名称:拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法
技术领域
本发明属于雷达技术领域,涉及一种模式识别技术的具体应用,具体地说是一种拉普拉斯Laplacian正则化最小二乘合成孔径雷达SAR自动目标识别方法。该方法可用于解决基于二维SAR图像的识别问题。

背景技术
SAR技术在对地面目标,特别是对静止目标探测方面的独特优势,以及其在现代战场感知、对地面打击等领域的良好应用前景,使得基于SAR图像的自动目标识别技术ATR受到了越来越多的重视。目前针对SAR图像的自动目标识别学者们已经进行了多方面的研究,提出了各种方法,这些方法都是基于目标模型的识别方法。目标模型的描述方法通常分为两类基于模板的目标描述方法和基于模型的目标描述方法。基于模板的目标描述方法通过一些典型的目标特征样本来描述每一类目标,基于模型的目标描述方法利用隐马尔可夫模型或神经网络模型来描述每一类目标特征,这些方法都存在一定的不足和缺陷。
1998年,美国的Timothy Ross等人提出一种基于模板匹配的SAR自动目标识别方法,并以此结果作为标准,向该领域征集更优的ATR方法。该方法是在图像域内,将样本按10°方位间隔分组,在每一个方位单元内利用样本均值作为模板,用最小距离分类法进行分类。由于模板匹配法是利用样本的均值作为模板,其与样本图像的几何形状有直接关系,同时SAR目标图像对方位比较敏感,所以方位间隔越小,形成的模板质量越高,匹配效果越好,但是需要对方位有较好的估计,并且随着模板数量的增加,所需存储空间增大。
同样在1998年,Theera-Umpon提出利用形态学权值共享神经网络来解决SAR图像中军用车辆的检测和识别问题。这种处理方法基于如下事实异类神经网络能够同时学习特征提取和分类。权值共享神经网络和形态学权值共享神经网络是异类神经网络的一种。这些神经网络由两个阶段组成特征提取阶段和分类阶段。此方法只能对两类目标进行分类识别,由于神经网络的输入是一块图像,因此网络的训练计算量较大。在目标类较多的情况下,可能导致网络训练无法收敛。
2001年,Qun Zhao对样本不做任何特征提取,将样本按30°方位分组,在每一个方位单元内建立支撑矢量机SVM分类器,识别时利用目标的方位信息选出相应方位单元的分类器进行分类。虽然SVM适合解决小样本高维模式分类问题,但在按10°方位间隔分组时,样本数目过于少,每类目标在每个方位单元内只有6~7个训练样本,训练性能较差,在此情况下达不到较高的识别率。另外,该方法没有经过特征提取的预处理,一方面会因为噪声的存在降低识别率,另一方面达不到降维的目的,给计算带来负担。
目前,已经有学者将核主成分分析KPCA的特征提取方法对SAR目标进行预处理,然后用SVM进行目标识别,与上述的方法相比该方法的识别率有一定的提高,但在训练样本过于少的情况下,比如按10°方位间隔分组,训练性能同样会较差。


发明内容
本发明的目的在于为了克服现有技术的不足,提出了一种拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法,以提高SAR图像的目标识别率,并且对方位不需要精确的估计,在小样本情况下仍然可以获得很好的识别效果。
本发明的技术方案是将待识别的SAR目标图像看作是半监督学习中训练集的无标识样本,通过转导推理得到标识。首先将运动、静止目标获取与识别MSTAR数据库中的全部样本采用KPCA进行特征提取,再将训练集数据全部作为有标识样本,测试集数据全部作为无标识样本来建立一个无向加权图G=(V,E),将数据点看作G的顶点V,并定义成对数据点的相似度为无向加权图的边,然后用图的方法逼近流形,在全局上要求满足光滑性的假设,并将它作为一个正则项,添加到正则化最小二乘分类RLSC中,称为拉普拉斯正则化最小二乘分类LapRLSC,求解对应的优化问题,最后用训练得到的分类函数对无标识样本进行分类。该方法的具体实现步骤如下 (1)输入l个有标识样本{(xi,yi)i=1l,l是训练集样本的个数,xi表示第i个样本,用一个行向量表示,yi是该样本所属的类别标号,输入u个无标识样本{xj}j=l+1l+u,u是测试集样本的个数,xj表示第j个样本,也用一个行向量表示,用l+u个数据点建立一个邻接图,数据点看作邻接图的顶点,定义Wij为邻接图的边,是成对数据点的相似性度量,上述的邻接图可以选择n近邻或者图核,n为近邻个数,边的权值选择0或1的二值权; (2)计算第(1)步得到的邻接图的Laplacian矩阵L=D-W,其中L表示Laplacian矩阵,D是一个对角矩阵,即第i个点到其它各点的权值之和,其值越大表示该点越重要; (3)采用一个核函数K(xi,xj)对第(1)步所说的l+u个数据点,计算核矩阵K,Kij=K(xi,xj),Kij表示样本i和样本j的相似性; (4)选择正则化参数γA和γI;它们分别控制周围空间函数的复杂性和边缘分布的内在几何函数的复杂性,该两参数的确定可以采用简单的网格搜索方法来实现; (5)采用上述(1)~(4)步得到的结果,计算向量α*,其计算公式如下 其中J是一个(l+u)×(l+u)的对角矩阵,J=diag(1,...1,0,...,0),Y是一个(l+u)维的标识向量,Y=[y1,...yl,0,...0]; (6)输出分类函数x表示一个测试集样本,即待识别目标,对于两类的分类问题,根据分类函数的正负来分类,对于多类的分类问题,则采用“一对多“的策略,把有标识的当前类作为+1类,有标识的剩余样本作为-1类,无标识的样本全部标为0。当有C类时,得到C个分类函数,对无标识的每一个样本都有C个函数值,取其中最大的一个所对应的类别作为该样本所属的类别。
上述的拉普拉斯正则化最小二乘SAR自动目标识别方法,第(3)步所说的核函数的计算,可以选用以下几种核函数来进行计算 ①多项式核函数k(x,y)=(a(x·y)+b)d,x,y表示两个样本,每个样本用一个向量表示,a,b,d均表示多项式核函数的参数; ②高斯核函数σ2表示高斯核函数的参数; ③Sigmoid核函数k(x,y)=tanh(α(x·y)+β),α,β表示Sigmoid核函数的参数。
本发明采用了高斯核函数,参数σ2通过核-目标配准方法,在某个参数范围上搜索,找到使得到最大值的σ2,其中K′是关于有标识样本的核矩阵,y是有标识样本的标号列向量,yT表示y的转置。
上述的Laplacian正则化最小二乘SAR自动目标识别方法,所说的通过表达式得到α*,其实现过程如下 根据再生核希尔伯特空间RKHS的两个重要事实 第一,正则化最小二乘问题可以用来表示,其中H表示再生核希尔伯特空间。该问题的解存在并且唯一,由“表示理论”给出解的表达形式 第二,‖f‖K2可以表示成下面的式子 α是待优化的列向量。
那么将其扩展到拉普拉斯正则化最小二乘法,它需要解决下式所表示的优化问题 其解可以表达为将和代入中得到

对它求关于α的偏导数,并令该偏导数等于零,即求解则得到解的表达式 本发明通过上述步骤,拉普拉斯正则化最小二乘SAR自动目标识别方法最终输出识别结果。
本发明与现有技术相比具有如下优点 1.识别率高,对方位具有较好的鲁棒性,实现简单 为了验证拉普拉斯正则化最小二乘SAR自动目标识别方法的优越性,我们将其与模板匹配法和SVM进行了比较。仿真实验表明,与模板匹配法相比,拉普拉斯正则化最小二乘SAR自动目标识别方法不需要对方位估计有较高的精度,并且不需要大量的空间来存储模板,与SVM相比,拉普拉斯正则化最小二乘SAR自动目标识别方法实现简单,仅仅需要求解一个线性方程系统,复杂度的计算很明确,需要O((l+u)3),l+u为训练集和测试集样本的总个数。针对SAR自身的特点,其在360°方位范围内对目标的成像数目有限,数据量不大,该方法依然可以很快地求解。而SVM需要求解一个凸的二次规划问题,它通常对解有个稀疏的表示,实现起来比较复杂,对资源的需求也不能通过简单的分析得到。此外拉普拉斯正则化最小二乘SAR自动目标识别方法在10°、30°、90°、180°、和360°方位间隔分组内均比模板匹配法和SVM的识别率要高。尽管在10°方位间隔分组时,样本数目很少,每类目标在每个方位单元内只有6~7个样本,识别率仍然可以达到95%左右,说明该方法对小样本问题仍然可行。
2.理论上具有合理性 拉普拉斯正则化最小二乘分类问题可以用下面的式子来表示 它是在正则化最小二乘分类上加了有关无标识样本的一个正则化项,可以证明 其中L=D-W,L是一个有限半正定的矩阵,可以看成定义在图上的算子,根据谱图理论-如果数据均匀取样自高维空间中的低维流形,流形上的Laplacian-Beltrami算子可以由图的Laplacian逼近,其最前面的几个特征向量就是流形上的Laplacian-Beltrami算子特征函数的离散逼近,那么L就相当于流形学习中的Laplacian-Beltrami算子。



图1是本发明实现步骤的流程原理框图 图2是本发明针对的SAR目标图像,其中图2(a)是BMP2装甲车;图2(b)是RTR70装甲车;图2(c)是T72坦克 图3是10°方位间隔分组时各方法的性能比较图 图4是30°方位间隔分组时各方法的性能比较图 图5是90°方位间隔分组时各方法的性能比较图 图6是180°方位间隔分组时各方法的性能比较图 图7是360°方位间隔分组时各方法的性能比较图 图8是正则化最小二乘和Laplacian正则化最小二乘的性能比较图 图9是在测试集样本不参与训练的情况下,识别误差率随训练集中有标识样本的个数变化的曲线图 图10是在测试集样本参与训练的情况下,识别误差率随训练集中有标识样本的个数变化的曲线图
具体实施例方式 参照图1和图2,图1是本发明实现步骤的流程原理框图,图2是本发明的主要针对的目标图像,训练集是MSTAR数据中17°俯视角的图像,测试集是MSTAR数据中15°俯视角的图像。
针对SAR自动目标识别的具体问题,对本发明设计的基于KPCA特征提取和Laplacian正则化最小二乘SAR自动目标识别方法具体描述如下 先进行预处理,从原始128×128的图像中心截取60×60的区域,该区域包含了整个目标,而去除了多余的背景区域。在此基础上利用KPCA提取各自目标图像35维特征,并进行归一化到[-1,1]。
将每一类训练样本在0°~360°方位范围内,按等方位间隔分为P组,比如方位间隔为10°,则分为36组,在每一组上进行测试,将36组得到的测试结果做平均。其中P为分成的组数。
结合图1可以看出本发明的具体实现步骤如下 (1)输入l个有标识样本{(xi,yi)}i=1l,l是训练集样本的个数,xi表示第i个样本,用一个行向量表示,yi是该样本所属的类别标号,输入u个无标识样本{xj}j=l+1l+u,u是测试集样本的个数,xj表示第j个样本,也用一个行向量表示,用l+u个数据点建立一个邻接图,数据点看作邻接图的顶点,定义Wij为邻接图的边,是成对数据点的相似性度量,上述的邻接图可以选择n近邻或者图核,n为近邻个数,边的权值选择0或1的二值权; (2)计算第(1)步得到的邻接图的Laplacian矩阵L=D-W,其中L表示Laplacian矩阵,D是一个对角矩阵,即第i个点到其它各点的权值之和,其值越大表示该点越重要; (3)选择一个核函数计算(l+u)×(l+u)的核矩阵K,Kij=K(xi,xj),Kij表示样本i和样本j的相似性; (4)选择正则化参数γA和γI;它们分别控制周围空间函数的复杂性和边缘分布的内在几何函数的复杂性,该两参数的确定可以采用简单的网格搜索方法来实现; (5)采用上述(1)~(4)步得到的结果,计算向量α*,其计算公式如下 其中J是一个(l+u)×(l+u)的对角矩阵,J=diag(1,...1,0,...,0),Y是一个(l+u)维的标识向量,Y=[y1,...yl,0,...0]; (6)输出分类函数x表示一个测试集样本,即待识别目标,对于两类的分类问题,根据分类函数的正负来分类,对于多类的分类问题,则采用“一对多“的策略,把有标识的当前类作为+1类,有标识的剩余样本作为-1类,无标识的样本全部标为0。当有C类时,得到C个分类函数,对无标识的每一个样本都有C个函数值,取其中最大的一个所对应的类别作为该样本所属的类别。
本发明采用了高斯核函数,参数σ2通过核-目标配准方法,在参数范围lnσ2={-10∶1∶10}上搜索,找到使得到最大值的σ2,其中K′是关于有标识样本的核矩阵,y是有标识样本的标号列向量,yT表示y的转置。
为了验证在KPCA提取特征的基础上用拉普拉斯正则化最小二乘SAR自动目标识别方法的优越性,我们将其与模板匹配法和SVM,以及线性主成分分析PCA+SVM,KPCA+SVM,KPCA+RLSC的方法通过以下仿真实验进行了比较。以下仿真实验中用KPCA提取目标图像的35维特征,并归一化到[-1,1]。采用的近邻个数是6,高斯核函数的σ2在1~e2范围内取值,γA和

分别取0.005和0.045。
Laplacian正则化最小二乘在不同方位间隔分组内的识别率与其它方法的比较 (1)Laplacian正则化最小二乘在10°方位间隔分组的识别率与其它方法的比较 参照图3,它是10°方位间隔分组时各方法的性能比较图。本实验是将每一类训练样本在0°~360°方位范围内,按等方位间隔10°分为36组,在每一组上进行测试,将36组得到的测试结果做平均。在每一组上,σ2通过核-目标配准方法,在参数范围lnσ2={-10∶1∶10}上搜索,找到使得到最大值的σ2,此时K′为有标识样本的核矩阵,y是有标识样本的标号列向量,也就是说核参数σ2的确定只用到有标识的样本。10°方位间隔分组内各识别方法模板匹配法、SVM、线性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的识别结果分别用1、2、3、4、5、6所标注。
(2)Laplacian正则化最小二乘在30°方位间隔分组的识别率与其它方法的比较 参照图4,它是30°方位间隔分组时各方法的性能比较图。本实验是将每一类训练样本在0°~360°方位范围内,按等方位间隔30°分为12组,在每一组上进行测试,将12组得到的测试结果做平均。在每一组上,σ2与上述(1)一样,用核-目标配准方法得到,搜索范围为lnσ2={-10∶1∶10}。30°方位间隔分组内各识别方法模板匹配法、SVM、线性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的识别结果分别用1、2、3、4、5、6所标注。
(3)Laplacian正则化最小二乘在90°方位间隔分组的识别率与其它方法的比较 参照图5,它是90°方位间隔分组时各方法的性能比较图。本实验是将每一类训练样本在0°~360°方位范围内,按等方位间隔90°分为4组,在每一组上进行测试,将4组得到的测试结果做平均。在每一组上,σ2与上述(1)一样,用核-目标配准方法得到,搜索范围为lnσ2={-10∶1∶10}。90°方位间隔分组内各识别方法线性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的识别结果分别用1、2、3、4所标注。
(4)Laplacian正则化最小二乘在180°方位间隔分组的识别率与其它方法的比较 参照图6,它是180°方位间隔分组时各方法的性能比较图。本实验是将每一类训练样本在0°~360°方位范围内,按等方位间隔180°分为2组,在每一组上进行测试,将2组得到的测试结果做平均。在每一组上,σ2与上述(1)一样,用核-目标配准方法得到,搜索范围为lnσ2={-10∶1∶10}。180°方位间隔分组内各识别方法线性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的识别结果分别用1、2、3、4所标注。
(5)Laplacian正则化最小二乘在360°方位范围内的识别率与其它方法的比较 参照图7,它是360°方位间隔分组时各方法的性能比较图。本实验是将每一类训练样本在0°~360°方位范围内,按方位间隔360°,成为一组,在这一组上进行测试。σ2与上述(1)一样,用核-目标配准方法得到,搜索范围为lnσ2={-10∶1∶10}。最后将该方位范围的测试结果作为最终结果。360°方位范围内各识别方法线性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的识别结果分别用1、2、3、4所标注。
正则化最小二乘和Laplacian正则化最小二乘的性能比较 参照图8,它是正则化最小二乘和Laplacian正则化最小二乘的性能比较图,图中识别方法中的1和2分别表示用RLSC对训练集中无标识样本和测试集样本进行分类的结果,识别方法3和4分别表示用LapRLSC对训练集中无标识样本和测试集样本进行分类的结果。训练集中随机取150个有标识的样本。训练集中有不同个数的有标识样本时,用LapRLSC方法的识别误差率 (1)训练过程只包含训练集中有标识和无标识样本,测试集不参与训练 从训练集的每类中随机取出个数相同的有标识样本,依次为20~100个,用转导推理对无标识样本进行标识,即LapRLSC-U(transductive),用只包含训练集样本信息的分类函数,对测试集样本分类,即LapRLSC-T(out-of-sample),做10次实验取平均,识别结果如图9所示。
(2)训练过程包含训练集中的有标识样本,训练集剩余无标识样本和测试集样本全部作为无标识样本 从训练集的每类中随机取出个数相同的有标识样本,依次为20~100个,对所有的无标识样本通过转导推理transductive赋予标识,即LapRLSC-U(transductive)表示用LapRLSC通过转导推理对训练集中无标识样本进行标识,LapRLSC-U(transductive)表示用LapRLSC通过转导推理对测试集样本进行标识,做10次实验取平均,识别结果如图10所示。
仿真实验结果分析 SVM是没有做任何特征提取,将样本按10°或30°方位间隔分组,在每一个方位单元内建立SVM分类器。从图3和图4可以看到,KPCA+LapRLSC在各个方位间隔分组内均比模板匹配法,SVM,线性PCA+SVM,KPCA+SVM和KPCA+RLSC的识别率要高,给出KPCA+RLSC的仿真结果是为了说明它可以获得与其它方法相比的结果,进而将其扩展成为半监督的LapRLSC。
从图5~图7可以看到,KPCA+LapRLSC在90°、180°和360°方位间隔分组内比线性PCA+SVM、KPCA+SVM以及KPCA+RLSC的识别率都要高,并且都达到了98%以上。
图8说明在只有150个有标识的样本参与训练的情况下,RLSC对训练集中无标识样本的正确率95.77%要高于RLSC对测试样本集的正确率91.86%,而在有150个有标识的样本和548个无标识样本参与训练的情况下,LapRLSC对训练集中无标识样本的正确率98.69%要高于LapRLSC对测试样本集的正确率95.13%,LapRLSC不论是对无标识样本还是对测试集样本的识别率都要高于RLSC。原因分析对于RLSC,它是一个全监督的方法,只有150个有标识的样本参与训练,548个无标识样本相当于测试集中的样本,对训练集中无标识样本的正确率95.77%要高于对测试样本集的正确率91.86%,是因为无标识的548个样本与有标识的150个样本同属于17°俯视角下的样本集中,相似性较高,而测试集的1169个样本是15°俯视角下的图像。对于LapRLSC,它是一个半监督的方法,有150个有标识和548个无标识样本参与训练,参与了邻接图的建立和对邻接图求Laplacian的过程,通过挖掘有标识样本和无标识样本的相对位置再对548个无标识样本进行标识,而测试集的样本没有参与这一过程,所以对训练集中无标识样本的正确率98.69%要高于对测试样本集的正确率95.13%。
LapRLSC无论是对训练集中的无标识样本进行标识,还是对测试集样本进行分类的结果都比RLSC要好,因为RLSC仅仅利用了150个有标识的训练样本得到分类函数,对无标识和测试样本进行分类,而LapRLSC对150个有标识样本和548个无标识样本进行学习,再用学习得到的分类函数对测试集样本进行分类。主要区别是LapRLSC用了有标识样本和无标识样本共同来建立邻接图,求邻接图的Laplacian,RLSC没有这一步。
图9说明随着训练集中有标识样本数目的增加,对无标识样本和测试集样本的识别误差率都会下降,图10也能说明同样的问题。所不同的是,图9的结果是在只有训练集的有标识和无标识样本参与训练,测试集样本没有当作无标识样本参与训练的情况下得到的,而图10的结果是除了训练集的有标识样本和无标识样本参与训练以外,测试集样本也全部作为无标识样本参与训练的情况下得到的,可以看到,图10所示的情况下对无标识样本LapRLSC-U(transductive)和测试集样本LapRLSC-T(transductive)的误差率都比图9所示的情况下对无标识样本LapRLSC-U(transductive)和测试集样本LapRLSC-T(out-of-sample)要低。原因是测试样本参与了训练,通过转导推理得到标识的正确率要比其不参与训练直接用分类函数得到的正确率要高。
总之,本发明在基于KPCA特征提取的基础上用Laplacian正则化最小二乘SAR自动目标识别方法达到了较高的识别率,与传统的模板匹配法、有特征提取和没有特征提取的基于SVM的方法相比,对方位具有更好的鲁棒性,降低了对目标方位信息估计的精度要求,并且不像模板匹配法需要大量的空间存储模板,在小样本的情况下也可以获得较高的识别率。
算法参数影响分析 用于SAR自动目标识别的Laplacian正则化最小二乘方法主要有5个设定的初始参数,即邻接图的近邻个数n,训练集中有标识样本的个数l,高斯核函数K(xi,xj)=exp(-‖xi-xj‖2/2σ2)的宽度σ2,控制周围空间中函数的复杂性γA,和控制分布的内在几何结构函数的复杂性

其中邻接图的近邻个数n,在此算法中不敏感,实验中设为6不变,在其它参数不变的情况下,训练集中有标识样本的个数l越大,越有利于提高识别率,因此本发明提出利用全部的有标识的样本,只将测试集样本作为无标识样本。所以主要考虑核函数的宽度σ2,以及γA和

对识别率的影响。
1.核函数的宽度σ2对识别率算法性能的影响 基于核的学习算法将数据嵌入在核的核矩阵中。核的宽度σ2过大或者过小都会使识别率下降。如果能建立起目标与核函数之间的匹配程度的一种度量,则可为确定最优核参数提供依据。配准的一个关键特性是它的实际值可以通过经验值有效估计,因此为每一个σ2计算核矩阵K′,只要找到使最大的σ2即为最优的σ2。本发明中在参数范围lnσ2={-10∶1∶10}上搜索,得到在不同的目标方位范围内高斯核函数的σ2有较小的不同,都在1~e2的范围内。
2.γA和

对识别率的影响 γA和

分别控制周围空间中函数的复杂性和控制分布的内在几何结构函数的复杂性,针对不同的有标识样本和无标识样本的比例有所不同,从图9可以看到在有标识样本数目改变时,曲线不是严格下降的,就是因为有标识和无标识样本数目的比例变了,而两个参数保持不变。所以本发明针对全部训练集作为有标识样本,全部测试集作为无标识样本的样本数目比例固定的情况下,采用网格搜索法找到最佳的参数组合,分别设置为0.005和0.045。
权利要求
1.一种拉普拉斯正则化最小二乘SAR自动目标识别方法,其具体实现步骤如下
(1)输入l个有标识样本{(xi,yi)}i=1l,l是训练集样本的个数,xi表示第i个样本,用一个行向量表示,yi是该样本所属的类别标号,输入u个无标识样本{xj}j=l+1l+u,u是测试集样本的个数,xj表示第j个样本,也用一个行向量表示,用l+u个数据点建立一个邻接图,数据点看作邻接图的顶点,定义Wij为邻接图的边,是成对数据点的相似性度量,上述的邻接图可以选择n近邻或者图核,n为近邻个数,边的权值选择0或1的二值权;
(2)计算第(1)步得到的邻接图的Laplacian矩阵L=D-W,其中L表示Laplacian矩阵,D是一个对角矩阵,即第i个点到其它各点的权值之和,其值越大表示该点越重要;
(3)采用一个核函数K(xi,xj)对第(1)步所说的l+u个数据点,计算核矩阵K,Kij=K(xi,xj),Kij表示样本i和样本j的相似性;
(4)选择正则化参数γA和γI;它们分别控制周围空间函数的复杂性和边缘分布的内在几何函数的复杂性,该两参数的确定可以采用简单的网格搜索方法来实现;
(5)采用上述(1)~(4)步得到的结果,计算向量α*,其计算公式如下
其中J是一个(l+u)×(l+u)的对角矩阵,J=diag(1,...1,0,...,0),Y是一个(l+u)维的标识向量,Y=[y1,...yl,0,...0];
(6)输出分类函数x表示一个测试集样本,即待识别目标,对于两类的分类问题,根据分类函数的正负来分类,对于多类的分类问题,则采用“一对多“的策略,把有标识的当前类作为+1类,有标识的剩余样本作为-1类,无标识的样本全部标为0。当有C类时,得到C个分类函数,对无标识的每一个样本都有C个函数值,取其中最大的一个所对应的类别作为该样本所属的类别。
2.根据权利要求1所述的拉普拉斯正则化最小二乘SAR自动目标识别方法,所说的核函数的计算,可以选用以下几种核函数来进行计算
①多项式核函数k(x,y)=(a(x·y)+b)d,x,y表示两个样本,每个样本用一个向量表示,a,b,d均表示多项式核函数的参数;
②高斯核函数σ2表示高斯核函数的参数;
③Sigmoid核函数k(x,y)=tanh(α(x·y)+β),α,β表示Sigmoid核函数的参数。
本方法采用了高斯核函数,参数σ2通过核-目标配准方法,在某个参数范围上搜索,找到使得到最大值的σ2,其中K′是关于有标识样本的核矩阵,y是有标识样本的标号列向量,yT表示y的转置。
3.根据权利要求1所述的Laplacian正则化最小二乘SAR自动目标识别方法,所说的通过得到α*,其实现过程如下
根据再生核希尔伯特空间RKHS的两个重要事实
第一,正则化最小二乘问题可以用来表示,其中H表示再生核希尔伯特空间。该问题的解存在并且唯一,由“表示理论”给出解的表达形式
第二,‖f‖K2可以表示成下面的式子
α是待优化的列向量。
那么将其扩展到拉普拉斯正则化最小二乘法,它需要解决下式所表示的优化问题
其解可以表达为将和代入中得到
对它求关于α的偏导数,并令该偏导数等于零,即求解则得到解的表达式
全文摘要
本发明公开了一种拉普拉斯正则化最小二乘合成孔径雷达自动目标识别方法,它涉及雷达技术领域,其目的在于采用该方法以提高SAR目标图像的识别率,对方位具有较好的鲁棒性。该方法的实现步骤为首先将MSTAR数据库中的全部样本采用KPCA进行特征提取,再将训练集数据全部作为有标识样本,测试集数据全部作为无标识样本来建立一个无向加权图G=(V,E),将数据点看作G的顶点V,并定义成对数据点的相似度为该图的边,然后求该图的Laplacian,将它作为一个正则项,添加到正则化最小二乘分类中,称为拉普拉斯正则化最小二乘分类,求解对应的优化问题,最后用训练得到的分类函数对无标识样本进行分类。该方法可用于解决基于二维SAR图像的识别问题。
文档编号G01S13/90GK101196564SQ20071019927
公开日2008年6月11日 申请日期2007年12月18日 优先权日2007年12月18日
发明者张向荣, 焦李成, 春 阳, 公茂果, 芳 刘 申请人:西安电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1