一种基于半监督SVM和MeanShift的极化SAR图像分类方法

文档序号:6539460阅读:255来源:国知局
一种基于半监督SVM和MeanShift的极化SAR图像分类方法
【专利摘要】本发明方法公开了一种基于半监督SVM和MeanShift的极化SAR图像分类方法,其实现步骤是:分别建立极化SAR图像分类训练集和图像分类测试集;用S4VMs算法获得极化SAR图像分类结果;选取S4VMs分类结果置信度高的样本集;用MeanShift结果修改S4VMs分类结果,更新样本集;更新训练集、测试集和分类模型;用分类模型对极化SAR图像进行分类。本发明采用阈值软化分,提高了算法的自适应性;通过MeanShift结果修改样本集,完善了图像信息,避免了人工标记困难的问题,获得了更好的分类效果,可用于目标检测、识别和分类。
【专利说明】—种基于半监督SVM和MeanShift的极化SAR图像分类方法
【技术领域】
[0001]本发明属于图像处理【技术领域】,特别涉及一种基于半监督SVM和MeanShift的极化SAR图像分类方法。
【背景技术】
[0002]随着电子技术,尤其是大规模集成电路技术的高速发展,合成孔径雷达(SAR)正朝着多分辨、多波段、多极化、多工作模式等方向发展,致力于提供更丰富的目标散射信息。极化SAR (Polarimetric SAR)是能对目标进行全极化测量的合成孔径雷达,能对目标进行更为全面的描述。其数据包含了更为丰富的目标散射信息,所以极化SAR在目标检测与识别、分类及参数反演等方面有十分突出的优势,自出现开始便引起了各国学者的广泛关注。目前机载和星载极化SAR数据已成海量趋势增长,但极化SAR图像信息的自动解译系统的发展还远远落后于信息源的发展。同时合成孔径雷达图像独有的成像机理和成像环境也使极化SAR图像的人工判读和自动解译变得十分困难。因此,如何对海量极化SAR数据进行分析和利用,快速有效地提取尽可能多的目标散射信息,将是今后遥感信息处理领域的一个重要的研究方向。
[0003]根据学习过程中是否存在有标签的样本,传统的机器学习可以分为有监督学习和无监督学习两种。有监督学习通过已标记样本去获得一个最优模型,再利用这个模型将所有的输入映射为相对的输出,对输出进行判断从而实现分类的目的。典型的有监督学习方法有SVM,神经网络等。但是在很多实际应用中,由于缺少形成模式类的知识,或者出于实际工作中的困难,我们往往只能利用没有类别标记的样本,这就是所说的无监督学习方法。
[0004]半监督学习是有监督学习与无监督学习相结合的一种学习方法。同时利用已标记样本和未标记样本,通过挖掘未标记样本中所蕴含的各个待分类类型在特征空间中的固有结构,从而对根据训练样本拟合的分类器进行校正,减少因为训练样本代表性不好对分类器拟合造成的偏差。由于半监督学习只是利用少量昂贵的已标记样本,主要利用大量的所谓廉价的未标记样本,避免了对数据资源的极大浪费,同时有效解决了各种实际问题中常见的训练样本代表性不好或训练样本难以获得的问题,在遥感图像处理、文本分类、Web挖掘等领域受到了重视,得到了长足的发展。
[0005]由于地表情况的复杂性和地物散射机理的复杂性,地物散射特征的分析十分困难。虽然已经有Cloude和Freeman等基于散射特性的特征提取方法,但是离真正的从散射回波中分析出物体的类别,进行精准的分类,还有很大一段距离。所以目前的算法大多是提取散射特征后用无监督的方法进行分类,研究重心更多的是集中在数据分布的研究方面。Η/α分类法可以分析目标的散射特性,但是用阈值硬划分的方法明显不适合所有的地物,自适应性比较差。
[0006]极化SAR的每个像素点包含极化散射信息,而作为图像每个像素点又包含图像信息,如何将两种信息充分利用,使其互相补充得到更好地分类效果,是极化SAR地物分类面临的一大问题。很多经典算法如H/ a wishart等方法都是将极化SAR图像纯粹的当做了数据,而没有考虑到图像的灰度、纹理等特质,没有充分利用极化SAR图像所包含的信息。

【发明内容】

[0007]本发明的目的在于针对上述已有方法的不足,提出一种基于半监督SVM(支持向量机,SupportVectorMachine)和MeanShift (均值漂移)的极化SAR图像分类方法,提高了算法的自适应性,以减少了人工标记的需求,将图像特征的目标散射信息和图像信息有效的结合,提高分类效果。
[0008]为实现上述目的,本发明提供的一种基于半监督SVM和MeanShift的极化SAR图像分类方法,包括如下步骤:
[0009](I)分别建立极化SAR图像分类训练集Tr和图像分类测试集Ts ;
[0010](Ia)分别从极化SAR图像的低熵H < 0.2、中熵0.5 < H < 0.6、高熵H > 0.8中随机选取η个样本组成极化SAR图像分类训练集Tr,其余样本组成极化SAR图像分类测试集Ts,样本总数为A,若数据量较大,可将图像分类测试集Ts划分为80X80的小块依次处理,其中η的取值范围为50-200间的任意整数;
[0011](2)将极化SAR图像分类训练集和图像分类测试集的样本输入S4VMs算法,采用one-vs-all策略分别获得低熵、中熵、高熵对应的极化SAR图像分类模型吣、Mm、Mh和测试
集Ts的类别Lm: {f;}、其中之、Ym., 4分别表示测试集Ts中的样本
j在低熵、中熵、高熵分类模型中的分类结果;
[0012](3)选取S4VMs算法分类结果中只被一类标记的样本,即Y',Ymj +%=1对应的样本,构成置信度高的样本集S ;
[0013](4)利用MeanShift结果修改S4VMs分类结果,更新样本集S,得到样本集S2:
[0014](4a)输入极化SAR图像功率,使用MeanShift方法对极化SAR图像做过分割处理,得到样本类别集N ;
[0015](4b)依次找出样本集S中MeanShift聚类结果和S4VMs分类结果一致的样本,构成样本集S1 ;
[0016](4c)用MeanShift聚类结果辅助标记样本集S中S4VMs分类结果未标记的若干样本,加入样本集S1,得到样本集S2 ;
[0017](5)随机选择样本集S2中若干样本加入训练集Tr中,将样本集S2从测试集Ts中去掉,得到新的训练集Tr1和测试集Ts1 ;
[0018](6)用极化SAR图像分类模型Mp Mm、Mh对测试集Ts1进行分类,获得分类结果:
[0019](6a)若Ts1中所剩样本大于全部样本A的5%,则对被两类标记的样本,SP
+<=2对应的样本,使用传统的S4VMs分类器进行分类,分类结果加入训练集Trl,对
被三类均标记的样本,即对应的样本,删除其类别标签并放回测试集Tsl中,返回⑵;
[0020](6b)若Ts1中所剩样本小于全部样本A的5%,用有向非循环图SVM,即DAGSVM决定其最终分类。[0021]上述图像分类步骤中的步骤(Ia)所述的分别从极化SAR图像的低熵H < 0.2、中熵0.5 < H < 0.6、高熵H > 0.8中随机选取η个样本组成极化SAR图像分类训练集Tr,其余样本组成极化SAR图像分类测试集Ts,样本总数为A,若数据量较大,可将图像分类测试集Ts划分为80X80的小块依次处理,其中η的取值范围为50-200间的任意整数,是根据下列公式计算各样本的熵,
【权利要求】
1.一种基于半监督SVM和MeanShift的极化SAR图像分类方法,其特征在于,包括如下步骤: (1)分别建立极化SAR图像分类训练集Tr和图像分类测试集Ts; (Ia)分别从极化SAR图像的低熵H < 0.2、中熵0.5 < H < 0.6、高熵H > 0.8中随机选取η个样本组成极化SAR图像分类训练集Tr,其余样本组成极化SAR图像分类测试集Ts,样本总数为Α,若数据量较大,可将图像分类测试集Ts划分为80 X 80的小块依次处理,其中η的取值范围为50-200间的任意整数; (2)将极化SAR图像分类训练集和图像分类测试集的样本输入S4VMs算法,采用one-vs-all策略分别获得低熵、中熵、高熵对应的极化SAR图像分类模型M1' Mm、Mh和测试集Ts的类别Ll=Ij1j]、、Lh = {yj},其中、Ymj、Yhj分别表示测试集Ts中的样本j在低熵、中熵、高熵分类模型中的分类结果; (3)选取S4VMs算法分类结果中只被一类标记的样本,即+<=1对应的样本,构成置信度高的样本集S ; (4)利用MeanShift结果修改S4VMs分类结果,更新样本集S,得到样本集S2: (4a)输入极化SAR图像功率,使用MeanShift方法对极化SAR图像做过分割处理,得到样本类别集N ; (4b)依次找出样本集S中MeanShift聚类结果和S4VMs分类结果一致的样本,构成样本集S1 ; (4c)用MeanShift聚类结果辅助标记样本集S中S4VMs分类结果未标记的若干样本,加入样本集S1,得到样本集S2 ; (5)随机选择样本集S2中若干样本加入训练集Tr中,将样本集S2W测试集Ts中去掉,得到新的训练集Tr1和测试集Ts1 ; (6)用极化SAR图像分类模型MpMm、Mh对测试集Ts1进行分类,获得分类结果: (6a)若Ts1中所剩样本大于全部样本A的5%,则对被两类标记的样本,即y? +Y丨)=2对应的样本,使用传统的S4VMs分类器进行分类,分类结果加入训练集Trl,对被三类均标记的样本,即yi+y:;+4=3对应的样本,删除其类别标签并放回测试集Ts1中,返回(2); (6b)若Ts1中所剩样本小于全部样本A的5%,用有向非循环图SVM,即DAGSVM决定其最终分类。
2.根据权利要求1所述的基于半监督SVM和MeanShift的极化SAR图像分类方法,其特征在于,其中步骤(Ia)所述的分别从极化SAR图像的低熵H < 0.2、中熵0.5 < H< 0.6、高熵H > 0.8中随机选取η个样本组成极化SAR图像分类训练集Tr,其余样本组成极化SAR图像分类测试集Ts,样本总数为A,若数据量较大,可将图像分类测试集Ts划分为80 X 80的小块依次处理,其中η的取值范围为50-200间的任意整数,是根据下列公式计算各样本的熵,
3.根据权利要求1所述的基于半监督SVM和MeanShift的极化SAR图像分类方法,其特征在于,其中步骤(2)所述的将极化SAR图像分类训练集和图像分类测试集的样本输入S4VMs算法,采用one-vs-all策略分别获得低熵、中熵、高熵对应的极化SAR图像分类模型MpM1^ Mh和测试集Ts的类别
Ll-1yj) > Lm- {yj} X Lh = {yh1}, one-vs-all 策略的步骤如下: (2a)依次将训练集中低熵、中熵、高熵样本设置为正类+1,其他样本为负类-1 ; (2b)分别将不同正、负类训练样本、测试样本输入S4VMs算法,获得对应的分类模型和测试集类别。
4.根据权利要求1所述的基于半监督SVM和MeanShift的极化SAR图像分类方法,其特征在于,其中步骤(4b)所述的依次找出样本集S中MeanShift聚类结果和S4VMs分类结果一致的样本,构成样本集S1,步骤如下: (4bI)使用3X3的滑窗依次获取样本集S中各样本及其8连通区域的MeanShift聚类结果P和S4VMs分类结果Q ; (4b2)分别找出MeanShift聚类结果P和S4VMs分类结果Q与滑窗中心样本类别一致的样本U、V ; (4b3)找出样本U、V中同一空间位置的样本,构成样本集Sp
5.根据权利要求1所述的基于半监督SVM和MeanShift的极化SAR图像分类方法,其特征在于:其中步骤(4c)所述的用MeanShift聚类结果辅助标记样本集S中S4VMs分类结果未标记的若干样本,加入样本集S1,得到样本集S2,步骤如下: (4cl)找出样本集S中S4VMs分类结果中无标记的样本集0,即4+y:;+4=0的样本集; (4c2)找出样本集O对应空间位置的MeanShift聚类结果与滑窗中心样本类别一致的样本R,加入样本集S1,得到样本集S2。
【文档编号】G06K9/66GK103914704SQ201410076676
【公开日】2014年7月9日 申请日期:2014年3月4日 优先权日:2014年3月4日
【发明者】焦李成, 刘芳, 白雪, 马文萍, 马晶晶, 张丹, 王爽, 侯彪 申请人:西安电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1