基于增量支持向量机的sar图像多类标场景分类方法

文档序号:8431202阅读:220来源:国知局
基于增量支持向量机的sar图像多类标场景分类方法
【技术领域】
[0001] 本发明属于图像处理技术领域,特别涉及一种图像场景分类方法,可快速准确地 处理海量多类标SAR图像。
【背景技术】
[0002] 在机器学习领域中,针对多类标学习的研宄对于多义性对象学习建模具有十分 重要的意义,现在已经逐渐成为国际机器学习界一个新的研宄热点。由于客观事物本身的 复杂性,一个事物对象可以用单个实例来表示,并且该实例属于多个类别标签,即单实例 多类标。单实例多标签的学习方法对图像分类的问题具有重要的意义,但是该方法却很少 被应用到SAR图像的场景分类当中。
[0003] 随着合成孔径雷达SAR技术的发展,SAR图像在分辨率、图像内容和数量上都达到 了一定的高度,其应用也越来越广泛。SAR图像的场景分类不同于传统的SAR图像分类技 术,场景分类中并不严格追求同类图像间的内容相似性,而是关注于通过某种学习方法挖 掘图像内在的语义信息。近年来,学者们针对该问题也做出了一些研宄。
[0004] 武汉大学的殷慧在其博士学位论文"基于局部特征表达的高分辫率SAR图像城区 场景分类方法"中研宄了高分辨率SAR图像的城区场景解译应用。该论文涉及到局部特征表 达和分类技术,中间表达和主题提取技术。主要提出了两种分类算法,分别是:1.基于多维 金字塔表达算法和AdaBoost的高分辨率SAR图像的城区场景分类算法;2.基于多维金字 塔匹配核和支持向量机的高分辨率SAR图像城区场景分类算法。还提出了两种分类框架, 分别是:1.基于两级地物语义的高分辨率SAR图像的城区场景分类框架;2.基于中间表达 式和线性判别分析法的高分辨率SAR图像城区场景分类框架。从分类结果看,其研宄结果 存在的不足是各算法的分类准确率较低,分类时间较长。

【发明内容】

[0005] 本发明的目的是针对上述已有技术的不足,提出一种基于增量支持向量机的SAR 图像多类标场景分类方法以缩短分类时间,提高分类精度。
[0006] 实现本发明目的的技术方案是:采用多标签的标记方式,使单幅图像描述内容更 加丰富具体,能够通过学习挖掘出图像内部语义信息,提高分类精度,采用增量支持向量机 作为分类器,缩短分类时间。其实现步骤包括如下:
[0007] (1)将四幅给定的SAR图像分别切割成无重叠的小图像块,每个小图像块的大小 均为256*256像素,从这些小图像块形成的图像库中选取肉眼能够清晰识别且信息完整的 图像块组成一个数据库,该数据库包括山脉,水域,城市,建筑,池塘和平原这六个类别;
[0008] (2)在上述数据库中提取每一幅图像基于contourlet变换的纹理特征和形状特 征作为一个特征集,并将该特征集当中的每一个特征向量归一化到0-1之间;
[0009] (3)将上述特征集中图像的地物标签矩阵表示为y,当第i幅图像属于第j个类别 时,则地物标签矩阵y中的元素y(i,j) = 1,否则,y(i,j) = -1,并规定特征集中任意一 幅图像至少属于一个类别,其中i = 1,???,]!,n表示特征集中图像张数,j = 1,…,6,表示 一共有6个类别;
[0010] ⑷将上述地物标签矩阵y中的每一列向量作为一个类别的地物标签,得到六组 地物标签y w,j = 1,6 ;
[0011] (5)从步骤⑵的特征集中随机选取训练样本和测试样本,构成训练样本集 {xk,#丨^和测试样本集{txk,# ,其中,xk是第k个训练特征样本,用一个行向量表示, yf是与Xk相对应的第j个类别的地物标签,n是训练样本个数,tx k是第k个测试特征样 本,用一个行向量表示,tyf是与txk相对应的第j个类别的地物标签,tn是测试样本个数;
[0012] (6)对训练样本集采用增量学习的方法进行迭代训练,得到支持向量集合 怂={ps,yp s}=,以及该集合中所有支持向量所对应的拉格朗日乘子向量《={〇^}二和偏 斜量b,其中Ps为当前支持向量集合中第s个支持向量,y Ps为当前支持向量集合中第s个 支持向量所对应的类别标签,a Ps是当前支持向量集合中第s个支持向量所对应的拉格朗 日乘子,b是一个标量;
[0013] (7)根据上述训练得到的支持向量集合Pm、拉格朗日乘子向量a和偏斜量b,用分 类决策函数对测试样本进行识别,得到测试样本的输出矩阵T,其中第k个测试样本对应的 输出向量T k是输出矩阵T中第k个行向量;
[0014] (8)判断测试样本的标签:
【主权项】
1. 一种基于增量支持向量机的SAR图像多类标场景分类方法,包括如下步骤: (1) 将四幅给定的SAR图像分别切割成无重叠的小图像块,每个小图像块的大小均为 256*256像素,从这些小图像块形成的图像库中选取肉眼能够清晰识别且信息完整的图像 块组成一个数据库,该数据库包括山脉,水域,城市,建筑,池塘和平原这六个类别; (2) 在上述数据库中提取每一幅图像基于contourlet变换的纹理特征和形状特征作 为一个特征集,并将该特征集当中的每一个特征向量归一化到0-1之间; (3) 将上述特征集中图像的地物标签矩阵表示为y,当第i幅图像属于第j个类别时, 则地物标签矩阵y中的元素 y (i,j) = 1,否则,y (i,j) = -1,并规定特征集中任意一幅图 像至少属于一个类别,其中i = 1,···,]!,η表示特征集中图像张数,j = 1,…,6,表示一共 有6个类别; (4) 将上述地物标签矩阵y中的每一列向量作为一个类别的地物标签,得到六组地物 标签 y(j),j = 1,2···6 ; (5) 从步骤(2)的特征集中随机选取训练样本和测试样本,构成训练样本集 Κ,yf1 L和测试样本集UxkWt1,其中,xk是第k个训练特征样本,用一个行向量表示, 是与Xk相对应的第j个类别的地物标签,η是训练样本个数,tx k是第k个测试特征样 本,用一个行向量表示,tyf1是与txk相对应的第j个类别的地物标签,tn是测试样本个数; (6) 对训练样本集采用增量支持向量机的学习方法进行迭代训练,得到支持向量集合 尺={PS,,以及该集合中所有支持向量所对应的拉格朗日乘子向量和偏 斜量b,其中ps为当前支持向量集合中第s个支持向量,y Ps为当前支持向量集合中第S个 支持向量所对应的类别标签,a ps是当前支持向量集合中第s个支持向量所对应的拉格朗 日乘子,b是一个标量; (7) 根据上述训练得到的支持向量集合Pm、拉格朗日乘子向量α和偏斜量b,用分类决 策函数对测试样本进行识别,得到测试样本的输出矩阵T,其中第k个测试样本对应的输出 向量T k是输出矩阵T中第k个行向量; (8) 判断测试样本的标签: 8a)当测试样本的输出向量Tk中每一个值都小于0时,则第k个测试样本的类别向量 为:
8b)当测试样本的输出向量Tk中至少有一个值大于0时,则第k个测试样本的类别向 量为:
其中j = 1,2…6, j表示类别数,k = 1,2··· tn, tn表示测试样本数; 8c)根据步骤8a)-Sb)的判别结果得到测试样本的标签向量tyk,再由向量tyk构成测 试样本的标签矩阵{ty,H1,该矩阵{对应测试样本的类别,即分类结果。
2. 根据权利要求1所述的方法,其中步骤6所述的采用增量学习的方法进行迭代训练, 按如下步骤进行: 2a)选择第一个训练样本X1作为支持向量,得到一个初始的向量集Pm= {x p yj,,其中 m = 1,71是X i对应的地物标签;通过最小二乘支持向量机的求解线性方程组的方法得到该 支持向量集相应的拉格朗日乘子向量°^和偏斜量b m,由Pm、aPm和bm构成一个初始的分类 器
2b)用初始的分类器对剩下的训练样本进行分类,即每次从错分的样本和离类边 界比较近的样本中选择一个样本作为新的支持向量,把这个样本和其相对应的标签加 到支持向量所对应的拉格朗日乘子向量%^和偏斜量b m+1中,得到一个新的分类器:
2c)更新变量m = m+1 ; 2d)重复过程2b)和2c)共L次,其中L多30,得到一次更新后的分类器:
2e)找出拉个朗日乘子向量中绝对值最小的拉格朗日乘子,并删除掉其所对应的那 个支持向量,通过最小二乘支持向量机求解线性方程组的方法得到该支持向量集相应的拉 格朗日乘子向量<"_,和偏斜量b' μ,得到一个新的分类器:
2f)更新变量m = m-Ι ; 2g)循环步骤2b)到2f)直到满足停止的条件,得到支持向量集合P" m,并通过最小二 乘支持向量机的求解线性方程组的方法计算得到更新后的支持向量集合的拉格朗日乘子 向量和偏斜量b" m,其中α" &是更新后的支持向量集合中第s个支持向量所 对应的拉格朗日乘子,b" m是一个标量。
3. 根据权利要求1所述的方法,其中所述步骤(7)中的分类决策函数,表示如下:
其中tx是测试样本,a Ps是支持向量集合中第s个支持向量所对应的拉格朗日乘子, Ps是支持向量集合中第s个支持向量,y Ps是支持向量集合中第s个支持向量所对应的类 别标签,b是支持向量集合中第s个支持向量所对应的偏移量,K是一个核函数,其表示为:
X,y是两个不同的样本向量,σ 2是和核函数的宽度,通过网格搜 索法求出。
【专利摘要】本发明公开了一种基于增量支持向量机的SAR图像多类标场景分类方法,主要解决如何更加准确高速的处理多标签SAR图像的场景分类问题。其实现步骤为:首先,将SAR大图切割为大小相同的小图像块,选出信息清晰完整的图像块进行多标签标记;然后提取基于contourlet的形状、纹理特征,再随机选取训练样本和测试样本;而后,将多类标分解成多个单类标,依次采用增量学习的方法训练支持向量机的模型;最后,根据学到的模型计算测试样本输出值,进而预测出标签,得到分类结果,本发明具有分类精度更高,分类时间更短的优点,可用于快速准确地处理海量多类标SAR图像。
【IPC分类】G06K9-62
【公开号】CN104751175
【申请号】CN201510109062
【发明人】焦李成, 马文萍, 张曼, 屈嵘, 刘红英, 杨淑媛, 侯彪, 王爽, 马晶晶
【申请人】西安电子科技大学
【公开日】2015年7月1日
【申请日】2015年3月12日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1