基于空间金字塔稀疏编码的自然场景多标记分类方法_2

文档序号:9350408阅读:来源:国知局
数,d表示SIFT特征维数,本实施例中d= 128,均匀采 样步长k可为6像素,8像素等。
[0035] 步骤3,对所有图像的SIFT特征矩阵,从中随机选取M个特征向量,构成新特征矩 阵Y,将新特征矩阵Y通过K-奇异值分解方法K-SVD训练,得到字典D。
[0036] 步骤4,对每幅图像进行稀疏编码得到图像的稀疏矩阵W。
[0037] 对每幅图像的特征矩阵F,通过已经训练好的字典D进行稀疏编码,据求解公式W =DTF,得到图像的稀疏矩阵W,其中Dt表示字典D的转置。
[0038]步骤5,对每幅图像中所有图像块的稀疏向量利用空间金字塔最大池化方法,得到 整幅图像的稀疏向量X。
[0039] 步骤6,将每幅图像的稀疏编码向量X分别通过多分类支持矢量机SVM和排序支持 矢量机Rank-SVM进行分类,分类结果分别为S和R。
[0040] (6. 1)把图像的稀疏编码向量X输入到多分类支持矢量机SVM中,通过一对多的正 项准则策略,经过训练、测试,得到图像的分类结果S=以,S2,…,S1,…,S丄其中S1表示 在该分类策略中第i幅图像的分类结果,m表示测试图像的总数。
[0041 ] 将自然场景图像多标记类别库中图像按照标记沙漠、山、海洋、落日和树拆分为5 个单标记图像组,其中拆分的多标记图像只作为该类的正类样本,随机从每个单标记图像 组中选取100幅图像作为训练样本,所有图像作为测试样本,通过一对多的正项准则策略, 得到图像的分类结果S= (S1,S2,…,S1,…,S1J,其中m= 2000。
[0042] (6. 2)把图像的稀疏编码向量X输入到排序支持矢量机Rank-SVM中,经过训练、测 试,得到图像的分类结果R=取,R2,…,R1,…,RnJ,其中民表示在该分类策略中第i幅图 像的分类结果;
[0043] 步骤7,通过多分类支持矢量机SVM的分类结果S辅助校正排序支持矢量机 Rank-SVM的分类结果R,得到自然场景图像多标记类别库中图像的最终分类结果C。
[0044] (7. 1)从多分类SVM的分类结果S= (S1,S2,…,S1,…,SJ中找到非零向量的位置 为j,j= 1,2, ? ?m,位置为j的非零向量为Sj;
[0045] (7. 2)用非零向量Sj替换Rank-SVM的分类结果R={Ri,R2,…,R1,…,RJ中对应 位置j的向量R,,得到最终分类结果C= (R1,R2,…,S,,…,RJ,从而获得自然场景图像多标 记类别库中图像的分类结果为C。
[0046] 实施例2
[0047] 以k像素为步长均匀采样,并提取每个采样点周围16X16像素大小图像块的d维 尺度不变特征SIFT,本例中以6像素为步长均匀采样,并提取每个采样点周围16X16像素 大小图像块的d维尺度不变特征SIFT,
[0048] 基于空间金字塔稀疏编码的自然场景多标记分类方法同实施例1,其中步骤2所 述的提取每个采样点周围16X16像素大小图像块的d维尺度不变特征SIFT,按如下步骤进 行:
[0049] (2. 1)对16X16像素大小的图像块进行高斯滤波,其中高斯滤波的参数分别为: 均值为〇,方差为1,大小为5X5像素;
[0050] (2. 2)计算高斯滤波后的图像块内每一个像素点的梯度模值和梯度方向;
[0051] (2. 3)统计高斯滤波后的图像块中每个4X4像素的图像区域每个像素点分别在8 个方向上的投影大小之和,得到一个8维的特征向量,其中8个方向分别为0度,45度,90 度,135度,180度,225度,270度,315度,16X16像素大小的图像块内共有16个8维特征 向量,得到每个图像块的SIFT特征为128维,d= 128。最终得到图像的SIFT特征矩阵F ={yi,y2,…,yi,…,yJGRdxn,其中R表示实数集合,yi表示图像的第i个图像块的sift 特征向量,i= 1,2,…,n,n表示图像中图像块的个数。本发明使用SIFT算法,它是一种局 部特征描述子,SIFT特征具有尺度不变性,对旋转、尺度缩放、亮度变化保持不变性,对视角 变化、仿射变换、噪声也保持一定程度的稳定性。SIFT特征适合图像的特征描述。
[0052] 实施例3
[0053] 基于空间金字塔稀疏编码的自然场景多标记分类方法同实施例1-2,其中步骤3 所述的对所有图像的SIFT特征矩阵,从中随机选取M个特征向量,构成新特征矩阵Y,将其 通过K-奇异值分解方法K-SVD训练字典D,按如下步骤进行:
[0054] (3. 1)从所有图像的SIFT特征矩阵中随机选取M个特征向量,构成新特征矩阵Y, 矩阵大小为128XM,其中M-般取值为100000、200000、1000000,本实施例中]?= 200000, 发明从特征矩阵中选取了M个特征向量进行字典训练,减小了训练计算量。
[0055] (3. 2)随机选取矩阵Y中的B列特征向量初始化字典D,本实施例中字典的原子数 B= 1024,字典D的大小为128X1024,本发明利用矩阵Y中的B列特征向量初始化字典D, 比随机初始的字典效果更好;
[0056] (3. 3)利用K-奇异值分解方法K-SVD求解优化方程
[0058] 得到字典D的近似解,其中Y表示特征矩阵,a为稀疏系数矩阵,Hf表示矩阵的 2范数的平方,min{II?II}表示使?的值达到最小,s.t.表示约束条件,Vf表示任意的i值,i= 1,2,???,]?,II?I|。表示向量?的0范数,a;表示稀疏系数矩阵a的第i列,TqS 稀疏度,设为1。
[0059] 实施例4
[0060] 基于空间金字塔稀疏编码的自然场景多标记分类方法同实施例1-3,其中步骤5 所述的对每幅图像的稀疏矩阵W,利用空间金字塔最大池化方法,得到整幅图像的稀疏编码 向量X,按如下步骤进行:
[0061] (5. 1)对金字塔第一层的整幅图像进行稀疏编码,计算其各个维度的最大值,得到 1个1024维的特征向量;
[0062] (5. 2)把金字塔第二层的整幅图像分为2X2的4个图像块,计算每个图像块中所 有稀疏编码在各个维度的最大值,得到4个1024维的特征向量;
[0063] (5. 3)把金字塔第三层的整幅图像分为4X4的16个图像块,计算每个图像块中所 有稀疏编码在各个维度的最大值,得到16个1024维的特征向量;
[0064] (5. 4)整合步骤(5. 1)至(5. 3)得到的21个1024维的特征向量,得到21504维的 整幅图像的稀疏编码矩阵X。
[0065] 实施例5
[0066] 基于空间金字塔稀疏编码的自然场景多标记分类方法同实施例1-4,其中步骤 (6. 1)所述的把图像的稀疏编码向量X输入到多分类支持矢量机SVM中,通过一对多的正项 准则策略,经过训练、测试,得到图像的分类结果S=以,S2,…,S1,…,S丄是将自然场景图 像多标记类别库中图像按照标记沙漠、山、海洋、落日和树拆分为5个单标记图像组,其中 拆分的多标记图像只作为该类的正类样本,随机从每个单标记图像组中选取1〇〇幅图像作 为训练样本,所有图像作为测试样本,通过一对多的正项准则策略,得到图像的分类结果S =(S1,S2,…,S1,…,S1J,构建多分类支持矢量机SVM的准则策略有两种,一对多和一对一, 本实施例中采用一对多的准则策略。
[0067] 本发明的效果可以通过以下仿真实验进一步说明:
[0068] 1.仿真条件:
[0069] 仿真实验采用自然场景图像多标记类别库,包含2000幅自然场景图像。该图像库 包含沙漠、山、海洋、落日和树5个概念类,具有两个或两个以上概念标记,例如"海洋+落 日"的图像约占图像库的22 %,其中某些类型的概念标记集合(例如"山+落日+树)出 现频率极低,每幅图像平均对应于I. 24±0. 44个概念标记。其样例图像如图2所示,其中 图2(a)是沙漠场景,图2(b)是山场景,图2(c)是海洋场景,图2(d)是落日场景,图2(e) 是树场景,图2(f)是沙漠+山场景,图2(g)是山+海洋场景,图2(h)是海洋+落日场景, 图2(i)是落日+树场景,图2(j)是沙漠+山+落日场景,图2(k)是山+海洋+树场景,图 2(1)是海洋+落日+树场景,其每个类别的类别名称以及包含的图像数目如表1所示。
[0070] 表1自然场景图像多标记类别库
[0071]
[0072]仿真实验在CPU为IntelCore(TM) 2Duo、主频 2. 33GHz,内存为 2G的WINDOWSXP 系统上用MATLAB7. 0. 1软件进行。
[0073] 2?仿真内容及分析:
[0074] 使用本发明与Boutell
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1