基于空间金字塔稀疏编码的自然场景多标记分类方法_3

文档序号：9350408阅读：来源：国知局

等、Zhang和Zhou的方法进行对比，均对自然场景图像多标记类别库中的每个概念类自然场景图像中随机选取100幅共500幅图像组成自然场景图像多标记分类的训练集，用自然场景图像多标记类别库中所有2000幅图像组成自然场景图像多标记分类的测试集，ML-KNN方法中参数取值为k= 10。
[0075] 仿真1，用本发明方法及现有Boutell等的方法和Zhang和Zhou的ML-KNN方法进行对比实验，对自然场景图像多标记类别库中的5个概念类自然场景图像进行10次交叉验证实验，计算10次交叉验证实验的平均分类正确率，作为自然场景图像多标记类别库的最终分类正确率，对比结果如表2所示。
[0076] 表2实验结果对比
[0077]
[0078] 从表2可见，本发明方法对自然场景图像多标记类别库的最终分类正确率高于其他方法。
[0079] 综上，本发明公开的基于空间金字塔稀疏编码的自然场景多标记分类方法，主要解决现有分类方法对自然场景描述不够完全和分类正确率较低的问题。其实现步骤是：建立自然场景图像多标记类别库；提取它的尺度不变特征SIFT生成稀疏字典D;用稀疏字典对图像进行字典映射，并用空间金字塔和稀疏编码生成多尺度稀疏向量；用多分类支持矢量机分类结果校正排序支持矢量机分类结果，得到自然场景图像的最终分类结果。本发明采用了多尺度特征、稀疏编码和多标记分类方法，通过对自然场景图像进行空间金字塔稀疏编码，提取了更多的图像局部信息，丰富了图像的特征，对自然场景描述的更为完全，与 Boutell等及Zhang和Zhou的方法相比，提高了自然场景的分类精度和鲁棒性，可用于自然场景匹配、分类和识别。
【主权项】
1. 一种基于空间金字塔稀疏编码的自然场景多标记分类方法，包括如下步骤： (1) 建立自然场景图像多标记类别库； (2) 对自然场景图像多标记类别库中的每幅图像，提取图像的尺度不变SIFT特征矩阵 F ：以k像素为步长均匀采样，并提取每个采样点周围16 X 16像素大小图像块的d维尺度不变特征SIFT，得到图像的SIFT特征矩阵F = {yi，y2, . . .，yi，. . .，yj e Rdxn，其中R表示实数集合，yi表示图像的第i个图像块的SIFT特征向量，i = 1，2,…，η，η表示图像中图像块的个数，d表示SIFT特征维数； (3) 对所有图像的SIFT特征矩阵，从中随机选取M个特征向量，构成新特征矩阵Y，将其通过K-奇异值分解方法K-SVD训练字典D，M取值为100000-1000000之间的整数； (4) 对每幅图像的特征矩阵F，通过已经训练好的字典D进行稀疏编码，得到图像的稀疏矩阵W; (5) 对每幅图像的稀疏矩阵W，利用空间金字塔最大池化方法，得到图像的稀疏编码向量X ; (6) 将每幅图像的稀疏编码向量X分别通过多分类支持矢量机SVM和排序支持矢量机Rank-SVM进行分类，通过多分类支持矢量机SVM的分类结果为S，通过排序支持矢量机 Rank-SVM的分类结果为R : (6a)把图像的稀疏编码向量X输入到多分类支持矢量机SVM中，通过一对多的正项准则策略，经过训练、测试，得到图像的分类结果S =以，S2，…，S1，…，S丄其中示在该分类策略中第i幅图像的分类结果，m表示测试图像的总数； (6b)把图像的稀疏编码向量X输入到排序支持矢量机Rank-SVM中，经过训练、测试，得到图像的分类结果R = (R1, R2，…，R1，…，RJ，其中民表示在该分类策略中第i幅图像的分类结果； (7) 通过多分类支持矢量机SVM的分类结果S辅助校正排序支持矢量机Rank-SVM的分类结果R，得到自然场景图像多标记类别库中图像的最终分类结果C : 多分类SVM的分类结果S = (S1, S2，…，S1，…，SJ中找到非零向量的位置为j，j = 1，2,. . m，用位置为j的非零向量Sj替换Rank-SVM的分类结果R = {R u R2，…，R1，…，RJ 中对应位置j的向量R,，得到自然场景图像多标记类别库中图像的最终分类结果C = (R1, R2，…，Sj，…，R1J，其中Sj为替换向量R j的非零向量。2. 根据权利要求1所述的基于空间金字塔稀疏编码的自然场景多标记分类方法，其中步骤2所述的提取每个采样点周围16 X 16像素大小图像块的d维尺度不变特征SIFT，按如下步骤进行： (2a)对16X16像素大小的图像块进行高斯滤波，其中高斯滤波的参数分别为：均值为〇,方差为1，大小为5X5像素； (2b)计算高斯滤波后的图像块内每一个像素点的梯度模值和梯度方向； (2c)统计高斯滤波后的图像块中每个4X4像素的图像区域内每个像素点分别在8个方向上的投影大小之和，得到一个8维的特征向量，其中8个方向分别为0度，45度，90度， 135度，180度，225度，270度，315度，16 X 16像素大小的图像块内共有16个8维特征向量，得到每个图像块的SIFT特征为128维。3. 根据权利要求1所述的基于空间金字塔稀疏编码的自然场景多标记分类方法，其中步骤（3)所述的对所有图像的SIFT特征矩阵，从中随机选取M个特征向量，构成新特征矩阵Y，将其通过K-奇异值分解方法K-SVD训练字典D，按如下步骤进行： (3a)从所有图像的SIFT特征矩阵中随机选取M个特征向量，构成新特征矩阵Y，矩阵大小为128XM ; (3b)随机选取特征矩阵Y中的1024列特征向量初始化字典D，字典D的大小为 128X1024 ； (3c)利用K-奇异值分解方法K-SVD求解优化方程得到字典D的近似解，其中Y表示特征矩阵，α为稀疏系数矩阵，K表示矩阵的2范数的平方，min{ I I · I I}表示使?的值达到最小，s. t.表示约束条件，_W_表示任意的i值， i = 1，2, "·，Μ，I I · I |。表示向量?的0范数，α ;表示稀疏系数矩阵α的第i列，T。为稀疏度，设为1。4. 根据权利要求1所述的基于空间金字塔稀疏编码的自然场景多标记分类方法，其中步骤（4)所述的对每幅图像的特征矩阵F，通过已经训练好的字典D进行稀疏编码，根据求解公式W = DTF，得到图像的稀疏矩阵W，其中示字典D的转置。5. 根据权利要求1所述的基于空间金字塔稀疏编码的自然场景多标记分类方法，其中步骤（5)所述的对每幅图像的稀疏矩阵W，利用空间金字塔最大池化方法，得到整幅图像的稀疏编码向量X，按如下步骤进行： (5a)对金字塔第一层的整幅图像进行稀疏编码，计算其各个维度的最大值，得到1个 1024维的特征向量； (5b)把金字塔第二层的整幅图像分为2 X 2的4个图像块，计算每个图像块中所有稀疏编码在各个维度的最大值，得到4个1024维的特征向量； (5c)把金字塔第三层的整幅图像分为4X4的16个图像块，计算每个图像块中所有稀疏编码在各个维度的最大值，得到16个1024维的特征向量； (5d)整合步骤（5a)至（5c)得到的21个1024维的特征向量，得到21504维的整幅图像的稀疏编码向量X。6. 根据权利要求1所述的基于空间金字塔稀疏编码的自然场景多标记分类方法，其中步骤（6a)所述的把图像的稀疏编码向量X输入到多分类支持矢量机SVM中，通过一对多的正项准则策略，经过训练、测试，得到图像的分类结果S = (S1, S2，…，S1，…，SJ，是将自然场景图像多标记类别库中图像按照标记沙漠、山、海洋、落日和树拆分为5个单标记图像组，其中拆分的多标记图像只作为该类的正类样本，随机从每个单标记图像组中选取100幅图像作为训练样本，所有图像作为测试样本，通过一对多的正项准则策略，得到图像的分类结果 S = (S1, S2，…，S1，…，SJ 〇
【专利摘要】本发明方法公开了一种基于空间金字塔稀疏编码的自然场景多标记分类方法，主要解决现有分类方法对自然场景描述不够完全和分类正确率较低的问题。其实现步骤是：建立自然场景图像多标记类别库；提取它的尺度不变特征SIFT生成稀疏字典D；用稀疏字典对图像进行字典映射，并用空间金字塔和稀疏编码生成多尺度稀疏向量；用多分类支持矢量机分类结果校正排序支持矢量机分类结果，得到自然场景图像的最终分类结果。本发明采用了多尺度特征、稀疏编码和多标记分类方法，提取了图像的局部信息，丰富了图像的特征信息，对自然场景描述的更为完全，提高了自然场景的分类精度和鲁棒性，可用于自然场景匹配、分类和识别。
【IPC分类】G06K9/62
【公开号】CN105069481
【申请号】CN201510512625
【发明人】焦李成, 张丹, 马文萍, 屈嵘, 曾杰, 刘红英, 王爽, 侯彪, 杨淑媛, 尚荣华
【申请人】西安电子科技大学
【公开日】2015年11月18日
【申请日】2015年8月19日

完整全部详细技术资料下载

当前第3页1 2 3