基于surf特征的图像物体识别方法

文档序号：9631819阅读：1112来源：国知局

基于surf特征的图像物体识别方法
【技术领域】
[0001] 本发明涉及图像物体识别领域，具体地，涉及一种基于SURF(SpeedUpRobust Feature)特征和词袋模型的图像物体识别方法。
【背景技术】
[0002] 图像识别和分类技术是计算机视觉和模式识别领域的一个重要的应用，在机械工业、物流运输、零售等行业，精确的图像物体识别技术可以将人们从繁重的劳动中解放出来，降低生产成本，提高工作效率。在日常生活中，人们可以快速准确的抓住物体的特征并识别物体，但对于计算机来说，自动识别物体却有着不小的困难。其原因在于图像中的物体受到拍摄角度、旋转变化、光照变化、尺度变化、拍摄质量等因素的影响。
[0003] 现有的针对这些困难的解决方法是结合使用局部特征点、词袋模型以及分类器的方法。这种方法在一定程度上解决了物体识别的问题，但是其中带来的特征维数高，计算量大，不能满足实时性、且词袋模型效果不好。
[0004] 经过检索发现，专利【申请号】CN201210196526. 2,名称为"基于SURF高效匹配核的人体检测方法"中提出：在不同图像尺度下提取SURF描述子特征点，随机采样提取特征点构成视觉词汇的初始向量基，对初始向量基使用带约束的奇异值分解获得最大核函数特征，对不同图像尺度下的最大核函数特征进行加权获得所有图像尺度下的特征，对得到的特征利用SVM(SupportVectorMachine支持向量机）分类器进行分类训练，最后得到检测分类器。该专利文献中计算多尺度的SURF特征，计算量大，且直接使用奇异值分解分解构建词典，对特征没有进一步的处理。
[0005] 由刘鹏、叶志鹏、赵巍等在自动化学报2015,41 (5) :960-969发表的"一种多层次抽象语义决策图像分类方法" 一文中提到了使用视觉词包（Bag-of-visual-words,BoVW 词袋模型）模型生成视觉词典的建模方法。由袁安富、曹金燕、余莉在计算机应用与软件 2015, 32 :186-189发表的"一种基于SURF特征的零件识别算法"一文中使用了SURF(Speed UpRobustFeature)特征和ANN(ApproximateNearestNeighbor)近似最近邻算法识别零件的方法。本发明结合了以上两种方法的优势，并采取了神经网络领域的白化降维方法，对 SURF特征与词袋模型的结合进行了改进与创新。
[0006] 本发明中的方法没有采用多尺度训练，直接对图像进行去噪、尺寸归一化和中心裁剪预处理，利用PCA(PrincipalComponentsAnalysis)白化和降维对数据进行处理后使用Kmeans构建词袋模型，提高了训练和分类的速度，使视觉词汇之间稀疏性更强，得到了更好的分类效果。

【发明内容】

[0007] 针对现有技术中的缺陷，本发明的目的是提供一种基于SURF特征的图像物体识别方法。
[0008] 根据本发明提供的基于SURF特征的图像物体识别方法，包括如下步骤：
[0009] 步骤a:对图像进行预处理，提取预处理后图像的局部兴趣点特征，将局部兴趣点特征进行聚类，根据聚类中心的结果建立词袋模型，通过词袋模型建立视觉词汇直方图得到图像的视觉词汇直方图特征；
[0010] 步骤1:对每个训练样本进行类标签的标记，通过对带有类标签的所述训练样本执行步骤a的操作后得到所述训练样本的视觉词汇直方图特征，利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器，通过核函数将词汇直方图特征映射到特征空间，并在该核函数映射的特征空间中得到最优分类超平面；
[0011] 步骤2 :对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征，利用核函数将视觉词汇直方图特征映射到特征空间，在该特征空间中判断该待测样本的视觉词汇直方图特征位于训练完成的SVM分类器的最优分类超平面的哪一侧，统计待测样本属于某个类别的概率，确定所述待测样本所属的类别；
[0012] 步骤3 :对SVM分类器的分类结果进行矫正。
[0013] 优选地，所述步骤a包括：
[0014] 步骤al:对图像进行预处理，即使用3*3的高斯卷积模板对图像进行高斯滤波，将图像尺寸归一化为512*512,并将图像做中心裁剪裁掉边缘的12*12像素；
[0015] 步骤a2 :使用OpenCV开源库函数中的类SurfFeatureDetector中的detect方法检测图像中的SURF快速鲁棒特征兴趣点，和类SurfDescriptorExtractor中的compute方法计算每个兴趣点的SURF描述特征矢量；
[0016] 步骤a3 :对特征矢量进行PCA主成分分析及白化处理，消除特征矢量之间的相关性，并对白化后的特征矢量进行降维处理；
[0017] 步骤a4 :使用Kmeans聚类方法对降维过的兴趣点特征进行聚类，设置K个聚类中心，聚类后使用这K个聚类中心作为视觉词汇建立词袋模型B0VW，即所述词袋模型B0VW中包含了K个视觉词汇；计算图像中的每个兴趣点与词袋模型中词汇的欧氏距离，确定兴趣点属于哪一类视觉词汇，并统计图像中每类视觉词汇出现的次数，建立图像的视觉词汇直方图作为整幅图像的内容表征。
[0018] 优选地，所述步骤1包括：
[0019] 步骤1. 1 :将需要分类的η种训练样本类别按照两两组合分成C:丨个分类器；
[0020] 步骤1. 2 :每个训练样本进行步骤a的处理后得到对应训练样本的视觉词汇直方图特征，将训练样本的视觉词汇直方图特征和所述训练样本的类标签进行关联；
[0021] 步骤1. 3 :选择高斯核函数进行非线性可分特征的映射分类，调整支持向量机SVM 分类器和核函数的参数，利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器，通过高斯核函数将词汇直方图特征映射到特征空间，并在该高斯核函数映射的特征空间中得到最优分类超平面，该最优分类超平面将不同类标签的训练样本区分开来；其中，选择的高斯核函数如下：
[0022]
[0023] 式中：K(x，y)表示内积函数，X表示高维空间中的一个向量，y表示高维空间中的另一个向量，σ表示尺度参数。
[0024] 优选地，所述步骤2包括：
[0025] 步骤2. 1:对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征，利用核函数将视觉词汇直方图特征映射到特征空间；
[0026] 步骤2. 2:在所述特征空间中判断该待测样本特征位于训练完成的SVM分类器的最优分类超平面的哪一侧；i类、j类训练样本构成的分类器记为SVMu，其中i，je(1，n)， i、j分别表示两种不同类别的训练样本，η表示训练样本的种类数；若分类器的分类结果为 i，则测试样本属于i类，i类投票加1 ;若分类器的分类结果为j，则测试样本属于j类，j类投票加1 ;
[0027] 步骤2. 3 :统计待测样本属于某个类别的概率，确定所述待测样本所属的类别。
[0028] 优选地，所述步骤3包括：当待测样本属于各个类别的概率均不超过0. 5时，将该待测样本定义为无法判别的类别，用于对SVM分类器的分类结果进行矫正。
[0029] 优选地，所述步骤2. 2中的在特征空间中判断该待测样本特征位于训练完成的 SVM分类器的最优分类超平面的哪一侧的判定公式如下：
[0030]
[0031] 式中：S(F,)表示第j个待测样本的判定结果，sgn( ·)表示符号函数运算（如果数字大于〇,则Sgn返回1，数字等于0,则返回0,数字小于0,则返回-1)，ai表示第i个训练样本的拉格朗日乘子，b为最优分类超平面的参数，1((匕，匕）表示高斯核函数，R表示样本空间中第i个训练样本的直方图特征，F,表示第j个待测样本的直方图特征，N为样本空间中的样本总数；S(FJ为+1时，表示第j个待测样本属于正样本类，S(FJ为-1时，则表示第j个待测样本属于负样本类。
[0032] 与现有技术相比，本发明具有如下的有益效果：
[0033] 1、本发明首先对图像进行去噪、尺寸归一化、中心修剪的预处理，然后对图像提取 SURF角点和SURF描述子描述图像特征，再通过PCA数据白化、降维对特征进行处理，处理后的特征通过Kmeans聚类建立词袋模型，利用词袋模型构建图像的视觉词汇直方图，最后利用非线性的支持向量机（SVM)分类方法进行训练，并完成对图像不

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蒋兴浩;孙锬锋;许可;姜华;郑辉;
技术所有人：上海交通大学;上海神州数码有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。