基于视觉词典的图像分类方法

文档序号：6558312阅读：235来源：国知局

专利名称：基于视觉词典的图像分类方法
技术领域：
本发明涉及数字图像处理技术领域，特别涉及一种基于视觉词典的图像分类方法。
背景技术：
图像分类是对图像中的目标判定类别，从而将图像进行归类。目前，图像分类技术已经成为了人工智能和模式识别中的重要研究方向，在军事目标识别、遥感和医学图像识别、OCR、生物特征识别、票据识别、智能交通等领域中得到了应用。从技术上来说，基于内容的图像分类主要是利用图像的低层局部特征和高层语义特征，建立基于特征的向量表示，从而将其转化为人工智能领域的监督学习问题。在实际使用中，图像分类的难点在于目标由于不同程度的遮挡、观察视角不同、光照条件变化、仿射变换以及同类目标之间的差异性，造成分类失败。目前，基于局部区域特征提取算子(如HarriS-Affine、MSER、SIFT等)的图像分类识别方法在仿射变换、光照变化、遮挡等条件下都被证明可以取得较好的分类效果。该方法从图像中抽取局部关键区域，并用仿射不变性描述算子建立这些区域的特征向量，然后通过向量矢量化方法建立视觉词典(Visual Code Book)，并将图像用基于该视觉词典的频率直方图表示，最终建立分类模型实现对目标识别。常用的向量矢量化方法是k-means ( 一种硬聚类算法)，但该算法一般假设数据集是一个混合正态分布，在迭代过程中容易在样本点分布密集的地方陷入局部极值，而且还必须事先确定聚类个数，初始点不同可能结果也不一样，一个远离中心点的样本点可能会使中心点产生较大偏离，而且计算复杂度较高，在实际使用中无法得到最具区分度的视觉词典。

发明内容
(一)要解决的技术问题本发明要解决的技术问题是如何得到最具区分度的视觉词典，并根据该视觉词典进行图像分类。( 二 )技术方案为解决上述技术问题，本发明提供了一种基于视觉词典的图像分类方法，包括以下步骤Sl 抽取训练图像数据集的联合局部特征；S2:通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化，从而选择聚类中心个数，以形成视觉词典；S3 根据所述视觉词典生成图像的特征表示，以建立图像分类器；S4 根据所述图像分类器分类所述训练图像数据集中的图像。其中，所述步骤Sl具体包括Si. 1 利用Harris-Affine算子或提取训练图像数据集的局部区域集合H= {h}；
Si. 2 利用MSER算子提取训练图像数据集的局部区域集合E = {e}；Si. 3 利用SIFT算子提取训练图像数据集的特征点集合为Q = {q}；Si. 4根据S1.1 Si. 3得到所述联合局部特征为: U = {u\u gQ and (u [ H or ti [ Ε)}。其中，所述步骤Si. 1具体包括Harris-AfTine利用公式(1)所示的图像二阶自相关矩阵的特征值度量判断角
权利要求
1.一种基于视觉词典的图像分类方法，其特征在于，包括以下步骤51抽取训练图像数据集的联合局部特征；52通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化，从而选择聚类中心个数，以形成视觉词典；53根据所述视觉词典生成图像的特征表示，以建立图像分类器；54根据所述图像分类器分类所述训练图像数据集中的图像。
2.如权利要求1所述的基于视觉词典的图像分类方法，其特征在于，所述步骤Sl具体包括Si. 1:利用Harris-AfTine算子或提取训练图像数据集的局部区域集合H= {h}； Si. 2:利用MSER算子提取训练图像数据集的局部区域集合E= {e}； Si. 3 利用SIFT算子提取训练图像数据集的特征点集合为Q = {q}； Si.4根据Si. 1 Si. 3得到所述联合局部特征为 U ~{u\u G Q and (u c H ο u c Ε)}。
3 如权利要求2所述的基于视觉词典的图像分类方法，其特征在于，所述步骤Si.1具体包括Harris-Affine利用公式(1)所示的图像二阶自相关矩阵的特征值度量判断角点
4.如权利要求2所述的基于视觉词典的图像分类方法，其特征在于，所述步骤Si.2具体包括对所述训练图像数据集中的图像按灰度值大小对像素排序；按所述排序将像素逐渐添加到空白图像，并记录相应连通成分及其面积函数，所述面积函数为灰度值的函数；根据所述面积函数变化率的局部极小值确定MSER，最终得到局部区域集合E = {e}。
5.如权利要求3所述的基于视觉词典的图像分类方法，其特征在于，所述步骤Si.3具体包括使用高斯差分算子DoG来确定特征尺度，DoG定义如( 所示 DoG(s, σ ) = L(s, ko )+L(s, k)(5)其中σ是特征尺度，k为常数，L是尺度空间函数，用于在各个尺度上对图像进行平滑，从而建立DoG金字塔尺度空间，得到各个尺度上的平滑图像后，SIFT算子将每个点与相邻的8个点以及上下层各9个点相比较，通过计算该点是否是极大值或极小值点来判断是否为特征点，同时利用梯度方向来判断该点的主方向，SIFT算子得到的特征点集合记为Q = {q}。
6.如权利要求1所述的基于视觉词典的图像分类方法，其特征在于，所述步骤S2具体包括对于步骤Sl得到的d维图像局部特征向量空间，均值移动算法利用核函数处理不同的样本空间分布，并自动查找样本空间中的概率密度极值点，迭代过程如式(6)所示其中，a,和h是d维图像局部特征向量空间的样本点，GO是单位高斯核函数，ω (a,) 表示样本点％的权重系数，η表示样本空间的样本点总数；迭代步骤包括S2. 1 查找与…的距离小于r的相邻点集合，具体查找方式为对d维欧式空间X进行T次切分，每次切分需要随机选定Z维，建立不等式，并用布尔向量记录切分得到的子空间，如在随机选定的某一维dz上，取一个随机值Uz，这个值在整个样本空间第dz维的值域范围之内，根据式(7)来对样本点％进行切分
7.如权利要求1所述的基于视觉词典的图像分类方法，其特征在于，步骤S3具体包括通过对每个图像统计所包含视觉单词的分布直方图，将图像转化为模式识别方法可以处理的数据集，即具有相同维度的特征向量集合；利用SVM、贝叶斯等分类算法对其进行训练和分类，并在训练过程中进行特征权重计算，选择最有效的特征。
全文摘要
本发明公开了一种基于视觉词典的图像分类方法，涉及数字图像处理技术领域，包括以下步骤S1抽取训练图像数据集的联合局部特征；S2通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化，从而选择聚类中心个数，以形成视觉词典；S3根据所述视觉词典生成图像的特征表示，以建立图像分类器；S4根据所述图像分类器分类所述训练图像数据集中的图像。本发明能够获得最具区分度的视觉词典，从而使分类方法对图像数据集的样本空间分布具有自适应性，可以抵抗各种仿射变换和光照变化，对于局部异常、噪声干扰、以及复杂背景具有更好的鲁棒性，而且具有很强的通用性，可以用于各种类型的图像分类，因而具有较高的实用价值。
文档编号G06K9/66GK102208038SQ20111017510
公开日2011年10月5日申请日期2011年6月27日优先权日2011年6月27日
发明者李环, 纪磊, 覃征申请人:东莞理工学院, 清华大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：覃征;纪磊;李环
技术所有人：清华大学;东莞理工学院
我是此专利的发明人

上一篇：一种提高学生书写能力的电子书包的制作方法
上一篇：一种计算机汉字快速录入方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。