一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法

文档序号：6538009阅读：249来源：国知局

一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法
【专利摘要】本发明公开了一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法，主要解决现有分类方法人工标记工作量较大和分类正确率较低的问题。其实现步骤是：分别建立自然场景图像分类的训练集和测试集；对图像进行金字塔分块；提取图像块集合的采样点尺度不变特征集合，并生成字典；用字典对图像块尺度不变特征集合进行词袋模型描述；用Gibbs采样方法生成词汇频次向量的潜在语义主题模型,得到图像的潜在语义主题分布，进而构建自然场景图像分类模型；用分类模型对自然场景图像进行分类。本发明采用了空间关系和潜在语义主题模型，丰富了图像特征信息，避免了大量的人工标记工作,提高了分类正确率,可用于目标识别及车辆、机器人导航。
【专利说明】一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法
【技术领域】
[0001]本发明属于图像处理【技术领域】，特别涉及一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法。
【背景技术】
[0002]在过去的十年里，自然场景图像分类已经成为图像处理【技术领域】里一个很重要的研究主体。自然场景图像分类有很广泛的应用，如目标识别与检测和智能车辆或机器人导航等领域。由于自然场景图像类内差异性、照明条件差异性和图像本身尺度差异性较大，使其仍然是具有挑战性的问题。
[0003]自然场景图像分类的分类方法大致可以分为两类:一类是基于低层语义模型的自然场景图像分类方法；一类是基于中层语义模型的自然场景图像分类方法。早期的一些自然场景图像分类方法大多数是应用低层信息建立模型的，这些方法采用全局统计信息，如运用全局的颜色或者纹理特征直方图表示图像。尽管这些方法的时间复杂性较低，但是它们通常应用于人为场景图像和室内场景图像分类，并且分类结果较差。近期关于自然场景图像分类的方法都是基于中层语义模型的，它们弥补了高层语义信息和低层语义信息之间的鸿沟，并解决层次分类定义重叠问题，因此得到了广泛应用。
[0004]由于图像的语义大都通过区域对象来体现，采用基于区域的方法对图像进行场景分类是一种合理有效的方法。但是在场景图像分类训练集中，往往不具体指定图像区域和目标之间的对应关系，而且图像区域之间往往存在着语义概念相关性，这给基于区域的有监督学习算法造成了困难。图像区域间的相关性是指同一幅图像的一些图像区域往往对应着相同的语义概念，且对应不同语义的图像区域间往往也存在的关联性。比如对一幅含有“天空”、“云彩”等语义概念的图像进行分割后，某一图像区域含有目标语义“天空”，与它相邻的图像区域也会包含有“天空”的概念，而且不同的语义概念“云彩”和“天空”具有较高的同时出现的频率，它们对应的不同图像区域之间也存在着语义相关性。Wang等人提出了一种结合底层视觉特征分布和区域间关系的图像区域标注的概率模型，它有效地利用了图像区域间的关系，对图像区域进行标注。但是Wang等人提出的算法需要事先标记每一个图像区域对应的语义概念，然后建立含有同一语义概念的图像区域训练集，需要大量人工标记。然而通常情况下并不能够提供这样的训练集，而且该文中使用的表示概念类的高斯分布模型较为简单，实验测试也仅在较小的数据集上进行。为了减少生成中间语义所需的人工标记工作，一些采用文本主题模型的方法被用于自然场景图像分类，这些方法主要以Lifeifei和Quelhas等人提出的自然场景图像分类方法为代表。这些方法通常先提取图像中的尺度不变特征，然后将图像的尺度不变特征通过聚类生成一个字典来表示聚类中心，然后通过字典映射得到一个表示图像的稀疏表示向量，最后应用文本分类中的概率潜在语义分析方法和潜在狄利克雷模型等主题分析方法来找出图像的潜在语义主题分布，从而完成图像的场景分类。[0005]上述方法或对人工标记的需求很大，或通常是根据图像中视觉词汇出现的总体情况来进行场景分类的，由于没有考虑图像的空间信息，因此往往不能得到准确率高的分类结果。

【发明内容】

[0006]本发明的目的在于针对上述已有方法的不足，提出一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法，以减少人工标记的需求，具有处理较大数据的能力，并通过引入图像空间信息，提高分类正确率。
[0007]为实现上述目的，本发明的技术方案，一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法，其特征是:包括如下步骤:
[0008](I)分别建立自然场景图像分类训练集和图像分类测试集；
[0009](2)用空间金字塔分块方法分别对自然场景图像分类训练集和图像分类测试集中的图像进行图像分块，得到图像块集合P= {Pp P2，…，Pi,…，P丄其中Pi为图像的第i个图像块，η为图像的分块总数；
[0010](3)提取训练集中图像的图像块集合P的采样点尺度不变特征集合F，生成字典D:
[0011](3a)用网格采样方法对训练集中图像的图像块集合P进行网格采样，得到图像的图像块网格采样点集SP = (SP1, SP2,…，SPi, - ,SPJ,其中SPi为图像第i个图像块的网格采样点；
[0012](3b)用尺度不变特征提取方法对训练集中图像的图像块网格采样点SP提取尺度不变特征，得到训练集中图像的图像块尺度不变特征集合F=的，F2，…，Fi,…，FJ，其中Fi为图像第i个图像块的尺度不变特征；
[0013](3c)用K均值聚类算法分别对训练集上图像的图像块尺度不变特征集合F进行聚类，生成字典D= (D11D2,-,Di,-,DJ,其中DiS图像第i个图像块生成的字典；
[0014](4)用字典D对训练集中图像的图像块尺度不变特征集合F进行词袋模型描述，得到图像的图像块对应的词汇频次W = (W1, W2,…，Wi,…，WJ，其中Wi为图像第i个图像块对应的词汇频次向量；
[0015](5)用Gibbs采样方法估计潜在狄利克雷模型中的隐参数，得到训练集中图像的潜在语义主题模型Z和潜在语义主题分布Θ ；
[0016](6)用图像潜在语义主题模型Z生成测试集中图像潜在语义主题分布Θ i ；
[0017](7)将训练集中图像的潜在语义主题分布Θ和其对应的类别I作为训练数据，用支撑向量机SVM算法获得自然场景分类模型E ；
[0018](8)根据自然场景分类模型E对测试图像进行分类。
[0019]其中步骤(1)所述的分别建立自然场景图像分类训练集和图像分类测试集，是先根据使用需要定义N个自然场景图像类别，类别编号为I~N ;再在每个自然场景图像类别中随机选取50~100幅图像组成自然场景图像分类训练集，其余图像组成自然场景图像分类测试集。
[0020]其中步骤(5)用Gibbs采样方法估计潜在狄利克雷模型中的隐参数，得到训练集中图像的潜在语义主题模型Z和潜在语义主题分布Θ，按如下步骤进行:[0021](5a)将Wi对应词汇被分配的潜在语义主题Zi赋值为I~T任意值，作为马尔可夫链的初始状态，其中T为正整数；
[0022](5b)利用迭代公式I)，分别计算图像中第i个词汇Wi被分配给主题I~T的概率 P(Zi = j I z_i, w):
【权利要求】
1.一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法，其特征是:包括如下步骤: (1)分别建立自然场景图像分类训练集和图像分类测试集； (2)用空间金字塔分块方法分别对自然场景图像分类训练集和图像分类测试集中的图像进行图像分块，得到图像块集合P=的，P2,-,Pi,…，PJ，其中Pi为图像的第i个图像块，η为图像的分块总数； (3)提取训练集中图像的图像块集合P的采样点尺度不变特征集合F，生成字典D: (3a)用网格采样方法对训练集中图像的图像块集合P进行网格采样，得到图像的图像块网格采样点集SP=ISPpSP2, - ,SPi,...，SP1J，其中SPi为图像第i个图像块的网格采样占.(3b)用尺度不变特征提取方法对训练集中图像的图像块网格采样点SP提取尺度不变特征，得到训练集中图像的图像块尺度不变特征集合F= (F1, F2, -,Fi,…，FJ，其中Fi为图像第i个图像块的尺度不变特征； (3c)用K均值聚类算法分别对训练集上图像的图像块尺度不变特征集合F进行聚类，生成字典D= (D1, D2,…，Di,…，DJ，其中Di为图像第i个图像块生成的字典； (4)用字典D对训练集中图像的图像块尺度不变特征集合F进行词袋模型描述，得到图像的图像块对应的词汇频次W= (W1, W2,…，Wi,…，WJ，其中Wi为图像第i个图像块对应的词汇频次向量； (5)用Gibbs采样方法估计潜在狄利克雷模型中的隐参数，得到训练集中图像的潜在语义主题模型Z和潜在语义主题分布Θ ； (6)用图像潜在语义主题模型Z生成测试集中图像潜在语义主题分布Θi ； ⑵将训练集中图像的潜在语义主题分布Θ和其对应的类别I作为训练数据，用支撑向量机SVM算法获得自然场景分类模型E ； (8)根据自然场景分类模型E对测试图像进行分类。
2.根据权利要求1所述的一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法，其特征是:其中步骤(1)所述的分别建立自然场景图像分类训练集和图像分类测试集，是先根据使用需要定义N个自然场景图像类别，类别编号为I~N ;再在每个自然场景图像类别中随机选取50~100幅图像组成自然场景图像分类训练集，其余图像组成自然场景图像分类测试集。
3.根据权利要求1所述的一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法，其特征是:其中步骤(5)用Gibbs采样方法估计潜在狄利克雷模型中的隐参数，得到训练集中图像的潜在语义主题模型Z和潜在语义主题分布Θ，按如下步骤进行: (5a)将Wi对应词汇被分配的潜在语义主题Zi赋值为I~T任意值，作为马尔可夫链的初始状态，其中T为正整数； (5b)利用迭代公式1)，分别计算图像中第i个词汇Wi被分配给主题I~T的概率P(Zi = j I Z_J, w):
【文档编号】G06K9/66GK103942573SQ201410055126
【公开日】2014年7月23日申请日期:2014年2月18日优先权日:2014年2月18日
【发明者】王爽, 焦李成, 张雪, 陈阳平, 马晶晶, 马文萍, 侯彪申请人:西安电子科技大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王爽;焦李成;张雪;陈阳平;马晶晶;马文萍;侯彪
技术所有人：西安电子科技大学
我是此专利的发明人

上一篇：一种基于通用pc机的射电天文数据处理方法
上一篇：报表定制方法及移动终端的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。