基于改进概率主题模型的地点图像识别方法

文档序号：6363572阅读：308来源：国知局

专利名称：基于改进概率主题模型的地点图像识别方法
技术领域：
本发明涉及一种图像识别方法，尤其是一种基于改进概率主题模型的地点图像识别方法，用于室内及室外地点图像的识别。
背景技术：
目前，随着智能移动机器人走进人们的日常生活，并在军事、商场、医院、家庭等各种领域发挥重要作用，人们对智能移动机器人系统的自动定位需求越来越迫切。移动机器人只有准确地知道自身的位置以及所处的工作空间，才能安全有效地进行自主运动，为人类服务。因此，自定位和位置估计成为自主移动机器人最重要的能力之一。视觉系统能够为移动机器人提供最丰富的感知信息，同时也具有最接近人类的环境感知方式。因此，基于视觉的机器人自定位问题吸引了大量研究人员的参与，同时也取得了大量的研究成果。基于视觉的机器人自定位根据使用的视觉特征信息的不同，可分为3种基于地标特征的自定位方法、基于图像外观特征的自定位方法以及最近出现的基于地点识别的自定位方法。其中，基于地点或者场景识别的机器人视觉自定位方法使用人类能够直接理解的高层语义信息如“门口”、“走廊”、“厨房”等作为视觉特征，非常适合于机器人在复杂环境中的自定位问题。2005年李桂芝，安成万，杨国盛等.基于场景识别的移动机器人定位方法研究[J].机器人，2005，27 (2) :123-127使用多通道Gabor滤波器提取场景图像的全局纹理特征，并使用支持向量机来分类识别室内、走廊、门厅等场景，进而实现机器人的逻辑定位，2008年Ullah M M,Pronobis A,Caputo B,et al. Towards robust place recognition for robot localization[C]//Proc of 2008IEEE ICRA. 2008 :530-537 使用 Harris 角点特征检测子和SIFT特征描述子提取局部特征，并使用支持向量机作为分类器实现基于局部特征的地点识别。然而，机器人实际获得的图片常会出现拍摄角度、光照的不同，遮挡甚至背景混乱，以及因为人物及物体的位置变化而导致的高度动态变化等现象，这些固有的可变性导致地点图像识别的过程充满了不确定。为了更好地解决地点图像识别过程中由于拍摄角度、光照的不同，以及人物和物体的高度动态变化所导致的不确定性问题，引入基于概率主题模型的图像识别方法，并对原始概率主题模型进行改进，降低算法复杂度的同时有效提闻识别性能。概率主题模型是一种流行的一种图模型结构，它能够对实际问题进行概率建模，并对各种复杂相关的因素进行刻画。作为概率论和图论相结合的产物，为解决地点图像识别中的不确定性、复杂性提供了直观而自然的方法。目前，概率主题模型在人工智能、自然语言处理、文本分类等领域已经取得了很好的应用效果，并逐渐引入到图像识别领域中。

发明内容
本发明的目的在于提供一种基于概率主题模型的地点图像识别方法，更好地解决地点图像识别过程中由于拍摄角度、光照的不同，以及人物和物体的高度动态变化所导致的不确定性问题，并对原始概率主题模型进行改进，降低算法复杂度的同时有效提高识别性能。为了达到上述目的，本发明所采用的技术方案是提供一种基于改进概率主题模型的地点图像识别方法，通过改进的概率主题模型建立图像的潜在主题分布，然后通过分类器来识别未知地点图像，其特征包括以下步骤I)图像获取步骤，通过安装在机器人上的标准摄像头拍摄获取训练图像和测试图2)图像预处理步骤，将获取的图像进行灰度化，并将其尺寸缩小至128X128像素；3)特征提取步骤，采用尺度不变特征提取算法(Scale-Invariant Features(SIFT))对图像进行局部特征提取；4)特征聚类步骤，将所有特征通过k-means算法进行聚类，得到若干聚类中心；5)特征分配步骤，将每幅图像的特征点在对应的聚类中心上进行投票，得出每幅图像对应于每个聚类中心的频数表示向量；6)潜在主题建模步骤，以步骤5)中得出的图像的频数向量作为输入特征变量，设定潜在主题个数，采用改进的概率主题模型对图像进行建模，学习模型，得到图像的潜在主题分布向量；7)采用分类器识别未知地点图像。所述步骤I)中训练图像和测试图像由安装在机器人上的标准摄像头按照固定路径拍摄得到，图像可包含光照、视角、尺度的变化以及人物和物体的动态变化。所述步骤3)中采用尺度不变特征提取算法(Scale-Invariant Features (SIFT)) 对图像进行局部特征提取包括图像关键点检测以及将关键点表示为128维的特征描述子。所述步骤6)中的概率主题模型为潜在Dirichlet分布模型(Latent Dirichlet Allocation, LDA),对原始LDA模型进行改进,加入量化函数得到改进模型Quantified LDA 模型(QLDA)，对训练图像和测试图像进行建模。改进模型对于每幅图像的模型生成过程如下对于每幅图像X，选择一个Dirichlet参数π , Ji服从参数为α的Dirichlet分布，g卩Ji Dirichlet ( α )，对于每幅图像的每个特征χ」，选择一个主题ζ」,服从参数π的离散分布，即Zj discrete O )，然后选择一个特征Xj，服从参数β的概率分布，即Xj p(Xj| β), β是每幅图像的不同特征对应不同主题的概率，如果一幅图像有m个特征，k个设定的主题，则β为mXk的矩阵；对于图像的所有特征，统计并分析数据集中每幅图像的特征分布，根据不同数据集的特征分布情况，建立对应的量化函数QUP，对输入特征进行分级量化处理，使其服从Xj Q(Xj)分布，这样每幅图像的密度函数可表示为P(x \(Χ,β)= I ρ(π I )nj=1 Tj2j P(zj I ^)P(Xj I Zj, P)Q(Xj )dn ；分级量化的基本思想是统计平均每幅图像的特征在各区间内的密集程度，最密集且特征值较小的特征，区分度最低，作为非显著特征忽略；比较密集且特征值较大的特征，区分度较高，保持不变；最稀疏且特征值最大的特征，区分度最高，作为显著特征，近似处理为距离其最近的整十数(实验显示该处理可降低计算复杂度，且不会影响识别性能)；具体的量化标准制定方法如下
统计输入特征的最小值Xniin和最大值Xniax ;设定[a，b]区间的特征密度函数D(a，b)，表示特征在[a，b]区间内的密集程度，表达式如下
权利要求
1. 一种基于改进概率主题模型的地点图像识别方法，其特征在于，通过改进的概率主题模型建立图像的潜在主题分布，然后通过分类器来识别未知地点图像，包括以下步骤1.1.图像获取步骤，通过安装在机器人上的标准摄像头拍摄获取训练图像和测试

图1.2.图像预处理步骤，将获取的图像进行灰度化，并将其尺寸缩小；1.3.特征提取步骤，采用尺度不变特征提取算法对图像进行局部特征提取；I. 4.特征聚类步骤，将所有特征通过k-means算法进行聚类，得到若干聚类中心；I. 5.特征分配步骤，将每幅图像的特征点在对应的聚类中心上进行投票，得出每幅图像对应于每个聚类中心的频数表示向量；I. 6.潜在主题建模步骤，以步骤I. 5中得出的图像的频数向量作为输入特征变量，设定潜在主题个数，采用改进的概率主题模型对图像进行建模，学习模型，得到图像的潜在主题分布向量；I.7.采用分类器识别未知地点图像；所述步骤I. 6中学习算法采用Variational推断；估计模型参数U % β*)，使整个图像集的似然函数P ( X α *, β *)最大；与原始LDA相同，该似然函数不可求，须采用Variational推断；利用Jensen不等式获得一个可计算的下界来近似真实的似然函数值，然后估计参数来最大化这个下界；用L(y，Φ ;α，β)表示似然函数的近似下界，则有Iogp (X I α , β ) = L( Y , Φ ； α , β )+KL (q( π , ζ | Y , Φ) | | β ( π , ζ | χ, α , β ))其中 Iogp (χ I α，β )为似然函数，q O , ζ | Y , Φ)为 Variational 分布，ρΟ , ζ |χ, α， β )为后验概率密度函数，KL(q(3 , ζ I Y , Φ) I |ρ( 3 , ζ |χ, α , β ))为 Variational 分布与后验概率密度函数的Kullback-Leibler距离；由上,最大化下界L( Y，Φ ； α , β )使其接近似然函数logp(x| α，β)就可以转变为估计参数 U*，Φ*)使 KL(qU，z| Υ，Φ)||ρ(π,ζ χ，α, β))最小，即:(Y *, Φ*) = arg min (γ, $)KL(q( η , ζ Y, Φ)||ρ(π,ζ|χ, α, β))Yi和$〃的计算公式如下
2.根据权利要求I所述的基于改进概率主题模型的地点图像识别方法，其特征在于，所述步骤I. I中训练图像和测试图像由安装在机器人上的标准摄像头按照固定路径拍摄得到，图像包含光照、视角、尺度的变化以及人物和物体的动态变化。
3.根据权利要求I所述的基于改进概率主题模型的地点图像识别方法，其特征在于，所述的步骤I. 2的缩小尺寸为128 X 128像素。
4.根据权利要求I所述的基于改进概率主题模型的地点图像识别方法，其特征在于，所述步骤I. 3中采用尺度不变特征提取算法对图像进行局部特征提取包括图像关键点检测以及将关键点表示为128维的特征描述子。
5.根据权利要求I所述的基于改进概率主题模型的地点图像识别方法，其特征在于，所述步骤I. 7中分类器为最近邻分类方法。
全文摘要
一种基于改进概率主题模型的地点图像识别方法，属于图像识别技术领域。目的在于更好地解决地点图像识别中由于不同角度、光照，以及人物和物体的高度动态变化导致的不确定性问题。包括以下步骤图像获取步骤；图像预处理步骤；特征提取步骤，采用SIFT算法对图像进行特征提取；特征聚类步骤，将所有特征聚类，得到若干聚类中心；特征分配步骤，将每幅图像的特征在聚类中心上投票，得出对应每个聚类中心的频数向量；潜在主题建模步骤，采用改进的概率主题模型学习图像的潜在主题分布；采用分类器识别未知地点图像。本发明在LDA模型中加入量化函数，通过改进LDA模型学习图像的潜在主题，在保证实时性的前提下，可有效提高识别性能。
文档编号G06K9/62GK102609719SQ20121001769
公开日2012年7月25日申请日期2012年1月19日优先权日2012年1月19日
发明者傅金融, 李明爱, 杨婉露, 杨金福, 王锴, 王阳丽申请人:北京工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨金福;王阳丽;王锴;李明爱;杨婉露;傅金融
技术所有人：北京工业大学
我是此专利的发明人

上一篇：用于控制触摸屏终端中的屏幕显示的设备和方法
上一篇：一种航天器测试项目指标的通用化定义系统及其定义方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。