对象识别设备和方法

文档序号:6486308阅读:142来源:国知局
对象识别设备和方法
【专利摘要】本发明公开了一种对象识别设备和方法,所述对象识别设备包括:边缘方向分布模式计算装置,被配置为计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为候选对象的多个局部边缘方向分布模式特征;以及分类器,被配置为基于多个局部边缘方向分布模式特征对候选对象进行分类。
【专利说明】对象识别设备和方法
【技术领域】
[0001]本发明总体上涉及图像处理领域,具体涉及模式识别和人机交互领域,更具体地,本发明涉及一种用于对象识别的设备和方法。
【背景技术】
[0002]在计算机视觉应用中,基于数字图像或视频输入的自动对象识别是一项重要技术。作为对象识别系统的前端,快速有效的对象识别方法是非常重要的,尤其对于低计算能力的装置比如移动电话、平板电脑等而言更是如此。对象识别中的难点在于如何提取描述对象的稳定特征。
[0003]传统的方法通常设计一些简单的规则来定义海量的基本特征,然后使用机器学习方法比如boosting通过大量训练样本来选择出一些最有效的特征构成分类器,将目标对象与背景区分开。现有的特征包括例如类Haar矩形特征、局部二值模式(LBP)、梯度方向直方图(HOG)等。
[0004]但是,这些方法都存在一些缺陷。例如,类Haar特征太简单,为获得满意的性能,学习得到的分类器通常要包括上千个矩形特征。大量的特征提取使得训练过程和测试过程都十分耗时。另外,采用LBP特征的优点在于不受图像灰度的整体变换的影响,但是,如果灰度反转,该特征会改变较大。如图1所示,当对象(例如,杯子)处于不同亮度的背景,例如如图1a所示处于暗背景和如图1b所示处于亮背景中时,同样位置的LBP特征完全不一样。相比而言,HOG特征对背景灰度反转较为鲁棒,但是该特征向量是由4个局部直方图级联得到的高维向量(例如,36维)。在这种高维的特征空间中训练弱分类器十分耗时,因此只能承受较简单的弱分类器,例如线性支持向量机(SVM)。

【发明内容】

[0005]在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
[0006]鉴于【背景技术】部分所述的需求,本发明关注于采用局部边缘方向分布模式特征进行分类以识别对象。由于所采用的特征的候选集小、表示简单且不受背景灰度反转的影响,因此本发明可以在降低计算量的同时提供更好的识别性能。
[0007]因此,根据本发明的一个方面,提供了一种对象识别设备,包括:边缘方向分布模式计算装置,被配置为计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及分类器,被配置为基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
[0008]根据本发明的另一个方面,提供了一种对象识别方法,包括:计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及使用分类器基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
[0009]依据本发明的其它方面,还提供了相应的计算机程序代码、计算机可读存储介质和计算机程序产品。
[0010]通过以下结合附图对本发明的优选实施例的详细说明,本发明的这些以及其他优点将更加明显。
【专利附图】

【附图说明】
[0011]为了进一步阐述本发明的以上和其它优点和特征,下面结合附图对本发明的【具体实施方式】作进一步详细的说明。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。具有相同的功能和结构的元件用相同的参考标号表示。应当理解,这些附图仅描述本发明的典型示例,而不应看作是对本发明的范围的限定。在附图中:
[0012]图1a是示出了对象处于暗背景中的图;
[0013]图1b是示出了对象处于亮背景中的图;
[0014]图2示出了根据本发明的一个实施例的对象识别设备的结构;
[0015]图3示出了根据本发明的一个实施例的对象识别设备中的边缘方向分布模式计算装置的结构;
[0016]图4示出了根据本发明的一个实施例的边缘方向的概率分布计算的实例的图;
[0017]图5示出了根据本发明的一个实施例对图4中的直方图进行二值化的图;
[0018]图6示出了根据本发明的一个实施例的对象识别方法的流程图;
[0019]图7示出了根据本发明的一个实施例的对象识别方法中计算每个局部区域的边缘方向分布模式的步骤的流程图;以及
[0020]图8是其中可以实现根据本发明的实施例的方法和/或设备的通用个人计算机的示例性结构的框图。
【具体实施方式】
[0021]在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
[0022]在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的设备结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
[0023]下文中的描述按如下顺序进行:
[0024]1.对象识别设备
[0025]1-1.边缘方向分布模式计算装置
[0026]i)边缘提取模块[0027]i i )概率分布计算模块
[0028]iii) 二值化模块
[0029]1-2.分类器
[0030]2.对象识别方法
[0031]3.用以实施本申请的设备和方法的计算设备
[0032][1.对象识别设备]
[0033]首先参照图2描述根据本发明的实施例的对象识别设备的结构。如图2所示,对象识别设备100包括边缘方向分布模式计算装置101和分类器102。其中,边缘方向分布模式计算装置101被配置为计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征。分类器102被配置为基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
[0034]具体地,当向对象识别设备100中输入一幅图像时,对象识别设备100可以用不同尺寸的滑动窗口扫描图像,以检测不同位置、不同大小的对象。相应地,每一个滑动窗口中的图像为候选对象。对于候选对象,边缘方向分布模式计算装置101采用具有某一尺寸的特征窗口对候选对象进行扫描。对于特征窗口所限定的每个局部区域计算其边缘方向分布模式。其中,特征窗口的尺寸、位置和长宽比可以任意指定或改变,只要该特征窗口在候选对象的范围内即可。
[0035]当对候选对象的扫描完成之后,边缘 方向分布模式计算装置101获得了一组边缘方向分布模式作为该候选对象的多个局部边缘方向分布模式特征,并将这些特征传递给分类器102。
[0036]分类器102例如是采用大量的正样本(表示是对象)和负样本(表示不是对象)预先训练得到的。因此,该训练好的分类器102基于从边缘方向分布模式计算装置101传递来的多个局部边缘方向分布模式特征,对候选对象进行分类,例如,可以判断候选对象是否是要检测的对象。
[0037]下面将参照图3更进一步地详细描述边缘方向分布模式计算装置101的结构。
[0038]<1-1.边缘方向分布模式计算装置〉
[0039]如图3所示,边缘方向分布模式计算装置101包括边缘提取模块1001、概率分布计算模块1002和二值化模块1003。
[0040]i)边缘提取模块
[0041]边缘提取模块1001用于提取每个局部区域内的边缘。作为一个示例,边缘提取模块1001可以通过计算局部区域内的梯度向量的分布来提取该局部区域内的边缘。
[0042]具体地,例如可以通过使用索贝尔(Sobel)算子来实现边缘的提取,如以下公式
(I)所示。
[0043]Gx (x, y) = Sobelx*I (x, y)
[0044]Gy (x, y) = Sobely*I (x, y)
[0045]G(x, v) = ^Gx(x,yf +G}(x,y)2( I)
[0046]


0其他
【权利要求】
1.一种对象识别设备,包括: 边缘方向分布模式计算装置,被配置为计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及 分类器,被配置为基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
2.根据权利要求1所述的对象识别设备,其中,所述边缘方向分布模式计算装置包括: 边缘提取模块,被配置为提取所述局部区域内的边缘; 概率分布计算模块,被配置为计算所述边缘的方向的概率分布;以及 二值化模块,被配置为将所述概率分布二值化,以得到所述局部区域的边缘方向分布模式。
3.根据权利要求2所述的对象识别设备,其中,所述边缘提取模块被配置为通过计算所述局部区域内的梯度向量的分布来提取所述局部区域内的边缘。
4.根据权利要求3所述的对象识别设备,其中,所述概率分布计算模块被配置为将边缘像素中方向相同的梯度向量的模累加作为该方向的概率,以获得所述边缘的方向的概率分布。
5.根据权利要求3所述的对象识别设备,其中,所述概率分布计算模块被配置为将边缘像素中方向相同的像素的个数累加作为该方向的概率,以获得所述边缘的方向的概率分布。
6.根据权利要求4或5所述的对象识别设备,其中,所述概率分布计算模块被配置为将边缘方向的取值范围划分为多个区间,并将每个区间内的所有方向的概率累加作为边缘方向位于所述区间的概率,以得到边缘方向在所述多个区间之间的概率分布作为所述边缘的方向的概率分布。
7.根据权利要求2至5中的任意一项所述的对象识别设备,其中,所述二值化模块被配置为用数字I和O进行二值化,并将得到的数字序列作为所述边缘方向分布模式特征。
8.根据权利要求2所述的对象识别设备,其中,所述二值化模块被配置为利用概率的均值或中值作为阈值实施所述二值化。
9.根据权利要求1至4中的任意一项所述的对象识别设备,其中,所述分类器被配置为基于从所述多个局部边缘方向分布模式中在线选取的子集中的局部边缘方向分布模式特征对所述候选对象进行分类。
10.一种对象识别方法,包括: 计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及 使用分类器基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
【文档编号】G06K9/62GK103514453SQ201210203740
【公开日】2014年1月15日 申请日期:2012年6月15日 优先权日:2012年6月15日
【发明者】范伟, 皆川明洋, 孙俊, 堀田悦伸, 直井聪 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1