使用基于全局相似度的分类器的目标识别的制作方法

文档序号:6587909阅读:111来源:国知局
专利名称:使用基于全局相似度的分类器的目标识别的制作方法
技术领域
本发明的实施例总体上涉及视频处理领域,并且更具体地涉及使用基于全局相似 度的分类器的目标识别。
背景技术
目标识别总体上涉及表示测试图像数值,然后将该测试图像与在训练阶段 存储的样本图像进行比较或分类,以尝试并识别测试图像。许多分类器要求表示 (representation)是数字的定长向量,而目标的几何形状难以编码为定长向量。


在附图中通过示例而非限制性的方式来说明本发明,其中,相似的附图标记指示 相似的元素,并且其中图1是根据本发明的一个实施例的示例设备的图形说明;图2是根据本发明的一个实施例的适用于实现公开的方法的示例电子装置的框 图;图3是根据本发明的一个实施例的、使用基于全局相似度的分类器的目标识别的 示例方法的流程图;图4是包括内容的示例制品的框图,其中,当由设备访问所述内容时,使得设备实 现本发明的一个或多个实施例的一个或多个方面。
具体实施例方式在以下描述中,为了解释的目的,阐述了许多具体细节以便于对本发明的透彻的 理解。但是,很明显,对于本领域技术人员来说,可以在没有这些具体细节的情况下,实施本 发明的实施例。在其它例子中,以框图的形式示出了结构和设备以避免模糊本发明。贯穿该说明书提及的“一个实施例”或“实施例”意味着结合该实施例描述的特定 特征、结构或特性包括在本发明的至少一个实施例中。因此,贯穿该说明书各处的短语“在 一个实施例中”或“在实施例中”并不必然都指相同的实施例。此外,可以在一个或多个实 施例中以任何合适的方式来组合特定的特征、结构或特性。图1是根据本发明的一个示例性实施例的示例设备的图形说明。根据所说明的示 例性实施例,设备100可以包括一个或多个显示器102、图像104、标签106和摄像头108。 虽然显示为移动手持设备,但是设备100也可以是大型的或固定的设备,或是能够受益于 本发明的教导的任何其它类型的设备。显示器102可以是液晶显示器或能够显示图像(例如,图像104)的其它显示器。 图像104可以是由摄像头108拍摄的图片或从另一个来源(例如,互联网)接收的图片。 可以显示标签106,作为下文将更详细地描述的用于目标识别的方法的一部分。虽然摄像 头108意图表示标准摄像或照相机,但是可以将本发明的益处应用于测量可识别目标的其
4它传感器或设备。图2是根据本发明的一个实施例的、适用于实现公开的方法的示例性电子装置的 框图。电子装置200旨在表示各种传统或非传统的电子装置中的任何一种、膝上型计算机、 台式计算机、蜂窝电话、无线通信用户单元、无线通信电话基础架构元件、个人数字助理、机 顶盒或受益于本发明的教导的任何电子装置。根据所说明的示例性实施例,电子装置200 可以包括如图2所示耦合的一个或多个处理器202、存储器控制器204、系统存储器206、输 入/输出控制器208、网络控制器210和输入/输出设备212。在一个实施例中,电子装置 200描绘了设备100。在另一实施例中,电子装置200与设备100联网。处理器202可以表示各种控制逻辑中的任何一种,包括但不限于一个或多个微 处理器、可编程逻辑器件(PLD)、可编程逻辑阵列(PLA)、专用集成电路(ASIC)、微控制器 等,尽管本发明并不限于与此。在一个实施例中,处理器202是Intel 兼容处理器。处理 器202可以具有包含可被调用的多条机器级指令的指令集,例如,由应用程序或操作系统 调用。存储器控制器204可以表示将系统存储器206与电子装置200的其它部件连接的 任何类型的芯片组或控制逻辑。在一个实施例中,在处理器202与存储器控制器204之间 的连接可以是点对点串行链路。在另一实施例中,存储器控制器204可以被称为北桥。系统存储器206可以表示用于存储数据和指令的任何类型的存储器设备,所述数 据和指令可以已被处理器202使用或将由处理器202使用。通常,系统存储器206由动态 随机存取存储器(DRAM)构成,尽管本发明并不限于此。在一个实施例中,系统存储器206 可以由Rambus DRAM (RDRAM)构成。在另一实施例中,系统存储器206可以由双倍数据速率 同步 DRAM(DDRSDRAM)构成。输入/输出(I/O)控制器208可以表示连接I/O设备212和电子装置200的其它 部件的任何类型的芯片组或控制逻辑。在一个实施例中,I/O控制器208可以被称为南桥。 在另一实施例中,I/O控制器208可以符合PCI特别兴趣小组在2003年4月15日发布的 外围设备部件互连(PCI) Express 基本规范版本1.0a。网络控制器210可以表示允许电子装置200与其它电子装置或设备进行通信 的任何类型的设备。在一个实施例中,网络控制器210可以符合电气电子工程师学会 (IEEE)802. Ilb 标准(1999 年 9 月 16 日通过,对 1999 版的 ANSI/IEEE Std 802. 11 的补 充)。在另一实施例中,网络控制器210可以是以太网接口卡。输入/输出(I/O)设备212可以表示向电子装置200提供输入或者处理来自电子 装置200的输出的任何类型的设备、外围设备或部件。图3是根据本发明的一个示例实施例的用于使用基于全局相似度的分类器进行 目标识别的示例性方法的流程图。对本领域的普通技术人员而言,显而易见的是,尽管以下 操作可以被描述为顺序过程,但是实际上可以并行地或同时地执行多个操作。此外,在不背 离本发明的实施例的精神的情况下,可以重置操作的顺序。在一个实施例中,方法300以从摄像头(例如,摄像头108)接收(302)图像作为 开始。在一个示例性实施例中,电子装置通过网络从设备100接收图像。下一步是将图像转换为(304)数值表示。在一个实施例中,处理器202将图像转 换为彩色直方图(color histogram)。在另一实施例中,处理器202将图像转换为关于边缘方向或边缘轮廓表示的统计,例如尺度不变特征转换(SIFT)特征。方法300继续计算(306)在转换后的图像与原型图像之间的相似度函数。在一个 实施例中,处理器202计算在测试图像与原型图像表示之间的最大加权匹配。在另一实施 例中,处理器202计算在测试图像与原型图像表示之间的Hausdorff距离。在一个实施例 中,对于测试图像乂和一组原型图像^相似度函数输出一组定长向量以^,力-!^^)。下一步是将相似度函数的输出分类(308)。在一个示例性实施例中,分类器是最近 邻分类器(nearest neighbor classifier)。在一个实施例中,分类器是k最近邻分类器。 在一个实施例中,分类器是支持向量机分类器。在一个实施例中,分类器是决策树分类器。 本领域技术人员将意识到分类器不会对图像表示直接分类,而是对定长相似度函数向量分 类,从而允许更为复杂的图像表示。在一个实施例中,使用原型图像表示仅对分类器训练一 次。然后,假定在原型图像中找到匹配,那么将在显示器102上显示(310)用于图像 104的标签106。在另一实施例中,可以以本领域技术人员知晓的其它方式来传达目标识别
fn息ο图4说明了包括内容的示例性存储介质的框图,其中,当访问所述内容时,使得电 子装置实现所公开方法300的一个或多个方面。在这方面,存储介质400包括内容402 (例 如,指令、数据或其组合),其中,当执行所述内容402时,使得装置实现上述方法的一个或 多个方面。机器可读(存储)介质400可以包括但不限于软盘、光盘、⑶-ROM和磁光盘、ROM、 RAM、EPROM、EEPR0M、磁卡或光卡、闪存或其它类型的适合于存储电子指令的媒介/机器可 读介质。此外,本发明还可以作为计算机程序产品下载,其中,可以经由通信链路(例如,调 制解调器、无线或网络连接),通过在载波或其它传播介质中体现的数据信号,将程序从远 程计算机传输到请求计算机。在以上描述中,为了解释的目的,阐述了许多具体的细节以便于对本发明的透彻 的理解。但是对本领域的技术人员来说,显而易见的是,可以在没有这些具体细节的情况下 实施本发明。在其它实例中,以框图的形式示出了已知的结构和设备。可以在各种应用中使用本发明的实施例。本文公开的发明可以用在微控制器、通 用微处理器、数字信号处理器(DSP)、精简指令集计算(RISC)、复杂指令集计算(CISC)和其 它电子元件中,尽管本发明并不局限于此。然而,应当理解本发明的范围并不限于这些例 子。本发明的实施例还可以包括在集成电路模块中,其可以被称为核心存储器、高速 缓存存储器或其它类型的存储器,其存储由微处理器执行的电子指令或存储可以用在算术 操作中的数据。一般而言,根据所声明的主题使用多级多米诺逻辑的实施例可以将益处提 供给微处理器,并且特别地,可以被并入存储设备的地址解码器中。注意,实施例可以被集 成到无线电系统或手持便携式设备中,特别是当设备依赖于减少的功耗时。因此,膝上型计 算机、蜂窝无线电话通信系统、双向无线通信系统、单向寻呼机、双向寻呼机、个人通信系统 (PCS)、个人数字助理(PDA)、照相机和其它产品旨在被包括在本发明的范围内。本发明包括各种操作。本发明的操作可以由硬件部件来执行,或者可以被体现在 机器可执行的内容(例如,指令)中,其可以用于使得用指令编程的通用或专用处理器或逻辑电路来执行所述操作。或者,操作可以由硬件和软件的组合来执行。此外,尽管结合计算 装置描述了本发明,但是本领域的技术人员应该理解,这种功能还可以体现在许多替代实 施例中,例如集成在通信装置(例如,蜂窝电话)内。 以最基本的形式描述了许多方法,但是可以在不背离本发明的基本范围的情况 下,向任何方法增加或删除操作并且可以向任何描述的消息增加或减少信息。在本发明的 范围和精神内,可以预期发明构思的任何数量的变形。在这点上,所提供的特定的说明性的 实施例不是用于限定本发明而是仅用于说明。因此,本发明的范围不应由以上提供的具体 例子确定,而应仅由以下权利要求的清晰语言来确定。
权利要求
一种装置,包括摄像头;显示器;以及处理器,所述处理器用于从所述摄像头接收图像;将所述图像转换为数值表示;计算所述转换后的图像与多个原型图像表示之间的相似度函数;以及将所述相似度函数的输出分类以识别所述图像。
2.根据权利要求1所述的装置,进一步包括所述处理器用于在所述显示器上将所述 图像标记为所述原型图像中的一个。
3.根据权利要求1所述的装置,其中,所述处理器计算在所述转换后的图像与多个原 型图像表示之间的相似度函数包括所述处理器计算在多组SIFT特征之间的最大加权匹 配。
4.根据权利要求1所述的装置,其中,所述处理器计算在所述转换后的图像与多个原 型图像表示之间的相似度函数包括所述处理器计算边缘轮廓表示之间的Hausdorff距罔。
5.根据权利要求1所述的装置,其中,所述处理器将所述图像转换为数值表示包括所 述处理器将所述图像转换为彩色直方图。
6.根据权利要求1所述的装置,其中,所述处理器将所述图像转换为数值表示包括所 述处理器将所述图像转换为关于边缘方向的统计。
7.一种包括内容的存储介质,其中,当由访问机器执行所述内容时,使得所述访问机器 从摄像头接收图像,将所述图像转换为数值表示,计算在所述转换后的图像与多个原型图 像表示之间的相似度函数,并且将所述相似度函数的输出分类以识别所述图像。
8.根据权利要求7所述的存储介质,进一步包括用于在显示器上将所述图像标记为 所述原型图像中的一个的内容。
9.根据权利要求7所述的存储介质,其中,用于计算在所述转换后的图像与多个原型 图像表示之间的相似度函数的内容包括用于计算在多组SIFT特征之间的最大加权匹配 的内容。
10.根据权利要求7所述的存储介质,其中,用于计算在所述转换后的图像与多个原型 图像表示之间的相似度函数的内容包括用于计算边缘轮廓表示之间的Hausdorff距离的 内容。
11.根据权利要求7所述的存储介质,其中,用于将所述图像转换为数值表示的内容包 括用于将所述图像转换为彩色直方图的内容。
12.根据权利要求7所述的存储介质,其中,用于将所述图像转换为数值表示的内容包 括用于将所述图像转换为关于边缘方向的统计的内容。
13.一种装置,包括 摄像头;显示器;以及处理器,所述处理器用于从所述摄像头接收图像; 将所述图像转换为SIFT特征;计算在所述图像的多组SIFT特征与多个原型图像之间的最大加权匹配;以及 将所述最大加权匹配的定长向量分类以识别所述图像。
14.根据权利要求13所述的装置,其中,所述处理器执行分类算法包括所述处理器执 行最近邻分类器。
15.根据权利要求13所述的装置,其中,所述处理器执行分类算法包括所述处理器执 行k最近邻分类器。
16.根据权利要求13所述的装置,其中,所述处理器执行分类算法包括所述处理器执 行支持向量机分类器。
17.根据权利要求13所述的装置,其中,所述处理器执行分类算法包括所述处理器执 行决策树分类器。
18.—种包括内容的存储介质,其中,当由访问机器执行所述内容时,使得所述访问机 器从摄像头接收图像,将所述图像转换为SIFT特征,计算在所述图像的多组SIFT特征与 多个原型图像之间的最大加权匹配,并将所述最大加权匹配的定长向量分类以识别所述图像。
19.根据权利要求18所述的存储介质,其中,用于执行分类算法的内容包括用于执行 最近邻分类器的内容。
20.根据权利要求18所述的存储介质,其中,用于执行分类算法的内容包括用于执行 k最近邻分类器的内容。
21.根据权利要求18所述的存储介质,其中,用于执行分类算法的内容包括用于执行 支持向量机分类器的内容。
22.根据权利要求18所述的存储介质,其中,用于执行分类算法的内容包括用于执行 决策树分类器的内容。
全文摘要
在一些实施例中,描述了使用基于全局相似度的分类器的目标识别。关于这一点,介绍了一种装置,其包括摄像头、显示器和处理器,处理器用于从摄像头接收图像,将图像转换为数值表示,计算在转换后的图像与多个原型图像表示之间的相似度函数,并且将相似度函数的输出分类以识别图像。还公开并要求保护其它实施例。
文档编号G06K9/64GK101944182SQ20091100025
公开日2011年1月12日 申请日期2009年12月25日 优先权日2008年12月31日
发明者A·拉希米 申请人:英特尔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1