用于物体识别的图像数据库的制作方法、制作装置以及制作程序的制作方法

文档序号:6350131阅读:254来源:国知局
专利名称:用于物体识别的图像数据库的制作方法、制作装置以及制作程序的制作方法
技术领域
本发明涉及用于物体识别的图像数据库的制作方法、制作装置以及制作程序。具体而言,本发明涉及压缩特征向量的表示并涉及在特定物体识别上的应用,其中使用关联数据结构。关联数据结构允许假阳性,当给定某个数据集和元素时,使用该数据结构来基于键(key)关联分配给每个数据(键)的值。
背景技术
特定物体识别是一项识别物体实例的任务。在本说明书中,描述使用如SIFT(例如参见非专利文献1)的局部特征向量的特定物体识别。由于我们周围有许多物体,需要一种允许我们识别大量物体的特定物体识别技术来提供实际服务。局部特征是基于实数值的多维向量。由于局部特征的区别能力强,所以局部特征适用于识别许多物体。作为特定物体识别方法,基础的方法基于通过对从未知物体获得的特征向量和从已有物体获得的特征向量进行匹配而实现的投票。该方法采用特征向量的最近邻搜索进行匹配。该方法面临由大量特征向量造成的下列问题。最主要的问题涉及处理速度和存储量。幸运的是,已针对处理速度问题提出了许多方法。这些方法的例子包括如k维树的树结构(例如参看非专利文献1)和基于哈希的方法(例如参看非专利文献1和非专利文献幻。这些方法所采用的近似最近邻搜索使我们可以极大地提高处理速度。另一方面,存储量问题则难以实现突破。通常从一副图像提取几千个局部特征,而且,物体数增加时,需要大量存储器进行存储。已提出了一些减少存储量的方法。例如,方法之一是基于称为“视觉词(visual words),,的经向量量化的特征向量减少所需存储量。该方法对于用于识别图像中一类物体 (例如普通“汽车”类别)的“通用物体识别”是有效的。然而,这种方法不是特别适用于识别图像中物体实例(例如,“汽车”类别中特定的型号名称)的“特定物体识别”。为了实现大规模特定物体识别,必须增加视觉词数量。然而,为了实现大规模识别,只有两到三个特征向量可以与一个视觉词关联。据报道,如果多于两个或三个特征向量与一个视觉词关联, 识别率就会降低(参看非专利文献4)。因而,这种方法的存储量减少有限。另一种方法是利用标量量化(例如参看非专利文献幻或者通过选择特征向量 (例如参看非专利文献6、非专利文献4)减少存储量。在这些使用近似最近邻搜索的方法中,需要计算特征向量的距离,这使得在任何情况下都需要存储各个特征向量。因而,需要与要存储的特征向量数成正比的存储量,因而,这种方法的存储量减少有限。解决该问题的一个可能途径是省去进行匹配的距离计算。这样,不需要存储特征向量,从而可以极大减少存储量。基于这一考虑,提出了基于哈希的方法,其中,把特征向量存储在哈希表中,访问哈希表以进行识别(例如参看专利文献1和非专利文献幻。在该方法中,不是通过基于例如距离和相似度的量化概念的相似度搜索过程来进行特征向量匹配,而是通过特征向量是否具有同一哈希函数(同一哈希值)的标识过程来进行特征向量匹配。由于哈希表中仅标出特征向量的存在性,可以大大减少存储量。引文列表专利文献专利文献1 国际公开W02008/(^6414非专利文献非专利文献 1 :D. Lowe ,Distinctive Image Features fromScale-Invariant KeypointsInternational Journal of ComputerVision, Vol.60, No. 2, pp. 91-110(2004)非专利文献2 :野口和人,黄瀬浩一,岩村雅一“近似最近傍探索O多段階化(二 J:易物体Θ高速認識,‘‘画像O認識 理解* >求”勺K (MIRU2007)論文集,0 S-B2-02, pp. 111-118(2007)。# 专禾Ij 文 ^ 3 :K. Kise, K. Noguchi and Μ. Iwamura "Memory Efficient Recognition of Specific Obj ects with LocalFeatures,,,Proc. Of the 19th International Conference of PatternRecognition(ICPR2008)WeAT3. 1(2008).非专利文献4 :井上勝文,三宅弘志,黄瀬浩一‘‘局所記述子(二基3 < 3次元物体認識Q t的Q ^ U削減一局所記述子O取捨選択(二 J 3 7 口一子一〃,画像乃認識·理解* > 水。”々 A (MIRU2008)論文集、OS 15-3, pp. 363-370(2008)。非专利文献5 本道貴行,黄瀬浩一“特定物体認識O tz^^ 7—夕^ 一 ^容量削減法O検討 局所特徵量O量子化△取捨選択 “,電子情報通信学会技術研究報告、 Vol. 108,No. 484,PRMU2008-265, pp.171-176(2009)。非专利文献6 :B. Chazelle, J. Killian, R. Rubinfeld and A. Tal :‘‘The Bloomier Filter :An Efficient Data Structure for Static Support Lookup Table", Proc.15th Annual ACM-SIAM SODA,pp.30-39 (2004).

发明内容
发明要解决的问题然而,该方法仍然存在关于存储量的问题。为了实现正确识别,类似的特征向量必须具有相同的哈希值。然而,这样一来,存储在哈希表中的特征向量是偏移的,而且,几乎哈希表中的所有bin通常都是空的。因而,空间效率即存储空间中有效利用的存储区域比变差。考虑到上述情况提出了本发明,其目的在于提供一种空间效率很好的制作和检索图像数据库的方法,其中使用关联数据结构来解决上述问题。关联数据结构提供一个值,根据用作数据集元素的键把该键分配给该值。关联数据结构包括允许假阳性的数据结构,作为对压缩数据量的折中,即,作为减少存储数据所需的存储量和实现高空间效率之间的平衡。数据结构用于检查(检索)所存储的许多键中是否存有某个键。假阳性意味着检索时可能返回不是分配给该键的值,或者虽然没有存储某个键但是返回值。由此,可以说该数据结构是概率(probabilistic)数据结构。虽然不能保证可以获得正确答案,即可能返回错误结果,但错误结果的概率低到实际使用没有问题就可以。允许假阳性是降低制作数据库所需的存储量的取舍之一。不使用哈希表而使用上述数据结构来检查是否存储了特征向量。重要区别在于在错误地检测到没有存储的特征向量时所出现的假阳性。在使用哈希表的方法中,不会出现假阳性。另一方面,在使用上述数据结构的方法中,虽然某种程度上允许假阳性,但是可以实现高空间效率。用于解决问题的方案本发明提供一种图像数据库制作方法,用于制作物体识别用图像数据库,并包括如下步骤提取步骤,从通过拍摄要存储在图像数据库中的物体所形成的图像提取多个特征向量,其中,预先对所述物体分配了 η位的标识符,η是自然数,并且每个特征向量表示所述图像的局部特征;以及存储步骤,通过使用一组数据结构将每个特征向量存储在所述图像数据库中,每个数据结构返回表示指定的数据是否存储在该数据结构中的值,从而将所述物体的标识符与从所述物体提取的特征向量关联,其中,所述一组数据结构具有至少 2Χη个标识符数据结构,每个标识符数据结构与所述标识符的每一位的0值和1值相对应; 所述存储步骤根据提取出特征向量的所述物体把每个特征向量存储到每一位的0值或1值的标识符数据结构;通过计算机访问所述图像数据库,以在给出显示有物体的图像作为查询时执行识别处理,从而检查所述图像数据库中是否存储了与所述查询相同的物体;其中所述识别处理包括如下步骤从所述查询提取多个特征向量作为查询向量;检查所述标识符数据结构中是否存储了与每个查询向量相对应的特征向量;以及在所述相对应的特征向量存储在所述标识符数据结构的每一位的0值或1值中时,根据每一位的存储值找到与所述查询向量相关的标识符,从而基于对每个查询向量进行的检查的统计将所述查询与最相关的标识符关联。另一方面,本发明提供一种图像数据库制作装置,用于制作物体识别用图像数据库,并包括提取单元,用于从通过拍摄要存储在图像数据库中的物体所形成的图像提取多个特征向量,其中,预先对所述物体分配了 η位的标识符,η是自然数,并且每个特征向量表示所述图像的局部特征;数据结构单元,包括一组数据结构,每个数据结构返回表示指定的数据是否存储在该数据结构中的值;以及存储单元,用于将每个特征向量存储在所述数据结构单元中,以将预先分配给所述物体的标识符与从所述物体提取的特征向量关联,其中, 所述数据结构单元具有至少2Χη个标识符数据结构,每个标识符数据结构与所述标识符的每一位的0值和1值相对应;所述存储单元根据提取出特征向量的所述物体把每个特征向量存储到每一位的0值或1值的标识符数据结构;通过识别设备访问所述图像数据库,以在给出显示有物体的图像作为查询时检查所述图像数据库中是否存储了与所述查询相同的物体;以及所述识别设备从所述查询提取多个特征向量作为查询向量;检查所述标识符数据结构中是否存储了与每个查询向量相对应的特征向量;以及在所述相对应的特征向量存储在所述标识符数据结构的每一位的0值或1值中时,根据每一位的存储值找到与所述查询向量相关的标识符,从而基于对每个查询向量进行的检查的统计将所述查询与最相关的标识符关联。此外,本发明提供一种图像数据库制作程序,用于制作物体识别用图像数据库,并且使计算机能够执行如下步骤提取步骤,从通过拍摄要存储在图像数据库中的物体所形成的图像提取多个特征向量,其中,预先对所述物体分配了 η位的标识符,η是自然数,并且每个特征向量表示所述图像的局部特征;以及存储步骤,通过使用一组数据结构把每个特征向量存储在所述图像数据库中,每个数据结构返回表示指定的数据是否存储在该数据结构中的值,从而将所述物体的标识符与从所述物体提取的特征向量关联,其中,所述一组数据结构具有至少2Xn个标识符数据结构,每个标识符数据结构与所述标识符的每一位的0 值和1值相对应;所述存储步骤根据提取出特征向量的所述物体把每个特征向量存储到每一位的0值或1值的标识符数据结构;通过所述计算机或其它计算机访问所述图像数据库, 以在给出显示物体的图像作为查询时执行识别处理,从而检查所述图像数据库中是否存储了与所述查询相同的物体;其中所述识别处理包括如下步骤从所述查询提取多个特征向量作为查询向量;检查所述标识符数据结构中是否存储了与每个查询向量相对应的特征向量;以及在所述相对应的特征向量存储在所述标识符数据结构的每一位的0值或1值中时, 根据每一位的存储值找到与所述查询向量相关的标识符,从而基于对每个查询向量进行的检查的统计将所述查询与最相关的标识符关联。发明的效果在用于物体识别的图像数据库的制作方法中,在存储步骤,根据提取出特征向量的物体,把特征向量存储到每一位为O值或1值的2Xn标识符数据结构中。因而,可以根据存储特征向量的数据结构,即通过检查对应的特征向量是否保存在0值数据结构或1值数据结构中,来从特征向量关联标识符的值。该数据结构允许假阳性以压缩数据量。因而, 可以以和常规方法基本相同的存储量实现大型物体识别图像数据库。如下文的图9、10、15 和16所示,根据实验可以验证,与使用哈希表的近似最近邻搜索相比,本发明可以减少存储量。本发明中,可用作数据结构的具体示例是Bloom滤波器,用作关联数据结构的具体示例是Bloomier滤波器(例如参看非专利文献6)。Bloomier滤波器是如下方法的数据结构,该方法基于用作要存储的元素的多个键来关联分别分配给相应的键的值。关联意味着给定某个键时,根据预定数据结构可以短时间内得到与该键关联的值。关联意味着利用该策略获得与键关联的值。Bloomier滤波器包括具有多个共同哈希函数的多个Bloom滤波器(m位的位数组(bit array))。当给定某个键时,使用从各个哈希函数得到的哈希值引用各个Bloom滤波器,并可以基于引用结果来得到和该键关联的值。下文对此进行详细描述。根据本发明,把表示物体的图像存储到用于物体识别的图像数据库中,并且给出图像作为查询。如果可以从数据库找到和该查询的图像代表的物体匹配的物体,则可认为识别到了物体。在物体识别时,重要的是短时间内完成物体识别,并且实现图像数据库的存储量的减少。这两者之间的关系通常是有所取舍的。本发明更侧重于减少存储量。具体而言, 本发明是一种构建存储大量图像数据的图像数据库的有效方法。上述操作和效果同样也适用于根据本发明的用于物体识别的图像数据库的制作装置和制作程序。


图1是示出常规物体识别中为了缩短识别时间而具有级联的多个识别器的级联结构的示意图。
图2是示出根据本发明的存储到Bloom滤波器的存储流程的示意图。图3是示出根据本发明的实验中使用的三维物体示例的示意图。图4是示出根据本发明的实验中使用的平面物体示例的示意图。图5是示出本发明实验中用作查询的图像的示意图,其中通过改变每个平面物体的视角而拍摄每个图像。图6是示出本发明方法以及作为比较示例的野口和人的方法改变各个参数时的物体识别率(实验U5个三维物体的识别实验)的第一图。图7是示出本发明方法以及作为比较示例的野口和人的方法改变各个参数时的物体识别率(实验U5个三维物体的识别实验)的第二图。图8是示出作为比较示例的野口和人的方法改变各个参数时的物体识别率(实验 1,55个三维物体的识别实验)的第三图。图9是示出对本发明方法以及作为比较示例的野口和人的方法改变参数c时识别过程所需存储量的比较结果(实验1巧5个三维物体的识别实验)的第一图。图10是示出对本发明方法以及作为比较示例的野口和人的方法改变参数c时识别过程所需存储量的比较结果(实验1,55个三维物体的识别实验)的第二图。图11是示出改变本发明方法中的参数t的识别率(实验1,55个三维物体的识别实验)的图。图12是示出本发明方法以及作为比较示例的野口和人的方法改变各个参数时的物体识别率(实验2,5000个平面物体的识别实验)的第一图。图13是示出本发明方法以及作为比较示例的野口和人的方法改变各个参数时的物体识别率(实验2,5000个平面物体的识别实验)的第二图。图14是示出作为比较示例的野口和人的方法改变各个参数时的物体识别率(实验2,5000个平面物体的识别实验)的第三图。图15是示出对本发明方法以及作为比较示例的野口和人的方法改变参数c时识别过程所需存储量的比较结果(实验2,5000个平面物体的识别实验)的第一图。图16是示出对本发明方法以及作为比较示例的野口和人的方法改变参数c时识别过程所需存储量的比较结果(实验2,5000个平面物体的识别实验)的第二图。图17是示出对本发明方法以及作为比较示例的野口和人的方法利用相同的存储器大小在d =观和d = M时改变参数b和c时的识别率和处理时间(实验2,5000个平面物体的识别实验)的图。图18是示出改变本发明方法中的参数t的物体识别率(实验2,5000个平面物体的识别实验)的图。图19是示出本发明方法中错误检测所用的Bloomier滤波器(55个三维物体的识别实验)的有效性的第一图。图20是示出本发明方法中错误检测所用的Bloomier滤波器(55个三维物体的识别实验)的有效性的第二图。图21是示出本发明方法中错误检测所用的Bloomier滤波器(5000个平面物体的识别实验)的有效性的第三图。图22是示出本发明方法中错误检测所用的Bloomier滤波器(5000个平面物体的
9识别实验)的有效性的第四图。图23是描述根据本发明的数据库制作方法的具体示例的第一示意图。图M是描述根据本发明的数据库制作方法的具体示例的第二示意图。
具体实施例方式下面描述本发明的优选实施例。在根据本发明的用于物体识别的图像数据库制作方法中,每个数据结构可允许假阳性,以减少存储数据所需的存储量。存储步骤可应用预定规则以获得与标识符相关的错误检测值,并且可把所获得的值存储到错误检测的数据结构中;识别步骤可比较获得的标识符和存储到错误检测的数据结构中的值,并且当两者彼此相符时,识别步骤可将关于查询向量的确定结果用于检查的统计,如果两者不等,则可不用于检查的统计。具体而言,存储步骤应用预定的规则以获得和标识符相关的错误检测的值,并且把所获得的值存储到错误检测的数据结构中。因而,即便确定查询向量同时存储在位的0值和1值中,仍然可确定与存储到错误检测的数据结构中的值的一致性。因而,与不使用错误检测的数据结构的情况相比,可以以更高的准确度找到和查询向量相关的图像。错误检测的值可包括至少一位,错误检测的数据结构可包括用于存储该位的0值的数据结构和用于存储该位的ι值的数据结构。利用该结构,除了包括通过利用2Xn数据结构来关联标识符的关联数据结构外,检测用的数据结构可被配置为还包括上述数据结构。当确定同一查询向量由于假阳性既存储在0值数据结构中又存储在1值数据结构中的位的数量超过预定数值时,识别步骤可把和查询向量相关的确定结果排除在检查的统计之外。当由于假阳性获得超过预定数值的值作为和查询向量相关的图像的标识符时,根据特定基础排除包括许多错误值的确定结果。这样,与上述不排除确定结果的情况相比,可以以更高的准确度找到和查询向量相关的图像。识别步骤可对被确定为和查询向量相关的标识符的值赋予预定的得分,同时,识别步骤也可以在确定没有标识符和查询向量相关时不对任何标识符赋予得分,而且识别步骤可基于对从查询提取的查询向量进行的检查的统计来确定得分最高的标识符。进行对查询向量的多个确定结果投票的投票处理。因而,即便单个确定结果正确的概率不是100%, 仍可以通过投票处理得到有效结果。数据结构可以是Bloom滤波器。在上述制作方法和检索方法中,每个数据结构的位数m (m是自然数)可以大于预定的最大存储向量数。更优选地,m被确定为使得存储每个向量后的每个数据结构变得足够稀疏从而包括0值的位。该结构可以降低数据结构的错误检测的概率,即降低假阳性风险。m增大太多时,空间效率变差。设计者可以通过实验或者根据经验确定两者之间平衡的有效值。此处所述的许多优选实施例可彼此组合。下面参考附图详细描述本发明。下面的说明书从各方面来讲都应认为是说明性的而不是对本发明的限定。
详细描述本发明之前,详细描述相关工作以易于理解本发明的技术含义。1、相关工作减少存储量是使用局部特征向量的特定物体识别的重要问题。减少存储量的传统技术包括基于对特征向量进行向量量化的技术(参看非专利文献7),或者基于标量量化的技术(参看非专利文献3)。在基于向量量化的前一种技术中,将多个特征向量转换成称为视觉词的代表向量以减少存储量。然而,为了实现大规模识别,只有几个特征向量可以和一个视觉词关联。据报道,如果多于两个或三个特征向量和一个视觉词关联,那么识别率会降低(参看非专利文献5)。另一方面,在基于标量量化的后一种技术中,通过对特征向量的每一维进行标量量化来减少存储量。该技术某种程度上对大型物体识别是有效的。然而,即便特征向量数用1位表示,存储量也和特征向量数成正比地增加,因而,执行更大型物体识别受到限制。 因而,减小特征向量自身容量的技术是有限制的。减少存储量的另一方法是不使用主存储器而使用辅助存储(例如,参看 F. Fraundorfer, H. Stewenius and D. Nister ·."k Binning Scheme for Fast Hard Drive Based Image Search", Proc. Of CVPR2007,pp. 1-6 U007),或者Noritaka Himei,Toshikazu Wada "Approximate nearest neighbor search algorithm on HDD based on B+ tree", IEICE, Vol. 108,No. 484,PRMU2008-273, pp. 223-228 (2009))。还有一种对存储在数据库中的特征向量进行采样的技术(例如参看非专利文献5和4)。使用辅助存储的技术,策略是在主存储器中仅存储到特征向量的指针以减少存储量。该技术可实现大型物体识别,但是带来的问题是识别过程需要太多时间。在对特征向量进行采样的技术中,选择对识别有效的特征向量以减少存储量。即便在该技术中,对于实现大型物体识别而言,可以减少的特征向量的数量也是有限的。如果要减少多于限制的特征向量,识别率可能下降。在上述每种技术中,必需存储各个特征向量以计算特征向量之间的距离。因而,识别所需的存储量的减少是有限的。作为解决该问题的一种方法,考虑省去计算特征向量之间的距离。提出了使用哈希表的技术(参看专利文献1、非专利文献幻作为基于该概念的技术。然而,这种技术也存在问题。具体而言,存储在哈希表中的特征向量是有偏的(biased),其中,哈希表中的大部分bin是空的,这意味着空间效率低。鉴于此,本发明基于不进行特征向量距离计算的概念给出使用和哈希表相比空间效率良好的Bloomier滤波器来减少存储量的技术。2、野口和人的方法这部分描述本发明所基于的野口和人的方法(参看专利文献1、非专利文献幻。野口和人的方法是特定物体识别处理,其中特征向量的维数是36。用PCA-SIFT计算特征向量(例如参看Y. Ke and R. Sukthankar "PCI-SIFT :A more distinctive representation for local image descriptors", Proc. Of CVPR2004, Vol. 2, pp. 506-513 (2004)) 野口和人的方法分为两个过程,这两个过程是构建用于把特征向量存储在哈希表内的数据库的过程和使用该数据库基于投票处理识别物体的识别过程。下面描述具体过程。2. 1、数据库构建
11
该部分描述野口和人的方法构建数据库的过程。在野口和人的方法中,提取特征向量P的第1 d维(d彡36)以形成P’ = (Pl, P2,…,pd)。然后,利用向量P’通过对每一维进行二值化处理得到位向量u = (U1, U2,…,ud)。[公式1]
权利要求
1.一种图像数据库制作方法,用于制作物体识别用图像数据库,并包括如下步骤 提取步骤,从通过拍摄要存储在图像数据库中的物体所形成的图像提取多个特征向量,其中,预先对所述物体分配了 η位的标识符,η是自然数,并且每个特征向量表示所述图像的局部特征;以及存储步骤,通过使用一组数据结构将每个特征向量存储在所述图像数据库中,每个数据结构返回表示指定的数据是否存储在该数据结构中的值,从而将所述物体的标识符与从所述物体提取的特征向量关联,其中,所述一组数据结构具有至少2Χη个标识符数据结构,每个标识符数据结构与所述标识符的每一位的0值和1值相对应;所述存储步骤根据提取出特征向量的所述物体把每个特征向量存储到每一位的0值或1值的标识符数据结构;通过计算机访问所述图像数据库,以在给出显示有物体的图像作为查询时执行识别处理,从而检查所述图像数据库中是否存储了与所述查询相同的物体;其中所述识别处理包括如下步骤 从所述查询提取多个特征向量作为查询向量;检查所述标识符数据结构中是否存储了与每个查询向量相对应的特征向量;以及在所述相对应的特征向量存储在所述标识符数据结构的每一位的0值或1值中时,根据每一位的存储值找到与所述查询向量相关的标识符,从而基于对每个查询向量进行的检查的统计将所述查询与最相关的标识符关联。
2.根据权利要求1所述的图像数据库制作方法,其中,每个数据结构允许假阳性,以减少存储数据所需的存储量。
3.根据权利要求1或2所述的图像数据库制作方法,其中,所述存储步骤应用预定的规则以获得与所述标识符相关的错误检测用值,并把所获得的错误检测用值存储到错误检测用数据结构中;以及所述识别处理将所找到的标识符与存储到所述错误检测用数据结构中的值进行比较, 并且,当两者相符时,所述识别处理将有关所述查询向量的确定结果用于检查的统计,当两者不相符时,所述识别处理不把所述确定结果用于检查的统计。
4.根据权利要求3所述的图像数据库制作方法,其中, 所述错误检测用值包括至少一位,而且所述错误检测用数据结构包括用于存储所有位的0值的数据结构和用于存储所有位的1值的数据结构。
5.根据权利要求2至4中任意一项所述的图像数据库制作方法,其中,当同一查询向量由于假阳性而被确定为同时存储在0值的数据结构和1值的数据结构中的位的数量超过预定数值时,所述识别处理将关于该查询向量的确定结果从检查的统计中排除。
6.根据权利要求1至5中任意一项所述的图像数据库制作方法,其中,所述识别处理对被确定为与所述查询向量相关的标识符的值赋予预定的得分,并在确定没有标识符与所述查询向量相关时不对任何标识符赋予得分;而且所述识别处理根据针对从所述查询提取的查询向量进行的检查的统计确定得分最高的标识符。
7.根据权利要求1至6中任意一项所述的图像数据库制作方法,其中,所述数据结构是布隆滤波器。
8.一种图像数据库制作装置,用于制作物体识别用图像数据库,并包括提取单元,用于从通过拍摄要存储在图像数据库中的物体所形成的图像提取多个特征向量,其中,预先对所述物体分配了 η位的标识符,η是自然数,并且每个特征向量表示所述图像的局部特征;数据结构单元,包括一组数据结构,每个数据结构返回表示指定的数据是否存储在该数据结构中的值;以及存储单元,用于将每个特征向量存储在所述数据结构单元中,以将预先分配给所述物体的标识符与从所述物体提取的特征向量关联,其中,所述数据结构单元具有至少2Χη个标识符数据结构,每个标识符数据结构与所述标识符的每一位的0值和1值相对应;所述存储单元根据提取出特征向量的所述物体把每个特征向量存储到每一位的0值或1值的标识符数据结构;通过识别设备访问所述图像数据库,以在给出显示有物体的图像作为查询时检查所述图像数据库中是否存储了与所述查询相同的物体;以及所述识别设备从所述查询提取多个特征向量作为查询向量;检查所述标识符数据结构中是否存储了与每个查询向量相对应的特征向量;以及在所述相对应的特征向量存储在所述标识符数据结构的每一位的0值或1值中时,根据每一位的存储值找到与所述查询向量相关的标识符,从而基于对每个查询向量进行的检查的统计将所述查询与最相关的标识符关联。
9.一种图像数据库制作程序,用于制作物体识别用图像数据库,并且使计算机能够执行如下步骤提取步骤,从通过拍摄要存储在图像数据库中的物体所形成的图像提取多个特征向量,其中,预先对所述物体分配了 η位的标识符,η是自然数,并且每个特征向量表示所述图像的局部特征;以及存储步骤,通过使用一组数据结构把每个特征向量存储在所述图像数据库中,每个数据结构返回表示指定的数据是否存储在该数据结构中的值,从而将所述物体的标识符与从所述物体提取的特征向量关联,其中,所述一组数据结构具有至少2Χη个标识符数据结构,每个标识符数据结构与所述标识符的每一位的0值和1值相对应;所述存储步骤根据提取出特征向量的所述物体把每个特征向量存储到每一位的0值或1值的标识符数据结构;通过所述计算机或其它计算机访问所述图像数据库,以在给出显示物体的图像作为查询时执行识别处理,从而检查所述图像数据库中是否存储了与所述查询相同的物体;其中所述识别处理包括如下步骤 从所述查询提取多个特征向量作为查询向量;检查所述标识符数据结构中是否存储了与每个查询向量相对应的特征向量;以及在所述相对应的特征向量存储在所述标识符数据结构的每一位的0值或1值中时,根据每一位的存储值找到与所述查询向量相关的标识符,从而基于对每个查询向量进行的检查的统计将所述查询与最相关的标识符关联。
全文摘要
提供一种利用随机关联数据结构创建并搜索空间效率良好的图像数据库的方法。该方法包括特征提取步骤和记录步骤。在特征提取步骤中,从图像提取一个或多个特征向量作为局部特征量,特征向量表示图像的多个部分各自的局部特征,该图像要记录在图像数据库中并且表示物体。记录步骤使用关联数据结构,其中,使被分配给用作要记录的元素的多个键的值基于这些键相关联,而且其中包括容许假阳性的压缩数据结构作为构成元素,容许假阳性的目的在于压缩数据量。即,记录步骤使用关联数据结构将作为键的特征向量记录在关联数据结构中。
文档编号G06T7/00GK102460511SQ20108003562
公开日2012年5月16日 申请日期2010年6月2日 优先权日2009年6月10日
发明者井上胜文, 黄濑浩一 申请人:公立大学法人大阪府立大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1