物体识别用图像数据库的制作方法、处理装置以及处理用程序的制作方法

文档序号:6593420阅读:171来源:国知局
专利名称:物体识别用图像数据库的制作方法、处理装置以及处理用程序的制作方法
技术领域
本发明涉及一种物体识别用图像数据库的制作方法、处理装置以及处理用程 序。更详细地说,本发明涉及如下一种图像数据库的制作方法、处理装置以及处理程 序能够从图像所涉及的数据库中检索示出有与出现在作为检索问题(Query:查询对 象)的图像中的对象物一致的对象物的图像。
背景技术
当使用SIFT (Scale-Invariant Feature Transform 尺度不变特征转换)等局部描
述符时,能够实现对于隐藏、照明条件的变动具有鲁棒性的物体识别,因此当前广受 关注(例如参照非专利文献1、2)。识别的基础是被称为〃 BagofWords"或〃 Bagof Features"的模型,不考虑局部描述符的配置、关联(conjunction)而仅以该局部描述符的 频率为线索来识别物体。在此,局部描述符表现了图像的局部特征,按照规定的过程抽取局部描述符, 使得对于图像的变动(几何转换或照明条件、分辨率的差异)具有稳健(鲁棒性)的特 性。另外,局部描述符是基于图像的局部区域而决定的,因此对于隐藏也具有鲁棒性。 在本说明书中也将局部描述符称为特征矢量。这是由于该局部描述符是以矢量来表现 的。一般来说,从图像中抽取的局部描述符的数量为数百到数千,根据情况可至数 万,因此,局部描述符的对照所需的处理时间和存储所需的存储器容量庞大。因而,在 将识别精确度保持为固定水平的状态下怎样削减处理时间和存储器容量成为了重要的研 究课题。例如,在代表性的局部描述符SIFT中,各局部描述符表现为128维的矢量。另 外,已知一种通过对SIFT实施主成分分析来削减维数的PCA-SIFT。尽管如此,作为实 际使用的PCA-SIFT的一例,其维数也为36维。并且,通常使用应用于一般的数值表现 的32位(bit)的float型或int型作为表示各维度的数值的数据类型。在需要更高的精确 度的情况下使用64位的double型。另一方面,在数值的范围有限的情况下或即使牺牲精 确度也要削减存储器容量的情况下,也有时特别地使用16位的short int型。即使在优先 削减数据容量而特别地使用了 short int型的36维的PCA-SIFT的情况下,每个局部描述 符也需要16位X 36维=512位(64字节)的存储器。在最邻近搜索中,通常对矢量进行距离计算来决定最邻近的局部描述符。如 果降低各维度的数据的精确度则无法进行准确的最邻近搜索,则认为图像识别的精确度 (识别率)会降低,这在以往是公知常识。因此,以往在很多方法中,从如下方面进行研究将从用于制作模型的图像中 得到的局部描述符矢量量化(通过搜集类似的局部描述符并分类为规定数量的组,来将 同一组的各局部描述符置换为该组的代表值进行表现的方法、聚类分析)来确定数千乃至数十万的visual word (相当于上述代表值)、使用该visual word来记述图像(例如,参 照非专利文献3)。在对未知的图像进行识别时,将从该图像中得到的局部描述符转换成 visual word并对频率等进行测量。在这种研究中,如果visual word的数量足够少则能够 期待高速的处理。但是,另一方面,也被指出如果visual word的数量不多则无法达到足 够的识别率(例如,参照非专利文献4)。如果visual word的数量增加,则与此相应地无 法忽视矢量量化所需的计算时间,并且visual word本身的记录也会导致在存储器容量方 面产生问题。以上的优点/问题点在极端的情况下、S卩、将从用于制作模型的图像中得到的 各个局部描述符直接设为visual word的情况下最为明显。例如,从VGA尺寸的通常的 图像中可抽取两千个左右的局部描述符。因而,在将VGA尺寸的10万个图像用于模型 制作的情况下,visual word的数量为2亿,对照和存储都需要庞大的计算资源。另一方 面,通过将大量的局部描述符使用于模型,能够实现高精确度的识别。针对处理时间问题的解决方案之一是在局部描述符的对照中导入“近似最邻近 搜索”(例如,参照非专利文献5和专利文献1)。由此,例如在执行上述规模的识别任 务的情况下,可知与单纯的全部对照的情况相比,该解决方案能够基本不降低识别率而 使处理速度快至不足10Λ另一方面,针对存储器容量的问题,使矢量量化稀疏是解决 方案之一,但是这意味着识别率的降低,因此并非上策。专利文献1 国际公开第2008/026414号小册子非专禾1J 文献 1 D.Lowe “ Distinctive image features from scale-invariant keypoints “,International Journal of Computer Vision, Vol.60, No.2, pp.91-110, 2004非专禾丨J文献 2 : J.Ponce, M.Hebert, C.Schmid and A.Ziss erman Eds.Toward Category-Level Object Recognition, Springer, 2006非专利文献 3 : J.Sivic and A.Zisserman, Video google A text retrieval approach to object matching in videos, Proc.ICCV2003, Vol.2, pp.1470-1477, 2003非专利文献 4 D.Nister and H.Stewenius, Scalable recognition with a vocabulary tree, Proc.CVPR2006, pp.775-7 81, 2006非专利文献5:野口和人、黄瀬浩一、岩村雅一“近似最近傍探索O多段階 化e J 3物体O高速認識、“画像Θ認識·理解* > ”力Λ (MIRU2007)論文集、 pp.111-118, July, 200
发明内容
发明要解决的问题根据以上的情况,本发明从一种异于以往的观点出发提供了解决方案。即,基 于以下的观点提供了解决方案在使用了局部描述符的物体识别中,在将识别精确度保 持为固定水平的状态下怎样削减处理时间和存储器容量。具体地说,发明者们研究了在可以忽视对识别率的影响的范围内将表示局部描 述符的各维度的数值的精确度缩小至极限的可能性。这是出于如下考虑如上述专利 文献1那样提供了能够在短时间内从很多局部描述符中搜索到最邻近的局部描述符的发 法,如果对存储器容量的削减制定某个程度的目标,则通过不使用visual word的直接检索能够高精确度地进行物体识别。特别地,在以不仅识别物体的类别也识别物体的实例为目的的用途中,期望一 种高精确度、高速且高存储效率的手法。visual word本质上与分组相称,因此存在虽然 对类别程度的识别有效但是不适于实例程度的识别的一面。认为本发明的方法对于实例 程度的识别特别有效。但是,并不排除将本发明应用于类别程度的识别以及使用了 visual word的方法中。在此,类别识别指的是当提供识别对象(检索问题)时回复(识别)例如椅子、 机动车等物体的类别作为结果。与此相对地,实例识别指的是对例如机动车这种类别中 的特定型号等的物体实例进行识别。用于解决问题的方案发明者们锐意研究,结果与上述的技术常识相反地意外发现即使利用少于实数 型或整数型数据的结构位数来表现局部描述符的各维度,该结构位数降低到2位识别率 也基本不会降低。使用实数型或整数型数据、具体地说32位的数据来表现特征矢量的各 维度是本技术领域的常识。但是,发现即使以少于该32位数据的结构位数、例如8位以 下的精确度来表现局部描述符的各维度,在该结构位数降低到2位时识别率也基本不会 降低。另外,发现了即使该结构位数是1位,与0位、即不进行矢量的距离计算的方法 相比也能够得到与2位的识别率相近的良好结果。并且,还发现了该结果对多数表决处 理起很大作用。然后,根据这些见解完成了本申请。S卩,作为解决上述问题的方式,本发明并未研究缩小通过矢量量化得到的visual word的范围的,而对削减每个局部描述符的记录所需的存储器量进行研究。具体地说, 对于表现局部描述符的矢量,将记录所需的各维度的位数削减为少于实数型或整数型数 据(32位)的结构位数。这可以视作对局部描述符应用了标量量化。本发明提供了一种物体识别用图像数据库的制作方法,具备特征抽取工序, 从要登记于图像数据库的示出物体的图像中抽取分别表现该图像的各处的局部特征的矢 量作为多个局部描述符;标量量化工序,对上述矢量的每个维度进行标量量化;以及 登记工序,将上述图像和与该图像对应的多个矢量登记于上述图像数据库,其中,对通 过上述标量量化工序进行了量化的各矢量进行系统化来进行登记,通过系统化以能够执 行近似最邻近搜索,并且对该各矢量分别附加用于确定抽取出各矢量的图像的图像标识 符,各工序是由计算机执行的,在上述登记工序进行各矢量的登记使得能够进行以下动 作在多个图像被登记于上述图像数据库且提供了示出作为问题的物体的一个图像作为 查询对象时,计算机通过与上述抽取工序同样的过程从上述查询对象中抽取多个查询对 象局部描述符,通过与上述标量量化工序同样的过程将各查询对象局部描述符量化,使 用上述近似最邻近搜索的算法从上述图像数据库所登记的矢量中检索作为各查询对象局 部描述符的邻近矢量的矢量,获取附加于上述邻近矢量的图像标识符,根据所获取的图 像标识符来决定示出作为问题的物体的至少一个图像,在上述标量量化工序中将各矢量 的维度量化为规定位数的标量值。另外,基于不同的观点,本发明提供了一种物体识别用图像数据库的处理装 置,具备特征抽取部,其从要登记于图像数据库的示出物体的图像中抽取分别表现该 图像的各处的局部特征的矢量作为多个局部描述符;标量量化部,其对上述矢量的每个维度进行标量量化;登记部,其将上述图像和与该图像对应的多个矢量登记于上述图像 数据库,其中,对通过上述标量量化工序进行了量化的各矢量进行系统化来进行登记, 通过系统化以能够执行近似最邻近搜索,并且对该各矢量分别附加用于确定抽取出各矢 量的图像的图像标识符;以及检索部,其在多个图像被登记于上述图像数据库且提供了 示出作为问题的物体的一个图像作为查询对象时,与要登记的图像同样地上述抽取部从 上述查询对象中抽取多个查询对象局部描述符,与要登记的图像同样地上述标量量化部 将各查询对象局部描述符量化,之后使用上述近似最邻近搜索的算法从登记于上述图像 数据库的矢量中检索作为各查询对象局部描述符的邻近矢量的矢量,获取附加于上述邻 近矢量的图像标识符,根据所获取的图像标识符来决定示出作为问题的物体的至少一个 图像,其中,上述标量量化部将各矢量的维度量化为规定位数的标量值。并且,基于不同的观点,本发明提供了一种物体识别用图像数据库的处理程 序,使计算机作为以下各部而发挥功能特征抽取部,其从要登记于图像数据库的示出 物体的图像中抽取分别表现该图像的各处的局部特征的矢量作为多个局部描述符;标量 量化部,其对上述矢量的每个维度进行标量量化;登记部,其将上述图像和与该图像对 应的多个矢量登记于上述图像数据库,其中,对通过上述标量量化工序进行了量化的各 矢量进行系统化来进行登记,通过系统化以能够执行近似最邻近搜索,并且对该各矢量 分别附加用于确定抽取出各矢量的图像的图像标识符;以及检索部,其在多个图像被登 记于上述图像数据库且提供了示出作为问题的物体的一个图像作为查询对象时,与要登 记的图像的动作同样地上述抽取部从上述查询对象中抽取多个查询对象局部描述符,与 要登记的图像同样地上述标量量化部将各查询对象局部描述符量化,之后使用上述近似 最邻近搜索的算法从登记于上述图像数据库的矢量中检索作为各查询对象局部描述符的 邻近矢量的矢量,获取附加于上述邻近矢量的图像标识符,根据所获取的图像标识符来 决定示出作为问题的物体的至少一个图像,其中,上述标量量化工序将各矢量的维度量 化为规定位数的标量值。发明的效果在本发明的物体识别用图像数据库的制作方法中,在上述标量量化工序中将各 局部描述符的各维度量化为少于实数型或整数型数据的结构位数,因此能够削减表现各 局部描述符所需的存储器容量。因而,即使在记录很多局部描述符(或者visual word)的 情况下,也能够在小于不执行标量量化工序的现有方法的容量的存储器中制作图像数据库。按常识来看,当以较少的位数表现特征矢量时,预计会出现识别率降低等不良 影响。但是,如在后述的实验结果中也示出的那样,发现即使将各维度削减至2位,与 不进行量化的情况相比识别率也基本不降低。即使在各维度为1位的情况下,与0位、 即不进行矢量的距离计算的方法相比,也能够得到非常高的识别率。在本发明中,局部描述符是以矢量来表现图像的局部特征。其具体的方式例如 是SIFT。在后述的实施方式中,应用PCA-SIFT作为局部描述符的一例。将各局部描述符系统化为能够进行最邻近搜索是指从要登记于图像数据库的 图像中抽取局部描述符,将这些局部描述符与上述图像相对应地登记为数据库。当提供 了某个局部描述符时,从登记于上述数据库的局部描述符中决定最邻近的局部描述符的
7处理即是最邻近搜索。评价是否是最邻近的方法的一例如下计算两个矢量的距离,将 距离最短的矢量作为最邻近。下面,对本发明的优选实施方式进行说明。较为理想的是,上述标量量化工序将各局部描述符的各维度量化为8位以下。 更为理想的是,上述标量量化工序将各局部描述符的各维度量化为2位。如在后述的实 验结果中也示出的那样,例如在将记录特征矢量的各维度的位数设为2位的情况下,与 不进行量化的情况相比,能够削减所需存储器容量(后述的实验例中为1/3左右)。此 时,虽然为了进行位运算而处理时间稍微增长(在后述的实验例中为1.6倍左右),但是 识别率基本不降低。另外,即使是将各维度设为8位的情况,在后述的实验例中也能够 将所需存储器容量削减为2/3左右。另外,在上述登记工序中,以也可以将规定的哈希函数应用于量化后的各局部 描述符来算出哈希表的索引值,与所算出的索引值相对应地登记量化后的各局部描述符 的各维度的值、用于识别要登记的图像的标识符以及上述图像的参照目的地,并且,在 对应于同一索引值而登记的局部描述符的数量超过规定数量的情况下,不再对该索引值 登记任何局部描述符。能够通过使用哈希表来实现高速的最邻近搜索处理。并且,在对 应于同一索引值而登记的局部描述符的数量超过规定数量的情况下,不再登记这些局部 描述符,由此能够将识别力较弱的局部描述符从最邻近搜索处理的对象中排除。因而, 能够不牺牲搜索的精确度而在短时间内进行搜索。在属于在哈希表中被分类的一类(索引)的局部描述符的数量较多的情况下,可 以说这些局部描述符的识别能力较低。即,在从输入图像的局部描述符算出索引值来参 照哈希表的情况下,登记了很多属于该类的候补。这些局部描述符对锁定识别对象不太 有贡献,可以说识别能力较低。如果将识别能力低的局部描述符从搜索对象中排除,则 可以仅参照识别能力高的局部描述符来进行高效的识别。并且,在上述标量量化工序中,也可以在对从检索问题中抽取出的局部描述符 进行量化时,对超过量化的阈值的多个值算出索引值,从对应于某一个索引值而登记的 局部描述符中决定最邻近的局部描述符。这样,包含量化的误差范围在内地算出哈希表 的索引值,因此能够抑制由于量化而导致的识别率降低。例如,在登记于图像数据库的图像是从不同视点观看检索问题所涉及的物体而 得到的图像的情况下,在所登记的图像与检索问题之间处于对应关系的特征矢量的各维 度的值有时会不同。即,各特征矢量对于视点的变化(几何变换)具有鲁棒性,但是并不 是完全的不变量,有时会发生变动。哈希表通过规定的计算过程(哈希函数的计算)来 基于各特征矢量的各维度的值算出作为离散值的索引值。在此,当对应的特征矢量的量 化后的值由于变动而不同时,很有可能会算出不同的索引值。当检索对象的特征矢量与 检索问题的特征矢量的索引值不同时,根据这一对特征矢量无法得到正确的搜索结果。 因此,考虑由于变动而各维度的值超过量化的阈值的情况,不仅计算量化后得到的各维 度的值的索引值,对超过量化的阈值的值也计算索引值,从对应于某一个索引值而登记 的特征矢量中决定最邻近的特征矢量。这样,能够抑制变动导致的识别率的降低。换言 之,在特征矢量的某个维度的值与量化的阈值相近的情况下,也考虑超过阈值的可能性 来计算索引值,由此能够确保识别率。
在上述特征抽取工序中也可以将以32位表现各维度的矢量值作为各局部描述符 抽取出来。另外,对检索问题的各局部描述符决定最邻近的局部描述符的处理也可以是对 局部描述符之间的距离进行计算来决定距离最近的局部描述符的处理。也能够将在此示出的各种优选方式的多个进行组合。


图1是说明本发明所涉及的标量量化的方法的一例的说明图。图2是表示在本实施方式的实验例中使用的登记图像的例的图。图3是表示本实施方式所涉及的图像数据库中的特征矢量的各维度的分布f(x) 的图表。图4是表示在本实施方式的实验例中使用的检索问题的例的图。图5是表示在本实施方式的实验例中特征矢量的容量与识别率之间的关系的图表。图6是表示在本实施方式的实验例中登记图像数与识别率、处理时间之间的关 系的图表。图7是表示在本实施方式的实验例中参数c与识别率、处理时间之间的关系的图表。图8是表示在本实施方式的实验例中参数b、e与识别率、处理时间之间的关系 的图表。图9是表示本实施方式的实验例以及作为现有方法的代表例的ANN的识别率与 处理时间的特性的图表。图10是表示向本实施方式所涉及的物体识别用图像数据库登记图像的登记过程 的流程图。图11是表示以通过图10的过程登记图像而得到的图像数据库为对象来进行识别 (检索)时的过程的流程图。图12是表示本发明的物体识别用图像数据库的处理装置的功能性结构的框图。附图标记说明1 图像数据库处理装置;11 特征抽取部;13 标量量化部;15 登记部; 17 检索部;21 登记图像;23 检索问题;25 图像数据库;27 识别结果。
具体实施例方式《近似最邻近搜索的现有方法》在详细说明本发明之前,对近似最邻近搜索的现有方法进行总结。在此所采纳 的现有方法即是在后述的实验例中使用的方法。在最邻近搜索中最耗费时间的是距离计算。为了使最邻近搜索高速,存在高速 进行各个距离计算本身和高效地锁定距离计算的对象这两种方法。在近似最邻近搜索 中,主要通过大胆进行后者的锁定来削减处理时间。但是作为其代价,有可能将最邻近 从距离计算的对象中排除而求不出最邻近。什么程度的近似较为适当依赖于作为对象的任务,因此在近似最邻近搜索的方法中,设置有用于调节近似程度的参数。下面,对作 为近似最邻近搜索的代表手法的ANN进行说明。ANN (Approximate Nearest Neighbor (近似最邻近搜索)的缩写。详情参照 S.Arya, D.M.Mount, R.Silverman and A.Y.Wu " An optimal algorithm for approximate nearest neighbor searching " ’ Journal of the ACM, Vol.45, No.6, pp.891-923, 1998) 是使用二叉树来高速进行近似最邻近搜索的方法。树的节点与分割特征空间得到的 hyperrectangle (超矩形)对应,叶节点所与单一特征矢量相对应。在ANN中,通过树结 构的搜索来收集成为距离计算的对象的特征矢量,将其中距离最短的特征矢量作为近似 最邻近搜索的结果而输出。在ANN中,作为表示近似的程度的参数,存在允许误差ε。 如果ε较大,则进行更大幅度的近似来锁定成为对象的特征矢量,因此能够缩短处理时 间。《实施方式》下面,使用附图来进一步详细叙述本发明。此外,在下面的说明中,所有点都 是例示,不应理解为是对本发明的限定。1.1.想法使用局部描述符进行识别的现有方法的问题在于,由于特征矢量的数量较多, 因此在进行大规模识别的情况下存储器使用量和处理时间都会变得庞大。对于处理时间的问题,野口等人提出了一种将利用近似最邻近搜索的识别器多 级连接来削减处理时间的方法(参照非专利文献5和专利文献1)。但是,该方法中没有 涉及到存储器使用量的问题。如果查看该方法的存储器使用量的明细,则可知其八成左 右用于保持特征矢量。因此,在本实施方式中,尝试以野口等人的方法为基础,通过将 特征矢量量化来以较少的位数表现该特征矢量来削减存储器使用量。在对矢量进行量化的方法中,代表性方法是矢量量化和标量量化。在矢量量化 中,预先求出某个数量的代表矢量,将输入矢量置换为最邻近的代表矢量的代码。在使 用了局部描述符的识别方法中多使用矢量量化(参照非专利文献3)。但是,难以针对大 规模的数据高效地求出量化误差较少的代表矢量(上述的visual word)。另外,当代表矢 量的数量增多时,存在搜索输入矢量的最邻近的代表矢量的处理会耗费时间的问题。另 一方面,标量量化是对输入矢量的每个维度进行量化。在以相同代码数进行比较的情况 下,该标量量化的量化误差大于矢量量化的量化误差。但是,认为在进行量化时不需进 行最邻近搜索,因此处理时间较少即可完成。因此,在本发明中,设为重视处理时间而 使用标量量化。在量化中,不是只有能够削减存储器使用量的优点,也存在识别率可能会降低 的问题。这是由于原本是不同的特征矢量通过量化变成了相同的特征矢量而使识别性降 低。本发明的识别结果是由投票而决定的,因此无法容易地获知特征矢量的识别性降低 对识别率产生的影响。这是由于如果正确结果的得票数不被逆转,则即使错误的投票计 入其它图像也不会产生错误识别。因此,通过实验对量化的位数与识别率的关系进行验 证。1.2.标量量化首先,对本发明所涉及的标量量化进行说明。在标量量化中对每个维度进行量化。图1中示出了以2位(bit)对各维度进行量化的情况。f(X)是特征矢量的某个维度 的分布。t是量化的阈值,例如从-⑴到^的范围被编码为0。在检索时进行距离计算 的情况下,使用值ν来计算与检索问题的特征矢量之间的距离。对每个维度决定t和ν的 值,使其满足下式。[式1]
权利要求
1.一种物体识别用图像数据库的制作方法,具备特征抽取工序,从要登记于图像数据库的示出物体的图像中抽取分别表现该图像的 各处的局部特征的矢量作为多个局部描述符;标量量化工序,对上述矢量的每个维度进行标量量化;以及登记工序,将上述图像和与该图像对应的多个矢量登记于上述图像数据库,其中, 对通过上述标量量化工序进行了量化的各矢量进行系统化并进行登记,以能够执行近似 最邻近搜索并且对该各矢量分别附加用于确定抽取出各矢量的图像的图像标识符,各工序是由计算机执行的,在上述登记工序中进行各矢量的登记使得能够进行以下动作在多个图像被登记于 上述图像数据库且提供了示出作为问题的物体的一个图像作为查询对象时,计算机通过 与上述抽取工序同样的过程从上述查询对象中抽取多个查询对象局部描述符,通过与上 述标量量化工序同样的过程将各查询对象局部描述符量化,使用上述近似最邻近搜索的 算法从登记于上述图像数据库的矢量中检索作为各查询对象局部描述符的邻近矢量的矢 量,获取附加于上述邻近矢量的图像标识符,根据所获取的图像标识符来决定示出作为 问题的物体的至少一个图像,在上述标量量化工序中将各矢量的维度量化为规定位数的标量值。
2.根据权利要求1所述的方法,其特征在于,在上述标量量化工序中将各矢量的维度量化为2位以下的标量值。
3.根据权利要求1或2所述的方法,其特征在于,上述登记工序以下面的方式进行处理来登记各矢量(1)对量化后的各矢量应用规 定的哈希函数来算出哈希表的bin参照用索引值,(2)将量化后的矢量的各维度和所附加 的图像标识符作为一个条目登记于利用所算出的索引值来进行参照的bin下,(3)在登记 于同一 bin下的条目的数量超过阈值的情况下,删除登记于该bin下的所有条目,并且之 后不在该bin下登记条目。
4.根据权利要求3所述的方法,其特征在于,在上述登记工序中登记各矢量使得上述计算机能够检索上述邻近矢量来决定上述图像,上述计算机根据量化后的矢量的维度算出上述索引值,并且根据一个以上的与量化 后的矢量的维度值相邻的值算出一个以上的索引值,从而从登记于利用这些算出的索引 值来进行参照的多个bin内的矢量中检索上述邻近矢量。
5.根据权利要求1 4中的任一项所述的方法,其特征在于,上述近似最邻近搜索的算法包括以下的处理计算各查询对象局部描述符与登记于 利用所算出的索引值来进行参照的bin内的矢量之间的距离,确定处于规定距离内的一个 以上的矢量或处于最短距离的矢量。
6.一种物体识别用图像数据库的处理装置,具备特征抽取部,其从要登记于图像数据库的示出物体的图像中抽取分别表现该图像的 各处的局部特征的矢量作为多个局部描述符;标量量化部,其对上述矢量的每个维度进行标量量化;登记部,其将上述图像和与该图像对应的多个矢量登记于上述图像数据库,其中,对通过上述标量量化工序进行了量化的各矢量进行系统化并进行登记,以能够执行近似 最邻近搜索并且对该各矢量分别附加用于确定抽取出各矢量的图像的图像标识符;以及检索部,其在多个图像被登记于上述图像数据库且提供了示出作为问题的物体的一 个图像作为查询对象时,与要登记的图像同样地上述抽取部从上述查询对象中抽取多个 查询对象局部描述符,与要该登记的图像同样地上述标量量化部将各查询对象局部描述 符量化,之后使用上述近似最邻近搜索的算法从登记于上述图像数据库的矢量中检索作 为各查询对象局部描述符的邻近矢量的矢量,获取附加于上述邻近矢量的图像标识符, 根据所获取的图像标识符来决定示出作为问题的物体的至少一个图像, 其中,上述标量量化工序将各矢量的维度量化为规定位数的标量值。
7. —种物体识别用图像数据库的处理程序,使计算机作为以下各部而发挥功能 特征抽取部,其从要登记于图像数据库的示出物体的图像中抽取分别表现该图像的 各处的局部特征的矢量作为多个局部描述符;标量量化部,其对上述矢量的每个维度进行标量量化;登记部,其将上述图像和与该图像对应的多个矢量登记于上述图像数据库,其中, 对通过上述标量量化工序进行了量化的各矢量进行系统化并进行登记,以能够执行近似 最邻近搜索并且对该各矢量分别附加用于确定抽取出各矢量的图像的图像标识符;以及检索部,其在多个图像被登记于上述图像数据 库且提供了示出作为问题的物体的一 个图像作为查询对象时,与要登记的图像同样地上述抽取部从上述查询对象中抽取多个 查询对象局部描述符,与要登记的图像同样地上述标量量化部将各查询对象局部描述符 量化,之后使用上述近似最邻近搜索的算法从登记于上述图像数据库的矢量中检索作为 各查询对象局部描述符的邻近矢量的矢量,获取附加于上述邻近矢量的图像标识符,根 据所获取的图像标识符来决定示出作为问题的物体的至少一个图像, 其中,上述标量量化工序将各矢量的维度量化为规定位数的标量值。
全文摘要
本发明涉及一种物体识别用图像数据库的制作方法、该方法的处理用程序以及进行该处理的处理装置,该方法具备以下工序特征抽取工序,从要登记于图像数据库的物体的图像中抽取局部描述符;标量量化工序,将各局部描述符的表示各维度的数值量化为规定的位数;以及登记工序,将量化后的各局部描述符系统化为能够进行最邻近搜索,并且附加抽取出该局部描述符的图像的标识符来登记于图像数据库,上述登记工序进行登记使得能够进行以下动作在提供了检索问题时,从该检索问题中抽取局部描述符并对各维度进行标量量化,从而从上述图像数据库中决定与各局部描述符最邻近的局部描述符,通过多数表决处理从包含所决定的任一局部描述符的图像中确定一个图像,在上述标量量化工序中将各局部描述符的各维度量化为8位以下。
文档编号G06T7/00GK102016918SQ20098011521
公开日2011年4月13日 申请日期2009年4月27日 优先权日2008年4月28日
发明者岩村雅一, 野口和人, 黄濑浩一 申请人:公立大学法人大阪府立大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1