用于图像分析的方法和系统的制作方法

文档序号:6498154阅读:288来源:国知局
用于图像分析的方法和系统的制作方法
【专利摘要】提出一种用于处理图像的方法。该方法包括标识图像中的一组关键点。所述方法还包括对于所述组中的每个关键点,计算包括多个阵列元素的对应描述符阵列,其中,每个阵列元素存储在所述关键点邻居内的图像的相应子区域的对应颜色梯度直方图所取的值。所述方法还包括对于所述组中的每个关键点,将所述描述符阵列再分成至少两个子阵列,每个子阵列包括所述描述符阵列的相应数量的元素,并且生成压缩的描述符阵列,所述压缩的描述符阵列针对所述至少两个子阵列中的每一个包括对应压缩的子阵列。每个压缩的子阵列通过使用相应码本利用矢量量化对所述至少两个子阵列中的对应子阵列压缩来获得。所述方法还包括利用所述组中的关键点的压缩的描述符阵列来分析图像。对于所述组中的每个关键点,描述符阵列再分成至少两个子阵列是基于其值存储在所述每个关键点的描述符阵列的元素中的颜色梯度直方图之中的相关关系将而被执行的。
【专利说明】用于图像分析的方法和系统

【技术领域】
[0001] 本发明涉及图像分析领域。

【背景技术】
[0002] 在图像分析领域中,常见操作是比较两个图像以在这两个图像包括同一场景或同 一对象的至少一部分的情况下找到其间发生的关系。
[0003] 在大量的应用之中,至关重要的是进行图像比较来校准属于多相机系统的摄像 机,评估在所拍摄视频的两帧之间发生的动作,并且识别图像(例如,照片)内的对象。由 于被专门设计成在所谓的可视搜索引擎中利用的对象识别算法最近的发展,导致后一个 应用呈现出越来越重要,即,从照片开始的自动化服务能够标识其内描绘的对象并且提 供与所标识的对象相关的信息。这种类型的已知服务示例包括Google Goggles、Nokia Point&Find和kooaba Smart Visuals。对象识别应用被提供用于比较描绘待识别对象的 第一图像(在行业术语中,被称为"查询图像")与多个模型图像,每个模型图像描绘一个已 知对象;这样允许执行在查询图像中描绘的对象和模型图像中描绘的对象之间的比较。
[0004] 模型图像通常被布置在适当的模型数据库中。例如,在在线购物场景中利用对象 识别的情况下,每个模型图像对应于在线商店提供的一个项目(例如,图书封面、DVD封面 和/或CD封面的照片)。这里数据库中包括的模型图像的数量会相当大;例如在线购物服 务的模型数据库可以包括数百万不同的模型图像。
[0005] 用于执行两个图像之间的比较操作的一种非常有效的方式被提供用于在第一图 像中选择点(在行业术语中,被称为关键点)的集合并随后将该集合中的每个关键点与第 二图像中的一个对应关键点匹配。通过提前环绕该点本身的图像区域的局部特征(例如, 点提取标度、区域优先定向以及所谓的"描述符"),有利地执行选择第一图像中的哪个点必 须变成关键点的步骤。在图像分析领域,关键点的描述符是描述以关键点为中心的图像区 域(称为贴片)的亮度梯度的数学算符,这种贴片根据贴片本身的主亮度梯度定向。
[0006] 在 David G.Lowe 的"Distinctive image features from scale-invariant keypoints"(国际计算机视觉期刊,2004)中,提出了标度不变特征变换(SIFT)描述符;简 单地说,为了允许可靠的图像识别,SIFT描述符在计及从与每个关键点对应的图像中提取 的局部特征即便在图像标度、噪声和光照改变时也应该可检测的每个情况下生成。SIFT描 述符因此对于均匀标度、定向是不变的,并且对于仿射失真和光照变化是部分不变的。
[0007] SIFT描述符是非常强大的工具,其允许选择关键点用以执行精确的图像比较。然 而,这种精确性只有利用非常大量的数据才能被实现;例如,典型的SIFT描述符是128数 据字节的阵列。由于每个每个图像中的关键点的数量相对较大(例如,对于标准VGA照片, 1000-1500个关键点),并且由于每个每个关键点与对应的SIFT描述符关联,因此待处理数 据的总量可能变得过多而难以有效管理。
[0008] 这一缺点在场景涉及使用移动终端(例如,标识从通过智能电话的相机拍摄的照 片提取的对象)的情况下加重。实际上,由于为了进行图像分析而将执行的操作非常复杂 并且对计算负荷有要求,因此在这种情况下大多数操作通常在服务器侧执行;为了拥有执 行分析所需的全部信息,服务器需要从移动终端接收全部所需的数据,包括用于所有关键 点的SIFT描述符。因此,将从终端发送至服务器的数据的量可能变得过多而难以保证服务 的良好效率。
[0009] 根据本领域已知的解决方案(例如,Google Goggles所采用的方案),这一缺点通 过从移动终端向服务器直接发送图像而非描述符来从根本上解决。的确,由于非常大量的 关键点,对应的SIFT描述符的数据的量可能超过标准VGA照片本身的大小(以字节计)。 [0010] 待处理数据的量可以通过在发送描述符阵列之前对其进行压缩而被有利地减少。 例如,可通过矢量量化来压缩描述符阵列,所述矢量量化被提供用于将描述符阵列可具有 的元组值近似为码本的码字的缩减集合。
[0011] 待处理数据的量的进一步减少可以通过乘积码矢量量化(即,通过将描述符阵列 再分成子阵列并在随后对每个每个子阵列应用矢量量化)压缩描述符阵列来实现。
[0012] Chandrasekhar V.等人:"Survey of SIFT Compression Schemes"(第二届国 际移动多媒体处理研讨会暨第20届国际模式识别会议" ICPR 2010 ;伊斯坦布尔,土耳其; 2010年8月23-26, 2010年8月22 (2010-08-22),第1-8页)执行文献中提出的标度不变 特征变换(SIFT)压缩方案的综合调查,并在通用框架中对其进行评估。
[0013] H Jegou等人'Product Quantization for Nearest Neighbor Search,'(IEEE模 式分析与机器智能汇刊,第33卷,第1期,2011年1月1日(2011-01-01),第117-128页) 介绍了一种用于近似最邻近搜索的基于乘积量化的方法。该构思是将空间分解成低维子空 间的笛卡尔乘积,并且分别量化每个每个子空间。矢量由其子空间量化索引构成的短码来 表示。两矢量之间的欧几里得距离可从它们的码有效地估计。不对称版本增加了精度,因 为其计算的是矢量和码之间的近似距离。


【发明内容】

[0014] 申请人:发现,本领域已知方法效率不高,仍需要管理大量数据和/或大部分操作 仍集中于服务器侧,这限制了系统的可扩展性和总体性能。
[0015] 例如,Google Goggles所采用的从移动终端向服务器直接发送图像(而不是描述 符)的解决方案要求整个计算负荷朝着服务器移动,服务器的负担可能过重。此外,发送压 缩的图像仍需要相当可观的数据量(例如,对于VGA图像而言,几十千字节)。
[0016] 申请人:致力于解决如何在待处理数据的量方面改进这些方法的问题。
[0017] 具体地, 申请人:致力于通过提供一种需要管理的数据量减少的处理图像的方法来 解决所述问题。
[0018] 申请人:发现能够通过基于存储在描述符阵列中的颜色梯度直方图之间的相关关 系将图像中标识的描述符阵列再分成对应的子阵列并在随后利用矢量量化压缩子阵列来 有利地减少为执行图像分析程序步骤而需要处理的数据量。
[0019] 本发明的一方面涉及一种用于处理图像的方法。该方法包括标识图像中的一组关 键点。所述方法还包括对于所述组中的每个每个关键点,计算包括多个阵列元素的一个对 应的描述符阵列,其中,每个每个阵列元素存储在所述关键点邻居内图像的相应子区域的 对应颜色梯度直方图所取的值。所述方法还包括对于所述组中的每个关键点,将所述描述 符阵列再分成至少两个子阵列,每个子阵列包括所述描述符阵列的相应数量的元素,并且 生成对于所述至少两个子阵列中的每一个子阵列包括对应的压缩子阵列的压缩的描述符 阵列。每个压缩的子阵列通过使用相应码本利用矢量量化对所述至少两个子阵列中的对应 子阵列进行压缩来获得。所述方法还包括利用所述组中的关键点的压缩的描述符阵列来分 析图像。对于所述组中的每个关键点,基于颜色梯度直方图之间的相关关系执行描述符阵 列到至少两个子阵列的再分,所述颜色梯度直方图的值存储在所述每个关键点的描述符阵 列的元素中。
[0020] 申请人:已观察到,通过压缩的描述符阵列(通过将描述符阵列再分成子阵列而压 缩)的解压缩获得的解压缩的描述符阵列可能受失真的影响(即,解压缩的描述符阵列在 一定程度上不同于压缩之前的原始描述符阵列)。基于这一观察, 申请人:发现一种方法,利 用该方法,可通过计及解压缩期间围绕一般关键点的区域的各种子区域之间的统计空间相 关性来显著降低失真。因此,根据本发明的实施方式,所述解压缩基于在关键点邻居内图像 的子区域的位置之间的统计空间相关关系进行。
[0021] 根据另一方面,提供一种如权利要求26所述的方法。
[0022] 根据另一方面,提供一种如权利要求32所述的方法。
[0023] 根据另一方面,提供一种如权利要求33所述的系统。
[0024] 根据另一方面,提供一种如权利要求34所述的系统。
[0025] 根据另一方面,提供一种如权利要求35所述的系统。
[0026] 优选实施方式在从属权利要求中阐述。

【专利附图】

【附图说明】
[0027] 本发明的这些和其它特征和优点将通过以下结合附图阅读的本发明的一些示例 性和非限制性实施方式的描述而变得显见,在附图中:
[0028] 图1以功能块示出了根据本发明的实施方式的用于从查询图像中提取最佳关键 点集合并生成压缩的描述符集合的提取过程;
[0029] 图2A-2F是根据本发明的一些示例性实施方式的关键点的对应选择的局部特征 的统计分布;
[0030] 图2G是根据图1的提取过程处理的示例性照片;
[0031] 图3A示出了 SIFT型示例性描述符;
[0032] 图3B不出了图3A的描述符的不例性描述符阵列;
[0033] 图4A示出了根据本领域已知解决方案的示例性描述符阵列压缩;
[0034] 图4B示出了根据本领域另一已知解决方案的示例性描述符阵列压缩;
[0035] 图5示出了根据本发明的实施方式的相关族中的描述符的子直方图的布置;
[0036] 图6A-6D示出了根据本发明的示例性实施方式如何压缩描述符阵列;
[0037] 图7A示出了关键点KP的示例性分布;
[0038] 图7B示出了为了量化图7A的关键点的坐标能够如何将网格叠加在查询图像上;
[0039] 图7C是通过将图7B的网格叠加在图7A的关键点KP的集合上而获得的直方图的 示例性图形描绘;
[0040] 图7D标识了图7B的网格的完全由不包括任何关键点的单元形成的列和行;
[0041] 图7E示出了秩1支集上的示例性直方图;
[0042] 图7F示出了与图7E的秩1支集上的直方图对应的直方图映射;
[0043] 图8A示出了字直方图的示例;
[0044] 图8B示出了直方图映射的示例;
[0045] 图9以功能块示出了根据本发明的实施方式的用于进行两个图像之间的比较的 匹配过程;
[0046] 图10以功能块示出了根据本发明的实施方式的用于从模型数据库检索描绘查询 图像中所描绘的同一对象/场景的模型图像的检索过程;
[0047] 图11以功能块示出了根据本发明的实施方式的用于对压缩的描述符阵列进行解 压缩的优化解压缩过程;
[0048] 图12图形描绘了描述符的区间的定向;
[0049] 图13A示出了与被提供用于将描述符阵列再分成四个子阵列并针对每个子阵列 使用包括2~ 13个码字的码本的压缩方案对应的示例性补偿矩阵;
[0050] 图13B是示出了图13A的补偿矩阵的列元素所具有的值的示图。
[0051] 图14A示出了与将描述符阵列再分成八个子阵列并针对每个子阵列使用包括 2~ 11个码字的码本的压缩方案对应的示例性补偿矩阵Z,并且
[0052] 图14B是示出了图14A的补偿矩阵的列的元素所具有的值的示图。

【具体实施方式】
[0053] 提取讨稈(图1)
[0054] 图1以功能块示出了根据本发明的实施方式的用于处理输入图像以便获得最佳 关键点集合并生成对应的描述符集合的过程(以下称作"提取过程",用参考编号1〇〇来标 识)。随后将出于图像分析的目的利用关键点和描述符。在以下描述中,一般性的表达"图 像分析"和"分析图像"旨在包括所有那些被提供用于将图像与至少一个其它图像进行比较 的操作。这些操作可在多种多样的应用中执行,例如,在对象识别应用中,以及在被提供用 于从多个不同的照片开始创建单个全景照片的应用中。
[0055] 如稍后将描述的,根据本发明的实施方式的提取过程还用于选择关键点的最佳子 集并将这些关键点的描述符在一定程度上压缩以极大地改进后续过程的效率。
[0056] 在这一章节中描述的提取过程100的步骤可由恰当的处理单元执行,所述处理单 元的结构和功能取决于它们所属的特定应用领域。例如,每个处理单元可以是专门被设计 为执行该方法的一个或多个步骤的硬件单元。此外,该方法的各步骤可以在对应指令集控 制下由可编程机器(例如,计算机)执行。
[0057] 关键点提取(阶段110)
[0058] 提取过程100的第一阶段110用于接收查询图像115并从中提取关键点KP的第 一集合,每个关键点与对应的一对空间坐标C关联,所述空间坐标标识该关键点KP在查询 图像115内的位置。
[0059] 这一操作可利用已知的高斯差(DoG)关键点提取算法来执行;然而,类似考虑同 样适用于采用不同的关键点提取算法(例如,Hessians行列式(DoH)关键点提取算法)的 情况。参照DoG关键点提取算法,在一个序列中按照不同的标度使查询图像115与高斯滤 波器卷积。然后,在该序列中在相邻对的高斯模糊的图像之间进行差分运算。然后在多个 标度下选择关键点KP作为具有最大/最小高斯差(DoG)值的点。具体地讲,将DoG图像中 的每个像素与其相同标度下的八个邻居进行比较,并与每一邻居标度(即,序列中的后续 标度和先前标度)下的九个邻居像素进行比较。如果像素值在所有比较的像素之中是最大 或最小值,则认为该点是候选关键点KP。
[0060] 阶段110还基于局部图像亮度梯度方向将每个关键点KP指派给一个或多个定向。 例如,形成具有多个区间的定向直方图,每个区间覆盖一个对应度的间隔。添加至直方图区 间的邻居窗口中的每个样本按照其梯度幅值并通过高斯加权圆形窗口加权。所得直方图中 的峰值对应于主要定向。一旦直方图被填充,与最高峰值以及最高峰值的80%内的局部峰 值对应的定向被指派给关键点KP。在指派了多个定向的情况下,针对每个附加定向创建具 有与原始关键点相同的位置和标度的附加关键点KP。
[0061] 在阶段110结束时,由此生成关键点KP的集合,以及对应坐标C、用以提取关键点 的标度S、其主要定向0和峰值P,S卩,与该关键点对应的DoG的绝对值(表征其对比度)。
[0062] 描沭符牛成(阶段120)
[0063] 随后的阶段120用于处理查询图像115以便针对每个关键点KP计算对应的描述 符D。在所讨论的示例中,在阶段120计算出的描述符D是SIFT型描述符。尽管按照确保 图像位置、标度和旋转的不变性的方式提取了关键点KP,但SIFT描述符D则以极为不同且 对光照和视点部分不变的方式算出。具体地,对于每个关键点KP,在以关键点KP位置为中 心并根据关键点KP的主要定向来定向的4x4网格上计算一组16个子直方图。每个子直方 图包括8区间,每一区间对应于相对于主要定向的角度为η* π/4(n = 0, 1,…7)的定向;子 直方图的每个区间的频率与该子直方图所对应的网格单元(以下称作子区域)沿着由该区 间标识的方向的亮度梯度成比例。这些定向直方图的值按照阵列布置,形成关键点KP的描 述符D。由于8个区间各自具有4 X 4 = 16个子直方图,因此描述符D是具有128个项的 阵列。
[0064] 如果在包括不同数量的单元的网格上计算SIFT描述符和/或每直方图具有不同 数量的区间,本发明的概念也适用。
[0065] 此外,即使在所讨论的示例中参照了 SIFT型描述符,类似考虑同样适用于采用不 同类型的描述符(例如,加速鲁棒特征(SURF)和定向梯度直方图(H0G)或者可能的其它类 型)的情况。另外,即使已参照了并且将在下面参照包括与亮度梯度有关的数据的描述符, 类似考虑同样适用于考虑不同参数的梯度的情况。实际上,如本领域技术人熟知的,亮度仅 是颜色的物理特性之一。因此,即使确定了对于图像分析而言亮度是最佳(即,最鲁棒)的 物理特性,也可考虑不同类型的描述符,例如,包括与色度梯度、饱和度梯度或者甚至颜色 (包括亮度、饱和度和色度)梯度有关的数据。
[0066] 如上面已经提及的,执行图像分析操作涉及管理非常大量的数据:实际上,每个关 键点KP与包括坐标C、标度S、主要定向0和峰值P以及由128项的阵列形成的对应描述符 D在内的多个局部特征(以下利用标号LFkp全局标识)关联。为此,为了减少待管理(例 如,待存储和/或待发送)的数据的总量,根据本发明的实施方式的提取过程1〇〇考察两种 情况,即:
[0067] 1)通过选择最相关的关键点KP(从图像比较的角度)来减少先前生成的关键点 KP的数量,以便获得关键点KP的最佳子集SUB,以及 [0068] 2)恰当地压缩坐标C和描述符D二者。
[0069] 提取过程100的阶段130专注于选择最佳子集SUB,阶段140专注于描述符D的压 缩,阶段150专注于坐标C的压缩。
[0070] 关键点的最伴子集的诜择(阶段130)
[0071] 根据本发明的实施方式,最佳子集SUB的选择这样进行:针对查询图像115的每个 关键点KP的至少一个局部特征LFkp (坐标C、标度S、主要定向0、峰值P和描述符D)计算 至少一个对应特征相关概率FRP,基于其局部特征LFkp的特征相关概率FRP根据关键点相 关概率KRP对关键点KP进行排序,然后选择具有最高关键点相关概率KRP的关键点KP。
[0072] 根据本发明的实施方式,一般关键点KP的每个局部特征LFkp的特征相关概率FRP 利用已在对基准图像数据库进行统计评价之后预先确定的对应参考统计分布Rsd来计算。
[0073] 参考统计分布Rsd以这样的方式形成以反映被认为可用于图像分析目的的关键 点KP的局部特征LFkp的统计行为。
[0074] 例如,在对象识别过程的情况下,基准图像数据库是包括多个图像对的数据库,每 个图像对由描绘同一对象/场景的两个照片组成。根据本发明的实施方式,按照以下方式 生成参考统计分布。
[0075] 首先从基准数据库的所有图像提取关键点。然后,对所有提取的关键点的一个或 多个选择的局部特征执行第一统计分析,以生成这些选择的局部特征的第一统计分布。局 部特征的每个第一统计分布以直方图的形式布置,所述直方图通过(在从基准数据库的图 像提取的关键点的总数之中)对该局部特征的值落入多个预定的局部特征值间隔(区间) 的每一个内的关键点的数量(关键点频率)进行计数来获得。然后,对于每个图像对,使一 个照片的关键点与另一照片的关键点匹配。利用图像比较过程(例如基于图像特征匹配 的已知图像比较过程中的任一个)处理这些关键点之间的匹配,以便标识哪一匹配是正确 的(内点),哪一匹配是不正确的(外点)。然后对同一特征或者为了生成参考统计分布 Rsd(将用于计算特征相关概率FRP)而考虑的先前特征执行第二统计分析。这次,通过针 对每个区间计算属于内点并且对应局部特征的值落入所述区间内的关键点的数量与对应 局部特征的值落入同一区间内的关键点(属于内点和外点)的总数之比来进行参考统计分 布Rsd的生成。 申请人:观察到,第一统计分布和参考统计分布Rsd彼此非常不同。由于参 考统计分布Rsd是计及有关正确特征匹配的关键点(内点)而生成的,因此 申请人:已发现, 这些统计分布良好地代表了与用于图像分析目的相关的关键点(以下,"相关关键点")的 统计行为,并且尤其适合于在图像比较过程中有效地利用。
[0076] 图2A-2F示出了根据本发明的一些示例性实施方式的关键点KP的对应选择的局 部特征LFkp的一些统计分布Rsd。具体地,图2A-2F的统计分布Rsd是从专门为对象识别 应用布置的基准数据库的图像生成的。如果考虑不同的图像分析应用(例如,从多个不同 的照片开始创建单个全景照片),则基准图像并且因此,所得统计分布Rsd将不同。
[0077] 图2A是与关键点KP的坐标C有关的统计分布Rsd。对应直方图的每个区间表示 一般关键点KP距图像中心的距离(以像素计)。在所讨论的示例中,考虑的图像为VGA型 (即,具有640 X 480的分辨率),因此中心对应于坐标(320, 240)。根据图2A所示的直方 图,具有最高关键点KP频率的区间是与图像中心对应的区间。这意味着关键点KP离中心 越近,该关键点KP是相关关键点的概率越高;直方图频率的趋势是随着距中心的距离增大 而单调减小的。这可通过拍摄对象时所述对象很可能被取景于照片的中心的事实而方便地 解释。必须理解,在这种情况下,直方图的区间不全具有同一的宽度;这是因为通过(标量 和/或矢量)量化器恰当地将每个区间的宽度确定为计算少量区间,因此避免过拟合现象 的发生。本发明的概念也适用于采用(标量和/或矢量)均匀量化(即,直方图的所有区 间具有同一宽度)的情况。
[0078] 图2Β是与关键点ΚΡ的主要定向0有关的统计分布Rsd。对应直方图的每个区间 表示一般关键点KP的主要方向相对于地平线(对应于0弧度)的角度(以弧度计)。根据 图2B所示的直方图,具有最高关键点KP频率的区间是与地平线定向平行或垂直的定向所 对应(即,对应于Ji/2、0、-ji/2、-ji)的区间。这意味着关键点KP的定向越接近所述定向 中的一个,该关键点KP是相关关键点的概率越高。这可通过拍摄对象时所述对象很可能被 取景为主要平行和/或垂直于地平线延伸的事实来解释。在这种情况下,也利用量化器确 定区间的览度。
[0079] 图2C是与关键点KP的峰值P有关的统计分布Rsd。对应直方图的每个区间表示 一般关键点KP与邻居点之中的最相似点之间的对比度。根据图2C所示的直方图,具有最 高关键点KP频率的区间是与最高峰值对应的区间。这意味着关键点KP的对比度越高,该 关键点KP是相关关键点的概率越高;直方图频率的趋势是随着对比度增加而单调增加的。 这可通过具有高对比度的照片的点可被容易识别和标识的事实而容易地解释。在这种情况 下,也利用量化器确定区间的宽度。
[0080] 图2D是与关键点KP的标度S有关的统计分布Rsd。对应直方图的每个区间表示 关键点KP可被提取的特定标度S。根据图2D所不的直方图,具有最1?关键点KP频率的区 间对应于中低标度。在这种情况下,也利用量化器确定区间的宽度。
[0081] 图2E是与关键点KP的描述符D有关的第一统计分布Rsd。在这种情况下,对应直 方图是三维的,其每个区间对应于一般关键点KP的描述符D的两个参数(即,描述符D的 均值(X轴)和方差(y轴))的间隔值。较大的频率值由较大直径的圆指示。均值和方差 由于彼此有联系而被一起考虑以形成同一直方图。根据该直方图,具有最高关键点KP频率 的区间(由较大的圆表示)是与最高均值和最低方差对应的区间。这可通过如下事实来解 释:关键点KP的描述符D的均值越大,与该关键点KP对应的亮度梯度越高,并且关键点KP 的描述符D的方差越低,影响该关键点KP的不想要的噪声越低。
[0082] 图2F是与关键点KP的描述符D有关的第二统计分布Rsd。在这种情况下,每个区 间对应于关键点KP的描述符D与同一图像的其它关键点KP的描述符D之间的特定最大距 离。例如,该最大距离可基于描述符之间的欧几里得距离来计算,还可考虑其它已知方法, 例如利用对称的Kullback-Leibler散度。
[0083] 参照图1,根据本发明的实施方式,提取过程100的阶段130用于针对在阶段110 提取的每个关键点KP计算:
[0084] -第一特征相关概率FRP1,其从与所述关键点KP的坐标C有关的统计分布Rsd获 得。检测与所述分布对应的直方图以便标识拟合所述关键点KP的坐标C的区间;然后,将 特征相关概率FRP1设定为等于标识的区间的关键点频率。
[0085] -第二特征相关概率FRP2,其从与所述关键点KP的主要定向0有关的统计分布 Rsd获得。检测与所述分布对应的直方图以便标识拟合所述关键点KP的主要定向0的区 间;然后,将特征相关概率FRP2设定为等于标识的区间的关键点频率。
[0086]-第三特征相关概率FRP3,其从与所述关键点ΚΡ的峰值Ρ有关的统计分布Rsd获 得。检测与所述分布对应的直方图以便标识拟合所述关键点KP的峰值P的区间;然后,将 特征相关概率FRP3设定为等于标识的区间的关键点频率。
[0087]-第四特征相关概率FRP4,其从与所述关键点KP的标度S有关的统计分布Rsd获 得。检测与所述分布对应的直方图以便标识拟合所述关键点KP的标度S的区间;然后,将 特征相关概率FRP4设定为等于标识的区间的关键点频率。
[0088] -第五特征相关概率FRP5,其从与所述关键点KP的描述符D的均值和方差有关的 统计分布Rsd获得。检测与所述分布对应的直方图以便标识拟合所述关键点KP的描述符 D的元素的均值和方差的区间;然后,将特征相关概率FRP5设定为等于标识的区间的关键 点频率。
[0089] -第六特征相关概率FRP6,其从与所述关键点KP的描述符D与其它关键点KP的 描述符D之间的最大距离(例如,欧几里得距离)有关的统计分布Rsd获得。检测与所述 分布对应的直方图以便标识拟合该距离的区间;然后,将特征相关概率FRP6设定为等于标 识的区间的关键点频率。
[0090] 因此,对于每个关键点KP,通过其局部特征的特征相关概率FRP中的至少一个(或 之中其中的组合)来获得关键点相关概率KRP。例如,首先假设特征相关概率FRP彼此独 立,通过将其对应特征相关概率FRP彼此相乘来计算一般关键点KP的关键点相关概率KRP。 通常,用于计算关键点相关概率KRP的不同特征相关概率FRP的数量越大,采用该方法可获 得的结果越好。考虑SIFT描述符用于视觉搜索应用的示例,优选的是为了计算关键点相关 概率所考虑的特征相关概率至少包括与标度、峰值和距中心的距离对应的那些特征相关概 率。
[0091] 图2G是利用对应圆点标识多个关键点的示例性照片,每个圆点的直径与关键点 的相关概率KRP成比例。
[0092] -旦算出在阶段110提取的所有关键点KP的关键点相关概率KRP,所述关键点KP 根据关键点相关概率KRP的降序排序。然后,通过从有序序列的第一序列中取出一定数量 (基于待管理数据量的期望减少度)的关键点KP来形成最佳子集SUB。选择的属于最佳子 集SUB的关键点KP结果是在阶段110提取的关键点KP的总数之中的最相关关键点KP (从 图像比较的角度)。这样,仅计及相关关键点KP而丢弃不太有用的那些关键点KP,以聪明 且有效的方式实现数据总量的减少。
[0093] 需要强调的是,尽管上述根据本发明的实施方式的关键点的最佳子集的选择利用 对应统计分布Rsd(通过针对其的每个区间计算对应局部特征的值落在所述区间内的关键 点内点与对应局部特征的值落在同一区间内的关键点的总数之比获得)计算每个特征相 关概率,但本发明的概念也适用于采用不同的统计上等效的统计分布的情况,所述统计分 布利用不同的(甚至手动)方法获得。在以下描述中,如果两个统计分布允许从同一关键 点集合获得相似的特征相关概率,则将其考虑为统计上彼此等效。
[0094] 描沭符的压缩(阶段140)
[0095] 根据本发明的实施方式,通过利用数量减少的优化码本而由矢量量化实现描述符 D的压缩。
[0096] 图3A示出与一般关键点KP对应的SIFT型示例性描述符D(在图1的提取过程 100的阶段120生成的描述符D之一,其被选择为是最佳子集SUB的一部分)。如上面已经 提及的,描述符D包括十六个子直方图shi (i = 1,2,…,16),每个子直方图示出靠近关键 点ΚΡ的图像的各个子区域的亮度梯度如何沿着八个方向分布。具体地,每个子直方图shi 与以关键点KP位置为中心并且根据关键点KP的主要定向0定向的4x4网格的16个单元 中的一个所对应的子区域关联;每个子直方图shi包括八个区间,每个区间对应于相对于 主要定向〇的角度为η* 31/4 (η = 0, 1,…7)的定向。
[0097] 如图3Β所示,描述符D的所有定向直方图shi的值按照对应描述符阵列(在图 中用标号DA标识)布置。描述符阵列DA包括十六个兀素 ai (i = 1,2,…,16),每一个兀 素存储对应子直方图shi (i = 1,2,…,16)所取的值;每个元素 ai继而包括八个相应的子 元素,每一个子元素存储与子直方图shi的八个区间中相应的一个区间对应的频率值。因 此,每个描述符阵列DA包括16*8 = 128个子元素(被标识为se (h) (h = 1,2,…,128))。 考虑到在SIFT描述符D中典型频率值可在0至255的范围内,描述符阵列DA的每个子元 素 se(h)可用字节表示;因此,描述符阵列DA的内存占用等于128字节。因此,再次参照图 1的提取过程100,与属于选择的最佳子集SUB的关键点KP的所有描述符D对应的数据量 (字节)等于128乘以最佳子集SUB中的关键点KP的数量。
[0098] 为了减少该数据量,通过矢量量化压缩与这些描述符D对应的描述符阵列DA。
[0099] 如本领域技术人员熟知的,利用矢量量化压缩由η个元素(η元组)形成的数据阵 列用于将数据阵列可具有的所有可能的η元组值的集合联合量化为包括较少数量的η元组 值的缩减集合(所述值甚至可不同于待量化的集合中的值)。由于缩减集合包括较少数量 的η元组值,它需要较少的存储空间。形成缩减集合的η元组值也称作"码字"。每个码字 与阵列可具有的不同η元组值的对应集合关联。数据阵列的η元组值与码字之间的关联关 系利用对应码本来确定。
[0100] 具体参照描述符阵列DA,该描述符阵列DA包括16个元素 ai,元素 ai继而由八个 子元素 se (h)形成,每个子元素 se (h)的值在0至255的范围内,描述符阵列DA可取N = 256128个不同的16元组值。通过矢量量化应用压缩,该N个不同的16元组值用码本的N1〈N 个码字近似。码本确定每个码字与描述符阵列DA的16元组值的对应集合之间的关联关系。 因此,码本的每个码字是用于"近似"描述符阵列DA的16元组值的对应集合的16元组值。 矢量量化是有损数据压缩,其精度可通过称为失真的参数来测量。例如,失真可被计算为码 本的一般码字与由该码字近似的阵列的η元组值的集合之间的欧几里得距离。即使用不同 的方法计算失真,类似考虑也同样适用。在任何情况下,一般来讲,码本的码字的数量Ν1越 大,压缩的失真越小。
[0101] 如本领域技术人员熟知的,码本的码字的生成通常通过对包括非常大量的训练阵 列的集合的训练数据库执行统计操作(称作训练操作)来完成。具体参照描述符阵列DA, 训练数据库可包括几百万的训练描述符阵列,其中,每个训练描述符阵列是描述符阵列DA 可具有的N = 256128个可能的16元组值中的一个。
[0102] 根据图4Α所示的方案,利用包括Ν1个16元组值码字CWj(j = 1,2,···Ν1)的单个 码本CBK压缩整个描述符阵列DA。因此,对于Ν1个不同的码字CWj,标识码字所需的最少 比特数等于l〇g2Nl。如上面已经提及的,该单个码本CBK的N1个不同码字CWj的生成通过 对多个训练描述符阵列执行训练操作来完成,其中,每个训练描述符阵列是描述符阵列DA 可具有的N = 256128个可能的16元组值中的一个。
[0103] 为了将压缩失真保持在足够减小的阈值以下以不损害后续图像分析操作的结果, 所需的码字数N1可能变得非常高。从不同的观点看,由过高数量N1的码字形成的码本是 不利的。实际上,将用于生成码字的训练阵列的数量将会得过多,处理时间将变得过长。此 夕卜,为了利用码本执行压缩操作,形成码本的全部N1个码字必须被存储在某处,占据不可 忽略的存储空间量。后一缺点非常关键,因为用于图像分析应用的硬件(例如,图形处理单 元GPU)可能未配备有容量如此大的内存。
[0104] 参照图4B,为了在不增加失真的同时减少待管理码字CWj的总数,描述符阵列DA 可被再分成多个子阵列SDAk (k = 1,2,…),每一个子阵列包括描述符阵列DA的相应数量 mk的元素 ai,然后,利用包括N2个mk元组值码字CWj (j = 1,2, "·Ν2)的相应码本CBKk单 独地对每个子阵列SDAk进行压缩。
[0105] 在图4B所示的示例中,描述符阵列DA被再分成四个子阵列SDAk(k = 1,2, 3, 4), 每一子阵列包括描述符阵列DA的mk = 4个元素 ai :
[0106] -第一子阵列SDA1由元素序列al、a2、a3、a4形成;
[0107] -第二子阵列SDA2由元素序列a5、a6、a7、a8形成;
[0108] _第二子阵列SDA3由兀素序列a9、alO、all、al2形成,以及
[0109] -第四子阵列SDA4由元素序列al3、al4、al5、al6形成。
[0110] 每个子阵列SDAk的压缩利用包括N2个4元组值码字CWj (j = 1,2, "·Ν2)的相应 码本CBKy(y = k)来进行。因此,对于4*Ν2个不同的码字CWj,标识所有码字所需的最少比 特数等于4*log2 N2。即使在所考虑的情况下利用包括同一数量N2的码字CWj的码本CBKy 压缩每个子阵列SDAk,类似考虑同样适用于利用相应的不同数量的码字CWj压缩每个子阵 列SDAk的情况。
[0111] 在图4B所示的情况下,通过对训练描述符阵列的相应子集执行训练操作来生成 每个码本CBKy的N2个不同的码字CWj。码本CBKk的训练描述符阵列的每个子集对应于四 个子阵列SDAk中的一个,并且可通过从用于生成图4A的单个码本CBK的每个训练描述符 阵列中仅考虑其与子阵列SDAk对应的那部分来获得。例如,为了生成码本CBK1,仅采用用 于生成图4A的单个码本CBK的16元组训练描述符阵列的前四个元素 al、a2、a3、a4。
[0112] 与图4A的利用由具有描述符阵列DA本身的同一维度(16个兀素)的码字CWj形 成的单个码本CBK压缩整个描述符阵列DA的情况相比,由具有其子阵列SDAk的(较小) 维度mk(例如,mk = 4个元素)的码字CWj形成的码本CBKy的使用允许利用同一数量的 码字CWj获得较低的失真。
[0113] 在码字CWj总数固定的情况下,描述符阵列DA被再分成的子阵列SDAk的数量越 高,失真越低,但与此同时标识所有码字CWj所需的最少比特数越高。
[0114] 根据本发明的实施方式,为了压缩目的将描述符阵列DA再分成子阵列SDAk通过 计及描述符阵列DA的元素 ai之间出现的相关关系来完成。
[0115] 如已经参照图3A和图3B描述的,描述符阵列DA的每个元素 ai存储与相应子区 域关联的子直方图shi所取的值,所述子区域则对应于以与该描述符阵列DA对应的关键点 KP为中心的4x4网格的单元。
[0116] 根据图5所示的本发明的实施方式,在对大量描述符阵列DA (例如,利用训练数据 库的训练描述符阵列)进行了统计行为分析之后,已发现一般关键点ΚΡ的子直方图shi可 布置在相关族CFx (X = 1,2, 3, 4)中,每个相关族CFx包括具有相似统计行为(即,具有类 似的区间频率趋势)的相关的子直方图shi的集合。例如,属于同一相关族CFx的两个子 直方图shi可在相同(或相似)区间处具有相似数量的频率峰值。
[0117] 用于形成相关族CFx的统计行为分析表明,在用于压缩描述符阵列DA的码字CWj 的最大数量固定的情况下,如果相关族CFx中的子直方图shi的布置变化(通过将子直方 图shi指派给不同的相关族CFx),则所得失真相应地变化。于是相关族CFx通过在所有可 能的子直方图shi再分中考虑与最低失真对应的一个再分来形成。
[0118] 在执行了该统计行为分析之后,还发现,两个子直方图shi的统计行为之间的相 关取决于两个主要参数,即,与子直方图shi关联的子区域距关键点KP的距离及其主要定 向。
[0119] 参照图5,关键点KP的十六个子直方图shi被布置在四个相关族中,即:
[0120] -第一相关族CF1包括子直方图shi、sh4、shl3和shl6 ;
[0121] -第二相关族CF2包括子直方图sh2、sh3、shl4和shl5 ;
[0122] -第三相关族CF3包括子直方图sh5、sh8、sh9和shl2,以及
[0123] -第四相关族CF4包括子直方图sh6、sh7、shl0和shll。
[0124] 根据本发明的实施方式,有利地利用以上标识的相关族CFx,以便利用数量减少的 优化码本CBKy压缩描述符阵列DA。以使得至少两个子阵列SDAk具有相同的全局(即,考 虑其所有元素)统计行为的方式将描述符阵列DA再分成子阵列SDAk ;这样,可使用单个码 本CBKy压缩不止一个子阵列SDAk。为此,描述符阵列DA的再分以获得一组(多组)子阵 列SDAk,其中对于每个组,在所有子阵列SDAk中占据相同位置的元素 ai属于同一相关族 CFx。因此,可有利地利用相同的对应码本CBKy压缩属于同一组的所有子阵列SDAk,所述码 本CBKy的码字CWj通过从用于生成图4A的单个码本CBK的每个训练描述符阵列中仅考虑 其属于该组的子阵列SDAk的元素 ai所属的相关族CFx的元素来获得。
[0125] 根据图6A所示的本发明的示例性实施方式,描述符阵列DA被再分成四个子阵 列SDA1-SDA4,这些子阵列被布置在单个组中。因此,利用同一码本CBK1压缩所有子阵列 SDAk。具体地:
[0126] -第一子阵列SDA1由兀素序列al、a2、a6、a5形成;
[0127] -第二子阵列SDA2由元素序列a4、a3、a7、a8形成;
[0128] -第三子阵列SDA3由元素序列al6、al5、all、al2形成,以及
[0129] -第四子阵列SDA4由元素序列al3、al4、al0、a9形成。
[0130] 在这种情况下:
[0131] -每个子阵列SDAk的第一元素 ai属于第一相关族CF1 ;
[0132] -每个子阵列SDAk的第二元素 ai属于第二相关族CF2 ;
[0133] -每个子阵列SDAk的第三元素 ai属于第四相关族CF4,以及
[0134] -每个子阵列SDAk的第四元素 ai属于第三相关族CF3。
[0135] 用于压缩一般子阵列SDA1-SDA4的码本CBK1包括N3个码字CWj,其中,每个码字 CWj具有属于第一相关族CF1的第一兀素、属于第二相关族CF2的第二兀素、属于第四相关 族CF4的第三元素以及属于第三相关族CF3的第四元素。
[0136] 对于N3个不同的码字CWj,标识所有码字所需的最少比特数等于4*(log2 N3)。
[0137] 根据图6B所示的本发明的另一示例性实施方式,描述符阵列DA被再分成布置于 单个组中的两个子阵列SDAUSDA2。因此,利用同一码本CBK1压缩所有子阵列SDAk。具体 地:
[0138] -第一子阵列SDA1由兀素序列al、a2、a3、a4、a5、a6、a7、a8形成,以及
[0139] -第二子阵列 SDA2 由元素序列 al3、al4、al5、al6、a9、alO、all、al2 形成。
[0140] 在这种情况下:
[0141] -每个子阵列SDAk的第一和第四元素 ai属于第一相关族CF1 ;
[0142] -每个子阵列SDAk的第二和第三元素 ai属于第二相关族CF2 ;
[0143] -每个子阵列SDAk的第五和第八元素 ai属于第三相关族CF3,以及
[0144] -每个子阵列SDAk的第六和第七元素 ai属于第四相关族CF4。
[0145] 用于压缩一般子阵列SDAUSDA2的码本CBK1包括N4个码字CWj,其中,每个码字 CWj具有属于第一相关族CF1的第一和第四元素、属于第二相关族CF2的第二和第三元素、 属于第三相关族CF3的第五和第八元素以及属于第四相关族CF3的第六和第七元素。
[0146] 对于Μ个不同的码字CWj,标识所有码字所需的最少比特数等于2* (log2 N4)。
[0147] 根据图6C所示的本发明的另一示例性实施方式,描述符阵列DA被再分成六个 子阵列SDA1-SDA6,其中的四个子阵列(SDA1-SDA4)布置于第一组中,两个子阵列(SDA5, SDA6)布置于第二组中。因此,利用同一第一码本CBK1压缩子阵列SDA1-SDA4,同时利用同 一第二码本CBK2压缩子阵列SDA5-SDA6。具体地:
[0148] -第一子阵列SDA1由元素序列a5、al、a2形成;
[0149] -第二子阵列SDA2由元素序列a8、a4、a3形成;
[0150] _第二子阵列SDA3由兀素序列a9、al3、al4形成;
[0151] -第四子阵列SDA4由元素序列al2、al6、al5形成;
[0152] -第五子阵列SDA5由元素序列a6、a7形成,以及
[0153] -第六子阵列SDA6由元素序列al0、all形成。
[0154] 在这种情况下:
[0155] -第一组的每个子阵列SDA1-SDA4的第一元素 ai属于第三相关族CF3 ;
[0156] -第一组的每个子阵列SDA1-SDA4的第二元素 ai属于第一相关族CF1 ;
[0157] -第一组的每个子阵列SDA1-SDA4的第三元素 ai属于第二相关族CF2,以及
[0158] -第二组的每个子阵列SDA5-SDA6的第一和第二元素属于第
[0159] 四相关族CF4。
[0160] 用于压缩属于第一组的一般子阵列SDA1-SDA4的码本CBK1包括N5个码字CWj,其 中,每个码字CWj具有属于第三相关族CF3的第一兀素、属于第一相关族CF1的第二兀素以 及属于第二相关族CF2的第三元素。用于压缩属于第二组的一般子阵列SDA5-SDA6的码本 CBK2包括N6个码字CWj,其中,每个码字CWj具有属于第四相关族CF4的第一和第二元素。
[0161] 对于N5+N6个不同的码字CWj,标识所有码字所需的最少比特数等于4* (log2 N5)+2*(l〇g2 N6)。
[0162] 根据图6D所示的本发明的另一示例性实施方式,描述符阵列DA被再分成八 个子阵列SDA1-SDA8,其中的四个子阵列(SDA1-SDA4)布置于第一组中,四个子阵列 (SDA5-SDA8)布置于第二组中。因此,利用同一第一码本CBK1压缩子阵列SDA1-SDA4,同时 利用同一第二码本CBK2压缩子阵列SDA5-SDA8。具体地:
[0163] -第一子阵列SDA1由元素序列a5、al形成;
[0164] -第二子阵列SDA2由元素序列a8、a4形成;
[0165] -第三子阵列SDA3由元素序列a9、al3形成;
[0166] -第四子阵列SDA4由元素序列al2、al6形成;
[0167] -第五子阵列SDA5由元素序列a6、a2形成;
[0168] -第六子阵列SDA6由元素序列a7、a3形成;
[0169] -第七子阵列SDA7由元素序列alO、al4形成,以及
[0170] -第八子阵列SDA8由元素序列all、al5形成。
[0171] 在这种情况下:
[0172] -第一组的每个子阵列SDA1-SDA4的第一元素 ai属于第三相关族CF3 ;
[0173] -第一组的每个子阵列SDA1-SDA4的第二元素 ai属于第一相关族CF1 ;
[0174] -第二组的每个子阵列SDA5-SDA8的第一元素 ai属于第四相关族CF4,以及
[0175] -第二组的每个子阵列SDA5-SDA8的第二元素 ai属于第二相关族CF2。
[0176] 用于压缩属于第一组的一般子阵列SDA1-SDA4的码本CBK1包括N7个码字CWj,其 中,每个码字CWj具有属于第三相关族CF3的第一元素以及属于第一相关族CF1的第二元 素。用于压缩属于第二组的一般子阵列SDA5-SDA8的码本CBK2包括N8个码字CWj,其中, 每个码字CWj具有属于第四相关族CF4的第一元素以及属于第二相关族CF2的第二元素。
[0177] 因此,对于N7+N8个不同的码字CWj,标识所有码字所需的最少比特数等于4* (log2 N7)+4*(log2 N8)。
[0178] 自然,本发明的概念也适用于再分成不同数量的子阵列和/或不同数量的码本。 此外,即使在本说明书中参照了在包括4x4单元的网格上(每直方图具有八个区间)计算 的SIF描述符的压缩,类似考虑适用于单元的数量和/或每直方图的区间的数量不同的情 况,并且也可考虑其它类型的描述符。
[0179] 与已知的方案相比,对于相同的压缩失真,将描述符阵列DA再分成子阵列SDAk和 针对不止一个子阵列SDAk采用同一码本CBKy的组合使用实现了存储用于压缩描述符阵列 DA的码本CBKy所需的存储空间的大幅缩减。这是极为有利的,因为如上面已经提及的,用 于图像分析应用的硬件(例如,图形处理单元GPU)可能未配备有容量如此大的内存。将描 述符阵列DA再分成子阵列SDAk和针对不止一个子阵列SDAk采用同一码本CBKy的组合使 用所给出的另一优点在于用于码本CBKy生成的训练过程变得更快。
[0180] 在提取过程100 (参见图1)的阶段140中对每个接收的描述符D执行的压缩操作 作为结果生成对应压缩的描述符阵列CDA,该描述符阵列CDA近似相应描述符阵列DA所取 的值。更具体地,对于用于压缩描述符阵列DA的每个码本CBKy,该码本CBKy的每个码字 CWj由对应压缩索引Cy标识;如果码本CBKy由N个不同的码字CWj形成,则压缩索引Cy由 至少l〇g2 NK特形成。对于再分成子阵列SDAk的集合的描述符阵列DA,对应压缩的描述 符阵列CDA包括用于集合中的每个子阵列SDAk的压缩索引Cy,其中,每个压缩索引Cy标识 用于近似所述子阵列SDAk的码本CBKy的码字CWj。
[0181] 坐标的压缩(阶段150)
[0182] 根据本发明的实施方式,通过压缩属于在提取过程100(参见图1)的阶段130算 出的最佳子集SUB的关键点KP的坐标C来进一步减少为执行图像分析操作而待管理(例 如,待存储和/或发送)的数据的量。
[0183] 图7A示出了在与查询图像115对应的二维空间内最佳子集SUB的关键点KP的示 例性分布;每个关键点KP与标识在查询图像115内该关键点KP的位置的一对对应的空间 坐标C关联。
[0184] 首先,对子集SUB的所有关键点KP的坐标C进行量化。为此,将η X m网格叠加 在查询图像115上。在图7B所示的示例中,网格具有η = 10行和m = 15列。
[0185] 然后,通过针对网格的每个单元(与直方图的区间对应)对落在其内的关键点KP 的数量进行计数来生成二维直方图。图7C是通过将图7B的网格叠加在图7A的关键点KP 的集合上而获得的直方图的示例性图形描绘。在图7C的图形描绘中,没有关键点KP的单 元为黑色,而包括至少一个关键点KP的单元为灰色。在所讨论的示例中(其中包括最多数 量的关键点的单元包括两个关键点),包括单个关键点KP的单元为深灰色,而包括两个关 键点KP的那些单元为浅灰色。
[0186] 从关键点计数获得的直方图具有大量频率等于零的区间,S卩,不包括任何关键点 KP的对应单元(图7C中所描绘的黑色单元)。
[0187] 表示直方图的数据可有利地通过考虑到其与零频率区间对应的部分仅提供其对 应单元不包括任何关键点的信息而被压缩。
[0188] 为此,可有利地去除网格的完全由不包括任何关键点KP的单元形成的行和列。然 而,由于去除这些行和/或列将改变关键点KP的绝对位置和相对位置,因此应该记录没有 关键点KP的所有行和列的位置(包括与待去除的行和/或列对应的那些位置)的指示。
[0189] 为此,按照以下方式定义两个阵列r和c :
[0190] -阵列r是针对网格的每一行包括一个元素的阵列,其中,如果网格的对应单元不 包括任何关键点KP,则该阵列的一般元素被设定为第一值(例如,0),如果网格的对应单元 包括至少一个关键点KP,则其被设定为第二值(例如,1),并且
[0191] -阵列c是针对网格的每一列包括一个元素的阵列,其中,如果网格的对应单元不 包括任何关键点KP,则该阵列的一般元素被设定为第一值(例如,0),如果网格的对应单元 包括至少一个关键点KP,则其被设定为第二值(例如,1)。
[0192] 一旦生成了阵列r和c,下一步骤则用于标识完全由不包括任何关键点KP的单元 形成的行和/或列。参照所讨论的示例,这些行和列在图7D中被描绘为黑色。
[0193] 然后,去除网格的完全由不包括任何关键点KP的单元形成的行和/或列,使所得 的网格部分紧凑,以便填充由于去除而留下的空白空间。因此,在所得的(紧凑)网格(称 作秩1支集)中,所有行和所有列中的至少一个单元包括至少一个关键点KP。图7E示出了 与所讨论的示例对应的秩1支集上的直方图。
[0194] 从该直方图,能够提取两条不同的信息,SP,:
[0195] 1)秩1支集的包括至少一个关键点KP的单元的位置,以及
[0196] 2)对于点1)处标识的秩1支集的每个单元,其中包括的关键点KP的数量。
[0197] 有利地,如 S. Tsai、D. Chen、G. Takacs、V. Chandrasekhar、J. P. Singh 和 B. Girod 在 "Location coding for mobile image retrieval"(国际移动多媒体会议(MobiMedia)会 报,2009)中所建议的,与点1)对应的信息可利用所谓的"直方图映射"来提取,而与点2) 对应的信息可被布置在所谓的"直方图计数"中。
[0198] 直方图映射是标识其频率大于等于1的区间的秩1支集上的直方图的二维映射。 与图7E的秩1支集上的直方图对应的直方图映射于图7F中示出。
[0199] 直方图映射可利用对应矩阵来表示,如果秩1支集的对应单元不包括任何关键点 KP,则该矩阵的一般元素等于零,如果秩1支集的对应单元包括至少一个关键点KP,则等于 一。图7F所示的直方图映射的矩阵如下:
[0200]

【权利要求】
1. 一种用于处理图像的方法,包括: -标识图像中的一组关键点; -对于所述组中的每个关键点: a) 计算包括多个阵列元素的对应描述符阵列,每个阵列元素存储在所述关键点邻居内 的图像的相应子区域的对应颜色梯度直方图所取的值; b) 将所述描述符阵列再分成至少两个子阵列,每个子阵列包括所述描述符阵列的相应 数量的元素,并且 c) 生成压缩的描述符阵列,所述压缩的描述符阵列针对所述至少两个子阵列中的每一 个包括对应压缩的子阵列,每个压缩的子阵列通过使用相应码本利用矢量量化对所述至少 两个子阵列中的对应子阵列压缩来获得; -利用所述组中的关键点的压缩的描述符阵列来分析所述图像,其中: -对于所述组中的每个关键点,将描述符阵列再分成至少两个子阵列是基于其值存储 在所述每个关键点的描述符阵列的元素中的颜色梯度直方图之间的相关关系而执行的。
2. 根据权利要求1所述的方法,还包括,对于所述组中的每个关键点: -将所述至少两个子阵列布置到至少一组的子阵列内,并且 -使用相同码本压缩所述至少一组的子阵列中的同一组的子阵列。
3. 根据权利要求2所述的方法,还包括,对于所述组中的每个关键点: -将颜色梯度直方图布置到多个相关族内,每个相关族包括具有相似统计行为的相关 的颜色梯度直方图的对应集合,其中,对于所述至少一组的子阵列中的每个组: -在所述组的所有子阵列中占据相同位置的阵列元素对应于属于相同相关族的颜色梯 度直方图。
4. 根据权利要求3所述的方法,其中,对于所述组中的每个关键点: -所述关键点与其邻居内的十六个相应子区域关联; -对应描述符阵列包括十六个阵列元素,每个阵列元素对应于其邻居内的十六个子区 域之中相应的一个子区域,以及 -所述将颜色梯度直方图布置到多个相关族内包括将颜色梯度直方图布置到四个相关 族内,每个相关族包括四个相关的颜色梯度直方图。
5. 根据权利要求4所述的方法,其中,对于所述组中的每个关键点: -所述十六个相应的子区域根据以所述关键点为中心并且包括四行和四列的网格布置 来布置,所述将颜色梯度直方图布置到多个相关族内包括: -将网格布置的第一行的第一和第四子区域以及网格布置的第四行的第一和第四子区 域布置到第一相关族内; -将网格布置的第一行的第二和第三子区域以及网格布置的第四行的第二和第三子区 域布置到第二相关族内; -将网格布置的第二行的第一和第四子区域以及网格布置的第三行的第一和第四子区 域布置到第三相关族内,以及 -将网格布置的第二行的第二和第三子区域以及网格布置的第三行的第二和第三子区 域布置到第四相关族内。
6. 根据权利要求5所述的方法,还包括,对于所述组中的每个关键点: -将描述符阵列再分成: -第一子阵列,其包括与描述符阵列的第一阵列元素对应的第一元素、与描述符阵列的 第二阵列元素对应的第二元素、与描述符阵列的第六阵列元素对应的第三元素以及与描述 符阵列的第五阵列元素对应的第四元素; -第二子阵列,其包括与描述符阵列的第四阵列元素对应的第一元素、与描述符阵列的 第三阵列元素对应的第二元素、与描述符阵列的第七阵列元素对应的第三元素以及与描述 符阵列的第八阵列元素对应的第四元素; -第三子阵列,其包括与描述符阵列的第十六阵列元素对应的第一元素、与描述符阵列 的第十五阵列元素对应的第二元素、与描述符阵列的第十一阵列元素对应的第三元素以及 与描述符阵列的第十二阵列元素对应的第四元素,以及 -第四子阵列,其包括与描述符阵列的第十三阵列元素对应的第一元素、与描述符阵列 的第十四阵列元素对应的第二元素、与描述符阵列的第十阵列元素对应的第三元素以及与 描述符阵列的第九阵列元素对应的第四元素, -使用相同码本来压缩第一子阵列、第二子阵列、第三子阵列和第四子阵列。
7. 根据权利要求5所述的方法,还包括,对于所述组中的每个关键点: _将描述符阵列再分成: -第一子阵列,其包括与描述符阵列的第一阵列元素对应的第一元素、与描述符阵列的 第二阵列元素对应的第二元素、与描述符阵列的第三阵列元素对应的第三元素、与描述符 阵列的第四阵列元素对应的第四元素、与描述符阵列的第五阵列元素对应的第五元素、与 描述符阵列的第六阵列元素对应的第六元素、与描述符阵列的第七元素对应的第七元素以 及与描述符阵列的第八元素对应的第八元素,和 -第二子阵列,其包括与描述符阵列的第十三阵列元素对应的第一元素、与描述符阵列 的第十四阵列元素对应的第二元素、与描述符阵列的第十五阵列元素对应的第三元素、与 描述符阵列的第十六阵列元素对应的第四元素、与描述符阵列的第九阵列元素对应的第五 元素、与描述符阵列的第十阵列元素对应的第六元素、与描述符阵列的第i^一元素对应的 第七元素以及与描述符阵列的第十二元素对应的第八元素, -使用相同码本来压缩第一子阵列和第二子阵列。
8. 根据权利要求5所述的方法,还包括,对于所述组中的每个关键点: _将描述符阵列再分成: -第一子阵列,其包括与描述符阵列的第五阵列元素对应的第一元素、与描述符阵列的 第一阵列元素对应的第二元素以及与描述符阵列的第二阵列元素对应的第三元素; -第二子阵列,其包括与描述符阵列的第八阵列元素对应的第一元素、与描述符阵列的 第四阵列元素对应的第二元素以及与描述符阵列的第三阵列元素对应的第三元素; -第三子阵列,其包括与描述符阵列的第九阵列元素对应的第一元素、与描述符阵列的 第十三阵列元素对应的第二元素以及与描述符阵列的第十四阵列元素对应的第三元素; -第四子阵列,其包括与描述符阵列的第十二阵列元素对应的第一元素、与描述符阵 列的第十六阵列元素对应的第二元素以及与描述符阵列的第十五阵列元素对应的第三元 素; -第五子阵列,其包括与描述符阵列的第六阵列元素对应的第一元素以及与描述符阵 列的第七阵列元素对应的第二元素,以及 -第六子阵列,其包括与描述符阵列的第十阵列元素对应的第一元素以及与描述符阵 列的第十一阵列元素对应的第二元素, -使用第一相同码本来压缩第一子阵列、第二子阵列、第三子阵列和第四子阵列,并且 -使用第二相同码本来压缩第五子阵列和第六子阵列。
9. 根据权利要求5所述的方法,还包括,对于所述组中的每个关键点: _将描述符阵列再分成: -第一子阵列,其包括与描述符阵列的第五阵列元素对应的第一元素以及与描述符阵 列的第一阵列元素对应的第二元素; -第二子阵列,其包括与描述符阵列的第八阵列元素对应的第一元素以及与描述符阵 列的第四阵列元素对应的第二元素; -第三子阵列,其包括与描述符阵列的第九阵列元素对应的第一元素以及与描述符阵 列的第十三阵列元素对应的第二元素; -第四子阵列,其包括与描述符阵列的第十二阵列元素对应的第一元素以及与描述符 阵列的第十六阵列元素对应的第二元素; -第五子阵列,其包括与描述符阵列的第六阵列元素对应的第一元素以及与描述符阵 列的第二阵列元素对应的第二元素; -第六子阵列,其包括与描述符阵列的第七阵列元素对应的第一元素以及与描述符阵 列的第三阵列元素对应的第二元素; -第七子阵列,其包括与描述符阵列的第十阵列元素对应的第一元素以及与描述符阵 列的第十四阵列元素对应的第二元素,以及 -第八子阵列,其包括与描述符阵列的第i^一阵列元素对应的第一元素以及与描述符 阵列的第十五阵列元素对应的第二元素, -使用第一相同码本来压缩第一子阵列、第二子阵列、第三子阵列和第四子阵列,并且 -使用第二相同码本来压缩第五子阵列、第六子阵列、第七子阵列和第八子阵列。
10. 根据前述权利要求中任一项所述的方法,其中,所述标识一组关键点包括标识图像 中的第一组关键点,所述方法还包括: -对于第一组中的每个关键点: a) 标识与所述每个关键点有关的关键点局部特征的对应集合; b) 对于对应集合的局部特征之中的至少一个关键点局部特征,计算对应局部特征相关 概率; c) 基于所述至少一个局部特征的局部特征相关概率计算关键点相关概率; -在第一组的关键点之中选择具有最高关键点相关概率的关键点,以形成第二组的关 键点,其中: -所述利用压缩的描述符阵列分析图像包括利用第二组的关键点的压缩的描述符阵列 来分析图像,以及 -针对关键点的局部特征计算的局部特征相关概率通过将所述局部特征所具有的值与 所述局部特征的值的对应参考统计分布进行比较来获得。
11. 根据权利要求10所述的方法,其中,每个所述对应参考统计分布在统计上等效于 通过在多个参考图像对中标识的多个参考关键点之中收集与每个参考图像对的被确定为 涉及该对的参考图像之间的正确特征匹配的那些参考关键点对应的局部特征值而生成的 对应统计分布。
12. 根据权利要求10或权利要求11所述的方法,其中,与所述每个关键点有关的关键 点局部特征的集合包括下列项中的至少一个: -关键点的坐标; -关键点被标识的标度; -关键点的主要定向; -关键点的峰值,以及 -关键点的描述符。
13. 根据权利要求11或从属于权利要求11的权利要求12所述的方法,其中: -每个参考统计分布按照具有多个区间的对应直方图的形式布置,每个区间对应于对 应局部特征的值的预定义范围,每个区间的频率对应于下列项之比: a) 被确定为涉及正确特征匹配并且对应局部特征的值落在所述区间内的参考关键点 的数量,以及 b) 对应局部特征的值落在所述区间内的参考关键点的总数, -所述针对关键点的局部特征计算局部特征相关概率包括: c) 检查与该局部特征对应的直方图以便标识其拟合关键点的局部特征所取的值的区 间,以及 d) 将局部特征相关概率设定为标识的区间的频率。
14. 根据权利要求10-13中任一项所述的方法,其中,所述计算第一组的关键点的关键 点相关概率包括将对应关键点的所述至少一个局部特征中的每一个的局部特征相关概率 组合。
15. 根据权利要求14所述的方法,其中,所述计算第一组的关键点的关键点相关概率 包括将对应关键点的所述至少一个局部特征中的每一个的局部特征相关概率彼此相乘。
16. 根据前述权利要求中任一项所述的方法,还包括: -在图像上方设置包括按照行和列布置的多个单元的参考网格以使得所述组的每个关 键点落在网格的相应单元内; -标识参考网格的完全由没有关键点的单元形成的行和列; -从参考网格去除完全由没有关键点的单元形成的所述行和列,并生成其中每一行和 每一列包括具有至少一个关键点的至少一个单元的紧凑的网格布置; -生成包括按照行和列布置的多个元素的坐标矩阵,其中,每个矩阵元素对应于紧凑的 网格布置的单元,所述矩阵元素在紧凑的网格布置的对应单元包括至少一个关键点的情况 下等于第一值,在紧凑的网格布置的对应单元没有关键点的情况下等于第二值; -将坐标矩阵再分成多个子字,每个子字包括相同数量的矩阵元素; -生成子字直方图,该子字直方图针对子字可取的每个可能的值包括一个区间,每个区 间的频率指示子字取与所述区间关联的值的概率; -基于所述子字直方图利用熵编码技术对每个子字进行编码,以针对每个子字获得压 缩的子字,以及 -利用压缩的子字来分析图像,其中: -所述生成子字直方图包括基于对多个训练图像的统计分析设定区间的频率,所述统 计分析基于从这些训练图像生成的坐标矩阵的元素彼此独立的假设进行,以及 -所述基于所述子字直方图利用熵编码技术对每个子字进行编码包括将每个子字编码 为压缩的子字,所述压缩的子字包括的矩阵元素的数量取决于与所述子字的值对应的区间 的频率。
17. 根据权利要求10以及从属于权利要求10的权利要求11-16中任一项所述的方法, 其中,所述分析图像包括在该图像与另一图像之间进行比较。
18. 根据权利要求10以及从属于权利要求10的权利要求11-16中任一项所述的方法, 其中,所述图像描绘对象/场景,所述分析图像包括从包括各自描绘相应对象/场景的多个 模型图像的模型数据库检索描绘与所述图像中所描绘的对象/场景对应的对象/场景的模 型图像。
19. 根据前述权利要求中任一项所述的方法,其中,所述利用所述组中的关键点的压缩 的描述符阵列来分析图像包括: -将压缩的描述符阵列解压缩以获得对应解压缩的描述符阵列,以及 -利用所述解压缩的描述符阵列来分析图像, 其中: -对于所述组中的每个关键点,基于在关键点邻居内的图像的子区域的位置之间的统 计空间相关关系进行所述解压缩。
20. 根据权利要求19所述的方法,其中,所述统计空间相关关系基于在关键点邻居内 的图像的子区域的位置之间的空间距离。
21. 根据权利要求19或20所述的方法,其中,对于所述组中的每个关键点: -对应描述符阵列的每个阵列元素包括一组子元素,每个子元素存储对应颜色梯度直 方图的相应区间的频率值,颜色梯度直方图的每个区间则又对应于相对于关键点的主要定 向的相应定向,以及 -所述解压缩基于与描述符阵列的不同阵列元素对应的颜色梯度直方图的区间所对应 的定向之中的统计角相关关系进行。
22. 根据权利要求21所述的方法,其中所述统计角相关关系基于与描述符阵列的不同 阵列元素对应的颜色梯度直方图的区间所对应的定向之中的角距离。
23. 根据权利要求21或22所述的方法,其中,对于所述组中的每个关键点,所述解压缩 包括: -将利用矢量量化从所述至少两个子阵列生成的压缩的子阵列相联合以形成包括多个 第一子元素的第一解压缩的描述符阵列,以及 -从第一解压缩的描述符阵列计算第二解压缩的描述符阵列,该第二解压缩的描述符 阵列包括多个第二子元素,其中,所述计算第二解压缩的描述符阵列包括将每个第二子元 素设定为至少两个第一子元素的加权线性组合, 其中: 所述利用解压缩的描述符阵列来分析图像包括: -对于所述组中的每个关键点,利用对应第二解压缩的描述符阵列来分析图像。
24. 根据权利要求23所述的方法,其中,所述计算第二解压缩的描述符阵列包括将第 一解压缩的描述符阵列乘以补偿矩阵,所述补偿矩阵如下计算: -将多个样本描述符阵列布置在第一样本矩阵内; -通过将每个样本描述符阵列再分成至少两个对应子阵列并经矢量量化压缩所述至少 两个对应子阵列中的每一个来压缩每个样本描述符阵列,生成压缩的样本描述符阵列; -对于每个压缩的样本描述符阵列,将对应压缩的子阵列相联合以获得解压缩的样本 描述符阵列; -将所述解压缩的样本描述符阵列布置在第二样本矩阵内; -设定补偿矩阵以使得下列项的范数最小化: a) 第二样本矩阵乘以补偿矩阵 减去 b) 第一样本矩阵。
25. 根据权利要求1所述的方法,其中,所述利用所述组中的关键点的压缩的描述符阵 列来分析图像包括: -将压缩的描述符阵列解压缩以获得对应解压缩的描述符阵列,以及 -利用所述解压缩的描述符阵列来分析图像, 其中: 对于所述组中的每个关键点,所述解压缩包括: -将利用矢量量化从所述至少两个子阵列生成的压缩的子阵列相联合以形成包括多个 第一子元素的第一解压缩的描述符阵列,以及 -从第一解压缩的描述符阵列计算第二解压缩的描述符阵列,第二解压缩的描述符阵 列包括多个第二子元素,其中,所述计算第二解压缩的描述符阵列包括将每个第二子元素 设定为至少两个第一子元素的加权线性组合, 其中: 所述利用解压缩的描述符阵列来分析图像包括: -对于所述组中的每个关键点,利用对应第二解压缩的描述符阵列来分析图像。
26. -种用于处理图像的方法,包括: -接收至少一个压缩的描述符阵列,所述压缩的描述符阵列如下获得: -标识图像中的至少一个关键点; -对于所述至少一个关键点: a) 计算包括多个阵列元素的对应描述符阵列,每个阵列元素存储在关键点邻居内的图 像的相应子区域的对应颜色梯度直方图所取的值; b) 将描述符阵列再分成至少两个子阵列,每个子阵列包括描述符阵列的相应数量的元 素,并且 c) 生成压缩的描述符阵列,所述压缩的描述符阵列包括针对所述至少两个子阵列中的 每一个的对应压缩的子阵列,每个压缩的子阵列通过使用相应码本利用矢量量化压缩所述 至少两个子阵列中的对应子阵列来获得; -将所述至少一个接收到的压缩的描述符阵列解压缩以获得对应至少一个解压缩的描 述符阵列,以及 -利用所述至少一个解压缩的描述符阵列来分析图像, 其中: -对于所述至少一个标识的关键点中的每一个,所述解压缩基于在关键点邻居内的图 像的子区域的位置之中的统计空间相关关系进行。
27. 根据权利要求26所述的方法,其中,所述统计空间相关关系基于在关键点邻居内 的图像的子区域的位置之中的空间距离。
28. 根据权利要求26或27所述的方法,其中,对于所述组中的每个关键点: -对应描述符阵列的每个阵列元素包括一组子元素,每个子元素存储对应颜色梯度直 方图的相应区间的频率值,颜色梯度直方图的每个区间则又对应于相对于关键点的主要定 向的相应定向,以及 -所述解压缩基于与描述符阵列的不同阵列元素对应的颜色梯度直方图的区间所对应 的定向之中的统计角相关关系进行。
29. 根据权利要求28所述的方法,其中,所述统计角相关关系基于与描述符阵列的不 同阵列元素对应的颜色梯度直方图的区间所对应的定向之中的角距离。
30. 根据权利要求28或29所述的方法,其中,对于所述组中的每个关键点,所述解压缩 包括: -将利用矢量量化从所述至少两个子阵列生成的压缩的子阵列相联合以形成包括多个 第一子元素的第一解压缩的描述符阵列,以及 -从第一解压缩的描述符阵列计算第二解压缩的描述符阵列,该第二解压缩的描述符 阵列包括多个第二子元素,其中,所述计算第二解压缩的描述符阵列包括将每个第二子元 素设定为第一子元素的加权线性组合, 其中: 所述利用解压缩的描述符阵列来分析图像包括: -对于所述组中的每个关键点,利用对应第二解压缩的描述符阵列来分析图像。
31. 根据权利要求30所述的方法,其中,所述计算第二解压缩的描述符阵列包括将第 一解压缩的描述符阵列乘以补偿矩阵,所述补偿矩阵如下计算: -将多个样本描述符阵列布置在第一样本矩阵内; -通过将每个样本描述符阵列再分成至少两个对应子阵列并经矢量量化压缩所述至少 两个对应子阵列中的每一个来压缩每个样本描述符阵列,生成压缩的样本描述符阵列; -对于每个压缩的样本描述符阵列,将对应压缩的子阵列相联合以获得解压缩的样本 描述符阵列; -将所述解压缩的样本描述符阵列布置在第二样本矩阵内; -设定补偿矩阵以使得下列项的范数最小化: a) 第二样本矩阵乘以补偿矩阵 减去 b) 第一样本矩阵。
32. -种用于处理图像的方法,包括: -接收至少一个压缩的描述符阵列,所述压缩的描述符阵列通过以下步骤获得: -标识图像中的至少一个关键点; -对于所述至少一个关键点: a) 计算包括多个阵列元素的对应描述符阵列,每个阵列元素存储在关键点邻居内的图 像的相应子区域的对应颜色梯度直方图所取的值; b) 将描述符阵列再分成至少两个子阵列,每个子阵列包括描述符阵列的相应数量的元 素,以及 c) 生成压缩的描述符阵列,所述压缩的描述符阵列包括用于所述至少两个子阵列中的 每一个的对应压缩的子阵列,每个压缩的子阵列通过使用相应码本利用矢量量化压缩所述 至少两个子阵列中的对应子阵列来获得; -将所述至少一个接收到的压缩的描述符阵列解压缩以获得对应至少一个解压缩的描 述符阵列,以及 -利用所述至少一个解压缩的描述符阵列来分析图像, 其中: 对于所述至少一个关键点中的每一个,所述解压缩包括: -将利用矢量量化从所述至少两个子阵列生成的压缩的子阵列相联合以形成包括多个 第一子元素的第一解压缩的描述符阵列,以及 -从第一解压缩的描述符阵列计算第二解压缩的描述符阵列,该第二解压缩的描述符 阵列包括多个第二子元素,其中,所述计算第二解压缩的描述符阵列包括将每个第二子元 素设定为至少两个第一子元素的加权线性组合, 其中: 所述利用解压缩的描述符阵列来分析图像包括: -对于所述至少一个关键点中的每个关键点,利用对应第二解压缩的描述符阵列来分 析图像。
33. -种用于处理图像的系统,包括: -第一处理单元,其被配置为标识图像中的一组关键点; -第二处理单元,其被配置为针对所述组中的每个关键点执行以下操作: a) 计算包括多个阵列元素的对应描述符阵列,每个阵列元素存储在所述关键点邻居内 的图像的相应子区域的对应颜色梯度直方图所取的值; b) 将所述描述符阵列再分成至少两个子阵列,每个子阵列包括所述描述符阵列的相应 数量的元素,并且 c) 生成压缩的描述符阵列,所述压缩的描述符阵列针对所述至少两个子阵列中的每一 个包括对应压缩的子阵列,每个压缩的子阵列通过使用相应码本利用矢量量化对所述至少 两个子阵列中的对应子阵列压缩来获得; -第三处理单元,其被配置为利用所述组中的关键点的压缩的描述符阵列来分析图像, 其中: -对于所述组中的每个关键点,所述第二处理单元被配置为基于颜色梯度直方图之中 的相关关系将描述符阵列再分成至少两个子阵列,所述颜色梯度直方图的值存储在所述每 个关键点的描述符阵列的元素中。
34. -种用于处理图像的系统,包括: -第一处理单元,其被配置为接收至少一个压缩的描述符阵列,所述压缩的描述符阵列 通过以下步骤获得: -标识图像中的至少一个关键点; -对于所述至少一个关键点: a) 计算包括多个阵列元素的对应描述符阵列,每个阵列元素存储在关键点邻居内的图 像的相应子区域的对应颜色梯度直方图所取的值; b) 将描述符阵列再分成至少两个子阵列,每个子阵列包括描述符阵列的相应数量的元 素,并且 c) 生成压缩的描述符阵列,所述压缩的描述符阵列包括所述至少两个子阵列中的每一 个的对应压缩的子阵列,每个压缩的子阵列通过使用相应码本利用矢量量化压缩所述至少 两个子阵列中的对应子阵列来获得; -第二处理单元,其被配置为解压缩所述至少一个接收的压缩的描述符阵列以获得对 应至少一个解压缩的描述符阵列,以及 -第三处理单元,其被配置为利用所述至少一个解压缩的描述符阵列来分析图像, 其中: -对于所述至少一个标识的关键点中的每一个,所述第二处理单元被配置为基于在关 键点邻居内的图像的子区域的位置之中的统计空间相关关系解压缩所述至少一个接收到 的压缩的描述符阵列。
35. -种用于处理图像的系统,包括: -第一处理单元,其被配置为接收至少一个压缩的描述符阵列,所述压缩的描述符阵列 通过以下步骤获得: -标识图像中的至少一个关键点; -对于所述至少一个关键点: a) 计算包括多个阵列元素的对应描述符阵列,每个阵列元素存储在关键点邻居内的图 像的相应子区域的对应颜色梯度直方图所取的值; b) 将描述符阵列再分成至少两个子阵列,每个子阵列包括描述符阵列的相应数量的元 素,并且 c) 生成压缩的描述符阵列,所述压缩的描述符阵列包括所述至少两个子阵列中的每一 个的对应压缩的子阵列,每个压缩的子阵列通过使用相应码本利用矢量量化压缩所述至少 两个子阵列中的对应子阵列来获得; -第二处理单元,其被配置为解压缩所述至少一个接收的压缩的描述符阵列以获得对 应至少一个解压缩的描述符阵列,以及 -第三处理单元,其被配置为利用所述至少一个解压缩的描述符阵列来分析图像, 其中: 对于所述至少一个关键点中的每一个,所述第二处理单元被配置为通过以下步骤解压 缩所述至少一个接收到的压缩的描述符阵列: -将利用矢量量化从所述至少两个子阵列生成的压缩的子阵列相联合以形成包括多个 第一子元素的第一解压缩的描述符阵列,以及 -从第一解压缩的描述符阵列计算第二解压缩的描述符阵列,该第二解压缩的描述符 阵列包括多个第二子元素,其中,所述计算第二解压缩的描述符阵列包括将每个第二子元 素设定为至少两个第一子元素的加权线性组合, 其中: 所述第三处理单元被配置为通过以下步骤利用解压缩的描述符阵列来分析图像: -对于所述至少一个关键点中的每个关键点,利用对应第二解压缩的描述符阵列来分 析图像。
【文档编号】G06K9/62GK104160409SQ201280069515
【公开日】2014年11月19日 申请日期:2012年10月12日 优先权日:2012年1月2日
【发明者】M·巴尔斯特里, G·弗朗西尼, S·莱珀索伊 申请人:意大利电信股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1