使用概率模型在视觉数据中检测对象的制作方法_3

文档序号：8947489阅读：来源：国知局

成功匹配数目与执行的总匹配数目的比率)。
[0056] : 是针对对象m的先验概率：梦的补数。更具体地， ρ(Μ fn.) ? I - PiM ? ??j〇
[0057] = = m)是针对与对象m的错误匹配获得n个内点的概率；换言之，在对象m事实上不在图像中时的概率。这能够从通过将参考图像与针对对象m的对象模型匹配(在418处获得)的统计来估计。该过程能够使用与上面指出的相同高斯模型以导出下面：
其中是针对与对象m的错误匹配的内点的经验平均数目。在前面示例中， :1????连同相关联的方差一起能够是在418处获得的统计。前面方程假定平均值等于方差。
[0058] 根据上面情况，概率模型提供对象m在图像中的概率与内点数目η之间的映射。如上面解释的，该映射能够被用来将针对对象的内点数目转换成为要与概率阈值相比的概率值，该概率阈值能够针对所有对象是相同的。可替代地，通过应用逆向映射，概率阈值能够被转换成为内点计数阈值，所述内点计数阈值对于每个模型是不同的。
[0059] 图5是根据一些实施方式的几何一致性程序的流程图。图5描绘RANSAC(随机采样一致)技术。如上面讨论的，几何一致性程序在图3的对象识别程序中在308处被执行用于将图像匹配到由对象描述符数据库116的模型表示的对象。
[0060] (在502处）得分Best_Score被初始化为零(或某一其它初始值)。（在504处）选择P个(其中P能够是三或某一其它值)点对应的随机样本。该样本然后被用来诸如通过使用三点姿态技术生成上至三个候选照相机姿态。在三点姿态技术中，三个几何点能够产生照相机的多个姿态。
[0061] 对于每个候选照相机姿态，下面针对每个点对应来执行。注意的是，点对应与图像中的点特征和由对象描述符数据库116的模型表示的对象中的匹配点特征相关联。（在506 处）对象中的点特征的位置使用候选照相机姿态来再投影。再投影有效地修改要与候选照相机姿态相一致的对象中的点特征的位置。
[0062] (在508处)然后计算对象中的再投影点特征与图像中的对应点特征的观察位置之间的距离，其中该距离被称为再投影误差。（在510处）将再投影误差与误差阈值相比。该过程将与在误差阈值以下的再投影误差相关联的点对应标识为内点。
[0063] 针对在随机样本(其具有p个点对应）中的其它点对应中的每个来重复任务506、 508 和 510〇
[0064] 过程接着(在512处)计数具有在误差阈值以下的再投影误差的点对应的数目。该计数的数目是得分。如果计数的得分大于当前最佳得分Best_Score，则Best_Score(在514 处）被更新到计数的得分。而且，与最高计数的得分相关联的候选照相机姿态至此(在516 处）被记录。
[0065] 前面任务被重复直到停止的标准(在518处）被确定已经被满足，其中停止的标准能够是最佳得分BeSt_SC〇re超过预定义阈值，或者重复的指定数目已经被执行。如果停止的标准不被满足，则任务504至518被反复，其中任务504将会选择p个点对应的另一个随机样本。
[0066] 在停止的标准被满足之后，则最佳的照相机姿态连同表示内点数目的对应计数的得分一起被确定(如在516处记录的)。
[0067] 如上面指出的，在408或416处执行的匹配使用在图3中描绘的对象识别程序的修改形式。在修改的对象识别程序中，在图3中在308处执行的几何一致性程序使用零(或某一其它低值）的误差阈值，这将会导致在图5中描述的过程中的内点的更大数目的检测。
[0068] 上面描述的模块(包含图1的对象识别器102和概率模型生成器103)的机器可读指令被加载用于在一个或多个处理器(诸如图1中的104)上实行。处理器能够包含微处理器、微控制器、处理器模块或子系统、可编程集成电路、可编程门阵列、或另一个控制或计算装置。
[0069] 数据和指令被存储在相应存储装置中，该相应存储装置被实施为一个或多个计算机可读或机器可读存储介质。存储介质包含不同形式的存储器，其包含半导体存储器装置诸如动态或静态随机存取存储器（DRAM或SRAM)、可擦除和可编程只读存储器（EPR0M)、电可擦除和可编程只读存储器（EEPROM)和闪速存储器；磁盘诸如固定磁盘、软盘和可移动磁盘；包含磁带的其它磁介质；光学介质诸如光盘（CD)或数字视频光盘（DVD);或其它类型的存储装置。注意的是，上面讨论的指令能够被提供在一个计算机可读或机器可读存储介质上，或者可替代地，能够被提供在分布在可能具有多个节点的大系统中的多个计算机可读或机器可读存储介质上。这样的一个或多个计算机可读或机器可读存储介质被认为是物品 (或制品)的部分。物品或制品能够指代任何制造的单个部件或多个部件。一个或多个存储介质能够位于运行机器可读指令的机器中，或者位于远程站点，机器可读指令能够从该远程站点经过网络被下载用于实行。
[0070] 在前面描述中，许多细节被阐明来提供在本文中公开的主题的理解。然而，实施方式可以在没有这些细节中的一些或所有的情况下被实践。其它实施方式可以包含对上面讨论的细节的修改和变化。意在所附权利要求覆盖这样的修改和变化。
【主权项】
1. 一种方法，包括：由具有处理器的系统提供基于将特定对象匹配到对象的表示的匹配程序的输出的概率模型，所述概率模型使对象存在的概率与匹配特征的数目相关；以及由系统使用概率模型来检测特定对象是否存在于接收的视觉数据中。2. 权利要求1的所述方法，其中提供概率模型包括在系统处建立概率模型。3. 权利要求1的所述方法，其中提供概率模型包括在系统处从另一个系统接收概率模型。4. 权利要求1的所述方法，其中所述概率模型进一步基于将没有特定对象的参考图像匹配到对象的表示的匹配程序的输出。5. 权利要求1的所述方法，其中所述概率模型基于将特定对象的相应模拟视图匹配到对象的表示的匹配程序的输出，所述模拟视图对应于相对于特定对象的照相机的不同姿 O6. 权利要求1的所述方法，其中使用概率模型包括：确定接收的视觉数据与对象的表示中的对应一个之间的匹配特征的数目；响应于匹配特征的确定的数目，通过概率模型来计算概率值；以及将概率值与预定概率阈值相比。7. 权利要求1的所述方法，其中使用概率模型包括：确定接收的视觉数据与对象的表示中的对应一个之间的匹配特征的数目；响应于预定义概率阈值，通过概率模型来计算数目阈值；以及将匹配特征的确定的数目与数目阈值相比。8. 权利要求1的所述方法，进一步包括：针对附加对象提供附加概率模型；以及使用附加概率模型来检测附加对象是否存在于接收的视觉数据中。9. 权利要求8的所述方法，其中使用概率模型来检测对象存在于相应视觉数据中采用概率阈值。10. -种物品，包括存储指令的至少一个机器可读存储介质，所述指令在实行时使系统：接收给定对象；将给定对象的特征匹配到对象的表示；将不包含给定对象的参考图像的特征匹配到对象的表示；以及建立基于将给定对象的特征匹配以及将参考图像的特征匹配的输出的概率模型，其中所述概率模型在对象识别程序中可用以确定对象是否在视觉数据中。11. 权利要求10的所述物品，其中将给定对象的特征匹配到对象的表示包括将给定对象的模拟视图的特征匹配到对象的表示，所述模拟视图对应于相对于给定对象的照相机的不同姿态。12. 权利要求10的所述物品，其中所述概率模型提供在给定匹配特征的数目情况下给定对象在视觉数据中的条件概率。13. 权利要求10的所述物品，其中所述指令在实行时使系统进一步：接收视觉数据；确定视觉数据与对象的表示中的给定一个之间的匹配特征的数目；以及使用概率模型和匹配特征的确定的数目来确定由给定表示所表示的对象是否存在于视觉数据中。14. 权利要求13的所述物品，其中使用概率模型基于概率阈值。15. -种系统，包括：至少一个处理器，用于：提供基于将特定对象匹配到对象的表示的匹配程序的输出的概率模型，所述概率模型使对象存在的概率与匹配特征的数目相关；以及使用概率模型来检测特定对象是否存在于接收的视觉数据中。
【专利摘要】提供基于将特定对象匹配到对象的表示的匹配程序的输出的概率模型，其中该概率模型使对象存在的概率与匹配特征的数目相关。该概率模型被用于检测特定对象是否存在于接收的视觉数据中。
【IPC分类】G06K9/62
【公开号】CN105164700
【申请号】CN201280077632
【发明人】G.萨克拉瓦拉
【申请人】奥瑞斯玛有限公司
【公开日】2015年12月16日
【申请日】2012年10月11日
【公告号】EP2907082A1, US20150278579, WO2014056537A1

完整全部详细技术资料下载

当前第3页1 2 3