使用概率模型在视觉数据中检测对象的制作方法_2

文档序号:8947489阅读:来源:国知局
示匹配。
[0026] 在进一步实施方式中,概率模型能够引入关于照相机姿态的信息。在这样的实施 方式中,概率值与点对应数目之间的映射能够取决于照相机与对象的相对姿态而不同。
[0027] 图3是依据进一步实施方式的能够由对象识别器102执行的过程。对象识别器 102 (在302处)接收图像110。然后,对象识别器102 (在304处)从图像中提取点特征。
[0028] 针对对象描述符数据库116中的多个对象模型中的每个执行图3的下面任务。针 对相应对象的模型i,(在306处)从图像110中提取的点特征被匹配到对象描述符数据库 116中的模型i中的描述符。针对每个模型i,在306处执行的匹配标识一组点对应。
[0029] 然后,对象识别器102 (在308处)标识该组中的点对应的子集,其中子集中的点 对应是与对象的给定视图相一致的那些点对应。可能存在对应于捕获图像110的照相机的 多个可能相对姿态(姿态能够通过距离和角度定义)的对象的多个可能视图。
[0030] 该组点对应包含针对相应不同视图的点对应是可能的。该组点对应可以含有失 配,从而导致与相应不同视图相一致的点对应的不同子集。在一些实施方式中,在308处标 识的子集是最大子集,其是具有与对象的给定视图相一致的点对应的最大数目的子集。该 最大子集和相关联的给定视图也将提供相对于对象的照相机姿态(例如,距离和角度)。
[0031] 点对应的最大子集的标识能够使用几何一致性程序。假如在306处基于将图像 110匹配到对象描述符数据库116中的模型i来识别该组点对应,则几何一致性技术尝试选 择与对象的单个视图相一致的点对应的最大子集。
[0032] 在一些示例中,几何一致性技术能够是RANSAC (随机采样一致)技术。下面关于 图5来讨论示例RANSAC技术。
[0033] 然后,对象识别器102 (在310处)针对由模型i表示的对象的类型使用相应概率 模型106 (图1)以确定由模型i表示的对象在图像110中是否已经被检测到。如上面指出 的,存在做出该确定的几个替代的技术。在一些实施方式中,对象识别器102能够使用相应 概率模型106以将在308处标识的最大子集中的点对应数目映射为概率值,该概率值然后 能够与概率阈值相比。在概率值超过概率阈值的情况下能够指示匹配。
[0034] 在替代实施方式中,针对模型i,相应概率模型106能够被用来将预定概率阈值映 射到相应数目阈值(在其以上指示匹配的点对应数目)。对象识别器102能够将在308处标 识的最大子集中的点对应数目与对于模型i的数目阈值相比以确定是否存在匹配。在一些 情况下,给定的概率阈值可能通过概率模型不可映射到数目阈值。在这样的情况下,对象在 指定置信度的情况下可以被视为不可检测。
[0035] 如果对象识别器(在312处)确定图像110与由模型i表示的对象之间的匹配在 310处被指示,则过程能够停止。如果匹配不被指示,则图3的过程能够通过更新i (在314 处)进行到对象描述符数据库116中的下一个模型。
[0036] 图4描绘依据一些实施方式的针对对象的特定类型(被称为"训练对象")来建立 概率模型106的示例过程。该过程例如能够被图1的概率模型生成器103执行。能够针对 对象的多个不同类型中的每个来反复图4的过程以建立相应概率模型。
[0037] 在替代实施方式中,取代针对对象的不同类型建立不同概率模型,能够产生一个 概率模型,其中该概率模型能够针对对象的不同类型来执行概率值与点对应的相应数目之 间的不同转换。
[0038] 在图4的过程中,概率模型生成器103 (在400处)接收训练对象。(在402处)提 取训练对象的点特征,并且这样提取的特征被存储在对象描述符数据库116中的训练对象 的模型中。
[0039] 图4的过程也(在404处)生成训练对象的许多模拟视图。模拟视图是对应于照相 机相对于训练对象的不同姿态的视图。例如,透视或仿射翘曲(warp)能够被采用来计算模 拟视图。
[0040] (在406处)从训练对象的模拟视图中的每个提取点特征。针对每个模拟视图提取 的特征然后(在408处)被匹配到对象描述符数据库116中的对象模型。在408处执行的匹 配使用在图3中描绘的对象识别程序的修改形式,如下面进一步解释的。在408处的匹配 的输出产生各种统计,所述各种统计(在410处)被获得。统计的相应收集通过模拟视图中 的每个到对象描述符数据库116中的对象模型的匹配而被输出。如下面进一步讨论的,这 样的统计能够包含平均值和方差值。
[0041] 在408处执行的匹配基于训练对象存在(因为模拟视图是含有训练对象的不同视 图的图像)的地面实况(ground truth)。因此,在410处获得的统计是针对匹配的统计。
[0042] 此外,在图4的过程中提供分离的子流程,其中匹配关于参考图像(在参考图像的 库412中含有)来执行,该参考图像已知不包含训练对象。图4的过程(在414处)从参考 图像中的每个提取点特征。针对每个参考图像,(在416处)将提取的特征匹配到对象描述 符数据库116中的相应对象模型。在416处执行的匹配使用在图3中描绘的对象识别程序 的修改形式,如下面进一步解释的。
[0043] (在418处)获得基于在416处将相应参考图像匹配到对象模型而输出的多个统计 的相应收集。在416处执行的匹配基于如下地面实况:应当不存在到对象描述符数据库116 中的对应对象的匹配。因此,在418处获得的统计是针对不匹配的统计。如下面进一步讨 论的,这样的统计能够包含平均值和方差值。
[0044] 在410和418处获得的统计然后(在420处)被组合以针对训练对象建立概率模型 (下面进一步讨论)。在一些实施方式中,概率模型能够被用来(在422处)从概率阈值确定 数目阈值,其中数目阈值能够被用在图2或3的对象识别程序中。计算的数目阈值然后(在 424处)被存储用于后面使用。
[0045] 在其中图2或3的对象识别程序执行与概率阈值的比较的替代实施方式中,任务 422和424能够被忽略,而任务410、418和420仍然被执行。
[0046] 下面依据一些实施方式讨论在420处建立的示例概率模型。概率模型具有下面随 机变量:M (对象描述符数据库116中的对象的地面实况指数)、0 (对象描述符数据库116 中的对象的经验指数)、以及N (观察到与对象相一致的内点(inlier)数目)。能够为M和N 指定(一个或多个)预定义值以指示没有对象(这样的预定义值的示例能够是一 1或某一其 它值)。
[0047] 内点能够指代图像的点特征与对象的模型的点特征之间的点对应。N能够表示这 样的点对应的数目。更一般地说,内点能够指代图像的特征与对象模型的特征之间的任何 对应(匹配)。
[0048] 地面实况指数M是对象描述符数据库116中的、表示实际在图像中的对象的模型 的标识符。经验指数〇是对象描述符数据库116中的、表示对象识别程序相信该程序正看 到的对象的模型的标识符。
[0049] 在图3中在308处应用的几何一致性程序输出针对0和N的值。概率模型能够 被表示为条件概率^ _:賴,_1汉:^:_,其中概率模型提供照相机实际正看到对象 (Μ = Μ)的概率,给定测量〇 (= m)以及N (= η)。
[0050] 应用贝叶斯定理两次,条件概率夂_f ::零__¥撼能够被导出如下:
通过对M忽略分母中的第一项并且简化,获得下面:
其中
O
[0051] 用于导出条件概率巧M = ⑷=?n( /V = n、)的上面方程的每项下面被描述。
[0052] P(财a m)是针对对象m的先验概率。这在一些示例中能够被假定针对所有对象 相同。先验概率= ??)表达在数据被接收之前关于对象m的概率的不确定性。
[0053] 给定正确观察的对象m,= = ?Ο是得到η个内点的概率。该概率 能够从在图4中在410处获得的对象m的模拟视图的统计来估计。在一些示例中,高斯分 布能够被假定具有由用于从对象的模拟视图进行正确检测的内点的经验平均数目估计的 平均值。方差也能够以这种方式来估计。在其它示例中,方差能够被设定等于平均值。将 方差设定等于平均值是可接受的,因为这是泊松分布的限制。
[0054] 给定上面情况,概率=??Μ) '二m)波导出如下:
其中_|_$是用于对象m的正确匹配的内点的经验平均数目。在该示例中,连 同对应的变量一起是在410处获得的统计。前面方程假定平均值等于方差。
[0055] 剩緣^_凝;:_|是正确观察到对象m的概率。这能够从对象的模拟视图的统计 (在410处获得)中估计。在一些示例中,概率能够仅是成功的检测的分数(换言之,模拟视 图到相应对象模型的
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1