跟踪器辅助的图像捕获的制作方法_4

文档序号:9510191阅读:来源:国知局
。可以在整个边界框中 将网格上的点均匀地隔开。此外,可以在两个图像(例如,先前的视频帧(N-I) 222和当前 的视频帧(N) 224)之间的网格上跟踪406所述点。在一个实例中,通过卢卡斯-卡纳德 (Lucas-Kanade)跟踪器来跟踪所述点,所述跟踪器生成图像之间的稀疏运动流。电子装置 102可以估计408两个图像(例如,先前的视频帧(N-I) 222和当前的视频帧(N) 224)之间 的跟踪误差。估计408跟踪误差可包含为跟踪点中的每个点指定误差值。此外,估计408 跟踪误差可使用多种方法来执行,包含例如向前-向后误差、归一化互相关(NCC)以及方差 和。可使用所估计的跟踪误差来获得跟踪置信度值228并且最终确定目标对象在当前的视 频帧(N) 224中的可能性。在一种配置中,可通过计算当前的视频帧(N) 224和先前的视频 帧(N-l)222中的跟踪窗之间的归一化互相关(NCC)来获得跟踪置信度值228。跟踪误差还 可以使用另外的技术来估计,包含下文结合图5更详细地描述的向前-向后误差估计。此 外,电子装置102可以过滤掉410范围之外的点预测。例如,所述电子装置可过滤掉50%的 最差预测。剩余的预测可用于估计边界框的位移。
[0076] 电子装置102可更新412边界框。可执行更新412边界框,使得更新的边界框变 成用于下一个视频帧的新边界框。随后可针对下一个视频帧重复基于运动的跟踪过程,或 者如果跟踪置信度值228小于或等于跟踪阈值250,那么可针对下一个视频帧停止基于运 动的跟踪过程,直到可准确地跟踪目标对象。在一些配置中,其中针对当前的视频帧(N) 224 的基于运动的跟踪未提供令人满意的结果,电子装置102可对当前的视频帧(N) 224执行对 象检测以便在定位目标对象方面获得更高的置信度水平。在一些配置中,其中基于运动的 跟踪不能提供令人满意的结果(例如,当目标对象移出视频帧的范围时),可针对任何后续 的视频帧执行对象检测,直到检测到目标对象。
[0077] 图5是示出用于基于向前-向后误差来估计基于运动的跟踪中的跟踪误差的方法 500的流程图。方法500可以通过电子装置102(例如对象跟踪和检测模块104)来实现。 在一些配置中,电子装置102可计算所跟踪的窗之间的归一化互相关(NCC)。归一化互相关 (NCC)可用于确定跟踪置信度值228。电子装置102还可使用互补于归一化互相关(NCC) 的各种跟踪误差估计技术(例如,向前-向后误差、方差和)。在使用向前-向后误差估计 的实例中,电子装置102可在先前的视频帧(N-l)222与当前的视频帧(N) 224之间执行502 向前跟踪以便确定向前轨迹。向前跟踪可包含向前跟踪图像达k个步骤。所得的向前轨迹 可等于(\,^+1,...,\+14),其中\是时间上的点位置并且1^指示图像序列的长度。电子装 置102可以在当前的视频帧(N) 224与先前的视频帧(N-I) 222之间执行504向后跟踪,以 便确定向后轨迹。所得的向后轨迹可等于(々士+1,…乂+4,其中%+# =々+/l-s
[0078] 电子装置102可确定506向前轨迹与向后轨迹之间的向前-向后误差。向前-向 后误差可被限定为向前轨迹与向后轨迹之间的距离。此外,可限定各种距离以用于轨迹比 较。在一种配置中,可以在确定向前-向后误差时使用验证轨迹的初始点与终点之间的欧 几里得(Euclidean)距离。在一种配置中,向前-向后误差可以被用作跟踪误差,所述跟踪 误差可用于确定跟踪置信度值228。
[0079] 图6是示出用于执行对象检测的方法600的流程图。方法600可以通过电子装 置102 (例如对象跟踪和检测模块104)来实现。电子装置102可以通过搜索当前的视频帧 (N) 224中的窗位置和大小的子集来对当前的视频帧(N) 224执行602对象检测和基于运动 的跟踪。
[0080] 电子设备102可以确定604检测和跟踪置信度值256。检测和跟踪置信度值256 可以提供在当前的视频帧(N)224中或在特定窗内发现目标对象的置信度水平。电子装置 102还可确定606检测和置信度值256是否大于检测和跟踪阈值254。如果检测和置信度 值256大于检测和跟踪阈值254,那么电子装置102可以使用下一个视频帧中的窗和大小的 子集来对下一个视频帧执行608对象检测。可替代地,如果检测和置信度值256小于检测 和跟踪阈值254,那么电子装置102可以使用下一个视频帧中的窗位置和大小的子集来对 下一个视频帧执行610对象检测。在一些配置中,其中置信度值256小于检测和跟踪阈值 254,那么电子装置102可以使用下一个视频帧的整个搜索空间和/或所有窗来对下一个视 频帧执行610对象检测。
[0081] 图7是示出可以与本发明的系统和方法一起使用的具有不同窗大小766的图像窗 700的框图。具体地说,图7示出一组十个可能的窗大小766a-j。每个窗大小766可对应 于尺度水平(例如,1-10)。尽管本文中被示出为矩形,但所搜索的窗可以是任何形状,例如 正方形、矩形、圆形、椭圆形、用户定义的等。此外,任何数量的窗大小766或尺度水平可为 可用的,例如5、15、20、30个等。
[0082] 如上所述,搜索范围可以由用于特定位置的窗大小的子集表示,例如在当前视频 帧(N) 224中搜索到的窗大小可以被限制于类似于与当前帧中的目标对象相关联的窗位置 和窗大小的那些。例如,在不具有反馈的情况下,对象检测器208可搜索所有十个窗大小 766a-j以便查找每个选择的窗位置。然而,如果使用具有第五个窗大小766e的窗在最近的 (非当前的)视频帧中检测到对象,那么扫描器定标器236可以仅选择用于当前所捕获的 帧的为5加或减3的窗大小,即窗大小2-8。换句话说,可以基于来自最近或先前的视频帧 (N-I) 222的反馈来搜索具有第一窗大小766a、第九窗大小766i和第十窗大小766j的窗。 这可进一步消除低概率搜索并且提高对象检测的效率。换句话说,使用来自最近的视频帧 的反馈可以帮助减少所执行的计算。可替代地,如果最近的视频帧未检测到目标对象(即, 用于最近捕获的帧的检测和跟踪置信度值256小于检测和跟踪阈值254),那么对象检测器 208可以不使用大小水平的子集来限制搜索范围。
[0083] 图8是示出对象跟踪和检测模块804的另一种可能配置的框图。图8中所示的对 象跟踪和检测模块804可包含与图2中所示的对象跟踪和检测模块204类似的模块并且执 行类似的功能。具体地说,图8中所示的对象检测器808、运动跟踪器806、扫描定位器830、 窗位置选择器832、随机化发生器834、扫描器定标器836、分类器838、融合模块860、存储器 缓冲器810、所捕获的先前视频帧812、窗842、位置844、大小846、二进制决策848、跟踪阈 值850、检测阈值852、检测和跟踪阈值854、检测置信度值840、跟踪置信度值828以及检测 和跟踪置信度值856可对应于图2中所示的对象检测器208、运动跟踪器206、扫描定位器 230、窗位置选择器232、随机化发生器234、扫描器定标器236、分类器238、融合模块260、存 储器缓冲器210、所捕获的先前视频帧212、窗242、位置244、大小246、二进制决策248、跟 踪阈值250、检测阈值252、检测和跟踪阈值254、检测置信度值240、跟踪置信度值228以及 检测和跟踪置信度值256并且具有与它们类似的功能。
[0084] 另外,对象跟踪和检测模块804可包含平滑模块861,其用于降低由于目标运动和 跟踪误差造成的抖动影响。换句话说,平滑模块861使跟踪结果平滑,从而致使搜索窗在位 置(x,y)844和大小(宽度、高度)846两者中具有较平滑的轨迹。平滑模块861可以是简 单移动平均线(M)滤波器或自回归(AR)滤波器。针对位置844和大小846的平滑度可不 同。预测滤波器,诸如卡尔曼(Kalman)滤波器也可适用于位置844平滑。因此,平滑模块 861可接收未平滑位置863和未平滑大小865作为输入并且输出平滑位置867和平滑大小 869 〇
[0085] 图9是示出平滑模块961的框图。平滑模块961可用于降低由于目标运动和跟踪 误差造成的抖动影响,即,因此跟踪结果(边界框)在位(x,y)置和大小(宽度、高度)中 具有较平滑的轨迹。在一种配置中,位置平滑滤波器971和大小平滑滤波器973使用用于 接收未平滑位置963和未平滑大小965作为输入并且输出平滑位置967和平滑大小969的 自回归(AR)模块来实现。
[0086] 在自回归(AR)模块中,假定X是待平滑的变量,即位置或大小。此外,令X'为由 对象跟踪器实现的X的输出。在这种配置中,在时间t处X的平滑滤波X t可根据等式(1) 进行描述:
[0087] Xt=ff*X' t+(I-W)^Xtl (1)
[0088] 其中是X'在时间t处X的跟踪器输出,X t屬在时间t-1处X的平滑结果,并且 ¥(0〈 = 1〈=1)是控制平滑效果的平滑加权。例如4\可以是针对当前视频帧(吣224所 选择的窗位置或窗大小并且Xt i可以是用于先前的视频帧(N-I) 222的窗位置或窗大小。
[0089] 可以针对位置平滑滤波器971和大小平滑滤波器973使用不同的平滑加权W。例 如,在一种实现方式中,W fts= 0. 8并且W#、= 0. 4,使得对窗位置具有较小的平滑作用而对 窗大小具有较强的平滑作用。平滑加权的选择将产生较小的跟踪延迟和较小的抖动两者。
[0090] 此外,当检测和跟踪置信度值856低于特定阈值(例如,检测和跟踪阈值854)时, 也可以减小平滑加权的选择。当潜在的跟踪或检测误差较高时,这可能导致更强的滤波。例 如,响应于低的跟踪置信度(例如,检测和跟踪置信度值856低于检测和跟踪阈值854),用 于位置和大小的平滑加权可分别设定为Wfti = 0. 65并且W#、= 0. 2。换句话说,可以减小 所述加权中的一或两个,这可能导致相较于当前视频帧的那些,窗位置和大小的选择更严 重地依赖于先前视频帧的窗位置和大小。
[0091] 此外,加权可基于跟踪置信度值828或检测置信度值840而非检测和跟踪置信度 值856。例如,平滑加权W fts和Wm、可响应于跟踪置信度值828低于跟踪阈值850而减小, 即,可响应于差的运动跟踪而使用更强的滤波。可替代地,平滑加权可响应于检测置信度值 840低于检测阈值852而减小,即,可响应于差的对象检测而使用更强的滤波。
[0092] 在另一种配置中,可以使用卡尔曼滤波器来使窗位置平滑。在这种配置中,滤波可 根据等式(2)-(7)进行限定:
[0093] Xk= F kxk !+Wk (2)
[0094] Zk= Hx k !+vk (3)
[0095] 其中Xk屬在时间k_l处的先前状态,X k是由xk = [x. y,x, y]限定的当前状态,其 中(x,y)是边界框中心位置,(? B是每个方向上的速度。此外,状态过渡模型FjP观测模 型H可以分别由等式(4)-(5)限定:
[0098] 其中At是可调谐的参数。另外,Wk是过程噪声,其假定为根据等式(6)从具有 协方差Q(即,wk~N(0, Q))的零均值多元正态分布得出:
[0100] 其中〇 1是可调谐的参数。另外,wk是观察噪声,其假定为根据等式(7)从具有协 方差R(即,vk~N(0, R))的零均值高斯白噪声得出:
[0102] 其中〇2是可调谐的参数。
[0103] 图10是示出用于使运动跟踪结果中的抖动平滑的方法1000的流程图。方法1000 可由电子装置102、例如电子装置102中的对象跟踪和检测模块804执行。电子装置102可 以确定1002与当前的视频帧224相关联的一或多个窗位置以及一或多个窗大小,例如,未 平滑位置863以及未平滑大小865。电子装置102还可滤波1004 -或多个窗位置以及一或 多个窗大小以便产生一或多个平滑的窗位置867以及一或多个平滑的窗大小869。例如,这 可包含使用移动平动滤波器、自动回归滤波器、或卡尔曼滤波器。在一个配置中,响应低跟 踪置信度(例如,检测和跟踪置信度值856低于检测和跟踪阈值854),用于位置和大小的平 滑加权可以减小。可替代地,
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1