跟踪器辅助的图像捕获的制作方法_2

文档序号:9510191阅读:来源:国知局
,而剩余的预测被用来估计整个边界框的位移。运动跟踪器106可对由电子装置102 捕获的每个视频帧执行基于运动的跟踪。在类似的方法中,可通过以下步骤来执行基于运 动的跟踪:计算一或多个梯度(例如,X和y梯度)并且使用一对帧之间的差异来计算时间 梯度,并且使用所述多个梯度值来准确地跟踪当前视频帧内的目标对象。下文提供关于基 于运动的跟踪的其它细节。
[0044] 当执行基于运动的跟踪时,运动跟踪器106可基于所计算或所估计的运动跟踪方 法的准确度来确定跟踪置信度值。在一些配置中,跟踪置信度值可以是在〇与1之间的实 数,其对应于目标对象落在当前视频帧或所述视频帧的限定窗内的可能性或概率。可以将 跟踪置信度值与跟踪阈值进行比较。如果跟踪置信度值大于跟踪阈值,那么在当前视频帧 内发现目标对象的可能性可能较高。可替代地,如果跟踪置信度值小于或等于跟踪阈值,那 么在当前视频帧内发现目标对象的可能性可能较低或是不确定的。可使用用于确定跟踪置 信度值的各种方法。在一种配置中,通过计算当前视频帧中的跟踪窗(例如,跟踪补丁窗) 与来自先前捕获的视频帧的先前存储的图像补丁之间的归一化互相关(NCC)来确定跟踪 置信度值。下文提供关于确定跟踪置信度值的其它细节。
[0045] 电子装置102还可执行对象检测。可使用各种方法执行对象检测。在一种配置 中,使用滑动窗法执行对象检测,在所述方法中,观察视频帧内的多个窗子集的内容以确定 目标对象是否在当前的视频帧中或在当前的视频帧的特定窗或窗子集内。可在视频帧中搜 索所有可能的窗位置和大小的全部或子集。例如,每个窗可对应于数据像素并且对象检测 器108可使用所述数据像素执行一或多个计算,以便确定目标对象处于特定窗或子窗内的 置信度水平(例如,二进制指示符)。基于与一或多个窗相关联的置信度水平,可获得针对 当前的视频帧的检测器置信度值。此外,另外的技术可用于增加对象检测的准确度或效率。 下文解释这些技术中的一些。
[0046] 在一种配置中,运动跟踪器106和对象检测器108可顺序操作而不是并行操作。例 如,电子装置102可执行对所选择对象(例如,目标对象)的基于运动的跟踪并且基于跟踪 到的参数顺序地执行对所选择对象的对象检测。在一种配置中,电子装置102可对当前的 视频帧执行基于运动的跟踪。电子装置102随后可基于跟踪到的参数对当前帧执行对象检 测。在一种配置中,跟踪到的参数可基于置信度值与阈值之间的比较。例如,如果跟踪置信 度值低于跟踪阈值,那么电子装置102可执行对象检测。或者,如果跟踪置信度值高于跟踪 阈值,那么电子装置102可跳过针对当前的视频帧的对象检测并且基于当前的视频帧的运 动跟踪结果继续针对下一视频帧执行基于运动的跟踪。换句话说,只有当基于运动的跟踪 不是很好时,例如,跟踪置信度值低于跟踪阈值,可执行对象检测。当考虑是否执行对象检 测和/或如何执行对象检测时,可使用其它跟踪到的参数。跟踪到的参数的实例可包含目 标对象区域、窗位置、窗大小、尺度水平、目标大小、跟踪和/或检测置信度值或可用来促进 目标对象的有效跟踪和/或检测的其它参数。
[0047] 顺序地执行基于运动的跟踪和基于跟踪到的参数的对象检测可使得电子装置102 能够在不执行大量计算的情况下跟踪和/或检测视频帧内的目标对象。具体地说,因为基 于运动的跟踪的计算强度可能低于对象检测,所以电子装置102在基于运动的跟踪可用来 准确地跟踪当前的视频帧内的目标对象的情况下可跳过执行对象检测。例如,如果电子装 置102确定跟踪置信度值超过特定的目标阈值,那么电子装置102可确定不需要对当前的 视频帧的对象检测来准确地确定目标对象在当前的视频帧内的位置或存在。此外,因为对 象检测在许多情况下可为有益的,所以电子装置102可确定对象检测可用来更准确地检测 目标对象的情况或确定在基于与跟踪阈值的比较的基于运动的跟踪是不充分的情况下执 行对象检测。
[0048] 在一些配置中,不是跳过对当前的视频帧的对象检测,而是基于运动的跟踪结果 和/或由存储器缓冲器110提供的另外信息可用来缩减或调整执行对象检测的过程。例如, 在使用基于运动的跟踪方法不能准确地跟踪目标对象的情况下,电子装置102仍可估计或 获得关于位置、窗尺度或与目标对象相关联的其它跟踪到的参数的信息,从而可在对象检 测期间比在不具有通过基于运动的跟踪提供的参数的情况下使用更少的计算能力来更准 确地检测对象。因此,即使是在基于运动的跟踪不提供超过跟踪阈值的跟踪置信度值的情 况下,当顺序地执行对象检测时也可使用基于运动的跟踪结果。
[0049] 电子装置102上的取景器131可包含第一跟踪区域133和第二跟踪区域135。第 一跟踪区域133和第二跟踪区域135两者均可由用户使用触摸屏116来指定。例如,用户 可在触摸屏116上将聚焦环拖曳到第一跟踪区域133和第二跟踪区域135的期望位置。尽 管不需要,但跟踪区域中的一个可以是固定的。例如,第一跟踪区域133可跟随行走的人, 并且第二跟踪区域135可覆盖固定的树。在一种配置中,第二跟踪区域135可覆盖电子装 置102上的整个触摸屏116。
[0050] 电子装置102可包含图片处理模块137。图片处理模块137可提供不同类型的图 片处理,如拍照或编辑预录的视频。图片处理模块137可包含重叠143。重叠143可反映第 一跟踪区域133与第二跟踪区域135之间的重叠量。例如,如果第一跟踪区域133和第二 跟踪区域135完全不重叠,那么重叠143可以是0%。同样,如果第一跟踪区域133与第二 跟踪区域135完全重叠(或如果第二跟踪区域135与第一跟踪区域133完全重叠,这取决 于哪个跟踪区域更大),那么重叠143可以是100%。
[0051] 图片处理模块137可包含阈值145。重叠143可与阈值145进行比较以确定是否 应该执行图片处理。例如,当重叠143变得大于阈值145时,可拍摄照片149。作为另一个 实例,当重叠143变得小于阈值145时,可拍摄照片149。作为又一个实例,当重叠143变得 大于或小于阈值145时,可执行视频编辑。在视频编辑的一个实例中,可编辑未编辑的视频 序列147中的帧以获得编辑过的视频序列151。
[0052] 图2A是示出对象跟踪和检测模块204的框图。对象跟踪和检测模块204可在电 子或无线装置内实施。对象跟踪和检测模块204可包含运动跟踪器206,所述运动跟踪器 206具有光流模块226和跟踪置信度值228。对象跟踪和检测模块204还可包含对象检测 器208,所述对象检测器208具有扫描器定位器230、扫描器定标器236、分类器238和检测 置信度值240。存储器缓冲器210可存储与所捕获的先前的视频帧212相关联的数据,所述 数据可被提供到运动跟踪器206和对象检测器208。对象跟踪和检测模块204、运动跟踪器 206、对象检测器208和存储器缓冲器210可以是以上结合图1所述的具有对象跟踪和检测 模块104、运动跟踪器106、对象检测器108和存储器缓冲器110的配置。
[0053] 运动跟踪器206可用来执行对当前的视频帧(N) 224的基于运动的跟踪。例如,可 (例如,通过电子装置102)接收先前的视频帧(N-I) 222和当前的视频帧(N) 224。先前的 视频帧(N-l)222在视频帧的序列中可紧接在当前的视频帧(N) 224之前。可获得另外的视 频帧并且通过对象跟踪和检测模块204来处理所述视频帧。可将先前的视频帧(N-I) 222 提供到运动跟踪器206。此外,存储器缓冲器210可存储与先前的视频帧(N-I) 222相关联 的数据,本文被称为所捕获的先前的视频帧212。在一些配置中,存储器缓冲器210可直接 从电子装置102 (例如,从摄像机)获得关于先前的视频帧(N-I) 222的信息。存储器缓冲 器210还可从融合模块260获得关于先前的视频帧(N-I) 222的跟踪结果,所述跟踪结果 可指定在先前的视频帧(N-I) 222中的何处跟踪和/或检测对象。可将关于先前的视频帧 (N-I) 222或其它先前所捕获的视频帧的这种信息存储在存储器缓冲器210中。
[0054] 运动跟踪器206可顺序地接收在视频帧的序列中的当前的视频帧(N)224。运动跟 踪器206可(例如,使用由存储器缓冲器210提供的信息)将当前的视频帧(N) 224与先前 的视频帧(N-I) 222进行比较。运动跟踪器206使用光流模块226来跟踪对象在当前的视频 帧(N) 224上的运动。光流模块226可包含用于执行对当前的视频帧(N) 224上的对象的基 于运动的跟踪的硬件和/或软件。通过将先前的视频帧(N-I) 222与当前的视频帧(N) 224 进行比较,运动跟踪器206可确定与目标对象处于当前的视频帧(N) 224中的可能性相关联 的跟踪置信度值228。在一个实例中,跟踪置信度值228是基于目标对象处于当前的视频 帧(N) 224内或当前的视频帧(N) 224内的窗内的确定性百分比的实数(例如,在0与1之 间)。
[0055] 对象检测器208可用来检测当前的视频帧(N)224上的对象。例如,对象检测器 208可接收在视频帧的序列中的当前的视频帧(N) 224。对象检测器208可基于跟踪到的参 数对当前的视频帧(N)224执行对象检测。跟踪到的参数可包含对应于目标对象被正确地 跟踪的可能性的跟踪置信度值228。更具体地说,跟踪到的参数可包含跟踪置信度值228与 跟踪阈值250的比较。跟踪到的参数还可包含由存储器缓冲器210提供的信息。跟踪到的 参数在检测对象时可使用的一些实例包含区域、窗位置、窗大小或在执行对象检测时可由 对象检测器208用作参数的其它信息。
[0056] 对象检测器208可包含扫描器定位器230。扫描器定位器230可包含窗位置选择 器232和随机化发生器234。窗位置选择器232可选择视频帧内的多个窗。例如,视频帧 可包含多个窗,每个具有相关联的位置和大小。在一种配置中,每个视频帧被分成多个(例 如,近似10, 〇〇〇)重叠窗,每个包含视频帧中的总像素的一部分。或者,可存在任何合适数 量的窗并且其可不重叠。扫描器定位器230内的窗位置选择器232可选择窗位置,在所述窗 中试图识别目标对象。随机化发生器234可随机选择具有不同大小和位置的窗以用于检测 对象。在一些配置中,随机化发生器234随机选择视频帧内的窗。或者,随机化发生器234 可基于一或多个因素更精确地选择窗。例如,随机化发生器234可基于区域、大小或对象最 可能定位的一般位置来限制窗的选择。这种信息可通过存储器缓冲器210获得或可通过基 于运动的跟踪获得,所述信息虽然不是足够准确能够完全依赖的,但可提供在执行对象检 测时有用的信息。因此,虽然随机化发生器234可随机选择多个窗来搜索,但是窗的选择可 基于提供到对象检测器208的信息变窄并且因此不是完全随机的。
[0057] 对象检测器208还可包含扫描器定标器236,所述扫描器定标器236可用来绘制或 选择具有某一大小的窗。窗大小可由扫描器定标器230用来使窗大小在检测对象或将窗的 选择与原始图像进行比较以便检测图像是否处于特定窗内时变窄。当限定对象时,扫描器 定标器236可初始选择具有某些大小或尺度水平的一或多个窗或者基于从存储器缓冲器 210提供的信息来绘制具有某些大小或尺度水平的一或多个窗。
[0058] 分类器238可用来确定是否在特定窗内发现目标对象的一些或全部。在一些配置 中,分类器238可针对每个窗产生二进制值,以便指示是否在特定窗或子窗内检测到目标 对象。可针对对象检测器208搜索到的每个窗执行这种分类(例如,二进制分类)。具体地 说,分类器238可生成用于每个窗二进制1,在所述二进制中对象被检测到;和用于每个窗 的二进制0,在所述二进制中对象未被检测到。基于数字或1和0的组合,对象检测器208可 确定检测置信度值240,所述检测置信度值240指示目标对象存在于当前的视频帧(N) 224 内的可能性。在一些配置中,检测置信度值240是在0与1之间的实数,其指示对象已被准 确检测到的百分比或概率。
[0059] 对象检测器208可根据各种跟踪到的参数执行对象检测,所述参数包含区域、目 标大小、窗大小、尺度水平、窗位置和一或多个置信度值。一旦视频帧的窗或窗子集被搜索 并且对象检测器208获得用于每个搜索过的窗的二进制值,对象检测
...
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1