检测和分类使用移动设备采集的视频中对象的系统和方法_5

文档序号:9756939阅读:来源:国知局
作包括:使用移动设备的相机调用自动聚焦操作;使用 相机调用自动闪光操作;以及使用相机调用数据获取操作。
[0167] 在另一些方案中,数据获取可包括采集包括静态图像和数字视频中的一个或多个 的数据。数据可以是或可包括文档的数字展现或多个文档的数字展现。
[0168] 本公开范围内的再一些实施方式可附加地和/或可替代地包括:确定一个或多个 预定标准是否被满足;以及响应于确定一个或多个预定标准被满足而确定采集操作是否对 应于被满足的该一个或多个预定标准而采集数据。例如,一个实施方式可包括确定移动设 备在预定标准被满足的条件下采集数据,该预定标准如,最低的稳定性、恰当的方向角、特 定方向中的最小的移动等,如本领域普通技术人员通过阅读本说明书将理解的。
[0169] 本说明书范围内的示例性方法还可包括响应于确定操作采集对应于被满足的一 个或多个预定标准采集数据而将指示经由移动设备的显示器输出给用户。该指示优选地指 示采集操作对应于被满足的该一个或多个预定标准采集数据。在一个实施方式中,移动设 备可显示边界界限、边界框或围绕移动设备相机视场中描绘的对象的其它叠加形状。
[0170]边界框可基于确定采集操作已完成并且采集的数据在预定标准被满足的条件下 而改变颜色。在一个方案中,移动设备在相机视场中检测到对象之前显示白色边界框;基于 检测到对象但在期望的条件下完成采集操作之前显示黄色边界框;以及基于在期望的条件 下完成采集操作而显示绿色边界框或者基于未能在期望的条件下完成采集操作而显示红 色边界框。
[0171] 以这种方式用户可被有利地通知何时停止尝试经由移动应用的采集接口采集数 据和/或是否有必要重复对相机视场中的任意对象的采集操作。当然,在其它实施方式中, 当相机视场内存在多文档时,显示器可显示多个边界框。
[0172] 在另一个实施方式中,一个或多个边界框可响应于确定在相机视场内的多文档中 的一个或多个是否在近期被采集和/或处理过而改变颜色。例如,在一个方案中,当相机视 场包围许多对象(如文档)时,针对每个对象的期望的采集条件可在不同的时间点或许多不 同的时间点达到。相应地,可能是有益的是:确定视场中的对象何时已根据期望的采集条件 而被采集;以及停止尝试采集某对象而继续尝试采集仍未在期望的采集条件下被采集的其 它对象。类似地,一旦所有对象都已在期望的采集条件下被采集,则提供指示视场中描绘的 所有对象都已根据期望的采集条件被采集以及采集操作可被停止的反馈可能是有用的。
[0173] 在再一个实施方式中,当相机视场包围许多对象(如文档)时,在采集操作的过程 中排除或忽视对象可能是有益的,例如,如果该对象先前已经在适当条件下被采集过或者 如果该对象先前已经通过和/或根据意在待使用当前被采集的数据而执行的处理被处理 过。
[0174] 现在将描述根据许多实施方式的示例性使用案例场景。本领域普通技术人员通过 阅读本说明书将理解,该示例性使用案例被提供用于说明性的目的,而非意在以任何方式 进行限制。其它使用案例完全在本说明书的范围内,并且可包括利用对本文中公开的特征 的以任何方式的任意组合。
[0175] 根据示例性使用案例场景,当前公开的发明构思体现为如图5中所示的方法500所 基本代表的方法。方法500可在本文中公开的任何适当的环境中执行,或者在如本领域普通 技术人员通过阅读本说明书将理解的任何适当的环境中执行。
[0176]如图5中所示,方法500包括操作502,其中经由移动设备调用采集接口。采集接口 包括取景器,优选的是由经由移动设备显示的由目标刻线限定的矩形取景器。
[0177]方法500也包括操作504,其中多个采集的视频数据帧被分析来确定:(1)展示预定 限定特点的对象是否完全地或部分地被描绘在取景器区域中,以及(2)对象是否满足质量 控制标准。限定特点和质量控制标准可包括本文中所描述的任何特征,优选的是以上讨论 的那些特点以及在与图像或对象分类有关的、通过引用并入的相关申请中讨论的那些特 点。特征向量展现数据尤其适合用作"限定特点"。
[0178]根据方法500,以及根据对象是否展示限定特点并满足质量控制标准,在操作506 中采取了一个或多个应答动作。
[0179] 如果前述标准被满足(对象被检测到,质量可接受),则对该检测和/或质量状态的 指示可显示给用户,例如经由设备显示器。优选地,随着图像分析和/或处理的进行,这些指 示以实时或近实时的方式显示。
[0180] 另一方面,如果未检测到对象,或者对象不满足质量控制标准,则对失败的指示可 类似地经由移动设备显示。
[0181] 再另外地,一个或多个图像可在比视频数据帧的分辨率更高的分辨率被采集(以 提供更多和/或更好的原始数据)并且被处理或存储。类似地,在其中对象被描绘在取景器 中并且该对象满足质量控制标准的视频的那些帧可被存档、标记、保存存储到储存器等,如 本领域普通技术人员通过阅读本说明书将理解的。
[0182] 在许多方案中,方法500也可以一个或多个附加的和/或可替代的操作为特征。例 如,在一个方案中,采集的图像和/或视频帧还可被进一步处理。例如,处理可包括:分类图 像和/或帧中描绘的对象;从这些对象中提取数据;实时地追踪视频流中描绘的对象;将相 关信息显示给用户等。
[0183] 此外,在更优选的实施方式中,当前公开的技术完全能够随着视频流被采集而以 近实时的方式同时地执行公开的处理操作中的任一者,并且还能够针对单个视频流(或图 像)内描绘的多对象以实时或近实时的方式同时地执行本文中公开的采集、分析和/或处理 技术。在各种方案中,该并行、实时的功能应被理解为等同地应用到以上参照图5所讨论的 操作。
[0184] 在另一个使用案例说明中,用户在其移动设备上开始移动应用。用户被呈现有选 项来调用可选模块(如"自动帮助"模块或"移动采集向导")以帮助用户采集用于后续处理 的高质量图像数据。用户可与显示在移动设备显示器上的按钮交互来调用可选的例如"自 动帮助"模块或"移动采集向导"。可替代地,模块可被编程地调用或可由用户预先设置,例 如,在移动采集应用的"设置"接口中。在该使用案例中,用户调用移动采集向导。
[0185] 基于调用移动采集向导,接口经由移动设备显示器呈现给用户,该接口包括允许 用户以"照片"模式或"视频"模式选择性地采集的许多按钮。用户与"视频"按钮交互以向移 动应用指示用户希望采集视频流。可替代地,采集模式可被编程地调用或由用户预先设置, 例如在移动采集应用的"设置"接口中。
[0186] 在指示希望采集视频流之后,用户可与相机按钮交互。作为响应,移动采集向导查 询设备加速度计和/或陀螺仪以确定设备方向,以及如果设备没有基本如期望的那样被定 向(例如,对于文件而言平行于平坦、水平的表面,如桌子、地面等;或者平行于竖直表面,如 海报、描绘车辆识别号码的汽车表面等),用户反馈可经由移动设备显示器呈现给用户,例 如以透明屏幕的方式,反馈指示不当的设备方向。用户反馈可覆盖采集接口观察端口,使得 用户不能采集图像直至恰当的设备方向被达成。恰当的设备方向可被编程地确定和/或由 用户在设置接口中预先设置以包括任何设备方向(例如,作为角度)。
[0187] 随着用户将设备方向移动至"期望的方向",移动应用周期地查询设备加速度计 和/或陀螺仪以确定设备的实际方向。在该操作期间,显示有屏上用户反馈以向用户指示设 备方向应当被怎样调节以达到最佳采集方向。
[0188] 一旦方向落入长宽比修正和标准化的预定容差范围内,则透明覆盖页面消失并且 移动应用开始实时地分析从移动设备相机采集的视频数据以检测页面边界。
[0189] 基于检测到页面边界,移动设备再一次可选地周期地检查设备稳定性以及基于根 据预定容差阈值而确定设备足够稳定,附加的用户反馈被提供以指示存在适于采集检测到 的页面的条件。例如,用户反馈可被提供为以围绕被监测的页面边界显示的黄色边界框的 形式。
[0190] 无论可选的第二方向和/或稳定性检测操作是否被执行,基于确定设备是稳定的、 被恰当地定向的以及页面已被检测到,用户反馈都经由移动设备显示器显示以指示存在适 于采集高质量图像数据的条件。移动应用随后自动地进行以采集在采集接口观察端口中描 绘的文档图像。
[0191]移动应用使用设备相机采集并执行自动聚焦操作,并且采集包括有被检测到的页 面的视频帧,该视频帧可以是包括有被检测到的页面的原始视频帧的高分辨率版本(如果 是可用的)。可替代地,包括有其中检测到页面的相对低分辨率原始的视频帧的一个或多个 视频帧可被采集。移动应用实时地显示采集的图像,直接在采集接口中显示或者在完成高 分辨率采集操作之后显示在移动设备显示器上的另一个接口中显示。
[0192] 全图像处理(可包括在以上引用的相关美国专利申请中公开的图像处理操作中的 任一者或全部)被移动应用启动以作为后台的、异步的线程。此外,质量控制程序模块被同 时启动并且屏上指示被给出以作为关于文档照度和/或模糊的反馈。一旦异步后台处理完 成,用已处理的图像刷新(例如,在移动设备显示器上自顶部至底部)显示图象。显著地,图 像处理可使用移动设备的处理器、远程设备(如服务器)的处理器、或其任意组合来执行。
[0193] 移动应用可自动地保存原始的和已处理图像,或者向用户提示关于是否保存原始 的和/或已处理图像的指令,并且保存由用户相应地指示的图像。数据可与主机云或预置系 统同步以用于存储、进一步处理和/或后续的再次使用。
[0194] 在各种实施方式中,保存图像(无论是原始图像还是已处理图像或其任何变型)可 包括保存与任何图像相关元数据结合的文件,该图像相关元数据如全部在一个单一文件 (例如,可印刷的文档格式(PDF)的形式)内的分类结果、提取结果或任何环境元数据(如地 理位置标签、日期/时间戳记等)。这种类型的保存操作可以可选地由用户实时地调用或者 在设置接口中调用。可替代地,图像数据可被保存为与元数据无关。
[0195] 各种实施方式可附加地和/或可替代地包括:经由移动设备显示器显示采集结果 预览;以及响应于采集预览接收用户输入。此外,在至少一个实施方式中,预览描绘经由采 集操作采集的至少一个对象。
[0196] 已通过示例的方式呈现本文中公开的发明构思从而在多个说明性场景、实施方式 和/或实现中说明本发明构思的诸多特征。应理解,一般公开的概念应视作模块化的,并且 可以其任何组合、排列或综合来实施。此外,本领域普通技术人员通过阅读本说明书将理解 的当前公开的特征、功能和概念的任何修改、变化或等同也应视作在本公开范围之内。
[0197] 例如,在诸多说明性方案中,配置为执行逻辑以及执行方法和/或执行包括有配置 为导致处理器执行方法的计算机可读指令的计算机程序产品的方法、系统可包括以下特征 中的任意一个或多个。类似地,各种实施方式可排除以下陈述的特征中的一些或全部。通 常,以下特征可以以本领域普通技术人员通过阅读本说明书将理解的任何适当的方式结 合。
[0198] 再一次地,方法、系统和/或计算机程序产品可包括以下操作的任意组合:
[0199] 经由移动设备调用图像采集接口,采集接口包括展现在移动设备的显示器上的取 景器;以及分析经由采集接口采集的视频数据的多个帧。分析可包括:确定在取景器内是否 描绘有展示一个或多个限定特点的对象;以及如果在取景器内描绘有展示一个或多个限定 特点的对象,则确定在取景器内描绘的对象是否满足一个或多个预定质量控制标准。响应 于确定帧未达到预定质量控制标准中的一个或多个,方法/系统/计算机程序可包括在移动 设备显示器上显示对失败的指示。失败提示优选地识别帧未满足一个或多个质量控制标 准,并且可选地包括基本围绕取景器内的对象的周边的边界界限。响应于确定在取景器内 描绘的对象满足一个或多个预定质量控制标准,方法/系统/计算机程序可包括以下操作中 的一个或多个:显示对于在取景器中描绘的对象展示一个或多个限定特点的指示;自动采 集对象的图像,其中图像由比视频数据的分辨率更高的分辨率表征;以及自动将帧中的一 个或多个存储至储存器,其中在帧中满足预定质量控制标准的对象被描绘在取景器中。优 选地,成功指示器具体地识别对象分类,并且可选地包括基本围绕取景器内的对象的周边 的边界界限。在一些方案中,对象包括具有一个或多个页面的文档,或者具有一个或多个页 面的多文档。方法/系统/计算机程序可包括至少部分地使用移动设备的处理器处理自动采 集的图像和自动存储的帧中的至少一个。处理包括:以实时或近实时的方式追踪在取景器 内描绘的对象;对在取景器内描绘的对象进行分类;和/或从在取景器内描绘的对象中提取 数据。处理可选地关于多文档或多页面(当存在时)中的至少两个被执行;例如追踪、分类 和/或提取可关于另一个文档和/或单个文档的多文档或多页面而同时执行。该同时处理可 优选地在视频数据的多帧上进行。分类可更具体地包括:确定在所述取景器中描绘的对象 的一个或多个限定特点;以及将所述一个或多个确定的限定特点与多个对象分类中的每个 的限定特点作比较。在一些情况下,方法/系统/计算机程序包括:至少部分地基于所
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1