一种物体图像识别方法及其系统的制作方法

文档序号:8259573阅读:443来源:国知局
一种物体图像识别方法及其系统的制作方法
【技术领域】
[0001] 本发明涉及图像处理技术领域,尤其涉及一种物体图像识别方法及其系统。
【背景技术】
[0002] 物体图像识别系统在现今商业和娱乐产业中越发受到青睐。但是,以计算机视角 在视频中进行物体图像识别是存在一定难度的。因为,计算机很难依据给出一系列已知的 包含目标物体的图像,在视频序列中定位和识别目标物体(如给出一个准确的描述)。在实 际生活中,,物体视频识别系统基于其巨大的潜力,已经开始被应用于许多正在快速发展的 领域,包括视频监控,增强现实,自动目标捕捉,医学分析,质量控制以及视频讲座评估。虽 然物体图像识别对于人的大脑而言是非常简单的任务,但对于计算机却是一个重大挑战。 因为目标物体可以在方向,亮度,外观形态以及遮挡情况等方面存在许多不同的出现形式。
[0003] 典型的物体图像识别系统一般至少包括一个物体检测和物体确认模块。不管是检 测还是确认模块,在本领域的现有方法一般包括两个步骤:学习阶段和确认阶段。在学习 阶段,通常会有一个包括了不同物体的数据库作为训练数据。依据物体的类别,提取出那些 具有显著性区别,容易判断的物体特征,并结合一些已经确定的学习框架,生成一个物体模 型。在确认阶段,新给出的物体通过与物体模型的比较,将被确认,归入一个已知的物体类 型。
[0004] 如图1所示,为现有技术中典型的物体图像识别系统。物体检测模块应用于输入 视频序列。然后,物体跟踪和确认模块通过使用一个标已注物体的数据库作为训练数据,对 检测出的物体进行分析。在完成物体追踪和确认后,输出物体标注结果。
[0005] 但是,现有物体确认模块普遍存在的问题是:用作训练的静态数据库中的物体与 被检测视频序列中的物体在方向,明亮程度,外观形态以及遮挡情况等方面有很大的区别, 由此,导致物体确认准确度比较低。由本发明所述的具体实施例来看,视频序列中那些包含 固有的时空信息的视频帧能够很好的用来提取提示信息从而帮助进行物体图像识别。如何 有效的从视频中选择有用的和简洁的信息作为线索帮助进行物体图像识别是一个还没有 得到深入研究的充满挑战性问题。
[0006] 本发明公开的方法及其系统用于解决现有技术中的一个或者多个问题。

【发明内容】

[0007] 本发明的一方面公开了一种物体图像识别方法。所述方法包括:将一段输入视频 分成许多视频片段,每个视频片段都包含一个到多个视频帧。在每个视频片段中检测目标 类型以及相关类型的物体图像。然后,生成一个提示信息,所述提示信息具体为代表输入视 频的视频帧的一个子集。依据所述提示信息进行物体追踪和确认。结合并依据上述追踪和 确认结果输出物体标记结果。
[0008] 本发明另一方面公开了一种物体图像识别系统。所述系统包括:物体检测模块,用 于在每个视频片段中检测目标类型以及相关类型的物体图像。提示信息生成模块,用于生 成具体包括代表输入视频的视频帧的一个子集的提示信息。进一步的,还包括:物体追踪和 确认模块,用于依据所述提示信息进行物体追踪和确认并结合追踪和确认结果。输出模块, 用于依据上述追踪和确认结果输出物体标注结果。
[0009] 本发明的其他方面,所属技术领域技术人员能够依据本发明的权利要求书,说明 书,以及附图有效实施并充分公开。
[0010] 附图简要说明
[0011] 图1为现有的物体图像识别系统的结构框图。
[0012] 图2A为本发明【具体实施方式】中的一个具体工作系统200的示意图。
[0013] 图2B为本发明【具体实施方式】中的一个具体计算系统的示意图。
[0014] 图3为基于提示信息进行物体图像识别的系统的示意图。
[0015] 图4为本发明【具体实施方式】中物体图像识别方法的方法流程图。
[0016]图5为本发明具体实施例中生成提示信息的方法流程图。
【具体实施方式】
[0017] 附图中展示的部分将被引用以具体说明,阐述本发明具体技术实施方案。说明书 中引用的数字代表附图的相应部分。
[0018] 如图2A所示,这是本发明【具体实施方式】中的一个具体工作系统200。所述工作系 统200中包括有:电视机2102,遥控器2104,服务器2106,用户2108,网络系统2110。当然 还可以包括其他合适的设备。
[0019] 电视机2102可以是任何合适类型的电视机,例如等离子电视,LCD电视,背投式电 视,智能电视或者非智能电视。电视机2102还可以包括一个计算系统,例如个人电脑,掌上 电脑或者智能手机等。进一步的,所述电视机2102还可以是任何内容演示的设备,所述设 备由遥控器2104控制,能够在一个到多个频道中演示多个节目。
[0020] 所述遥控器2104可以是任何合适类型的能够遥控操作电视机2102的遥控器,例 如配套的电视遥控器,通用电视遥控器,掌上电脑,智能手机或者其他能够实现遥控功能的 智能设备。遥控器2104还可以包括其他不同类型的设备,例如动作感应遥控设备,图像感 应遥控设备以及其他一些简单输入设备,例如键盘,鼠标,声控输入等。
[0021] 具体的,所述服务器2106可以是任何用于提供个人信息内容给用户2108的一个 或者多个计算机服务器。所述服务器2106还用于帮助在遥控器2104和电视机2102之间 进行通信连接,数据存储和数据处理。电视机2102,遥控器2104以及服务器2106通过网络 系统2110建立通信连接,例如有线网络,手机网络,或者其他具体的网络。
[0022] 用户2108使用遥控器2104控制电视机2102播放不同的节目或者进行其他用户 感兴趣的活动。如果电视机配备有动作感应或者图像感应装置,用户还可以简单的使用手 势动作进行控制。用户2108可以是一个人也可以是多个,例如全部家庭成员在一起观看电 视节目。
[0023] 电视机2102,遥控器2104和/或服务器2106在一个合适的电子计算平台实现其 功能。图2B是本发明【具体实施方式】中的一种可用于实现上述设备2102、2104和/或2106 的功能的计算系统的结构框图
[0024] 如图2B所示,所述计算系统包括一个处理器202,存储器204,播放器206,通信模 块208,数据库214以及外围设备212。所述计算系统可以减省上述设备,也可以添加一些 其他类型的设备,而不限于上述设备。
[0025] 所述处理器202可以是任何合适的处理器或处理器组。具体的,所述处理器202为 能够进行多线程处理的多核心处理器。存储器204可以是任何合适的存储设备,例如R0M, RAM,闪存或者大容量机械式存储设备,例如CD-ROM,硬盘等。存储器204用于存储为进行各 种数据处理而预设的计算机运行程序。
[0026] 所述外围设备212具体包括:各种类型的传感器以及输入,输出设备,例如键盘, 鼠标。通信模块208具体包括:各类网络交互设备,用于在设备间通过网络系统建立连接。 数据库214具体包括一到多个用于存储不同数据以及对数据进行一些处理,例如搜索数据 的数据库。
[0027] 电视机2102,遥控器2104和/或服务器2106可以成为一个物体图像识别系统,用 于为用户108识别物体。图3展示了本发明【具体实施方式】中基于提示信息进行物体图像识 别的系统。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1