用于在图像中检测物体的方法、装置以及电子设备的制造方法

文档序号:9581991阅读:390来源:国知局
用于在图像中检测物体的方法、装置以及电子设备的制造方法
【技术领域】
[0001] 本发明实施方式涉及计算机视觉领域,具体而言,涉及一种用于在图像中检测物 体的方法、装置W及电子设备。
【背景技术】
[0002] 随着移动设备的普及,移动交互和服务正在促进移动解决方案和移动用户界面的 计算机视觉的更广泛使用。例如,手势跟踪与识别正在成为可穿戴设备的重要交互推动者。
[0003] 然而,与人类视觉相比,计算机视觉的效率仍然很低,其还不能满足许多实际移动 使用情况的需要。其原因主要在于W下两个方面:
[0004] (1)物体检测非常耗时。与人类视觉总是可WW并行方式搜索视野中的物体不同, 大多数现有计算机视觉是W遍历方式搜索物体。该遍历方式因为待检测物体的大小和方向 都是未知的所W常采用穷举搜索。
[0005] (2)目标识别是不稳定的并且识别错误经常发生。因为待检测物体的大小和方向 通常都是未知的,所W如果该物体的模型刚好将物体漏检则不能正确识别物体。
[0006] 由此可见,一方面,大量穷举搜索中很多计算是兀余的,采用穷举搜索非常耗时。 另一方面,虽然用不同尺度和方向训练了很多模型,但是总有一些尺度和方向不能被覆盖, 送使得在穷举搜索中将一些物体漏检。

【发明内容】

[0007] 为了克服现有技术中的上述问题,本发明实施方式旨在提供一种用于在图像中检 测物体的方法、装置W及电子设备。
[0008] 根据本发明的一个方面,提供一种用于在图像中检测物体的方法。所述方法包括: 将第一滑动窗口定位到所述图像中的起始采样点处;重复W下步骤;根据所述第一滑动窗 口中的像素点对所述物体的预定特征的匹配程度,计算响应值;依赖于所述响应值,按照预 定滑动方向确定所述图像中的下一采样点的位置;将所述第一滑动窗口定位到所述下一采 样点处;直至完成对所述图像的遍历,从而获得包括所述第一滑动窗口定位过的采样点的 第一组采样点;W及根据所述第一组采样点及其相应的响应值,检测所述物体的位置。根据 本发明的送一方面的实施方式还包括相应的计算机程序产品和电子设备。
[0009] 根据本发明的另一个方面,提供一种用于在图像中检测物体的装置。所述装置包 括:起始采样点定位单元,用于将第一滑动窗口定位到所述图像中的起始采样点处;重复 执行单元,用于重复执行W下单元:响应值计算单元,用于根据所述第一滑动窗口中的像素 点对所述物体的预定特征的匹配程度,计算响应值;下一采样点位置确定单元,用于依赖于 所述响应值,按照预定滑动方向确定所述图像中的下一采样点的位置;下一采样点定位单 元,用于将所述第一滑动窗口定位到所述下一采样点处;直至完成对所述图像的遍历,从而 获得包括所述第一滑动窗口定位过的采样点的第一组采样点;W及物体位置确定单元,用 于根据所述第一组采样点及其相应的响应值,检测所述物体的位置。
[0010] 通过下文描述将会理解,根据本发明实施方式,通过引入自适应搜索,即,依赖于 响应值从而确定该图像中的下一采样点的位置,能够聚焦于较大概率存在物体的区域,避 免对不存在该物体的区域的兀余计算,从而能够有效缩短图像搜索的时间,提高计算机视 觉的效率。
【附图说明】
[0011] 通过参考附图阅读下文的详细描述,本发明实施方式的上述W及其他目的、特征 和优点将变得易于理解。在附图中,W示例性而非限制性的方式示出了本发明的若干实施 方式,其中:
[0012] 图1是本发明实施方式可实现于其中的电子设备的示意图;
[0013] 图2是根据本发明实施方式的用于在图像中检测物体的方法的流程图;
[0014] 图3是根据本发明实施方式的依赖于响应值从而确定该图像中的下一采样点的 位置的示意图;
[0015] 图4是根据本发明实施方式的通过不同数目的滑动窗口来覆盖物体的预定尺度 范围的第一示意图;
[0016] 图5是根据本发明实施方式的通过不同数目的滑动窗口来覆盖物体的预定尺度 范围的第二示意图;
[0017] 图6是根据本发明实施方式的通过不同数目的滑动窗口来覆盖物体的预定尺度 范围的第H示意图;
[0018] 图7是根据本发明实施方式的对于给定响应值VO的通过最少数目的滑动窗口来 覆盖物体的预定尺度范围的示意图;
[0019] 图8是根据本发明实施方式的对于给定响应值VO=0. 5的具有9个滑动窗口的 具体实例的示意图;
[0020] 图9是根据本发明实施方式的在80X80像素点的滑动窗口接近相同大小的物体 时响应值等于0. 5的位置分布的示意图;
[0021] 图10是根据本发明实施方式的插入中间滑动窗口的示意图;
[0022] 图11是根据本发明实施方式的用于在图像中检测物体的装置的示意图。
[0023] 在各个附图中,相同或对应的标号表示相同或对应的部分。
【具体实施方式】
[0024] 下面将参考附图中示出的若干示例性实施方式来描述本发明的原理和精神。应当 理解,描述送些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明, 而并非W任何方式限制本发明的范围。
[00巧]正如上文概述W及下面将要详细讨论的,本发明实施方式提供了一种用于在图像 中检测物体的方法。其中,所使用的术语"图像"既包括例如照片的静态图像,也包括例如照 相机取景框中的动态图像。并且其中,所使用的术语"物体"既可W包括例如汽车的具有特 定颜色、特定形状的物体,也可W包括例如人脸的具有非特定颜色、非特定形状的物体。W 及其中,该物体(如果有)可W位于该图像中的任何位置。
[0026] 首先参考图1,其示出了本发明实施方式可实现于其中的电子设备100的示意图。 根据本发明实施方式,电子设备100可W是移动电话之类的便携式电子设备。然而,应当理 解,送仅仅是示例性和非限制性的。其他的用户设备类型也可W容易地采取本发明实施方 式,诸如个人数字助理(PDA)、寻呼机、移动计算机、移动TV、游戏装置、膝上式计算机、照相 机、视频照相机、GI^设备和其他类型的语音和文本通信系统。
[0027] 电子设备100可W具有通信功能。为此,如图1所示,电子设备100可W包括一个 或多个可操作与发射器114和接收器116通信的天线112。电子设备100还包括至少一个处 理器控制器120。应当理解,控制器120包括实现电子设备100的所有功能所需要的电路。 例如,控制器120可W包括数字信号处理器设备、微处理器设备、A/D转换器、D/A转换器W 及其他支持电路。电子设备100的控制和信号处理功能根据送些设备各自的能力分配。电 子设备100还可W包括用户接口,例如可W包括振铃器122、扬声器124、扩音器126、显示器 或取景器128W及小键盘130,所有W上设备都禪合至控制器120。
[0028] 特别地,电子设备100包括用于捕获静态图像和/或动态图像的相机136、摄像头 或类似的图像获取装置。电子设备也可W只有另外一个相机、摄像头或类似的图像获取装 置。
[002引另夕F,电子设备100还包括电池134,诸如振动电池组,用于向操作电子设备100所 需要的各种电路供电,并且备选地提供机械振动作为可检测的输出。电子设备100还包括 用户识别模块扣IM) 138。UIM138通常是具有内置的处理器的存储器设备。UIM138可W 例如包括订户识别模块(SIM)、通用集成电路卡扣ICC)、通用用户识别模块扣SIM)或可移 动用户识别模块(R-UIM)等等。UIM138可W包括根据本发明实施方式的卡连接检测装置。
[0030] 电子设备100还包括存储设备。例如,电子设备100可W包括易失性存储器140, 例如,包括高速缓存区域中的用于临时存储数据的易失性随机存取存储器(RAM)。电子设 备100还可W包括其他的可W是嵌入的或可移动的非易失性存储器142。非易失性存储器 142可W附加地或备选地例如包括EEPROM和闪存等。存储器可W存储多个信息片段中的任 意项和电子设备100使用的数据程序等,W便实现电子设备100的功能,例如后文参照图2 至图11中的一个或多个来举例说明的功能。
[0031] 应当理解,图1中的结构框图仅仅示出用于说明目的,并非旨在限制本发明的范 围。在某些情况下,某些组件可W按照具体需要而增加或者减少。
[0032] 图2是根据本发明实施方式的用于在图像中检测物体的方法200的流程图。可W 理解,方法200可W由上文参考图1描述的电子设备100执行,例如由控制器120来执行。 为讨论方便,在下文描述中将参考图1所示的电子设备1
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1