利用可变场照明设备的对象检测和跟踪的制作方法_2

文档序号:8449256阅读:来源:国知局
相似于相机的视场)。有用的布置还可以包括用于不同范围的短角和宽角照明器。光源通常是漫射的而非镜面点光源;例如,具有光扩展密封的封装LED是合适的。
[0037]操作中,相机102、104朝着关心的区域112定向,在该区域中可以存在关心的对象114 (在这一不例中,为人手)和一个或者多个背景对象116。光源108、110被布置为照射区域112。在一些实施例中,光源108、110中的一个或者多个和相机102、104中的一个或者多个被设置在将要检测的运动之下,例如将要检测手运动处,在该运动发生的空间区域下方。这是最优定位,因为所记录的关于手的信息量与手在相机图像中占据的像素数目成比例,当相机关于手的“指向方向”的角度尽可能接近垂直时,手将占据更多像素。因为对于用户而言,将其手掌朝着屏幕定向是不舒适的,最优位置是从下向上看、从上向下看(这需要桥)或者从屏幕边框(bezel)对角地向上看或者对角地向下看。在向上看的情形下,更无与背景对象(例如,用户桌子上的杂乱物)混淆的可能性,并且如果直接向上看,则几乎没有与视场外的其他人混淆的可能性(并且通过未对脸部成像,还增强了隐私)。图像分析系统106(其可以是例如计算机系统)可以控制光源108、110和相机102、104的操作以便捕捉区域112的图像。基于所捕捉的图像,图像分析系统106确定对象114的位置和/或运动。
[0038]例如,作为确定对象114位置的步骤,图像分析系统106可以确定由相机102、104捕捉的各个图像中的那些像素包含对象114的部分。在一些实施例中,图像中的任何像素可以被分类为“对象”像素或者“背景”像素,这取决于该像素是否包含对象114的一部分。通过使用光源108、110,将像素分类为对象像素或者背景像素可以基于像素的亮度。例如,在关心的对象114和相机102、104之间的距离(r0)预期小于在背景对象116和相机102、104之间的距离(rB)。因为来自源108、110的光的强度随着1/r2而减少,对象114将比背景116被照得更明亮,并且包含对象114的部分的像素(S卩,对象像素)将会相应地比包含背景116的部分的像素(即,背景像素)更明亮。例如,如果rB/r<)= 2,则对象像素的亮度将会是背景像素的大约四倍,其中假设对象114和对象116对来自源108、110的光具有相似的反射,并且进一步假设对区域112的整体照明(至少在由相机102、104捕捉的频带内)由光源108、110主导。对于相机102、104、光源108、110、过滤器120、122的合适选择以及通常遇到的对象,这些假设总体上适用。例如,光源108、110可以是有能力强烈发射窄频带中的辐射的红外LED,并且过滤器120、122可以与光源108、110的频带匹配。因此,虽然人手或者人体、或者背景中的热源或者其它对象可以发射一些红外辐射,但是相机102、104的响应仍然可以由源自源108、110并且由对象114和/或背景116反射的光主导。
[0039]在这一布置中,通过对每个像素应用亮度阈值,图像分析系统106可以迅速并且准确地从背景像素区分出对象像素。例如,CMOS传感器或者相似设备中的像素亮度可以以从0.0(暗)到1.0(完全饱和)的尺度来测量,其中之间的某个数目的分级取决于传感器设计。由相机像素编码的亮度随着对象的照度标准地(线性地)伸缩(scale),这通常起因于沉积的电荷或者二极管电压。在一些实施例中,光源108、110足够明亮以至于从距离rQ处的对象反射的光产生亮度水平1.0,然而在距离rB= 2r ^处的对象产生亮度水平0.25。对象像素因此可以基于亮度容易地与背景像素区分出。进一步地,对象的边缘也可以基于邻近像素之间的亮度差而容易地被检测到,从而允许确定每个图像内的对象位置。使来自相机102、104的图像之间的对象位置相关允许图像分析系统106确定对象114在3D空间中的定位,并且分析图像的序列允许图像分析系统106使用常规运动算法重构对象114的3D运动。
[0040]图1B示出了实现本发明的系统100’,其中为了便于呈现示出了单个相机102。所示系统100’包括位于相机102附近位置的一对宽光束LED 130、132,以及进一步远离相机102定位的一对窄光束LED140、142。通常地,“宽光束”为约120°宽而窄光束为大约60°宽,虽然这些仅是表示性的数字并且可以随着应用而变化;更一般地,宽光束可以具有从>90°到180°的无论何处的光束角,而窄光束可以具有从>0°到90°的无论何处的光束角。图像分析系统106还控制LED 130、132、140、142的操作。应该理解的是,示出四个LED仅是为了示例性目的;系统可以如下文所述那样并且根据应用而包含更多或者更少的发光元件,并且此外,发光元件不需要是LED ;再次,该术语为了方便而被广泛使用。
[0041]如图所示,LED 130、132的宽光束160、162在对象114的初始位置P截击对象114,该初始位置P是中心并且相对接近相机102。LED 130、132可以是用于仅照射接近相机102的对象的低功率LED,或者可以具有足够功率以照射整个检测空间,以便便于初始对象检测,在此情形下期望保持LED 130、132有效仅必要的时长。在对象114向第二位置P’移走时,其进入窄光束LED 142的照明场内。图像分析系统106’执行上述功能,但是还包括基于相机102记录的图像激活和停用LED的功能。此处,系统106’登记这一转变,并且既激活LED 102又停用宽光束LED 130、132。因此,在跟踪对象114时,其范围确定开启哪些 LED。
[0042]在一些实施例中,LED 130、132、140、142是完全相同的设备,但是具有由系统106’控制的关联的电可控或者机电可控的光学器件150(为了方便,仅示出在LED 140上方),系统106’还使用常规驱动和控制电路系统来控制供应到LED的功率(例如驱动电流)。例如,光学器件150可以是可调透镜。在此情形下,系统106’确定LED中的哪些LED可以用最窄的光束角照射对象114以便于汲取最小的功率,并且既以确定的功率水平驱动LED又调整关联的光学器件150以产生必要的光束角。在跟踪对象114时,系统106’可以使得所选择的LED的光束角加宽并且增加其驱动电流,直到对象114进入可以用更少的功率消耗照射对象114的邻近LED的场,在该点处系统106’激活新的LED并且关闭之前所选择的LED。
[0043]例如,检测空间最初可以用具有与相机102的聚集视场相似的聚集视场的一个或者多个宽光束发光元件照亮。一旦通过系统106’获取对象114的位置,系统106’可以关闭宽光束LED并且激活指向对象144的方向的一个或者多个窄光束LED。在对象114移动时,激活窄光束LED中的不同窄光束LED。在很多实施方式中,这些定向LED仅需要位于相机102的视场中心;例如,在手跟踪的情形下,人们通常不会试图同时以宽角度和大距离与相机交互。
[0044]如果被跟踪的对象与相机成大角度(即,对于运动跟踪设备侧远,在位置P”处),其可能相对接近相机102。因此,低功率、宽光束LED可以是合适的。结果,发光阵列可以包括接近相机102的仅一个或者小数目的宽光束LED连同相等或者更大数目的窄光束LED(例如,集体覆盖相机102前方空间的中心场区域一例如,在相机法线周围的30°或者45°圆锥体内)。因此,可能减少或者最小化用于照射空间所需要的LED的数目,其中通过使用指向中心场的小数目宽光束LED和更大(或者相等)数目的窄光束LED来检测运动。
[0045]还可能用指向不同方向的很多窄光束LED覆盖宽视场。可以由系统106’操作这些窄光束LED以便于扫描所监控的空间,以便标识实际照射对象114的LED ;系统106’保持供应到这些LED的功率而停用其它LED。在一些实施例中,系统106’使用常规预测跟踪技术计算被跟踪对象114的预测轨迹,并且这一轨迹用于预期在对象114移动时应该激活哪些LED。在对象114如相机102的连续图像帧所记录的那样移动通过空间时,系统106’绘制实际对象轨迹并且实时地将其与预测轨迹进行比较,从而在获取和分析新图像并且从中导出跟踪信息时对后者一一连同照明模式一一进行修正。在其它实施方式中,LED自身可以物理或者光学操纵。在这种实施方式中,系统106’使用所预测的轨迹操纵光束以便保持对象被照射,从而仅当对象超出当前跟踪它的LED的操纵范围时激活新的LED。为此目的,可以利用服从计算机控制的任何操纵布置。例如,LED自身可以被安装到在有角度支点之上可旋转悬置的柔性基板;压电或者弹簧承载的电磁致动器可以用于跨轴线变化LED的角度。备选地,LED输出可以穿过可操纵透镜或者使光束定向变化的其它光学元件。用于物理或者光学地操纵LED输出的合适布置在扫描和显示领域中是众所周知的。
[0046]图像分析系统106、106’(还称为图像分析器)可以包括有能力捕捉和处理图像数据(例如,通过使用本文所描述的技术)的任何设备或者设备部件,或者由它们组成。图2是计算机系统200的简化框图,计算机系统200实现根据本发明的实施例的图像分析系统106、106’。计算机系统200包括处理器202、存储器204、相机接口 206、显示器208、扬声器209、键盘210和鼠标211。
[0047]存储器204可以用于存储将要由处理器202执行的指令以及与指令执行关联的输入和/或输出数据。具体而言,存储器204包含控制处理器202的操作和其与其它硬件部件的交互的指令(概念性地示出为在下文更详细地描述的模块组)。操作系统指导诸如存储器分配、文件管理以及大容量存储设备的操作之类的低级、基础系统功能的执行。操作系统可以是或者包括各种操作系统,诸如Microsoft WINDOWS操作系统、Unix操作系统、Linux操作系统、Xenix操作系统、IBM AIX操作系统、Hewlett Packard UX操作系统、NovellNETWARE操作系统、Sun Microsystems SOLARIS操作系统、OS/2操作系统、BeOS操作系统、MACINTOSH操作系统、APACHE操作系统、0PENSTEP操作系统或者平台的另一操作系统。
[0048]计算环境还可以包括其它可移除/非可移除、易失性/非易失性计算机存储介质。例如,硬盘驱动可以读取或者写入到非可移除、非易失性磁性介质。磁盘驱动可以从其读取或者写入到可移除、非易失性磁盘,并且光盘驱动可以从其读取或者写入到诸如⑶-ROM或者其它光学介质之类的可移除、非易失性光盘。可以在示例性操作环境中使用的其它可移除/非可移除、易失性/非易失性计算机存储介质包括(但是不限于)盒式磁带、闪存卡、数字通用碟、数字视频带、固态RAM、固态ROM等。存储介质通常通过可移除或者非可移除存储器接口连接到系统总线。
[0049]处理器202可以是通用微处理器,但是取决于实施方式可以备选地为微控制器、外围集成电路元件、CSIC(客户专用集成电路)、ASIC(专用集成电路)、逻辑电路、数字信号处理器、诸如FPGA(现场可编程门阵列)、PLD(可编程逻辑设备)、PLA(可编程逻辑阵列)之类的可编程逻辑设备、RFID处理器、智能芯片、或者有能力实现本发明的过程的任何其它设备或者设备布置。
[0050]相机接口 206可以包括实现在计算机系统200和诸如图1A所示的相机102、104之类的相机、以及诸如图1A的光源108、110之类的关联光源之间通信的硬件和/或软件。因此,例如,相机接口 206可以包括相机可以连接到的一个或者多个数据端口 216、218,以及硬件和/或软件信号处理器,硬件和/或软件信号处理器用于在将信号作为输入提供到在处理器202上执行的常规运动捕捉(“moc
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1