提高定位估计的精度的系统和方法

文档序号:6099674阅读:314来源:国知局
专利名称:提高定位估计的精度的系统和方法
技术领域
本发明涉及在预定搜索区域中的目标的定位和跟踪,尤其涉及借助提供初始定位测量或估计的基于群集的统计后处理,来改善通过使用诸如麦克风阵列、定向天线阵列、雷达接收阵列等接收阵列生成的定位估计的精度的系统和过程。
背景技术
在预定区域中目标的定位和跟踪是许多系统的重要组成部分。例如,若干传统的音频会议应用使用带有传统的声源定位(SSL)处理(即时延估计、波束转向(beamsteering)等)的麦克风阵列,使特定个人的语音或声音能按要求地被有效隔离和处理。类似的技术使用定向天线阵列来定位射电源,用于若干应用,如用于判断在无线计算机网络中哪个或哪些节点被特定的订户使用。另外的类似技术采用雷达或激光接收阵列跟踪目标。通常,那样的技术对本领域技术人员是熟知的。
例如,传统的麦克风阵列通常包括以某种预定的布局的麦克风布置。这些麦克风通常用于捕捉来自各个方向并起源于空间中不同的点的声波。然后使用若干传统技术的一种来执行SSL。通常,这些SSL技术归入两个类别,包括基于时延估计(TDE)的技术和基于波束转向的技术。寻找指向声源的方向在空间滤波中起了重要的作用,即将一波束指向声源并抑制来自其它方向的噪声。在某些情况下,指向声源的方向被用于说话人跟踪和记录的音频信号的后处理。在视频会议系统的情况下,说话人跟踪常用于将视频摄像机动态定向到讲话的人。
通常,大多数声源定位系统通过首先预处理来自阵列的每个麦克风的每个信号处理来自麦克风阵列的信号。预处理通常包括将信号包装成帧、执行噪声抑制和分类各个帧以判断,为确定声源的位置的目的一些特定帧是否应被处理或被拒绝。
一旦完成了预处理,实际的声源定位通常涉及如TDE或波束转向技术的传统SSL技术的使用,来提供初始方向估计或概略分布函数(PDR),以表明声源位于何处。此位置能借助一维定位(即在平面上声源所位于的角度)、二维定位(即用于定义表示声源在三维空间中的方向的向量的两个角度-方向角和仰角)、以及全三维定向(即用于定位声源所在的三维空间中一点的方向角、仰角和距离)。一般而言,不论使用哪种SSL技术,目标通常是提供抵抗混响的健壮性、区别多个声源的能力、和在可能的噪声环境中的高的位置精度。
一旦计算了声源位置的指示符,常常执行一后处理阶段。一般而言,此后处理组合若干定位测量的结果,以提高精度、跟随声源的移动、或跟踪多个声源。用于SSL后处理的各种传统技术包括简单求平均值、统计处理、卡尔曼(Kalman)滤波、粒子滤波等。那些技术常常是与应用有关的,但一般针对去除来自混响波和强烈反射的定位,并提高声源定位精度。一般而言,当定位的估算或测量的精度提高时,音频信号的任何进一步处理(如精确的声源跟踪)也增强了。
相对于包括无线电信号、雷达波等的其它信号,信号源或目标定位常常使用类似于上述通过麦克风阵列捕捉的声波的情况的预处理和后处理技术。一般而言,那样的定位技术常包括适应于不同信号和接收器阵列类型(如定向天线阵列、雷达或激光接收器阵列等)的波束转向技术。如音频信号那样,其它信号类型的定位通常基于信号传播的分析(如声波、无线电波、雷达波反射等)。
对所有那些定位系统,不论信号或阵列的类型如何,一个主要的目的是即使存在如衍射、干涉、反射等可能会降低定位精度及可靠性的噪声或其它影响,也能提供快速精确的定位估计或测量。
如上所述,定位估计的后处理通常被设计成提高定位估计的精度。因而,需要的是用于提供快速可靠的定位数据后处理的系统和方法,以提高定位估计的精度。此外,那样的系统和方法应该可用于并适用于现有的定位技术。

发明内容
这里描述的系统及方法通过提高从传统定位技术导出的初始定位估计的可靠性和精度,来增强用于跟踪或定位一个或多个目标或信号源的现有信号定位技术。注意,在下面整篇讨论中,术语“目标”用于指通过定位方法跟踪或定位的实际目标,或信号源(如来自说话人的声音)。例如,通过使用后处理技术改善的传统定位技术包括基于麦克风阵列输入的传统声源定位(SSL)系统、基于定向天线阵列输入的传统射电源定位系统、基于雷达或激光接收器阵列的传统目标定位和跟踪系统等。注意,那些定位技术为本领域技术人员所熟知,在此不作详述。
一般而言,这里描述的后处理系统和方法向初始定位估计应用统计实时群集(Clustering)处理,并然后使用此实时群集来生成相对于初始定位估计具有提高的精度和可靠性的新定位估计。如上所述,这里描述的后处理技术适用于提供信号源定位估计的传统系统。此外,还观察到,这里描述的系统和方法在初始目标定位估计是在包括噪声、反射、混响、或其它干涉的环境中收集的情况下,提供了提高的精度和可靠性。
具体说来,这里描述的过程开始于使用若干传统定位技术的任一种,收集、生成、或获取初始的目标定位估计或测量。一般而言,通常以一维、二维或三维(如方向;方向和角度;或方向、角度和距离)方式提供传统的定位数据,作为时间的函数。虽然这里描述的后处理技术能推广到任何维数的定位数据,然而为了解释下面的讨论,我们假设定位数据是三维的,即预定区域中的方向、仰角和距离,以及分别对方向、仰角和距离的已知的或计算的标准偏差σ、σθ、σρ。
除了简单地提供位置估计外,传统的定位技术频繁地提供权重或置信度测量或估计,用于为每个定位估计描述计算的或估计的可靠性。此外,还通常提供每次定位估计的时间。此时间在后面称为每次定位估计的“时间标记”。所有这些信息在此处描述的后处理系统及方法中使用,用于提高初始定位估计的精度及可靠性。
换言之,这里描述的后处理系统取传统的定位估计的输入,每个定位估计包括1)位置数据;2)估计的位置可靠性;和3)数据时间标记。然后此数据被用于导出相对于输入定位估计具有提高的可靠性的新的定位估计。每个初始定位估计的这组信息(即位置、可靠性、及时间)在此整篇描述中称为“初始定位估计”,或简称“初始测量”。
一般假定位置或定位估计的可靠性随时间推移而降低,尤其在可能有目标移动或接收阵列移动的情况下。因而在一个实施例中,给定了初始定位估计,这里描述的后处理系统及方法从首先舍弃比预定时间早的所有定位测量开始。该预定时间,或测量的“生命周期”是这样的时间在此期间认为任何特定的定位估计是有效的,因而在此期间此定位估计被用于后处理计算。该“生命周期”简单地是从生成特定的定位估计以来的时间测量(即在特定的定位估计的时间标记和当前时间之间的时间)。
一般而言,当生命周期增加时,更多的定位估计可用于后处理。通常,给出更大的生命周期,可得到更多的定位估计,允许在真实目标和可能的反射之间作出更可靠的区分,从而提供更好的定位精度。然而,使用更大的初始定位估计生命周期也在目标相对于接收阵列移动或改变位置时导致更长的定位响应时间。因而,定位估计生命周期的优化选择是根据预期的目标运动而作出的。例如,对于静止或缓慢移动的目标,较长的生命周期通常是合适的。相反,对较快的目标运动较短的生命周期通常更合适。因而在一个实施例中,基于计算的目标运动计算自适应的生命周期,此生命周期选为响应时间和作为时间的函数的位置有效性之间的折衷。计算的运动简单地使用作为时间的函数的位置估计来计算。
如这里将进一步描述的,后处理用多阶段过程继续,包括1)在空间散布的重叠部分“群集”初始定位估计(在预定的生命周期中的那些);2)识别在该群集中的“潜在目标”;3)基于该群集估计潜在目标的位置及标准偏差;以及4)消除可能的重复目标。在一实施例中,后处理还通过对每个目标的位置估计计算置信度水平而继续(在消除重复目标之后)。因而,这里描述的后处理系统和方法的最终结果是目标的列表,其每一个用位置、标准偏差表示,且在一个实施例中还有目标位置的置信度水平。
看了上述综述后将明白,这里描述的后技术提供一改善的系统和过程,用于提高从传统的定位技术中导出的定位估计的精度。除上述好处外,此系统和方法的其它优点从后面结合附图的详细描述变得显而易见。


本发明的具体特征、观点和优点按照下面的描述、所附权利要求书及附图将变得很好理解,附图中图1是描述构成用于后处理初始定位数据以生成具有提高的精度和可靠性的新的定位估计的示例性系统的通用计算设备的通用系统原理图。
图2图示了示例性系统原理图,它示出实现用于后处理初始定位数据以生成具有提高的精度和可靠性的新的定位估计的后处理器的示例性程序模块。
图3提供示例性操作流程图,它示出图2的后处理器的操作。
具体实施例方式
在本发明的较佳实施例的下面描述中参考了附图,附图形成描述的一部分并作为说明示出能实施本发明的具体实施例。可以理解,能采用其它实施例,且能作出结构的改变而不脱离本发明的范围。
1.0示例性操作环境图1示出可实现本发明的合适的计算系统环境100的例子。计算系统环境100仅是合适的计算环境的一例,不作为对本发明的使用或功能的范围的限止。计算环境100不解释为对示例操作环境100示出的组件的任一个或其组合有任何依赖或需求。
本发明可用许多其它通用或专用计算系统环境或配置来操作。能适用于本发明的众知的计算系统、环境、和/或配置的例子包括,但不限于,个人计算机、服务器计算机、如蜂窝电话或PDA的手持、膝上或移动计算机或通信设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费者电子设备、网络PC、小型机、大型机、包括任何上面系统或设备的分布式计算环境等。
本发明能在由结合硬件模块的计算机执行的如程序模块的计算机可执行指令的一般上下文中描述,那些模块包括麦克风阵列198,或如定向无线电天线阵列、雷达接收器阵列等其它接收器阵列等组件。一般而言,程序模块包括例程、程序、对象、组件、数据结构等,它们执行特定任务或实现特定的抽象数据类型。本发明也能在分布式计算环境实施,在那里任务由通过通信网络连接的远程处理设备完成。在分布式环境中,程序模块能位于包括存储器存储设备的本地或远程计算机存储介质中。参考图1,实现本发明的示例性系统包括以计算机100形式的通用计算设备。
计算机110的组件能包括,但不限于,处理单元120、系统存储器130、和将包括系统存储器的各种系统组件耦合到处理单元120的系统总线121。系统总线121能是若干类型总线结构的任一种,包括存储器总线或存储控制器、外围总线、和使用各种总线体系结构的任一种的局部总线。例如,但不限于,那些总线体系结构包括工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、增强的ISA(EISA)总线、视频电子技术标准协会(VESA)局部总线、和也称Mezzanine总线的外围组件互连(PCI)总线。
计算机110通常包括各种计算机可读介质。计算机可读介质可以是能由计算机110访问的任何可用的介质,且包括易失和非易失介质、可移动和不可移动介质。例如,但不限于,计算机可读介质能包括计算机存储介质和通信介质。计算机存储介质包括以任何方法或技术实现的易失和非易失,可移动及不可移动介质,用于存储如计算机可读指令、数据结构、程序模块、或其它数据等信息。
计算机存储介质包括,但不限于,RAM、ROM、PROM、EPROM、EEPROM、闪存或其它存储技术;CD-ROM、数字多功能盘(DVD)或其它光盘存储;磁带盒、磁带、磁盘存储器或其它磁存储设备;或能用于存储希望的信息并能由计算机110访问的任何其它介质。通信介质通常在在如载波或其它传输机制那样的已调制数字信号中包含计算机可读指令、数据结构、程序模块或其它数据,并包括任何信息传送介质。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式设置和改变的信号。例如,但不限于,通信介质包括诸如有线网络或直线连接的有线介质,以及诸如声音、RF、红外和其它无线介质的无线介质。上面的任何组合也包括在计算机可读介质的范围中。
系统存储器130包括以易失和/或非易失存储器形式的计算机存储介质,如只读存储器(ROM)131和随机存储器(RAM)132。包含如在启动时帮助在计算机的诸元件之间传输信息的基本例程的基本输入/输出系统133(BIOS)通常存储在ROM 131中。RAM 132通常包含立即由处理器120访问和/或当前由其操作的数据和/或程序模块。例如,但不限于,图1示出了操作系统134,应用程序135,其它程序模块136,和程序数据137。
计算机110还包括其它可移动/不可移动、易失/非易失计算机存储介质。仅作为例子,图1示出读写不可移动、非易失磁介质的硬盘驱动器141、读写可移动、非易失磁盘152的磁盘驱动器151、和读写如CD ROM或其它光介质的可移动、非易失光盘156的光盘驱动器155。能用于示例性操作环境的其它可移动/不可移动、易失/非易失计算机存储介质包括,但不限于,盒式磁带、闪存卡、数字多功能盘、数字视频带、固态RAM、固态ROM等。硬盘驱动器141通常通过如接口140的不可移动存储器接口连接到系统总线121,而磁盘驱动器151和光盘驱动器155通常由如接口150的可移动存储器接口连接到系统总线121。
以上讨论并示于图1的驱动器及其相关联的计算机存储介质为计算机110提供计算机可读指令、数据结构、程序模块和其它数据的存储。例如在图1中,硬盘驱动器141被示作为存储操作系统144、应用程序145、其它程序模块146、和程序数据147。应注意,这些组件相同或不同于操作系统134、应用程序135、其它程序模块136、和程序数据137。这里对操作系统144、应用程序145、其它程序模块146、和程序数据147给出不同标号,以表明至少它们是不同的副本。用户能通过诸如键盘162、和常称为鼠标、跟踪球、或触摸垫的定位设备161,将命令和信息输入到计算机110。
其它输入设备(未示出)能包括操作杆、游戏垫、圆盘式卫星天线、扫描仪、无线电接收器、和电视或广播视频接收器等。另外的输入设备(未示出)能包括接收阵列或信号输入设备,如定向无线电天线阵列、雷达接收器阵列等。这些和其它输入设备通过连接到系统总线121的有线或无线用户输入接口160连接到处理单元120,但也能由诸如并行端口、游戏端口、通用串行口(USB)、IEEE1394接口、蓝牙无线接口、IEEE 802.11无线接口等其它传统的接口或总线结构连接。此外,计算机110还能包括诸如麦克风或麦克风阵列198的语音或音频输入设备,以及扬声器197或经过音频接口199连接的其它声音输出设备,接口199也包括诸如并行口、串行口、USB、IEEE 1394、蓝牙等传统的有线或无线接口。
监视器191或其它类型的显示设备也经过如视频适配器190那样的接口连接至系统总线121。除监视器外,计算机还能包括如打印机196的其它外围输出设备,它们能通过输出外围接口195连接。
计算机110能使用到如远程计算机180那样的一个或多个远程计算机的逻辑连接在网络环境中操作。远程计算机180能是个人计算机、服务器、路由器、网络PC、对等设备、或其它公共网络节点,并通常包括相对计算机110描述的许多或所有元件,虽然图1中只示出存储器存储设备181。图1中画出的逻辑连接包括局域网(LAN)171和广域网(WAN)173,但也能包括其它网络。那样的网络环境常见于办公室、企业范围计算机网络、内联网、和因特网。
当在LAN网络环境中使用时,计算机110通过网络接口或适配器170连接到LAN 171。在WAN网络环境中使用时,计算机110通常包括调制解调器172或用于通过如因特网那样的WAN 173建立通信的其它装置。内置或外接的调制解调器172能经由用户输入接口160或其它合适的机制连接到系统总线121。在网络环境中,相对于计算机110画出的程序模块或其部分能存储在远程存储器存储设备中。例如,但不限于,图1示出的远程应用程序驻留在存储器设备181中。可以理解,示出的网络连接是示例性的,可使用在计算之间建立通信链路的其它装置。
现已讨论了示例性操作环境,本专利说明的余下部分致力于讨论用于自动提高从一个或多个接收阵列导出的目标定位估计的可靠性及精度的系统和方法。
2.0引言这里描述的系统和方法用于提高现有的信号定位技术,以通过提高从传统的定位技术导出的初始定位估计的可靠性和精度来跟踪或定位一个或多个目标或信号源。注意,在下面整篇讨论中术语“目标”指的是通过定位方法跟踪或定位的实际目标,或信号源(如来自讲话人的声音、射电源、雷达反射等)。例如,通过使用后处理技术提高的定位技术包括基于麦克风阵列输入的传统声源定位(SSL)系统、基于定向天线阵列输入的传统射电源定位系统、基于雷达或激光接收器阵列的传统目标定位和跟踪系统等。注意,那样的定位技术对本领域的技术人员是熟知的,将不在此详述。
一般而言,此处描述的后处理系统及方法向初始定位估计应用统计实时群集过程,并然后使用此实时群集来生成相对于初始定位估计具有提高的精度和可靠性的新定位估计。如上所述,这里描述的后处理技术适用于提供信号源定位估计的传统系统。此外还注意到,这里描述的系统和方法在初始目标定位估计是在可能包括噪声、反射、混响、或其它干扰的环境中收集的情况下也提供提高的精度和可靠性。
2.1系统综述这里描述的用于定位估计的后处理的系统和方法从使用若干传统的定位技术的任一种收集、生成、或获取初始目标定位估计或测量开始。一般而言,通常以一维、二维、或三维方式(如方向;方向和角度;或方向、角度和距离)将传统的定位数据作为时间的函数提供。虽然这里描述的后处理技术可以推广到任何维数的定位数据,为解释起见下面的讨论将假设定位数据是三维的,即分别为预定区域中的方向、仰角和距离以及方向、仰角和距离的已知或计算的标准偏差σ、σθ、σρ。
除了简单地提供位置估计外,为了描述每个定位估计的计算或估计的可靠性,传统的定位技术经常提供权重或置信度测量或估计。此外,还通常提供每次定位估计的时间。此时间在后面称为每次定位估计的“时间标记”。所有这些信息用于此处描述的后处理系统和方法,以提高初始定位估计的精度及可靠性。
换言之,这里描述的后处理系统取用传统定位估计的输入,每个定位估计包括1)位置数据;2)估计的位置可靠性;和3)数据的时间标记。然后使用此数据导出相对于输入定位估计具有提高的可靠性的新定位估计。每个初始定位估计的这组信息(即位置、可靠性、和时间)在整篇说明中被称为“初始定估计”或简称为“初始测量”。
一般假定,位置或定位估计的可靠性随时间推移而降低,尤其在可能有目标运动或接收阵列运动的情况。因而在一个实施例中,给出初始定位估计后,这里描述的后处理系统和方法通过首先舍弃比预定时间更早的所有定位测量开始。此预定时间或测量的“生命周期”是这样一个时间在此期间任何特定的定位估计被认为是有效的,因而此期间的定位估计被用于后处理计算。此“生命周期”简单地是从生成特定定位估计起的时间的测量(即在特定定位估计的时间标记和当前时间之间的时间)。
一般而言,当生命周期增加时,对后处理可用更多的定位估计。通常,给定更大的生命周期,有更多可用的定位估计,有利于在真实目标和可能的反射之间更作出可靠的区别,从而提供更好的定位精度。然而当目标相对于接收阵列移动或改变位置时,使用更大的初始定位估计生命周期也导致更长的定位响应时间。因而,定位估计生命周期的最优选择是根据预期的目标运动而作出的。例如,给定静止或缓慢移动的目标,较长的生命周期常常是合适的。相反,对较快的目标运动,较短的生命周期常常更恰当。因而在一个实施例中,基于计算的目标运动计算适应的生命周期,生命周期选作在响应时间和作为时间的函数的位置有效性之间的折衷。计算的运动简单地使用作为时间函数的位置估计来计算。
如这里更详细描述的,后处理随后继续多阶段过程,包括1)在空间散布的重叠部分“群集”初始定位估计(在预定的生命周期中的那些);2)在该群集中识别“潜在的目标”;3)基于该群集估计潜在目标的位置和标准偏差;和4)消除可能的重复目标。在一个实施例中,后处理还通过计算每个目标(在消除重复的目标之后)的位置估计的置信度水平而继续。因此,这里描述的后处理系统及方法的最终结果是目标的列表,每个目标用位置和标准偏差表示,在一个实施例中还有目标位置的置信度水平。
2.2系统的体系结构上面概括的过程用图2的一般性系统原理图示出。具体而言,图2的系统原理图示出了在用于实现初始定位估计的后处理的系统和方法,以提高那些定位估计的精度和可靠性的程序模块之间的相互关系。此系统和方法在下面一般被称为“后处理器”。应该注意,在图2中用虚线表示的任何框和框之间的互连表示这里描述的后处理器的替换实施例,并且如下所示,这些替换实施例的任一个或所有可以结合在此整篇文档中描述的其它替换实施例一起使用。
一般而言,后处理器用来改善从传统接收器阵列200和传统初始定位估计模块210导出的初始定位估计220。如上所述,接收器阵列200是任何传统的接收阵列,如麦克风阵列、定向天线阵列、雷达阵列、激光接收器阵列等。此外,接收器阵列200也能是以类似于接收器的阵列的方式工作的单个接收器。例如,如旋转雷达接收器那样的单个旋转接收器从围绕旋转轴的各个方向获取信号。以此方式,雷达接收器通过在旋转时从各个方向接收信号以类似于雷达阵列的方式工作。然而,虽然来自那些接收器的定位估计与这里描述的后处理器兼容,应注意,单个接收器系统(与真实阵列不同)往往具有更长的响应时间来提供定位估计。
初始定位估计模块210是用于根据从接收器阵列200接收的信号或输入提供定位估计的传统定位或跟踪系统。例如,在麦克风阵列的情况下,初始定位估计模块210是传统的声源定位(SSL)系统。注意,为解释起见,下面的讨论继续使用传统的麦克风阵列作为接收器阵列200,使用SSL系统作为初始定位估计模块210。然而鉴于这里提供的后处理器的详述,可以理解,后处理器可以用于若干传统的定位系统的任一个,且不限于仅提高由传统的麦克风阵列/SSL系统提供的定位估计的精度及可靠性。
一旦由初始定位估计模块210提供了初始定位估计220,后处理器使用群集模块250来实时群集在空间散布的重叠部分的初始定位估计220。注意,在章节3.2.1中详细描述了在空间散布重叠部分的实时群集过程。如上所述,在一个实施例中,只有其生命周期尚未过期的那些估计由实时群集过程处理。对于这里描述的后处理,其生命周期已过期的定位估计简单地被舍弃。
在一个实施例中,生命周期计算模块230自动地基于计算的目标运动计算优化的定位估计生命周期。例如,由于初始定位估计220包括表示生成每个定位估计的时间标记,计算近似的目标运动作为时间的函数是简单的事情。给定这些目标移动,则生命周期计算模块230对每个目标确定用于定位估计的合适的生命周期。如上所述,这些生命周期取决于特定目标的运动。然而,生命周期也取决于所使用的接收器阵列220和定位系统的类型。
例如,在一个测试实施例中看到,大约4秒的定位估计生命周期对于与SSL组合的用来跟踪由麦克风阵列覆盖的有效体积中讲话的人的麦克风阵列,提供了好的结果。类似地,在另一测试实施例中看到,约2秒的生命周期对于识别在天线阵列中使用哪一天线来接收无线计算机网络中特定的节点会提供好的结果。在每种情况下,生命周期计算模块230然后将定位估计生命周期上调或下调一小量来考虑所计算的目标运动,其目的是提供保证定位估计不会早到相对不可靠的生命周期。此外,在多目标的情况下,根据每个特定目标的运动,每个目标可具有不同的定位估计生命周期。
在另一实施例中,不是对特定系统计算定位估计生命周期,而是使用生命周期输入模块240提供用于所有初始定位估计220的常数生命周期。生命周期的长度再次取决于接收器阵列200的类型、使用的定位系统的类型和预期的目标运动。
一旦群集模块250完成了定位估计的群集,潜在的目标识别模块260通过定位估计群集的统计分析识别代表在每个空间散布重叠部分中潜在的目标的定位估计的群集。一般而言,通过使用用于识别包含一个或多个目标的那些部分的阈值,在这些重叠部分中识别潜在的目标。如在章节3.2.2中详述,若具有非零个数测量的任何部分的计算的平均权重超过预定的阈值,则认为在此部分存在一潜在目标,它被选作进一步处理。
然后,潜在目标定位模块265根据包括每个群集的定位估计对每个潜在的目标计算一位置。在此,潜在目标的位置表示初始定位估计220的改进(refinement)。然而,作为使用重叠部分的结果,特定的定位估计或测量能存在于两个或更多相邻的部分。在章节3.2.3中将更详细地描述潜在的目标位置的计算。
于是,下一步骤使用重复目标消除模块270来消除由于使用重叠部分造成的识别的目标的重复。一般而言,在目标识别模块分析了定位估计的群集之后,存在假设的或潜在的目标的列表,每个由位置、标准偏差和权重表示。然而,由于使用了重叠部分,常在此列表中存在重复,因此使用术语“潜在目标”。一般而言,如章节3.2.4中详述,若在任何两个假设的目标之间的距离小于阈值距离,则认为存在重复。在认为存在重复的地方,重复目标消除模块简单地从列表中去除具有较低权重的潜在目标。在相等权重的不大可能的情况,简单地随机去除一个潜在目标。然后简单地提供余下的潜在目标作为新的定位估计280。
在另一实施例中,置信度水平计算模块290随后对每个新的定位估计280计算置信度水平或测量。在章节3.2.5中更详细描述置信度水平的计算。
最后在又一个实施例中,还向初始定位估计模块210提供回新的定位估计,用于生成新的初始定位估计220。现有的定位估计对初始化定位计算的使用对本领域技术人员是众知的,将不在此详述。
3.0操作概述采用上述程序模块来实现这里描述的后处理器。如上概括,此后处理器系统和方法通过输入定位数据的多阶段的后处理,自动地提高了定位估计的精度和可靠性。下列章节提供实现上述程序模块的示例方法的详细操作讨论。
3.1收集初始定位结果如上所述,这里描述的后处理器能应用到许多不同的定位技术。例如,这里描述的后处理系统和方法能改善使用麦克风阵列的音频系统中的声源定位(SSL)的结果。类似地,这里描述的后处理系统和方法也可改善无线电信号的定位,如用来选择天线阵列中的特定定向天线,用于无线计算机网络中的计算机端点。其它例子包括雷达和激光跟踪系统。所有这些系统在下面统称为“源定位器”。
不论使用什么类型的定位系统,一般在三维定位数据的情况下假定每个定位测量包括1)由方向、仰角和距离表示的目标位置;2)提供表示源定位器如何信任此测量的权重;以及3)表示每个定位测量的时间的时间标记。
如上所述,由定位器用来生成初始定位估计的实际算法实在是无关紧要的,只要它提供上述信息(即目标位置、权重、和时间)。在每次成功测量后由后处理器的输入队列收集初始定位估计。然后,后处理器从输入队列中去除比给定生命周期T更早的所有测量。如上所述,此生命周期或者基于目标运动自动计算,或者对特定的定位系统预先确定。一般而言,使用更大的生命周期意味着更多的结果可用于处理,从而便于更可靠地区分真实目标和反射,并提供更好的精度。然而如上所述,当目标或信号源移动或改变位置时,更长的生命周期导致更长的响应时间。
3.2初始定位估计的后处理初始定位估计的后处理涉及若干阶段,包括群集、寻找潜在目标(即声源、射电源等)、估计潜在目标的位置、减少或消除重复的目标、和计算置信度水平。在下列章节中描述这些后处理步骤。
3.2.1群集初始定位估计假设,有效体积(即由接收阵列监视或服务的空间或体积)是预定的或能使用传统技术容易地确定的。尤其是假设,关于有效体积的下列参数是已知的·最小和最大方向角min和max;·最小和最大仰角θmin和θmax;以及·最小和最大距离ρmin和ρmax。
给定这些参数,有效体积自动地被划分成若干(M个)重叠区域或部分。注意,不必要使用同样大小的区域,但是这用来减少计算的复杂性。注意,每部分的大小取决于初始估计器的精度,且通常不应大于标准偏差的约4到6倍,如6σ。
或者,在一个实施例中重叠区域或部分的数目和重叠的量是用户可确定的。可使用任何数目或大小的区域。然而,使用更小尺寸的更多区域往往以增加计算负担的代价提高定位估计的精度。具体地,假设每群集一个目标,区域的大小是后处理器检测单独的目标的分辨率。然而最小的大小取决于初始估计器的精度,希望具有几乎所有来自一个目标的测量进到同一群集。然而,对标准分布这意味着约为6倍标准偏差(如6σ)的区域大小将捕捉对该目标的约99%的测量。然而为特定目的,群集或区域的大小能大于6σ。
在涉及麦克风阵列和声源定位的测试实施例中,有效体积可被划分成M个重叠的区域,每个带有在每个维度中(即方向、仰角和距离)6倍标准偏差的大小。选择此大小的区域,并允许区域间50%的重叠,按等式(1)给出重叠区域数 等式(1)注意到在此试验实施例中,在等式(1)的分母中的6表示使用6倍初始估计器的标准偏差的区域大小。如上所述,为提供所需精度也可使用其它区域大小。然而应注意,6σ间隔(如平均值周围3σ)保持测量的约99%。此外,等式(1)中的“8”是在区域之间重叠的量的结果。具体说来,由于在本例中使中50%的重叠,从“2×2×2=8”(如在三维的每一维重叠50%)简单地导出因子“8”。考虑到前面讨论,可以清楚,更多的重叠意味着更多群集,因此更多的重复目标,结果更多的计算负担。然而,更少的重叠意味着在群集之间的目标可能丢失。对6σ部分宽度,到最优重叠是约66%。这意味着重叠区域是4σ,它在最坏情况保持约80%的测量。50%重叠被用于测试实施例,简单地减少计算负担。
一旦区域数已知,有效体积随即简单地被划分成那些数目的区域。然后每个初始定位估计简单地被分配到覆盖每个初始定位估计的有效体积的那些区域。由于初始定位估计具有相关的生命周期,多个定位估计通常对每个目标可用。因此,将定位估计分配到各特定区域导致在每个区域中定位估计群集的形成。注意,由于使用重叠区域,特定的测量能被分配给两个或多个相邻部分,这取决于重叠的量。如上所述,使用更大的重叠区域导致对各个目标更好的分辨率,但增加了必要的计算。
3.2.2识别带潜在目标的部分一旦有效体积被划分成各区域,且如上面章节3.2.1所述地形成定位估计的群集,则作出关于哪些区域在其中具有潜在目标的判断。例如,若特定区域没有定位估计,则假定在该特定区域中没有目标,所以那个区域不必进一步处理,从而降低了计算负担。
然而在另一实施例中,特定的区域是否包括一个或多个目标的判断是使用基于权重的阈值作出的。具体说来,在一测试实施例中,识别带有潜在目标的那些部分通过首先计算带有非零个数测量(即至少一个定位估计被分配给该特定区域)的所有部分的平均权重Wth来完成,它代表基于权重的阈值。然后Wth代表用于测量有效体积的每个区域的阈值权重。注意,阈值权重是使用作为初始定位估计的一部分提供的初始权重来计算的。例如,在等式(2)中如下地提供计算那些权重的一种方法Wth=KLΣi=0M-1Σj=0Ni-1Wij]]>等式(2)其中Wij是在第i部分中第j个测量的初始权重,Ni是在第i部分中的测量的数目,M是部分的数目,L是带有非零个数测量的部分数,而K是常数。
注意,K值取决于部分的个数和失败测量的数目(即在那些部分中导致反射和噪声而非真实目标的测量)。在一测试实施例中,使用K=2的值,使得在尽可能多的部分中作为失败的测量而忽略。具体地,观察到带有失败测量的诸部分通常包含约一个到二个测量,作为反射和噪声的结果。使用K=2的值使后处理器能忽略那些带很小数目测量的部分,使得那些测量不计作潜在的目标。注意,K的值是依赖应用的,且对后处理器的具体实现希望避免处理带有小于3个(或某个其它最小值)测量的部分,这取决于初始测量器提供多少测量作为时间的函数。
然后对每部分如等式(3)所示地计算对每个部分的总的部分权重,它代表在每个特定部分中所有测量的权重的总和Wi=Σj=0Ni-1Wij]]>等式(3)若任何部分的权重Wi大于阈值权重Wth,则假定在该部分中存在一潜在的目标,并加以标志以便如下所述地作进一步处理。
3.2.3位置估计计算虽然对有效体积的所有区域中的潜在目标能计算位置估计,然而在前面步骤中未被标记为具有超过阈值Wth的权重的区域中实际上不大可能存在任何目标,或任何具有高可靠性的定位估计。因此,在一实施例中,在具有超过阈值Wth的权重的那些区域中只对潜在的目标计算位置估计。一般而言,在后处理的此阶段中提供的位置估计涉及两个阶段的统计处理方法。
具体地,对每个部分,第一阶段计算在该部分中所有测量的加权平均。在一实施例中,此统计处理的速度通过首先将每个位置pij转换到直角坐标系统而得以提高,如等式(4)所示xij=ρijcosijcosθijyij=ρijsinijcosθij等式(4)zij=ρijcosθij然后如下等式(5)和(6)所示计算加权平均和加权标准偏差pi=1WiΣj=0Ni-1Wijρij]]>等式(5)σi=1WiΣj=0Ni-1Wij(pi-pij)2Ni-1]]>等式(6)其中pi是在此部分中目标的位置,而σi是目标位置估计的标准偏差。
由于使用重叠部分,并取决于每个部分的大小,属于同一目标的某些定位测量可能存在于两个或多个相邻部分中。此外,也能有噪声测量存在于每个那样的部分中。因而在一实施例中,为消除这些测量并提高整体位置精度,对计算的目标位置pi的特定距离中的测量执行第二轮加权平均。
在一测试实施例中,使用在pi±2σi范围内测量的加权平均,以获取对每个部分的最终位置估计 。在范围pi±2σi中测量的数目被标记成 。然后为精度估计重新计算对 的加权标准偏差 ,如下面等式(7)所示σ~i=1WIΣj=0n~i-1Wij(pi-pij)2n~i(n~i-1)]]>等式(7)最后,对每个潜在目标 在范围pi±2σi中计算所有位置测量的权重 之和。
3.2.4潜在目标的减少在这里,已生成假设的或潜在的目标的列表,这些潜在目标的每一个由位置 、标准偏差 和权重 表示。本步骤的目的是从该列表消除重复。如上所述,由于使用重叠部分可能存在重复。在一实施例中,判断任何两个目标是否重复的准则是基于在任何两个或多个假设的或潜在的目标之间的计算距离。例如,若在所有方向上在任何两个假设的目标k和l(k不等于l)之间的距离都小于每一方向上的部分的重叠的量,则这两个目标被认为实际上代表同一目标或信号源。假设6σ部分宽度和50%部分重叠,距离简单地如下等式(8)所示地计算|xk-xl|≤3σρcosσcosσθ|yk-yl|≤3σρcosσcosσθ等式(8)|zk-zl|≤3σρsinσθ一旦判定任何两个潜在或假设的目标实际上是同一目标,则简单地去除具有较低权重 的目标,从而减少目标的总的列表。在这里,目标的列表代表相对初始定位估计具有提高的精度和可靠性的一组目标定位测量或定位估计。
3.2.5位置估计置信度水平的计算在一实施例中,后处理通过对在上述后处理阶段期间生成的每个目标位置估计计算置信度水平继续。通常,置信度水平作为0到1之间的数提供,0代表无置信度,1代表全置信度。影响计算的置信度水平的因素是测量的数目 、标准偏差 和这 个测量中的最近时间标记。
具体地,在测量的数目小于给定数Ncrit时,置信度水平下降,从而表示不太可靠的位置测量。注意,Ncrit的值依赖于期望的反应时间,并依赖于初始估计器提供多少个初始测量。例如,在SLL的一测试实施例中,期望的反应时间是0.5秒,而提供的初始估计约每秒10个测量。结果,为了具有置信度1,至少需要5个测量,即Ncrit=5。增加Ncrit使得置信度水平从某人在特定位置开始说话的时间起缓慢地增加。然而,少于约5到10个测量的平均和统计处理在用于此测试实施例的SSL系统的类型中通常不十分可靠。
类似地,具有较大标准偏差的位置测量通常也较不可靠。最终,当特定位置测量是基于较早的数据时,那些位置估计也通常较不可靠。例如在一测试实施例中,当最近的测量的时效接近测量的生命周期时(见章节2.1和2.2对测量生命周期的讨论),对目标置信度水平降低。
因此在一实施例中,通过考虑每个上述因素对每个测量计算置信度水平。考虑这些因素来生成位置测量置信度水平的一个那样的方法由下面等式(9)和(10)提供ciN=n~i/Ncrit]]> ciρ=σρ/σ~ρ]]>等式(9)
ciT=(t-TiLast)/(2T)其中ciN是基于测量的数的置信度水平;ci、ciθ和ciρ是基于标准偏差的置信度水平;而ciT是基于最后一个测量时间标记TiLast的置信度水平,其中t是当前时间,而TL是测量的生命周期。在限止或限幅(Clipping)之后,等式(9)中示出的置信度水平子水平的值在0到1的范围中,然后最终置信度水平如下由等式(10)所示ci=ciNciciθciρciT等式(10)借助于将每个子置信度水平限止到此范围,其中最终置信度水平ci将在0到1之间。
然后与来自后处理的最终结果一起包括了对每个测量的计算的置信度水平(在章节3.2.1到3.2.4描述),以产生目标的列表,其每一个表示位置、置信度水平和标准偏差。如上所述,此列表表示初始定位估计的改进,并提供相对于初始定位估计更精确更可靠的定位测量或估计。
4.0后处理操作概况鉴于在章节2和3中提供的详述,上面参考图2描述的过程由图3的一般操作流程图示出。具体说来,图3示出表示后处理的操作的示例性操作流程图。应注意,在图3中用虚线表示的任何框和框之间的互连代表这里描述的后处理的替换实施例,且如下描述,任何一个或所有这些替换实施例可结合在此整篇文档中描述的其它替换实施例一起使用。
一般而言,如图3所示,后处理器操作开始于接受使用从接收阵列200产生定位测量的传统定位技术生成(300)的定位估计220的输入。如上所述,这些传统技术为本领域技术人员所熟知,并包括如使用麦克风阵列在有效体积内定位声源的传统的SSL技术。
然后有效体积被划分成若干重叠的区域或部分310。如章节3.2.1所述,在替换实施例中,重叠的区域的数目及使用的重叠的量或者是预定的、用户确定、或自动计算的。
接着,每个初始定位估计220基于这些处理定位估计的每一个的位置简单地被分配(320)给有效体积的对应区域。然而如上所述,对每个目标通常可得到多个定位估计。结果,由于使用区域重叠,特定的定位估计实际上能被分配给两个或多个区域。将这些初始定位估计分配(320)给各个区域用作形成在一个或多个区域内的定位估计群集。
然后使用在每个区域的群集的统计分析来判断哪个区域包含潜在的目标(330)。此步骤的要点在于简单地避免对那些不包含潜在目标的区域执行不必要的计算。因此虽然此步骤不是主要的,它确实起到减少后处理器的计算负担的作用。
一旦识别(330)了包含潜在目标的区域,再次使用代表在每个区域中每个潜在目标的群集的统计分析估计(340)每个潜在目标的位置。然后使用这些估计的位置来判断任何一个特定的目标是否为重复。例如,由于区域重叠并由于特定的测量能同时存在于两个或多个区域中,那些特定的目标可能被识别成在一个以上区域中的潜在目标。这个问题是通过对每个潜在的目标比较实际位置和计算的权重,以在潜在的目标之间的计算距离表明两个目标实际上是同一目标的情况下消除(350)较低权重的目标来解决的。
然后如上所述,使用余下的潜在目标填充新定位估计280的列表或组。此外在一实施例中,对每个新定位估计280的位置计算(360)置信度水平。一般而言,这些置信度水平基于若干因素提供新定位估计280的可靠性的测量,这些因素包括在计算新定位估计280中使用的测量的数目 、每个测量的计算的标准偏差 和用于计算新定位测量280的数据相对时效。
最后在一实施例中,将新定位估计280作为对用于生成(300)初始定位估计的初始定位系统的输入提供。例如本领域技术人员众知,在基于由如麦克风阵列或其它设备那样的接收器阵列200提供的新观察计算定位估计时,当前或以前的位置信息常常用作初始化因素。
为说明和描述的目的已提出用于自动提高初始定位估计的精度和可靠性的后处理器的上述描述。这不是试图包罗万象或将本发明限止在所揭示的精确形式。鉴于上述教义可能作出许多修改和变化。此外应注意,上述替换实施例的任一个或所有能以任何希望的组合方式使用,以形成后处理器的替换混合实施例。宗旨在于将本发明的范围不限于此详细的描述,而是由所附的权利要求书限止。
权利要求
1.一种用于自动提高初始定位估计的精度的系统,其特征在于,所述系统包括生成包括多个定位估计的定位数据的初始组;将一有效体积划分成预定数目的重叠区域;将每个定位估计分配给所述重叠区域的任何对应的一个或多个,以形成在所述一个或多个重叠区域中的定位估计的一个或多个群集;估计由定位估计的每个群集表示的目标的位置;通过比较重叠区域中的群集的所估计目标位置,判断任一目标是否为重复目标;消除每个重复目标;以及提供每个余下的已估计目标位置来填充位置估计组,所述位置估计组表示相对定位估计的所述初始组而言改善的定位估计的组。
2.如权利要求1所述的系统,其特征在于,还包括对所述位置估计组中的每个位置估计计算一置信度水平。
3.如权利要求1所述的系统,其特征在于,一生命周期与每个定位估计相关联,且其中,具有已过期生命周期的任何定位估计被排除在所述定位数据的初始组之外。
4.如权利要求3所述的系统,其特征在于,所述生命周期被计算成已估计的目标运动的函数。
5.如权利要求3所述的系统,其特征在于,每个定位估计的群集具有一单独的生命周期,每个群集的生命周期被计算成已估计的目标运动的函数。
6.如权利要求1所述的系统,其特征在于,所述位置估计组用于初始化由定位估计的每个群集表示的目标的位置的任何后续估计。
7.如权利要求1所述的系统,其特征在于,重叠区域的数目是用户可定义的。
8.如权利要求1所述的系统,其特征在于,重叠的量是用户可定义的。
9.如权利要求1所述的系统,其特征在于,还包括在估计由定位估计的每个群集表示的目标的位置之前,使用基于权重的阈值来判断特定的群集是否实际上代表目标。
10.如权利要求1所述的系统,其特征在于,用于判断任何目标是否为重复目标的准则是在任何两个或多个潜在目标之间的已计算距离的函数。
11.一种从一组初始定位估计自动生成一组新位置估计的方法,其特征在于,包括使用计算设备以便于通过将在初始定位估计组中的每个初始定位估计分配给覆盖由一接收阵列监控的有效体积的一个或多个对应的重叠区域,形成初始定位估计的一个或多个群集;从初始定位估计的每个群集计算新的位置估计;比较来自每个群集的新位置估计,以判断任何位置估计是否代表一重复目标的位置;通过舍弃具有比对应的重复位置估计更低的已计算权重的每个新位置估计,消除代表重复目标的新的位置估计;以及提供每个余下的新位置估计以填充新位置估计的组。
12.如权利要求11所述的方法,其特征在于,在形成初始定位估计的群集之前,比预定时间量更早的估计自动地从初始定位估计组中去除。
13.如权利要求12所述的方法,其特征在于,所述预定的时间量是通过估计从位置估计生成的估计的目标运动随时间变化的函数来计算的。
14.如权利要求11所述的方法,其特征在于,还包括对用于填充所述新位置估计组的每个新位置估计计算一置信度水平。
15.如权利要求11所述的方法,其特征在于,重叠区域的数目与重叠的量是用户可定义的。
16.如权利要求11所述的方法,其特征在于,从初始定位估计的每个群集计算新位置估计只对具有超过预定阈值的已计算权重的群集执行。
17.一种具有用于自动提高从接收阵列导出的初始定位估计的可靠性和精度的计算机可执行指令的计算机可读介质,其特征在于,所述计算机可执行指令包括根据从接收阵列接收的输入生成一初始定位估计组;将由接收阵列覆盖的有效体积划分成至少部分重叠的部分的组;将每个初始估计分配给一个或多个重叠的部分,以在一个或多个重叠部分中创建初始定位估计的一个或多个群集;识别任何重叠区域,其中,所述初始定位估计的群集代表潜在的目标;在包括表示潜在目标的群集的每个重叠区域中估计所述潜在目标的位置;比较每个估计的位置以判断任何所估计的位置是否表示重复潜在目标的位置;消除表示重复潜在目标的已估计位置;以及将每个余下的已估计位置提供给表示具有相对于初始定位估计提高的可靠性和精度的新定位估计的已估计位置组。
18.如权利要求17所述的计算机可读介质,其特征在于,还包括对提供给所述已估计位置组的每个已估计位置计算一置信度水平。
19.如权利要求17所述的计算机可读介质,其特征在于,一生命周期与每个定位估计相关联,且其中,生成所述初始定位估计组还包括排除其当前时效大于所述相关联的生命周期的任何定位估计。
20.如权利要求17所述的计算机可读介质,其特征在于,重叠区域的数目及重叠的量是用户可定义的。
21.如权利要求17所述的计算机可读介质,其特征在于,识别在其中初始定位估计的群集表示潜在目标的任何所述重叠区域还包括对每个群集计算一权重;将所述权重与预定权重阈值比较;以及排除其权重小于所述预定权重阈值的任何群集。
全文摘要
通过用于后处理初始定位数据的系统和方法,即使在包括噪声、反射、或其它干扰的环境下,也能够提高从传统的定位系统导出的定位估计的精度和可靠性。那样的定位系统包括基于麦克风阵列输入的传统声源定位(SSL)系统、基于定向天线阵列输入的射电源定位系统等。一般而言,此后处理系统和方法向初始定位估计应用统计实时群集,并随后在多阶段过程中使用此实时群集,以生成相对于初始定位估计有提高的精度和可靠性的新定位估计。
文档编号G01S3/14GK1664609SQ200510052968
公开日2005年9月7日 申请日期2005年3月1日 优先权日2004年3月1日
发明者I·J·塔谢夫 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1