物体定位方法和装置制造方法

文档序号:6500163阅读:161来源:国知局
物体定位方法和装置制造方法
【专利摘要】公开了一种物体定位方法,包括:从多个立体相机获得彩色图像和深度图像;利用每个立体相机获得的图像,对物体进行定位;对每个立体相机定位到的每个物体计算复合特征,该复合特征包括物体在统一世界坐标系下的位置信息并且包括物体的可见特征、速度矢量、加速度矢量中的至少一种;基于各个立体相机定位到的各个物体的复合特征,计算不同相机定位到的物体之间的相似度,从而确定不同相机定位到的物体是否属于同一物体;如果确定不同相机定位到的物体属于同一物体,则基于物体对于相机的可见度和物体与相机间距离,融合不同相机关于该同一物体的定位结果。该物体定位方法和装置可以降低融合歧义,得到更合理的融合结果。
【专利说明】物体定位方法和装置
【技术领域】
[0001]本发明总体地涉及图像处理,更具体地涉及基于立体视觉的物体定位方法和装置。
【背景技术】
[0002]近年来,基于视频的人的跟踪定位已成为了计算机视觉领域一个热门的研究课题,这是因为它是许多高层应用如人的动作识别,行为分析与预测的基础。人定位是指检测到人进而得到人在室内或者室外的位置信息,也就是得到人在世界坐标系中的坐标值(x, y, z)的过程。
[0003]已经存在一些利用立体摄像机采集的图像来定位跟踪对象的技术,例如,标题为“METHOD AND SYSTEM TO SEGMENT DEPTH IMAGES AND TO DETECT SHAPES INTHREE-DIMENSIONALLY ACQUIRED DATA” 的专利文献 US8009871B,标题为 “SURFACEGENERATION METHOD FROM BOUNDARIES OF STEREO IMAGES” 的专利文献 US5202928A,Michael Harville 在 2003 年发表的文章"Stereo Person Tracking with AdaptivePlan-View Templates of Height and Occupancy Statistics"等。
[0004]基于单个单目摄像机的人的跟踪定位这一研究课题已被广泛开展了多年,但目前,其仍是一个挑战性的技术课题,尤其是当前技术不能很好地适应宽敞且人流量大场景下的多人跟踪问题。造成这一问题的原因主要有:第一,人流量大,场景中出现的人多,势必造成一定的人与人之间的遮挡,这将在一定程度上降低跟踪的准确度;第二,单摄像机的拍摄范围有限,难以覆盖整个需要监视的区域。这样以来,为了克服上述问题,已经逐渐引入和采用基于多个立体双目相机的人的跟踪定位系统。

【发明内容】

[0005]如何利用多个立体相机的深度/视差信息来更有效地检测人、跟踪人和更精确地定位人,是对实际应用非常有意义的课题,可以通过使用融合技术来进行解决。融合,按照其融合对象的不同大致可以分为三类:原始数据集的融合;特征集的融合;以及结果集的融合。
[0006]对于多个立体相机诸如双目相机的场景而言,原始数据集的融合,即像素集的融合,网络传输数据量大和处理的数据量大,无法在实际场景中进行实时应用。
[0007]本发明关注结果集层面的融合。
[0008]专利US7929017B2提出了一种方法和装置用于立体相机、多相机以及RF和视频的融合。该方法融合单目相机、立体相机的跟踪结果,以及RFID、定位系统和生物识别系统的结果。该融合技术通过对不同传感器信息的噪声和模糊进行严格地不确定性分析后,进行传感器信息的转换。其基于时空约束来融合不同传感器的位置和速度信息。该专利提出的方法使用了贝叶斯方法来融合各类结果,融合目标是跟踪的结果和位置信息。为了增加稳定性,其考虑了时空的约束。[0009]专利US7742620B2提出了一种采用时空融合来提高目标检测的方法。该发明提出的目标检测方法采用预处理与后处理相结合的方法对传感器发来的数据进行时域上的融合。为了进一步提高目标的检出率以及避免传统恒虚警率检测器存在的缺点,该发明采用了双门限阈值与反向阈值的方法。
[0010]本发明的一个目的是希望提供一种物体定位方法和装置,其对多个物体距离较近且存在遮挡的情况具有较强的鲁棒性,能够准确地定位出对象。
[0011 ] 根据本发明的实施例,提供了 一种物体定位方法,包括:从多个立体相机获得彩色图像和深度图像;利用每个立体相机获得的图像,对物体进行定位;对每个立体相机定位到的每个物体计算复合特征,该复合特征包括物体在统一世界坐标系下的位置信息并且包括物体的可见特征、速度矢量、加速度矢量中的至少一种;基于各个立体相机定位到的各个物体的复合特征,计算不同相机定位到的物体之间的相似度,从而确定不同相机定位到的物体是否属于同一物体;如果确定不同相机定位到的物体属于同一物体,则基于物体对于相机的可见度和物体与相机间距离,融合不同相机关于该同一物体的定位结果。
[0012]根据本发明的另一实施例,提供了一种物体定位装置,包括:图像获得部件,从多个立体相机获得彩色图像和深度图像;物体定位部件,利用每个立体相机获得的图像,对物体进行定位;复合特征计算部件,对每个立体相机定位到的每个物体计算复合特征,该复合特征包括物体在统一世界坐标系下的位置信息并且包括物体的可见特征、速度矢量、加速度矢量中的至少一种;同一物体判定部件,基于各个立体相机定位到的各个物体的复合特征,计算不同相机定位到的物体之间的相似度,从而确定不同相机定位到的物体是否属于同一物体;结果融合部件,如果确定不同相机定位到的物体属于同一物体,则基于物体对于相机的可见度和物体与相机间距离,融合不同相机关于该同一物体的定位结果。
[0013]利用根据本发明实施例的物体检测方法和装置,因为引入了复合特征来判定不同相机定位到的物体是否属于同一物体,从而能够更好地区别如人与人之间距离很近情况下的人,避免融合歧义(fusion ambiguity);因为在融合不同相机的定位结果时综合考虑了物体对于相机的可见度和物体与相机间距离,因此得到更合理的融合结果。
【专利附图】

【附图说明】
[0014]图1 (a)和I (b)是根据本发明一个实施例的解释引入人相对于摄像机可见性原因的示意图。
[0015]图2(a)和(b)是根据本发明一个实施例的解释了双目立体相机用于人的跟踪定位时的鸟瞰图概念的示意图。
[0016]图3是根据本发明一个实施例的生成鸟瞰视图下的颜色直方图、鸟瞰视图下的高度直方图,鸟瞰视图下的表面积直方图的示意图。
[0017]图4是根据本发明一个实施例的通过复合特征融合多路跟踪结果完成人定位的系统不意图。
[0018]图5是根据本发明一个实施例的系统构架图以及构架中的每个组成部分所完成功能的示意图。
[0019]图6示出了根据本发明一个实施例的物体定位方法的总体流程图。
[0020]图7示出了根据本发明一个实施例的作为复合特征示例的人的速度矢量、相对于相机的可见度、转换后的高度直方图、转换后的颜色直方图的计算方法的流程图。
[0021]图8(a) ,8(b) ,8(c)是根据本发明一个实施例的解释人相对于摄像机可见度概念的示意图。图8 (a)示意性地示出了当人相对于摄像机完全可见时的鸟瞰视图下的表面积图;图8 (b)示意性地示出了当人被部分遮挡住时,其相应的鸟瞰视图下的表面积图;图8(c)示意性地示出了根据本发明实施例的计算人相对于摄像机可见度过程中所涉及的因素。
[0022]图9示出了根据本发明一个示例性实施例的基于各个立体相机定位到的各个物体的复合特征而建立的关联度矩阵的示意图。
[0023]图10是根据本发明一个实施例的由复合特征序列建立关联度矩阵的示例性方法的流程图。
[0024]图11示出了根据本发明一个实施例的基于关联度矩阵的示例性物体定位方法的流程图。
[0025]图12示出了根据本发明一个实施例的示例性物体定位装置的功能配置框图。
[0026]图13是示出按照本发明实施例的物体定位(跟踪)系统的总体硬件框图。
【具体实施方式】
[0027]以下,将参照附图描述本发明的优选实施例。需注意,在本说明书和附图中,具有实质上相同功能和结构的元件用相同的参考标记表示,并且省略了重复的解释。
[0028]将按下列顺序进行描述:
[0029]1、发明思想概述
[0030]2、本发明中的概念或术语含义
[0031]3、系统示意图
[0032]4、物体定位方法的概述
[0033]5、复合特征示例以及获得方法示例
[0034]6、基于复合特征序列建立关联度矩阵以及关联性判定
[0035]7、基于关联度矩阵的物体定位跟踪方法
[0036]8、物体定位装置
[0037]9、系统硬件配置
[0038]10、总结
[0039]1、发明思想概述
[0040]下面,首先总体介绍一下本发明的思想,以便本领域人员更好地理解本发明。
[0041]本发明中所关注的“融合”是结果的融合,更具体地,可以理解为在考虑某些因素的条件下,将从多个摄像机跟踪的结果根据某种策略合为一个跟踪结果,并把这个跟踪结果作为最终的融合结果。一般地,该最终的融合结果比单摄像机跟踪的结果精度要高。例如,一个人出现在了两台摄像机A和B视野的公共区域中,将从摄像机A和摄像机B检测和跟踪到的结果分别记为代81111:_4和result_B。由于代81111:_4和result_B是属于同一个人的跟踪结果,而该人的跟踪结果只能有一个。因此,需将其合并为一个result_f inal,作为最终的结果输出。在本发明中以上这个过程称之为“融合”。
[0042]发明人总结得出,融合涉及的技术点主要有:[0043](I)、当场景中出现了多个人的时候,如何判断哪些跟踪结果来自于同一个人,SP关联问题;
[0044](2)、当多个来自不同相机的跟踪结果被判定属于同一个人的时候,采用何种策略将这若干个结果融合为一个最终的结果输出。
[0045]对于第一个问题,现有的方案一般是根据不同跟踪结果间的距离来关联的。这样做的合理性在于,对同一个人的来自不同相机的跟踪结果在统一的世界坐标系下的距离不会相隔太大(理想情况下是完全重合,但是由于存在各种误差,它们之间会有距离偏差)。但是发明人发现,这种方法,在人与人之间距离很近的情况下将失效,从而产生融合歧义的问题(fusion ambiguity)。
[0046]对于第二个问题,现有的方案一般是根据摄像机的跟踪结果与相应相机的距离来衡量该跟踪结果在最终融合结果中的重要性。这是因为,一般而言,双目立体相机的深度值的精度会随着离相机距离的增大而降低。因此,对于属于同一个人的若干跟踪结果,在融合时,一般根据他们离相应相机的距离来分配它们在最终结果中的重要性。但是,发明人发现,当人被部分遮挡时,这种融合方案可能有失妥当,如图1(a)和图1(b)所示。在图1(a)中,有两个人A和B出现在了摄像机Cl和摄像机C2视野的公共交叠区域。假设人A比人B高,对于摄像机C2,人B部分可见(存在源于人A的遮挡);对于摄像机Cl,人B完全可见(不存在遮挡)。图1(b)是图1(a)对应的俯视图,其中直线1、2、3代表摄像机Cl的视野或者说视角边缘;直线4、5、6代表摄像机C2的视野或者说视角边缘,圆点IB和2B分别表示摄像机Cl和摄像机C2对人B的跟踪结果,而dl和d2分别表示跟踪结果1B、2B和相应相机C1、C2的距离(为了表示的清晰,人A的跟踪结果未在图上标记出)。按照现有的方法,在只考虑跟踪结果与摄像机距离的因素下,因为摄像机C 2和对应跟踪结果2B的距离比摄像机C I和对应跟踪结果IB的距离更小,因此摄像机C2的跟踪结果被认为更精确,从而在融合中将给予更大的权重。然而,事实上,人B对于摄像机C2仅部分可见,这将在一定程度上影响C2对人B的跟踪;而人B对于摄像机Cl完全可见。若加之考虑人对摄像机可见性的因素,来自Cl的跟踪结果的重要性将在融合时得到提升。
[0047]鉴于以上发现,为了克服上述两个问题,发明人提出如下解决思想:
[0048](I)、上述融合歧义性问题产生的根源在于缺少可观测的特征。因此,本发明人提出基于更复杂的复合特征的关联方法,该复合特征除了位置信息外还包括统计的可观测特征;
[0049](2)、在融合时,不仅考虑跟踪结果与相应相机的距离,还考虑人对于相机的可见度。
[0050]后续将结合具体实施描述实践本发明的思想的示例。
[0051]2、本发明中的概念或术语含义
[0052]下面介绍与本发明相关的鸟瞰视图、鸟瞰视图下的高度直方图,颜色直方图和表面积直方图以及转换的高度直方图、转换的颜色直方图的概念,更多细节请参看MichaelHarville 于 2003 年发表的论文“Stereo Person Tracking with Adaptive Plan-ViewTemplates of Height and Occupancy Statistics,,
[0053]“鸟瞰图”或“俯视图”:本发明中的鸟瞰图是指是指当世界坐标系的两个坐标轴XZ置于地面(下文称之为X O Z平面)上时世界坐标系中的点投影到X O Z平面下获得的图像。
[0054]图2(a)和(b)是根据本发明一个实施例的解释了双目立体相机用于人的跟踪定位时的鸟瞰图概念的示意图。
[0055]图2(a)示出了将立体摄像机获得的立体图像进行坐标转化,获得相当于假想的摄像机垂直拍摄物体的立体图像的示意图;以及图2(b)示意性示出了真实立体摄像机拍摄的图像和假想的摄像机拍摄的图像的对比示意图。
[0056]如图2a所示,在已知摄像机外参(图2(a)中的R和T)的情况下,对于按照与对面成一定倾斜角度布置的真实摄像机所拍摄的图像,可以将图像中的任意一个像素位置转换到世界坐标系,转换后就得到了如同图2(a)中的假想摄像机垂直俯拍物体时得到的立体图像。注意,图2(a)中的摄像机外参R为旋转参数,外参T为平移参数,具体描述可参见上述 T.Darrel 于 2001 年发表的文章 “Stereo Person Tracking with Adaptive Plan-ViewTemplates of Height and Occupancy Statistics,,。
[0057]鸟瞰视图下的高度直方图、颜色直方图、表面积直方图:图3示出了从立体图像即彩色图像和深度图像获得鸟瞰视图下的高度直方图、颜色直方图和表面积直方图的示例性过程的示意图。具体地,从双目摄像机获取颜色图和深度图后,首先通过背景减除法提取前景像素,然后把提取到的前景像素投影到三维世界坐标系中。并且将世界坐标系沿垂直于XOZ平面的方向分成等底面积的小立方体,称之为BIN,然后基于BIN,生成三种图:
[0058]鸟瞰视图下的高度肓方图:统计落入每个BIN中的最高点的高度,反映在图上为:高度越高,亮度越亮。
[0059]鸟瞰视图下的颜色肓方图:保存高度图中每个最高点的颜色,可以近似的看成是从上往下观察人的外观颜色。
[0060]鸟瞰视图下的表面积肓方图:保存的是落入每个BIN中的像素点的个数,反映在图上为:点数越多,亮度越亮。
[0061]上述表面积直方图、高度直方图可以视为立体图像在某个平面视图上物体的表面点的分布的统计数据,在某些文献例如标题为〃Plan-view trajectory estimation withdense stereo background model〃的T.Darrel于2001年发表的文章中也称为外观平面视图(Appearance plan view),或者同属理光株式会社 申请人:的发明人为王鑫等的专利申请号为CN201210292660.2的发明专利申请中被称为累加俯视图或高度俯视图,或者在同属理光株式会社申请的发明人为范圣印等的专利申请号为CN201210574632.X中被称为外观二维直方图或高度二维直方图。这里通过引用将上述三篇文献并入本文。
[0062]本文中的颜色直方图的获得方法和高度直方图的获得方法类似,只不过代替保存每个BIN中的最高点的高度,保存最高点的颜色。
[0063]另外,下文某实施例中,为了例如简化处理和适于实际应用的目的,可以对上述高度直方图和颜色直方图通过进一步统计进行转换处理,以转换成去除了位置信息的直方图。具体地,例如,对于高度直方图,可以通过统计像素值落入例如各区间[80,90], [90,100],...[190,200]内的像素个数,从而得到了转换后的高度直方图。类似地,可以得到转换后的颜色直方图。下文中,为了与高度直方图和颜色直方图进行区分的目的,将此转换后的直方图称为转换后的高度直方图和转换后的颜色直方图。
[0064]3、系统示意图[0065]图4是根据本发明一个实施例的通过复合特征融合多路跟踪结果完成人定位的系统示意图。图4主要示例性给出了本发明实施例的输入和输出。其中,输入的信息来自于两个双目相机,图4中仅给出了两个双目相机,实际上本发明可以支持一个、两个、更多个双目相机。本发明实施例的输出是定位到的人的位置,我们以鸟瞰图或俯视图的形式呈现出来。图1中的两个圆1、2表示的是两个双目相机在鸟瞰图中的位置;线A,B,C表示的是双目相机I的视角边缘;D,E,F表示的是双目像机2的视角边缘;正方形3、4表示经融合后的人在统一世界坐标系下的位置。
[0066]需要说明的是,本例子以及后续例子中,以人为检测目标,并假设人站在地面上。不过这仅为示例,本发明并不局限于此,可以以任何物体为检测目标,如动物、椅子等等,而且被检测对象可以任意布置而未必一定位于地面上。
[0067]图5示出了根据本发明一个实施例的示例性系统构架以及构架中的每个组成部分所完成功能的示意图。在该例子中,装置系统主要包括两个部分:第一个部分是在客户端上运行的复合特征队列生成模块;第二个部分是在服务器端运行的基于复合特征序列的多路跟踪结果融合模块。这两个部分之间通过网络进行连接。
[0068]4、物体定位方法的概述
[0069]下面参考图6描述根据本发明一个实施例的、利用多个立体摄像机来对物体进行定位的整体过程。
[0070]图6示出了根据本发明一个实施例的物体定位方法100的总体流程图。
[0071]为便于描述,该总体流程图假定针对一预定空间中,布置了多个立体摄像机,以对出现于该预定空间中的对象进行立体成像,通过对立体图像进行处理来进行对象检测。
[0072]关于预定空间,例如可以是一个房间,例如超市、厂房等,不过也可以是室外的空间,例如学校场地、军工场所等,只要是可以作为监控对象的空间即可。关于被检测的对象,没有特别限制,可以是人、动物、飞行物、汽车、椅子等等。
[0073]关于立体摄像机是指能够对物体进行三维成像或立体成像的摄像机,一般可同时输出深度图像和彩色图像(或灰度图像)。作为立体摄像机的例子,一类立体摄像机使用主动发射红外光来辅助生成立体信息,这样的摄像机例子,有微软的Kinect,还有基于红外光飞行时间(Time of Flight,T0F)技术的类型,或者基于纹理光的类型。作为立体摄像机的另一例子,另一类立体摄像机基于立体视距的双目原理,例如双目摄像机或多目摄像机。为描述便利,下文将采用双目摄像机为例进行说明,不过本发明并不局限于此,而是可以应用任何立体摄像机。
[0074]请注意,由于使用立体摄像机,能得到准确的三维信息。所以本发明提出的人的检测应理解为可以同时完成检测和定位,当然不必说也可以仅进行对象检测和定位之一。
[0075]如图6所示,在步骤SllO中,从多个立体相机的每个获得彩色图像和深度图像。
[0076]在步骤S120中,利用每个立体相机获得的图像,对物体进行定位。
[0077]任何基于彩色图像和/或深度图像进行物体检测和/或定位的方法均可以用于本发明。
[0078]在一个示例中,对物体进行定位包括从深度图像或彩色图像提取前景,或者说进行前景分割,即从立体图像中将作为处理对象的前景与背景分开,并提取出前景。作为提取前景的方法的示例,可以根据深度信息或者颜色信息,或者是两者的结合建立起当前场景的背景模型;然后根据建立的背景模型,采用背景减除法,获得每一帧图像上的前景。背景建模可以使用静态背景建模,也可以使用动态背景建模,作为一种示例性实现,可以使用RGBD的混合高斯动态建模来分割前景,具体可以参考标题为"Plan-view trajectoryestimation with dense stereo background model〃的 T.Darrel 于 2001 年发表的文章。
[0079]在前景提取之后,对于提取到的前景像素,采用例如图3中所示的方法,利用深度信息将其投影到三维空间中,生成鸟瞰图。接着在鸟瞰图上完成对人进行检测。这里可采用的检测方法可以有很多,最终的输出为鸟瞰图下人的外接矩形框。
[0080]这里,对于检测方法,本发明没有特别限制,任何检测方法都可以用于本发明,例如基于连通域分析来分割和检测对象的方法等。
[0081]作为一个物体检测方法示例,可以通过物体标准模板和表面积直方图中待检对象进行匹配的方法进行检测。具体地,例如通过将被检测物体和物体标准模板进行匹配、确定匹配程度、将匹配程度和阈值进行比较来检测物体。
[0082]例如,在一个示例性检测方法中,通过将物体标准模板和表面积直方图中待检对象进行匹配来检测对,例如以预定形状例如矩形、圆形等的匹配窗口在表面积直方图上移动,通过匹配窗口内的区域和物体标准模板的匹配来检测物体。例如,在检测人的情况下,计算匹配窗口内的物体表面积,将计算的物体表面积和标准物体的表面积大小进行比较,如果差值小于预定阈值,则认为匹配窗口内存在待检测对象即人,否则认为不存在待检测对象。
[0083]作为物体检测方法的另一示例,可以通过对物体检测模型进行建模的方法来对物体进行检测。
[0084]在同属理光株式会社 申请人:的发明人为王鑫等的专利申请号为CN201210292660.2的发明专利申请中或者在同属理光株式会社申请的发明人为范圣印等的专利申请号为CN201210574632.X的发明专利申请中介绍的物体检测方法均可以用于本发明。
[0085]在步骤S130中,对每个立体相机定位到的每个物体计算复合特征,该复合特征包括物体在统一世界坐标系下的位置信息并且包括物体的可见特征、纹理、速度矢量、加速度矢量中的至少一种。
[0086]在一个示例中,复合特征包括物体在统一世界坐标系下的位置信息、某种可见特征和速度矢量。可见特征例如包括物体相对于立体相机的可见度(或表面积直方图)、物体在鸟瞰视图下的高度直方图、以及物体在鸟瞰视图下的颜色直方图中的一种或者几种的任
意组合。
[0087]下文中,将参考图7、图8(a)_8(c)详细描述各种复合特征以及获得方法示例。
[0088]在步骤S140中,基于各个立体相机定位到的各个物体的复合特征,计算不同相机定位到的物体之间的相似度,从而确定不同相机定位到的物体是否属于同一物体。
[0089]下文将参考图9-10描述通过基于来自各个相机的复合特征序列建立关联度矩阵来计算不同相机定位到的物体之间的相似度(或关联度),从而确定不同相机定位到的物体是否属于同一物体的示例。
[0090]在步骤S150中,如果确定不同相机定位到的物体属于同一物体,则基于物体对于相机的可见度和物体与相机间距离,融合不同相机关于该同一物体的定位结果。[0091]在一个示例中,基于物体对于相机的可见度和物体与相机间距离,融合不同相机关于该同一物体的定位结果包括:如果确定不同相机定位到的物体属于同一物体,则如果可见度最高的物体定位结果相关联的相机和距离所定位的物体位置最近的相机为不同的相机,则融合该可见度最高的物体定位结果和距离所定位的物体位置最近的相机的物体定位结果。
[0092]例如,假设摄像机A的一个物体定位结果是Ra (PA,VA,DA),摄像机B的一个物体定位结果是Rb (Pb, Vb, Db),且来自摄像机A的物体定位结果Ra (Pa, Va, Da)和来自摄像机B的物体定位结果Rb(Pb,Vb,Db)被判定为属于同一个人的定位结果。这里P表示在统一世界坐标系下的位置坐标,V表示可见度,D表示人离摄像机的距离,即Pa表示摄像机A的物体定位结果在统一世界坐标系下的位置坐标,Va表示摄像机A定位的该物体相对于摄像机A的可见度,Da表示摄像机A定位到的该物体相对于摄像机A的距离;类似地,Pb表示摄像机B的物体定位结果在统一世界坐标系下的位置坐标,Vb表示摄像机B定位的该物体相对于摄像机B的可见度,Db表示摄像机B定位到的该物体相对于摄像机B的距离。在一个示例中,可以通过公式(I)将这对关联上的跟踪结果融合:
[0093]
【权利要求】
1.一种物体定位方法,包括: 从多个立体相机获得彩色图像和深度图像; 利用每个立体相机获得的图像,对物体进行定位; 对每个立体相机定位到的每个物体计算复合特征,该复合特征包括物体在统一世界坐标系下的位置信息并且包括物体的可见特征、速度矢量、加速度矢量中的至少一种; 基于各个立体相机定位到的各个物体的复合特征,计算不同相机定位到的物体之间的相似度,从而确定不同相机定位到的物体是否属于同一物体; 如果确定不同相机定位到的物体属于同一物体,则基于物体对于相机的可见度和物体与相机间距离,融合不同相机关于该同一物体的定位结果。
2.根据权利要求1的物体定位方法,其中复合特征包括物体的可见特征和速度矢量,该可见特征包括物体相对于立体相机的可见度、物体在鸟瞰视图下的高度直方图、以及物体在鸟瞰视图下的颜色直方图。
3.根据权利要求1的物体定位方法,所述基于各个立体相机定位到的各个物体的复合特征,计算不同相机定位到的物体之间的相似性,从而确定不同相机定位到的物体是否属于同一物体包括: 基于各个立体相机定位到 的各个物体的复合特征,建立关联度矩阵,其中对于来自任意两个相机的两个第一和第二复合特征序列,关联矩阵的行数等于第一复合特征序列所包含的元素个数,关联矩阵的列数等于第二复合特征序列所包含的元素个数,反之亦然,其中每个相机的复合特征序列由该相机定位到的各物体的复合特征作为元素而组成; 依次计算第一复合特征序列中每个第一元素所包含的物体在统一世界坐标系下的位置与第二复合特征序列中每个第二元素所包含的物体在统一世界坐标系下的位置之间的距离; 如果距离大于预定的距离阈值,将该复合特征矩阵的相应元素设定为O ; 否则,计算第一元素和第二元素之间的相似度,并将该相似度与预定阈值比较;如果该相似度小于预定阈值,将矩阵的相应元素设定为O ;否则保存该相似度到矩阵的相应元素中。
4.根据权利要求3的物体定位方法,所述基于各个立体相机定位到的各个物体的复合特征,计算不同相机定位到的物体之间的相似度,从而确定不同相机定位到的物体是否属于同一物体包括: 根据关联度矩阵,为第一复合特征序列中的物体和第二复合特征序列中的物体,分配局部或全局的最优关联,这里的关联是指将两个相机定位到的哪两个物体确定为属于同一物体。
5.根据权利要求1的物体定位方法,基于物体对于相机的可见度和物体与相机间距离,融合不同相机关于该同一物体的定位结果包括: 如果确定不同相机定位到的物体属于同一物体,则如果可见度最高的物体定位结果相关联的相机和距离所定位的物体位置最近的相机为不同的相机,则融合该可见度最高的物体定位结果和距离所定位的物体位置最近的相机的物体定位结果。
6.一种物体定位装置,包括: 图像获得部件,从多个立体相机获得彩色图像和深度图像;物体定位部件,利用每个立体相机获得的图像,对物体进行定位; 复合特征计算部件,对每个立体相机定位到的每个物体计算复合特征,该复合特征包括物体在统一世界坐标系下的位置信息并且包括物体的可见特征、纹理、速度矢量、加速度矢量中的至少一种; 同一物体判定部件,基于各个立体相机定位到的各个物体的复合特征,计算不同相机定位到的物体之间的相似度,从而确定不同相机定位到的物体是否属于同一物体; 结果融合部件,如果确定不同相机定位到的物体属于同一物体,则基于物体对于相机的可见度和物体与相机间距离,融合不同相机关于该同一物体的定位结果。
7.根据权利要求6的物体定位装置,其中复合特征包括物体的可见特征和速度矢量,该可见特征包括物体相对于立体相机的可见度、物体在鸟瞰视图下的高度直方图、以及物体在鸟瞰视图下的颜色直方图。
8.根据权利要求6的物体定位装置,所述基于各个立体相机定位到的各个物体的复合特征,计算不同相机定位到的物体之间的相似性,从而确定不同相机定位到的物体是否属于同一物体包括: 基于各个立体相机定位到的各个物体的复合特征,建立关联度矩阵,其中对于来自任意两个相机的任意两个第一和第二复合特征序列,关联矩阵的行数等于第一复合特征序列所包含的元素个数,关联矩阵的列数等于第二复合特征序列所包含的元素个数,反之亦然,其中每个相机的复合特征序列由该相机定位到的各物体的复合特征作为元素而组成;依次计算第一复合特征序列中每个第一元素所包含的物体在统一世界坐标系下的位置与第二复合特征序列中每个第二元素所包含的物体在统一世界坐标系下的位置之间的距离;如果距离大于预定的距离阈值,将该复合特征矩阵的相应元素设定为O ;否则,计算第一元素和第二元素之间的相似度,并将该相似度与预定阈值比较;如果该相似度小于预定阈值,将矩阵的相应元素设定为O ;否则保存该相似度到矩阵的相应元素中。
9.根据权利要求8的物体定位方法,所述基于各个立体相机定位到的各个物体的复合特征,计算不同相机定位到的物体之间的相似度,从而确定不同相机定位到的物体是否属于同一物体包括: 根据关联度矩阵,为第一复合特征序列中的物体和第二复合特征序列中的物体,分配局部或全局的最优关联,这里的关联是指将两个相机定位到的哪两个物体确定为属于同一物体。
10.根据权利要求6的物体定位方法,基于物体对于相机的可见度和物体与相机间距离,融合不同相机关于该同一物体的定位结果包括: 如果确定不同相机定位到的物体属于同一物体,则如果可见度最高的物体定位结果相关联的相机和距离物体最近 的相机为不同的相机,则融合该可见度最高的物体定位结果和距离物体最近的相机的物体定位结果。
【文档编号】G06T7/00GK104021538SQ201310063037
【公开日】2014年9月3日 申请日期:2013年2月28日 优先权日:2013年2月28日
【发明者】王千, 王鑫, 范圣印, 乔刚 申请人:株式会社理光
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1