基于聚类分析的目标快速关联方法

文档序号:6515932阅读:222来源:国知局
基于聚类分析的目标快速关联方法
【专利摘要】本发明提出的一种基于聚类分析的目标快速关联方法,旨在减少不必要的目标位置与属性比对次数,在不影响关联结果的前提下改善目标关联的时效性。本发明可以通过下述方案予以实现:首先构建一个结构体数组同时存放两待关联的子源目标信息,并标记好子源编号、信息地址和关联状态;其次利用位置坐标快速排序法和属性快速聚类法,按既定优先层次关系对结构体数组中的待关联目标按位置分量和属性信息进行递归快速排序和快速聚类,构建空间索引树;在空间索引树的支持下,采用基于密度的聚类算法分别将两子源测量到的位置邻近属性相同的目标进行递归聚类;待子序列目标总数少于预设值或无未使用的属性信息时,转为一一比对的关联方法完成目标关联判决。
【专利说明】基于聚类分析的目标快速关联方法
【技术领域】
[0001]本发明是关于数据挖掘领域中两子源态势数据中如何对含有属性信息和位置信息的多个目标进行快速关联的方法。
【背景技术】
[0002]聚类分析是数据挖掘领域中的一项重要的研究课题.它既可以作为一个单独的工具以发现数据库中数据分布的一些深入的信息,也可以作为其它数据挖掘分析算法的一个预处理步骤.聚类分析同时也是一个具有很强挑战性的领域,它的一些潜在应用对分析算法提出了特别的要求。在目标普通关联算法中,耗时会随着目标数的平方增加,同时待关联目标数往往能达几千量级,致使信息融合系统无法及时响应,如50个子源,1500个目标,目前使用的关联算法耗时487秒。为了保证系统的流畅运行,应尽量减少不必要的目标位置和属性的比对次数。目前典型的快速关联方法主要是区域关联算法,该算法主要存在以下不足:(I)它不适用于目标属性的判决;(2)目标区域划分存在随意性,当目标位于区域边界附近时,很容易关联错误;(3)算法性能不稳定,较大程度取决于目标的空间分布。在数据挖掘领域,聚类方法研究的很多,其中有种非常典型常用的方法,基于相对密度的聚类算法和快速DBSCAN聚类算法,称为DBSCAN,全称为Density-Based SpatialClustering of Applications with Noise algorithm,即基于密度的聚类算法(参考 NgR T, Han J.Efficient and effective clustering methods for spatial data mining.1n:Proc of the20th VLDB Conf.Santiago:Morgan Kaufmann, 1994, 144?155)。这种改进算法适用于空间中任意形状的蔟,简单高效。但这两种方法仍存在不足,.聚类与关联相似的地方就是将性质相同的目标搁置在一起,不同的是前者没有排它性,在一个样本空间只要满足聚类条件,可以同时聚类很多个目标;后者具有排它性,是在两个样本空间找到满足相似条件的目标点,一旦配对成功了,就不再增加进其它目标了。因此结合目标关联这种排它性的特点,又参照DBSCAN算法的精髓,同时借鉴其它一些改造DBSCAN的快速聚类方法,如发表在《计算机研究与发展》第37卷,第11期,第1287页名称为:一种基于密度的快速聚类算法,作者:周水庚,周傲英,曹晶,胡运发,提出的基于代表对象的快速聚类算法,设计出符合目标关联一般判决方法的空间索引树,形成了基于聚类分析的目标快速关联方法。周水庚等人通过选用核心对象附近区域包含的所有对象的代表对象作为种子对象来扩展类,达到减少区域查询次数的目的。其不足之处在于每次选择最远的点作为代表对象,这种策略适用于目标聚类分析,但并不适用于基于位置的目标关联,后者总是期望在关联门限内寻找可能配对的目标;而且因为提速的需要,上述方法只选取非常有限的代表点,数量通常为目标空间维数的2倍,使得该聚类方法会丢失少量位于特殊位置的对象。

【发明内容】

[0003]本发明的任务是针对子源多、目标多信息融合场景,目标关联耗时过大的问题,提供一种简单易懂,时效性高,对关联结果无影响,能够大幅度降低目标关联比对次数,基于聚类分析的目标快速关联方法。
[0004]本发明的上述目的可以通过以下措施来达到,一种基于聚类分析的目标快速关联方法,其特征在于包括如下步骤:
首先在快速关联模块中构建一个数组元素个数等于两子源探测到的目标数量之和的结构体数组,结构体数组中的每个元素均代表了某子源探测到的某个目标,将所有目标的初始关联状态均设为未关联,并在结构体数组中标记该目标来自于哪个子源的量测,包括目标在子源内部的目标编号、位置和属性信息的地址以及目标当前的关联状态;其次用位置坐标快速排序法和属性快速聚类法,按既定优先层次关系对上述结构体数组中的待关联目标以位置分量:地心地固ECEF坐标系下的X、Y和Z坐标值和属性信息为关键字,分别进行递归快速排序和快速聚类,构建递阶有序的空间索引树;然后在空间索引树的支持下,采用基于密度的聚类算法分别将两子源位置邻近属性相同的目标进行递归聚类,待子序列目标总数少于预设值k或再没有未使用的位置或属性信息时,则转为普通的一一比对的关联方法完成目标最终的关联判决。
[0005]本发明相比于现有技术具有如下有益效果。
[0006]本发明的核心创新点在于在进行目标位置或属性比对时,事先建立了空间索引树,使得目标排列井然有序,当进行关联判决时,因为大部分不关联的目标已被挪至位置较远处或划分到不同的目标类型中,故某个目标在寻找对应的关联目标时不需要比对另一子源量测中所有目标所有位置属性,仅需在位置较近的同类型目标中搜索关联目标即可;另外就是借鉴经典的快速排序方法采用了分层递归的目标关联判决流程,可以适应目标多个位置分量和多种属性的关联任务。本发明通过聚类方法有效地组织了所有待关联目标的位置和属性信息,特别是当目标数量达到了成百上千之多的时候,可以大大降低目标关联过程中需要比对的次数,从而大大提高了关联的时效性。另外只要关联判决条件没变,则关联结果与普通方法基本上是一样的。
[0007]本发明借鉴数据挖掘中一种较成熟的DBSCAN聚类分析方法,将两待关联的子源目标放置到同一个结构体数组中,再执行聚类分析,可操作性强,当目标数量较大的时候,关联的时效性改善非常明显,具有非常良好的工程应用前景。
[0008]本发明通过目标之间的位置和属性关系将其进行聚类组合,形成一个递阶的、有序的树形结构,称之为空间索引树,每层代表目标某种属性或位置。当聚类到目标数目少于某个定值k (建议取值30)或者没有进一步的目标位置或属性信息支持时,则转为逐一比对的普通关联方法,不再进行下一层聚类。在整个递归的聚类过程中,采用的典型算法就是快速排序法,对于位置信息它与传统的快速排序法是一致的,对于属性信息的聚类,则进行了一定的改造,即快速排序的左边数列不需要参与递归,因为它们的值都是相同的。
[0009]目标快速关联方法的增速源于省去了非常多的非关联目标的比对过程,而得以省去的基础是关联之前建立的空间索引树。得益于快速排序法的使用,目标快速关联方法建立空间索引树的计算复杂度是0(nlog2n),小于普通目标关联算法的计算复杂度0(n2)。因此,目标越多,时效性改善就越明显。如果目标少了,反而因为构建索引树等额外操作,增加的效率可能不及多耗去的时间。经过多次蒙特卡罗仿真,在两子源量测目标完全一致的情形下,当目标数为30左右时,快速关联算法所用时间与普通关联算法基本持平,这也是前面建议k取30的原因所在。当两子源量测目标并非一一对应时,则k值可取得更小。[0010]本发明目标快速关联方法较目标普通关联方法时效性高的原因是前者在空间索引树的支持下,进行聚类扩展时仅需在纯核心对象邻域中寻找种子对象即可,从而极大地减少了目标比对的次数。对于关联正确率,只要普通关联方法和快速关联方法的判决条件相同,则二者所得结果基本一样。本发明在不影响关联结果的前提下改善目标关联的时效性,能够减少不必要的目标位置与属性比对次数。
【专利附图】

【附图说明】
[0011]图1是本发明基于聚类分析的目标快速关联流程图。
【具体实施方式】
[0012]参阅图1。根据本发明,假设现有两个子源对同批次目标的位置与属性量测数据,需做目标关联处理,即辨别它们各自量测的目标中哪些属于共同目标。先将两待关联的子源目标放置到一起,并标记好子源编号、信息地址和关联状态(未关联、成功关联或独立目标)。在进行目标位置或属性比对时,首先构建一个结构体数组,数组中的每个元素均代表了某子源探测到的某个目标,并在结构体中标记该目标是来自哪个子源的量测,它在子源内部的编号、其位置属性信息的地址以及它当前的关联状态,其中所有目标的初始关联状态均设为未关联,其次执行聚类分析,用位置坐标快速排序法和属性快速聚类法,按既定优先层次关系对上述结构体数组中的待关联目标按位置分量和属性信息分别进行快速排序和快速聚类,构建空间索引树;然后在空间索引树的支持下,采用基于密度的聚类算法分别将两子源位置相近类型相同的目标进行递归聚类;当聚类到某层目标总数少于预设值k(即子序列目标集少于给定数目)或再没有未使用的位置或属性信息时,开始采用一一比对的普通关联方法完成目标关联判决。每次判决之后在完成目标关联表更新的同时,还须修改目标所对应的结构体数组元素中的关联状态,将它标记为成功关联或独立目标,被重新标记了关联状态的目标不再参与任何后续的关联处理。
[0013]假设当前需要做目标关联处理的是子源I和子源2的量测数据,其中子源I探测到的目标数为a个,子源2探 测到的目标数为b个,每个目标的数据结构基本相同,具有地心地固(简称ECEF)直角坐标系下的位置坐标X、Y、Z,原来是其它坐标系下的则通过简单的坐标变换转到ECEF坐标系下;同时具有属性1、属性2、…、属性n,总共n种属性,这里属性主要为目标识别信息。本发明适应的关联准则只能是“是”与“否”的判断,在确定两个目标是否关联的过程中,当比较它们的位置时,如果其直线距离小于等于预设的阈值,则程序判为“是”,大于则判为“否”;某种属性相同则判为“是”,不同则判为“否”。只有当两个目标其位置和所有n种属性的比较判决都为“是”的时候,程序才最终判它们为关联正确。具体流程包括:
(I)在快速关联模块中首先建立结构体数组,元素个数为两子源探测的总目标数a+b,每个结构体元素标明了目标来源于哪个子源,目标在子源内部的编号、目标的量测位置和属性信息,以及目标是否已被正确关联的标识。其中所有目标的量测位置和属性信息一般存放在另外某个固定的数组变量里面,而在结构体数组元素中,仅存放每个目标相应信息的地址指针即可。这样在后面快速聚类分析时,仅需挪动指针变量即可,而无需对原先存放目标位置和属性信息的数组变量进行任何更改,以达到提高关联效率的目的。是否正确关联则用单个整型变量进行标识,如果判决关联正确,则取值I ;如果判决为独立目标,即已发现另一子源没有任何目标与之正确关联,则取值2 ;初始值设为O。当取值非O时,该目标不再参与后续任何比对过程。
[0014](2)对结构体数组中的所有目标以其ECEF坐标系下的X坐标值为关键字进行递归快速排序,使结构体数组中的目标按坐标值X从小到大排列;排好序后,选择排序后的第I个目标,假设其X坐标为X1,按顺序向后查找,直到第i个目标的X坐标Xi满足X1-X1M,其中d为判断目标关联的距离阈值,此时将由前1-1个目标组成的序列称为子序列。在快速关联模块中将构建出的结构体数组按目标位置坐标X进行快速排序的具体步骤如下:按照分层递归的目标关联判决流程,
a)参照快速排序的方法,取第I个目标在ECEF坐标系下的X坐标值Xtl,后面所有目标如果其X坐标值小于等于Xtl,则移到第I个目标前面(即在结构体数组中的下标相对要小一些);否则移到第I个目标后面(即在结构体数组中的下标相对要大一些)。注意移动目标相对位置时结构体中的四项信息,即子源编号、目标编号、信息指针和关联标识要一起移动。
[0015]b)与快速排序方法一样,对于Xtl左边的数列和右边的数列分别重复上面步骤,并一直递归下去,直到左右下标相同,即剩下一个元素为止。
[0016]上述步骤(a)和步骤(b)的过程就是对所有目标以其ECEF坐标系下的X坐标值为关键字进行快速排序,使得结构体数组中的目标是按坐标值X从小到大排列的。
[0017](3)排好序后,开始进行基于位置的目标关联。选择排序后的第I个目标,假设其X坐标为X1,按顺序向后查找,直到第i个目标其X坐标Xi满足X1-X1M,其中d为判断目标关联的距离阈值,即当两目标之间距离大于d时,则判决它们不关联。由此排除第i个及它之后的所有目标,即第I个目标无需与第i个及它之后的所有目标再进行任何位置或属性比对。
[0018](4)程序开始判断子序列的目标总数1-1是否大于某个预设值,如果大于,则将该子序列所有目标再以其ECEF坐标系下的坐标分量Y为关键字进行一次快速排序,像步骤3所述的那样,得到由i2_l个目标组的新的子序列。如果发现i2_l仍然大于预设值,则将新的子序列再以坐标分量Z为关键字进行一次快速排序,得到由i3_l个目标组成的更新的子序列,继续将i3_l与预设值进行比较。接下来,程序开始判断可能关联的1-1个目标,如果1-1大于某个预设的值k (一般设值30),则将由这1-1个目标组成的序列再以其坐标Y为关键字进行一次快速排序和查找,像步骤(I)至(3)所述的那样,得到i2_l个目标。如果发现i2_l仍然大于某个预设的值k,则将由这i2_l个目标组成的序列再以其坐标Z为关键字进行一次快速排序和查找,得到i3_l个目标,继续与k值进行比较。
[0019]如果1-1 (或i2-l、i3-l)是小于等于某个预设的值k,则将第I个目标依次与第2个到第1-1 (或i2_l、i3_l)个目标进行一对一的距离判决和属性比对判决,即图1中所述的目标普通关联方法,如果发现距离小于d,属性又都一致,且是来自不同子源编号的目标,则判为关联,录入我们在关联模块中专设的作为输出用的目标关联表(即记录哪两个目标正确关联的一个列表,常用二维数组记录,一维标明目标在子源I中的编号,另一维标明目标在子源2中的编号),并在结构体数组中将二者标记成功关联,不参与任何后续关联过程。如未找到符合上述条件的目标,则将第I个目标的关联标识记为独立目标,也不再参与任何后续关联过程。[0020]对于第2个未被做任何关联标记的目标,假设其X坐标为X2,则重新判断X1-X2(或Yi2-Y2^Zi3-Z2)是否仍然大于d,如果大于,则同上一段所述目标普通关联方法那样对第2个目标与其之后子序列中的所有未做任何关联标记的目标进行一一比对,判决关联情况;如果小于山则再往后判断Xi+1-X2 (或Yi2+1-Y2、Zi3+1-Z2),直到出现Xj-X2 (或Yj2-Y2、Zj3-Z2)大于d为止,并将后续新增的所有目标纳进原子序列,重复执行一次本过程(4)。以此类推完成第3个、第4个未被做任何关联标记的目标直到整个结构体数组中没有再发现未被做关联标记的任何目标为止。 [0021 ] (5)当程序处理完目标位置信息发现子序列中尚未标记的目标数量仍然大于预设值k,或原目标并没有提供位置信息,则其开始进入属性快速聚类模块进行属性快速聚类。快速聚类过程如下:取第I个目标属性I的值Stl,后面所有目标如果其属性值等同于Stl,则移到第I个目标前面,即在结构体数组中的下标相对要小一些;否则移到第I个目标后面,即在结构体数组中的下标相对要大一些;对于第I个目标左边的数列维持不动,对于第I个目标右边的数列则重复上面的步骤,并一直递归下去,直到左右下标相同,即剩下一个元素为止。与一般快速排序不同的是其左边数列不需要再进行递归处理。对于属性,我们秉着优先处理取值空间少的属性信息,如敌我属性等,它只有三种取值可能,要么敌,要么我,要么中立。除了取值空间之外,还应当考虑目标分布的均匀性。比如对于敌我属性,如果明知道数千个目标中只有十几个敌方目标,非常失衡;而这些目标在水下、水上、陆地、空中的分布比较均匀,那么将目标的空间分布属性层次提到敌我属性层次上面,显然可以获得更好的时效性,因为后者聚类之后,关联的排它性更好了。而对于那些具有唯一标识的属性,如呼号等,则放到最底层。对于目标总共n种属性的优先层次关系,即各属性的先后处理顺序,必须在进行目标关联之前就设置好。
[0022](6)与步骤(3)类似,选择聚类后的第I个目标,假设其属性I的值为S1,按顺序向后查找,直到发现第i个目标其属性不再是S1为止。此时第i个及其之后的所有目标,都不可能与第I个目标关联,可以省去它们之间的任何比对过程,也就减少了目标比对的次数。
[0023](7)接下来同步骤4 一样,对于由1-1个目标组成的子序列,如果1-1大于预设值,再以二级优先的属性进行快速聚类,像步骤5所述的那样,又得到i2_l个目标。如果i2_l还大于预设值,则再以三级优先的属性进行快速聚类,得到i3_l个目标,并以此类推下去直到再没有可用属性或目标总数小于等于预设值k为止。
[0024]如果1-1 (或i2-l、i3-l、i4-l等)小于等于某个预设的预设值k或再没有可用属性,则将最后一次所得子序列如步骤5所述那样采用一一比对的关联方法逐个地进行关联判决,并在结构体数组中更改每个目标相应的关联状态,被更改的目标不参与任何后续关联过程。将最后一次所得序列的第I个目标依次与第2个到第1-1 (或i2-l、i3_l)个目标进行一对一的针对余下属性的比对判决,也即目标普通关联方法,如果余下属性又一致,且是来自不同子源的目标,则两目标判为关联,录入在关联模块中专设的作为输出用的目标关联表,并在结构体数组中将二者标记成功关联,不参与任何后续关联过程。如未能找到符合上述条件的目标,则将第I个目标的关联标识记为独立目标,也不参与任何后续关联过程。对于第2个未被做任何关联标记的目标,与其之后子序列中的所有未做任何关联标记的目标进行一一比对,类似地判决关联情况。第3个、第4个同样处理,直到子序列中每个目标都被标记正确关联或独立目标为止。[0025]举例说明:为测试方便,这里仅举例基于位置的目标快速关联方法。给定520像素X520像素固定大小的二维场景,以均匀分布方式随机投放n个目标,n的取值可变。现有雷达I和雷达2去量测它们,假定没有虚警和漏探情形发生,量测精度为I个像素,分别采用目标普通关联方法和目标快速关联方法进行关联,判决正确关联的阈值取4个像素。我们主要比较两种不同方法通过蒙特卡罗仿真得到的平均每拍关联所需的时间,并计算时耗的改善率,相关公式为:
所得结果如表1所示,我们可以发现改善率存在如下规律:
(I)随着目标数的增多,它的值越来越小,当目标数达到1000个时,每拍关联所需的时间约为原来的10%; (2)随着目标数的增多,它降低的幅度越来越小。表1普通关联方法与快速关联方法耗时比较
【权利要求】
1.一种基于聚类分析的目标快速关联方法,其特征在于包括如下步骤:首先在快速关联模块中构建一个数组元素个数等于两子源探测到的目标数量之和的结构体数组,结构体数组中的每个元素均代表了某子源探测到的某个目标,将所有目标的初始关联状态均设为未关联,并在结构体数组中标记该目标来自于哪个子源的量测,包括目标在子源内部的目标编号、位置和属性信息的地址以及目标当前的关联状态;其次按既定优先层次关系对上述结构体数组中的待关联目标以位置分量:地心地固ECEF坐标系下的X、Y和Z坐标值和属性信息为关键字,分别进行递归快速排序和快速聚类,构建递阶有序的空间索引树;然后在空间索引树的支持下,采用基于密度的聚类算法分别将两子源位置邻近属性相同的目标进行递归聚类,待子序列目标总数少于预设值k或再没有未使用的位置或属性信息时,则转为一一比对的关联方法完成目标最终的关联判决。
2.如权利要求1所述的基于聚类分析的目标快速关联方法,其特征在于:待聚类到子序列目标总数少于30个,预设值k取值30,当两个子源量测的目标并非一一对应时,可设为更小的值。
3.如权利要求1所述的基于聚类分析的目标快速关联方法,其特征在于:当进行关联判决时,先进行位置分量的快速排序,后进行各类属性的快速聚类。
4.如权利要求1所述的基于聚类分析的目标快速关联方法,其特征在于:所有目标的量测位置和属性信息存放在另外某个固定的数组变量里面,而在结构体数组元素中,仅存放每个目标相应信息的地址指针。
5.如权利要求1所述的基于聚类分析的目标快速关联方法,其特征在于:在确定两个目标是否关联的过程中,当比较它们的位置时,如果两个目标的直线距离小于等于预设的阈值,则程序判为“是”,大于则判为“否”;某种属性相同则判为“是”,不同则判为“否”;只有当两个目标其位置和所有n种属性的比较判决都为“是”时,程序才最终判为关联正确。
6.如权利要求1所述的基于聚类分析的目标快速关联方法,其特征在于:排好序后,选择排序后的第I个目标,假设其X坐标为X1,按顺序向后查找,直到第i个目标的X坐标Xi满足X1-X1M,其中d为判断目标关联的距离阈值,i为自然数,此时将由前1-1个目标组成的序列称为子序列。
7.如权利要求1所述的基于聚类分析的目标快速关联方法,其特征在于:程序开始判断子序列的目标总数1-1是否大于某个预设值,如果大于,则将该子序列所有目标再以其地心地固ECEF坐标系下的坐标分量Y为关键字进行一次快速排序,得到由i2_l个目标组的新的子序列;如果发现i2_l仍然大于预设值,则将新的子序列再以坐标分量Z为关键字进行一次快速排序,得到由i3_l个目标组成的更新的子序列,继续将i3_l与预设值进行比较。
8.如权利要求1所述的基于聚类分析的目标快速关联方法,其特征在于:如果1-1或i2-l、i3-l是小于等于预设值,则将第I个目标依次与第2个到第1-1或i2-l、i3_l个目标进行一对一的距离d和属性比对判决,如果发现距离小于d,属性又都一致,且是来自不同子源量测的目标,则判为正确关联,并在结构体数组中将二者关联状态更新为成功关联,不参与任何后续关联过程。
9.如权利要求1所述的基于聚类分析的目标快速关联方法,其特征在于:当程序处理完目标位置信息时发现子序列的目标数量仍然大于预设值,或原目标并没有提供位置信息,则进行属性快速聚类。
10.如权利要求1所述的基于聚类分析的目标快速关联方法,其特征在于:每次判决之后在完成目标关联表更新的同时,修改目标所对应的结构体数组元素中的关联状态,将它标记为成功关联或 独立目标,被重新标记了关联状态的目标不再参与任何后续的关联处理。
【文档编号】G06F17/30GK103617163SQ201310493512
【公开日】2014年3月5日 申请日期:2013年10月18日 优先权日:2013年10月18日
【发明者】宋文彬, 马霞, 陈怀新 申请人:中国电子科技集团公司第十研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1