一种基于聚类算法的群组识别方法

文档序号:6544466阅读:668来源:国知局
一种基于聚类算法的群组识别方法
【专利摘要】本发明提出一种基于聚类算法的群组识别方法,属于信息处理【技术领域】。所述方法以多个目标的状态信息为分析对象,包括粗聚类和层次聚类两个步骤。首先提取目标特征,包括经度、纬度、高度、速度大小及方向;接着采用均值漂移算法对目标归一化的经度、纬度和速度方向特征进行聚类,得到初步的群组发现结果,称为粗聚类结果。在聚类时设置了类内最少目标门限值,起到了排除单个噪声点的作用;最后利用目标的高度和运动速度特征对每个类分别进行多层次均值漂移聚类,进一步发现尚未被识别的群组,排除类内的噪声,得到更为准确的最终结果。
【专利说明】—种基于聚类算法的群组识别方法
【技术领域】
[0001]本发明涉及一种基于聚类算法的群组识别方法,属于信息处理【技术领域】。
【背景技术】
[0002]团队协作是现代社会的重要特征之一,多个相同或不同类型的成员组成团队,相互协作完成既定任务。相应地,目标状态分析也由以往对单个目标特征和描述的研究逐渐过渡到对群体目标的组织结构和空间分布特性的研究。对此首先要解决的就是群组识别的问题。通过对观测范围内的单目标的属性特征进行聚类,在特征空间中寻找特征点分布密集的区域,从而判断群组的个数,并识别各群组的成员。
[0003]群组识别可减轻数据分析人员的认知压力,是描述所观测空间的状态和形势的一种重要概念和方法。与原始的目标状态信息集相比,群组挖掘减少了指挥员需要关注的“焦点”数量,可以大大提高指挥员的决策速度和质量。目前,群组发现技术是数据挖掘领域的研究热点,具有重要的理论和应用双重价值。
[0004]聚类是识别群组的主要技术手段,目前有代表性的聚类方法包括:层次聚类、K均值聚类、均值漂移、谱聚类和基于人工神经网络的聚类等方法。其中,层次聚类方法简单,但当聚类的初始准确性不高时,无法进行回溯改进;谱聚类和基于神经网络的聚类方法聚类效果较好,但计算复杂,难以满足实时性要求;K均值聚类法计算简单,但需要先验知识(如分群个数K等)作为输入参数,若采用预先人工确定K值,通过随机选择初始化聚类中心的方法,智能化程度不高,而且聚类结果容易陷入局部最优解。均值漂移是一种无参数的概率密度函数估计算法,该方法在聚类时无需提供样本分布的先验知识,仅从数据本身来估计其分布情况。基于均值漂移的聚类方法可以自动判断群组个数,但识别结果对带宽尺度的变化很敏感,单一尺度的带宽无法应对数据分布的多样化。谱聚类方法具有严密的数学理论,但是计算开销大。人工神经网络模型聚类精度较高,聚类速度快,但是需要额外的数据来预先训练模型参数。
[0005]此外,在整个观测空间中,除了目标群之外还存在多种多样的单个目标,这些单个目标的分布具有不确定性,可以看作随机的噪声,传统的聚类分析算法并没有较好的排除噪声的能力。因此有必要提出一种智能化的群组识别方法,自动、准确地识别目标状态数据中的群组,同时去掉无关的噪声点。

【发明内容】

[0006]针对现有技术的不足,本发明提供一种基于聚类算法的群组识别系统及方法,相比传统的识别方法,本发明提供的系统及方法能以较大的概率准确地识别出观测范围内的群组,同时排除掉无关的噪声点。
[0007]为实现所述发明目的,本发明的一方面提供基于聚类算法的群组识别方法,其包括:S01:获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集;S02:从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类;S03:从待分析的对象目标集中提取出对粗聚类形成多个类的每一类中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集对每一类中的目标进行层次聚类形成待识别的群组。
[0008]优选地,采用均值漂移算法根据第一特征向量集对多个目标进行粗聚类形成多个类。
[0009]优选地,粗聚类包括设置类内目标门限数的步骤。
[0010]优选地,,采用均值漂移算法根据第二特征向量集对粗聚类形成多个类中的每一类进行层次聚类形成待识别的群组。
[0011]优选地,,层次聚类包括设置类内目标门限数的步骤。
[0012]为实现所述发明目的,本发明的另一方面提供一种基于聚类算法的群组识别系统,其包括:信息采集模块,其用于获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集;粗聚类模块,其从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类,以及层次聚类模块,从待分析的对象目标集中提取出对粗聚类形成多个类的每一类中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集每一类中的目标进行层次聚类形成待识别的群组。
[0013]优选地,粗聚类模块采用均值漂移算法根据第一特征向量集对多个目标进行粗聚类形成多个类。
[0014]优选地,粗聚类模块包括先验参数输入模块,先验参数输入模块输入了类内目标门限数。
[0015]优选地,层次聚类模块采用均值漂移算法根据第二特征向量集对粗聚类形成多个类的每一类进行层次聚类形成待识别的群组。
[0016]优选地,层次聚类模块包括先验参数输入模块,先验参数输入模块输入了类内目标门限数。
[0017]与现有技术相比,本发明提供的基于聚类算法的群组识别方法能以较大的概率准确地识别出观测范围内的群组,同时排除掉无关的噪声点。
【专利附图】

【附图说明】
[0018]图1是基于聚类算法的群组识别的流程图;
[0019]图2是基于均值漂移的粗聚类算法示意图;
[0020]图3是层次聚类过程示意图。
【具体实施方式】
[0021]下面结合附图详细说明本发明。
[0022]图1是基于聚类算法的群组识别的流程图。如图1所示,本发明提供的基于聚类算法的群组识别方法包括:
[0023]SOl:获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集;
[0024]S02:从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类;[0025]S03:从待分析的对象目标集中提取出每一类的中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集对每一类中的目标进行层次聚类形成待识别的群组。
[0026]仍如图1所示,本发明提供的基于聚类算法的群组识别系统包括:基于聚类算法的群组识别系统,其包括:信息采集模块,其用于获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集;粗聚类模块,其从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类,以及层次聚类模块,从待分析的对象目标集中提取出对粗聚类形成多个类的每一类中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集每一类中的目标进行层次聚类形成待识别的群组。
[0027]图2是基于均值漂移的粗聚类算法示意图。如图2所示,对多个目标进粗聚类包括:
[0028]S02-1:对第一特征向量集中每一维度进行归一化处理组成归一化第一特征向量集民,/ = 1,2,...,'} ,其中Xi _ [Xw,.^2?.,Α? ]中XwX21.,*?分力时曰弟^个目丰不的经度、讳度和
速度方向的归一化值;其中,釆用下式对目标的经度、纬度和速度方向进行归一化处理:
[0029]
【权利要求】
1.一种基于聚类算法的群组识别方法,其特征在于包括: 501:获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集; 502:从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类; S03:从待分析的对象目标集中提取出对粗聚类形成多个类的每一类中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集对每一类中的目标进行层次聚类形成待识别的群组。
2.根据权利要求1所述的基于聚类算法的群组识别方法,其特征在于,采用均值漂移算法根据第一特征向量集对多个目标进行粗聚类形成多个类。
3.根据权利要求2所述的基于聚类算法的群组识别方法,其特征在于,粗聚类包括设置类内目标门限数的步骤。
4.根据权利要求3所述的基于聚类算法的群组识别方法,其特征在于,采用均值漂移算法根据第二特征向量集对粗聚类形成多个类中的每一类进行层次聚类形成待识别的群组。
5.根据权利要求4所述的基于聚类算法的群组识别方法,其特征在于,层次聚类包括设置类内目标门限数的步骤。
6.一种基于聚类算法的群组识别系统,其特征在于,包括: 信息采集模块,其用于获取同一时间多个目标的多种状态信息形成待分析的对象目标信息集; 粗聚类模块,其从待分析的对象目标信息集中提取出所有目标的经度、纬度及目标的速度的方向组成第一特征向量集,根据第一特征向量集对多个目标进行粗聚类形成多个类,以及 层次聚类模块,从待分析的对象目标集中提取出对粗聚类形成多个类的每一类中的目标的高度和目标的速度大小组成第二特征向量集,并根据第二特征向量集每一类中的目标进行层次聚类形成待识别的群组。
7.根据权利要求6所述的基于聚类算法的群组识别系统,其特征在于,粗聚类模块采用均值漂移算法根据第一特征向量集对多个目标进行粗聚类形成多个类。
8.根据权利要求7所述的基于聚类算法的群组识别系统,其特征在于,粗聚类模块包括先验参数输入模块,先验参数输入模块输入了类内目标门限数。
9.根据权利要求8所述的基于聚类算法的群组识别系统,其特征在于,层次聚类模块采用均值漂移算法根据第二特征向量集对粗聚类形成多个类的每一类进行层次聚类形成待识别的群组。
10.根据权利要求9所述的基于聚类算法的群组识别方法,其特征在于,层次聚类模块包括先验参数输入模块,先验参数输入模块输入类内目标门限数。
【文档编号】G06F17/30GK104008127SQ201410162568
【公开日】2014年8月27日 申请日期:2014年4月21日 优先权日:2014年4月21日
【发明者】陈晓琳, 袁林, 韩国辉, 贲兴龙, 唐志军, 贾大文, 程浚, 冯燕来, 袁翔, 王稳军 申请人:中国电子科技集团公司第二十八研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1