一种基于移动对象时空信息轨迹分段聚类的方法

文档序号:6518403阅读:386来源:国知局
一种基于移动对象时空信息轨迹分段聚类的方法
【专利摘要】本发明公开了一种基于移动对象时空信息轨迹分段聚类的方法,该基于移动对象时空信息轨迹分段聚类的方法包括:引入时间、速度和方向三个属性,并给出他们的相似度计算公式来分析移动对象轨迹内外部结构;首先根据轨迹的空间密度将轨迹划分成若干轨迹段,然后通过计算各轨迹段在空间、时间、速度和方向上的差异来判断轨迹段的相似度,最后,基于第一次聚类结果,将非显著簇中的轨迹段删除或并入邻近的显著簇,使聚类空间形态体现出全局性的移动规律。本发明提高了聚类效果,具有更强的应用价值,采用空间四叉树对轨迹段进行索引,在大规模轨迹数集环境下极大提升聚类效率,可对轨迹进行有效聚类。
【专利说明】一种基于移动对象时空信息轨迹分段聚类的方法【技术领域】
[0001]本发明属于轨迹地理坐标值进行聚类【技术领域】,尤其涉及一种基于移动对象时空信息轨迹分段聚类的方法。
【背景技术】
[0002]时空轨迹是移动对象的位置和时间的记录序列,包括了时间、位置、速度等基础信息。随着移动互联网、定位系统等技术的快速发展,在交通、物流等应用领域,通过智能移动终端能够及时收集大量的时空轨迹(Trajectory)数据。作为一种重要的时空对象数据类型和信息源,时空轨迹数据蕴含着丰富的知识,其应用范围涵盖了人类行为、交通物流、应急疏散管理、动物习性和市场营销等诸多方面。聚类分析是对数据对象进行分组,使得同一组中对象之间具有较高的相似度,而不同组中的对象具有较低的相似度。轨迹聚类的目标是寻找那些具有相同运动模式的轨迹,通过对轨迹内部运动模式和特征信息的分析,确定轨迹间的相似程度,然后将相似程度较高的轨迹归为一类。通过对各种时空轨迹数据进行聚类分析,提取时空轨迹数据中的相似性与异常特征,有助于发现其中有意义的模式。
[0003]近年来,世界各国的研究人员提出了多种轨迹聚类方法,,如K-MEANS、BIRCH,DBSCAN、OPTICS、STING等[5]。KREVELD等[6]首次将轨迹的时间依赖关系引入到形状依赖的轨迹分析中,KNORR等将轨迹的起始位置、方向等要素引入轨迹间的相似度计算。张延玲等通过轨迹聚类得到运动模式,Ping等提出了路网空间下基于密度的轨迹聚类方法,该方法首先根据移动对象经过的道路计算出繁忙路径,然后根据用户设置的密度参数对子轨迹进行聚类。Sang等提出首先计算重叠路段长度的相似度,然后进行聚类。Ying等提出了在路网约束下综合考虑时间和空间约束的轨迹相似性度量方法,并应用于轨迹聚类。这些方法大多是基于整条轨迹 采样点空间信息进行聚类,没有全面考虑轨迹的局部特征和移动属性,难以匹配路径较长或较复杂的轨迹。
[0004]目前直接以轨迹地理坐标值进行聚类,导致聚类效果降低。

【发明内容】

[0005]本发明实施例的目的在于提供一种基于移动对象时空信息轨迹分段聚类的方法,旨在解决目前直接以轨迹地理坐标值进行聚类,导致聚类效果降低的问题。
[0006]本发明实施例是这样实现的,一种基于移动对象时空信息轨迹分段聚类的方法,该基于移动对象时空信息轨迹分段聚类的方法包括以下步骤:
[0007]第一步,轨迹和轨迹段:
[0008]定义I轨迹:三维空间中的有序点集称为轨迹,轨迹TRi定义=TRi=IPliP2,...,pk},其中Pk= {xk, yk,tk},分别代表该点的二维空间坐标和采用时间,不同轨迹长度可能不一样;
[0009]定义2轨迹段:为TRi内连续的部分三维点集,如:SubTrajectorys= {p1;..., pk}(I ^ s ^ k), k为该轨迹段所属轨迹的采样点总数;[0010]第二步,Hausdorff距离:给定两个轨迹段P和Q,使用HausdorfT距离进行相似性测量:
【权利要求】
1.一种基于移动对象时空信息轨迹分段聚类的方法,其特征在于,该基于移动对象时空信息轨迹分段聚类的方法包括以下步骤: 第一步,轨迹和轨迹段: 定义I轨迹:三维空间中的有序点集称为轨迹,轨迹TRi定义=TRi = {Pl, P2, , PkI,其中pk={xk,yk,tk},分别代表该点的二维空间坐标和采用时间; 定义2轨迹段:为TRi内连续的部分三维点集,如:SubTrajectorys= (P1,..., pk}(I ^ s ^ k), k为该轨迹段所属轨迹的采样点总数; 第二步,Hausdorff距离:给定两个轨迹段P和Q,使用HausdorfT距离进行相似性测量:
Zi(P5Q)-max{h(P,Q),h(Q,P)}
-Zr(P5Q) = maxmin{i/(p,g)}
peP qeQ κ
Α(Ρ, Q) = max min{d(p, q)} Vp龟P q^Q 其中,d(p, q)为点p和q之间某个属性上的距离公式,Hausdorff距离用以量度轨迹段之间的空间和时间差异度; 第三步,轨迹段速度:` 通过如下公式得到每个采样点速度:
distance^ ,p) + distance^/?+ ) ' =-_~T~rt-
P+ P- 其中,P-为P点之前的相邻采样点,P+为P点之后的相邻采样点,V和&分别代表P-和P+的米样时间; 第四步,轨迹段方向 轨迹段的总体移动方向之间方向差别,运动方向角?厂,其中,(Xs, ys)轨迹段起点,(Xyye)为轨迹段终点; 第五步,轨迹段邻域:
定义 3 轨迹段 Li 的 ξ 邻域 Nx(Li) =Nx(Li) = ILi 危 DlcKLi, Lj) 1}; 其中,D为所有轨迹段数据集合,轨迹段领域用以在DBSCAN轨迹密度聚类中,判断每个轨迹段的当前空间密度,进而将空间密度较大的轨迹段聚为同一组; 第六步,轨迹分割;通过采样点在某个时间段内的速度变化来分割轨迹; 定义4断点:假设存在一轨迹段,位于轨迹段上的任何两点之间的距离不超过阈值ε,并且这段子轨迹的采样点数s大于阈值Ε,则将这段子轨迹中的第[s / 2]个点设置为断点,同时将位于段子轨迹上其余的点删除;如果一条轨迹上有t个断点,则轨迹被分割为t+Ι个轨迹段; 第七步,轨迹段相似性比较:轨迹段之间的相似性通过轨迹段之间的差异度获取,包括:空间差异度、时间差异度、方向差异度和速度差异度; 第八步,VOC-TC算法:对轨迹进行分割后,再利用DBSCAN密度算法,采用距离公式,对轨迹段进行聚类,设聚类簇C中包含的轨迹数目为簇基数η?,簇基数nb与聚类中轨迹段数目η。之比为簇显著度Is,给定阈值τ和Y,进行如下定义:定义5显著簇:Csig= {C|C吻O η?Η?ηΜ g},其中,O为第一次聚类的结果集,即簇基数nb高于τ且簇显著度ns高于Y聚类称为显著簇; 定义6非显著簇:Cmsig= {C| C吻O C 口 Osig},其中,Osig为显著簇集合,即显著簇之外的聚类都为非显著簇; 进行第二次聚类,将第一次聚类中非显著簇删除,同时将该其中包含的轨迹段归并到离最距离小于阈值μ且包含同一条轨迹的聚类中,最终获取那些能反映主题变化的显著簇,非显著簇的轨迹段归并到其他簇不会改变这些簇中的轨迹数量。
2.如权利要求1所述的基于移动对象时空信息轨迹分段聚类的方法,其特征在于,在第三步中,进行Hausdorff距离进行相似性测量的计算公式利用移动对象在三个连续采用点的平均速度作为当前点的速度,轨迹段的速度通过该轨迹段中的最小速度、最大速度和平均速度来衡量:
3.如权利要求1所述的基于移动对象时空信息轨迹分段聚类的方法,其特征在于,在第七步中,空间差异度与时间差异度采用Hausdorff距离计算得到,方向差异度和速度差异度直接采用属性差值绝对值表示即可;结合得到一个统一的表达轨迹段相似性公式:
subDis = Ws ^1J spatialDis+wt tempoDis+wjJ OrientDis+wv velocityDis,
1=1.ws+wt+w0+wv=l 其中,spatialDis、tempoDis、OrientDi和seolocityDis分别为轨迹段之间的空间差异度、时间差异度、方向差异度和速度差异度,轨迹段相似性公式为:
subSIM = 1-tanh (subDis) 其中,tanh(subDis)为三角函数归一化公式。
4.如权利要求1所述的基于移动对象时空信息轨迹分段聚类的方法,其特征在于,在第八步中,从不同的聚类开始进行顺序显著簇的判断和轨迹段归并,最终会得到相同的聚类形态,计算每个轨迹段邻域的时间复杂度为0(n2),采用四叉树空间索引,将时间复杂度降为 O(nlogn) ο
【文档编号】G06F17/30GK103593430SQ201310553219
【公开日】2014年2月19日 申请日期:2013年11月11日 优先权日:2013年11月11日
【发明者】胡宝清, 段炼, 覃开贤 申请人:胡宝清
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1