一种基于移动目标轨迹分类的多属性异常检测方法与流程

文档序号:36794466发布日期:2024-01-23 12:15阅读:20来源:国知局
一种基于移动目标轨迹分类的多属性异常检测方法与流程

本发明涉及一种异常检测方法,一种基于移动目标轨迹分类的多属性异常检测方法。


背景技术:

1、在互联网和移动位置服务等高新技术快速发展的背景下,移动目标时刻在产生轨迹数据。传统意义上的轨迹数据,包括交通数据、人类移动数据、动物迁徙轨迹数据和自然现象轨迹数据等。随着信息技术的迅速发展和数据库管理系统的广泛应用,人们积累的轨迹数据数量激增,海量的轨迹数据具有很大的研究价值。一般而言,轨迹数据都具有时空序列性、异频采样性、数据质量差的特征,因此需要对信息采集设备获取的轨迹数据进行复杂、严密的预处理,而后再通过对轨迹数据的分析,挖掘目标的移动特征,为进一步的研究和决策提供辅助支撑。例如,基于城市交通的轨迹数据处理能够为优化交通路线、个性化推荐路线、路网预测、市政规划等提供很好的解决方案;基于人类移动轨迹、停留点和行为特征的分析,可以挖掘个人的兴趣爱好和社会关系等隐含信息;通过大量lbs(基于移动位置服务)的轨迹数据挖掘其中相互关联的轨迹行为,可以在数据关联性与时空特征维度下进一步勘探用户的隐性特征。

2、连续变化的时空轨迹数据更便于推断移动目标行为模式与习惯,研究人员可以根据移动目标的历史移动轨迹数据特征,挖掘出其活动范围和活动场景,构建正常行为模式集合,并进行异常检测,从而有意识地去避免出现异常或者根据这些信息做出决策判断。所以,如何对移动目标轨迹数据的隐含特征及模式进行挖掘,并从中检测出异常轨迹,已经开始成为学者专家关注的一个热点问题。

3、通常,按照处理数据类型的不同,可以将移动目标轨迹数据的异常检测分为面向静态数据集和面向数据流的两种方法。面向静态数据集的异常检测代表算法包括lee等人提出的基于划分和检测框架的异常轨迹检测算法,刘良旭等人提出的基于r-tree的异常轨迹检测算法,ge等人提出的实时轨迹异常检测算法等。面向轨迹数据流的异常检测代表算法则包括bu等人提出的基于滑动窗口的异常轨迹检测算法,cao等人提出的海量轨迹流中的异常移动目标检测算法等。

4、现有的移动目标异常检测算法存在的主要问题包括,未考虑到轨迹的动态增长,无法增量更新异常检测模型,检测不到异常行为的演化行为;同时,由于轨迹点数据量巨大,传统异常检测算法存在较高的时间开销及大量的存储空间。


技术实现思路

1、发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于移动目标轨迹分类的多属性异常检测方法。

2、为了解决上述技术问题,本发明公开了一种基于移动目标轨迹分类的多属性异常检测方法,包括以下步骤:

3、步骤1,移动目标轨迹整编:对移动目标的原始轨迹数据集进行整编,构建移动轨迹整编数据集,其中包括轨迹数据和轨迹点数据;所述的移动目标的原始轨迹数据集中包含若干条轨迹,每条轨迹包含若干轨迹点;

4、步骤2,移动目标轨迹特征提取:经过进一步计算获取移动目标的一条轨迹的特征属性集合,包括:移动目标经过区域、平均速度、轨迹出现时间、消失时间、出现时长、距离其他移动目标的最近距离和距离预设的热点区域的最近距离;上述特征属性集合中包含的属性,即为待检测异常属性;

5、上述待检测异常属性分为数值型与序列型两类,其中,序列型包括:移动目标经过区域,数值型包括:平均速度、轨迹出现时间、轨迹消失时间、轨迹出现时长、距离其他移动目标的最近距离和距离预设的热点区域的最近距离;

6、步骤3,移动目标轨迹多属性异常检测:根据待检测异常属性的类型,分别运用序列模式和聚类分类方法进行检测,完成基于移动目标轨迹分类的多属性异常检测;

7、步骤4,根据检测得到的异常数据,进行可视化展示,并为应急决策提供依据。

8、进一步的,步骤1中构建的移动轨迹整编数据集,具体包括:

9、轨迹数据:即描述移动目标活动情况的数据集,由若干条轨迹组成,针对移动目标的任一条轨迹的属性包括:该轨迹的唯一标识、移动目标名称、轨迹出现时间和轨迹消失时间;

10、轨迹点数据:即描述移动目标指定轨迹详情的数据集,指定轨迹由若干个轨迹点构成;针对构成当前轨迹的轨迹点集合,其中任一轨迹点的属性包括:当前轨迹点的唯一标识、所属轨迹的唯一标识、经度、纬度、当前时间、速度和高度。

11、进一步的,步骤2中所述的经过进一步计算获取移动目标的一条轨迹的特征属性集合,即根据待检测异常属性的类别,分别进行特征提取,具体包括:

12、步骤2-1,对移动目标轨迹进行序列型特征提取;

13、步骤2-2,对移动目标轨迹进行数值型特征提取。

14、进一步的,步骤2-1中所述的对移动目标轨迹进行序列型特征提取,具体包括:

15、步骤2-1-1,计算移动目标的所有轨迹点中,经纬度的最大值{jdmax,wdmax}和最小值{jdmin,wdmin};

16、步骤2-1-2,将地图上{jdmin,wdmin}、{jdmin,wdmax}、{jdmax,wdmin}及{jdmax,wdmax}四点经纬度范围内的区域作为移动目标的活动区域;

17、步骤2-1-3,对上述移动目标的活动区域进行网格化,并对每个网格区域命名;

18、步骤2-1-4,将移动目标的每一条轨迹,按照轨迹点所处的网格,转化为序列形式qs,得到移动目标轨迹经过区域。

19、进一步的,步骤2-2中所述的对移动目标轨迹进行数值型特征提取,具体包括:

20、步骤2-2-1,设移动目标a的任一条轨迹为tr,tr={tr1,tr2,…,trn},其中tri表示轨迹tr上的第i个轨迹点,i∈{1,2,…,n},n为该条轨迹包含的轨迹点个数;

21、步骤2-2-2,根据轨迹属性中的轨迹出现时间cxsj和轨迹消失时间xssj,计算轨迹出现时长,具体如下:

22、对于轨迹点tri,包含以下属性:当前轨迹点的唯一标识pidi,所属轨迹的唯一标识tid,轨迹点经纬度jdi和wdi,当前时间sji,速度sdi,高度gdi,以及轨迹点所处区域qyi;

23、对于移动目标a的一条轨迹tr而言,其轨迹出现时长cxsc为:

24、cxsc=(xssj-cxsj)/1000

25、其中,cxsc为轨迹出现时长;

26、步骤2-2-3,计算当前轨迹上的平均速度avg_sd,为:

27、

28、其中,sdi为当前轨迹上第i个轨迹点的速度;

29、步骤2-2-4,所述的距离其他移动目标的最近距离min_dis_t,计算方法如下:

30、min_dis_t=min{distj}

31、其中,distj为与轨迹tr存在共同出现时间区间的移动目标轨迹,在共同出现时间区间内,同时刻采样点的距离,j表示第j个采样点,即:

32、

33、其中,r表示地球半径,jdp和wdp分别表示轨迹tr上任一采样点的经纬度,jdq和wdq表示除移动目标a外任意移动目标在同时刻的采样点经纬度;

34、步骤2-2-5,所述的距离预设的热点区域的最近距离min_dis_a,计算方法如下:

35、min_dis_a=min{disaj}

36、其中,disaj为在轨迹tr出现时间段内,其与预设的热点区域在采样点时刻的距离。

37、进一步的,步骤2-2-5中所述的距离disaj,计算方法如下:

38、

39、其中,ida和wda表示预设的热点区域中心的经纬度。

40、进一步的,步骤3中所述的分别运用序列模式和聚类分类方法进行检测,具体包括:步骤3-1,运用序列模式,对序列型的待检测异常属性进行异常检测,包括:

41、步骤3-1-1,分析移动目标的轨迹数据,挖掘移动目标对应的频繁活动区域序列集合,作为当前移动目标经过区域的正常模式;

42、步骤3-1-2,进行异常检测:通过将同一移动目标的实时轨迹经过区域与上述正常模式进行对比,完成异常检测;

43、步骤3-1-3,对移动目标对应的频繁活动区域序列集合进行更新;

44、步骤3-2,运用聚类分类方法,对数值型的待检测异常属性进行异常检测,包括:

45、挖掘移动目标的数值型的待检测异常属性对应的正常活动模式集合,其中每一个属性的正常活动模式对应为一个数值取值区间,将同一移动目标实时轨迹的每一个数值型的待检测异常属性与该属性的正常活动模式进行对比,完成异常检测,随后对上述正常活动模式集合进行更新。

46、进一步的,步骤3-1-1中所述的挖掘移动目标对应的频繁活动区域序列集合,即采用基于前缀投影的频繁序列模式挖掘方法,挖掘移动目标频繁活动区域序列集合,具体方法如下:

47、步骤3-1-1-1,根据移动目标名称和时间区间,筛选满足条件的移动目标轨迹数据,并对其进行移动目标轨迹序列型特征提取,基于轨迹经过区域,即轨迹活动序列qs,建立序列数据库trace,且序列数据库trace的大小|trace|=sn,最长序列长度

48、步骤3-1-1-2,设定支持度百分比suppc,则支持度supδ=suppc×sn,扫描序列数据库trace,寻找满足出现次数大于支持度supδ的单项,记作序列数据库trace的1模式集合,即表示1模式集合中第m个单项;

49、步骤3-1-1-3,遍历1模式集合p1,对于其中每一项建立投影数据库即在序列数据库trace中前缀为的序列的后缀集合;

50、设定搜索参数l=2,并在其中挖掘以为前缀的l模式集合pl,即在序列数据库trace中个数大于支持度supδ的长度为l的序列的前缀集合;

51、l自增1,重复步骤步骤3-1-1-3,直到l=l或得到序列模式集合sp;

52、步骤3-1-1-4,根据序列模式集合sp,通过前缀合并得到最长序列模式集合lp,即为该移动目标的频繁活动区域序列集合。

53、进一步的,步骤3-1-2中所述的进行异常检测,具体包括:

54、步骤3-1-2-1,对于实时新增的n′条移动目标的轨迹,将其转化为序列q′i,建立实时轨迹数据集trace′,且|trace′|=n′;

55、步骤3-1-2-1,遍历trace′,若trace′遍历完成,跳转步骤3-1-2-3,否则进入步骤3-1-2-2;

56、步骤3-1-2-2,判断实时序列q′i是否为移动目标频繁活动区域序列集合lp中任意一条序列lpj的子串;若是,则遍历实时轨迹数据集trace′并继续判断,否则,继续判断移动目标频繁活动区域序列集合lp中的下一条序列,若集合lp遍历完成后,q′i无法匹配为lp中任一元素的子串,则标定当前目标轨迹的序列q′i经过区域存在异常,存入经过区域异常结果表area_abnormal中,遍历实时轨迹数据集trace′并继续判断;

57、步骤3-1-2-3,对于新增移动目标轨迹数据集trace′的轨迹序列型异常检测完成,根据area_abnormal表中数据,进行可视化展示。

58、进一步的,步骤3-1-3中所述的对移动目标对应的频繁活动区域序列集合进行更新,具体包括:

59、设已有移动目标轨迹数据集为trace,新增轨迹数据集为trace′,更新后的轨迹数据集为tracen,已有当前移动目标的频繁活动区域序列集合为lp,新增频繁活动区域序列集合为lp′,更新后的频繁活动区域序列集合为lpn,序列q在trace中的支持数为supporttrace(q),在trace′中的支持数为supporttrace′(q),在tracen中的支持数为则更新频繁活动区域序列集合情况包括以下四种:

60、情况1,序列q既属于已有频繁活动区域序列集合lp,又属于新增频繁活动区域序列集合lp′;

61、情况2,序列q属于已有频繁活动区域序列集合lp,但不属于新增频繁活动区域序列集合lp′;

62、情况3,序列q属于新增频繁活动区域序列集合lp′,但不属于已有频繁活动区域序列集合lp;

63、针对上述3种情况,计算支持数即:

64、

65、若满足则将序列q加入到更新后的频繁活动区域序列集合lpn中;

66、情况4,序列q既不属于已有频繁活动区域序列集合lp,也不属于新增频繁活动区域序列集合lp′,不予考虑。

67、有益效果:

68、(1)本发明中,将异常按轨迹属性进行分类,对数值型及序列型异常分别设计检测算法,能够定量分析和发现轨迹在单属性维度上存在的异常行为。

69、(2)本发明针对轨迹数据集更新快、数据量大的特点,提出的增量式异常检测方案,使得模型能够适应轨迹的动态增长,达到检测移动目标轨迹异常行为演化的目标。

70、(3)本发明采用复杂度相对更低的聚类方法提高了执行效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1