本发明涉及时空数据挖掘,特别是一种移动目标的活动规律确定方法、装置、设备和介质。
背景技术:
1、大数据时代,海量的时空动向信息为人们深度认知海上舰船、空中飞机、路上车辆等移动目标的行为活动规律提供了丰富的数据资源。这些移动目标通常在时间、空间、事件、属性等维度上有着潜在的活动机理,例如某些海域周期性出现的巡逻船只,某些空域频繁出现的无人机,某些地区协同出现的不同类型的作业车辆,等等。基于时空数据挖掘移动目标的行为模式,在国土防御、公共安全、案件侦破、城市治理等领域有着重大的意义。
2、然而,时空动向信息包含了时间、空间、事件、属性等多个维度的信息,内容复杂,在利用该信息挖掘移动目标的活动规律的过程中,需要充分考虑各种因素的影响,难以保证最终得到的活动规律的准确性。因此,需要提供一种移动目标的活动规律确定方法,以获取到准确全面的移动目标的活动规律。
技术实现思路
1、鉴于上述问题,本发明实施例提供了一种移动目标的活动规律确定方法、装置、设备和介质,以便克服上述问题或者至少部分地解决上述问题。
2、本发明实施例的第一方面提供了一种移动目标的活动规律确定方法,所述方法包括:
3、获取多个移动目标的时空动向信息,所述时空动向信息用于描述每个所述移动目标参与的多个时空动向事件;
4、根据所述多个移动目标的时空动向信息,确定每对所述移动目标的相似度,所述相似度表示该对移动目标在时空特征上的重叠程度;
5、以每个所述移动目标为节点,连接每对相似度高于阈值的移动目标,构建时空特征网络;
6、根据所述时空特征网络,获取每个所述移动目标的嵌入向量;
7、根据所述嵌入向量在表征空间中的分布情况,将所述嵌入向量确定为低活跃向量或高活跃向量,确定各个所述嵌入向量对应的移动目标属于低活跃度集合或高活跃度集合;
8、根据所述移动目标所在的活跃度集合,和该移动目标的目标事件项,生成该移动目标的候选序列集,所述事件项表示该移动目标参与的一种活动事件类型;
9、根据所述移动目标所在的活跃度集合,将所述候选序列集输入对应的序列模式挖掘模型,得到频繁序列模式集;
10、根据所述频繁序列模式集,确定所述移动目标参与所述目标事件项的活动规律。
11、可选地,根据所述多个移动目标的时空动向信息,确定每对所述移动目标的相似度,包括:
12、根据每个所述移动目标的时空动向信息,确定该移动目标的轨迹序列,所述轨迹序列表示该移动目标先后到访的时间和空间序列;
13、根据所述轨迹序列,确定每对所述移动目标的最长公共子序列,所述最长公共子序列表示该对移动目标的轨迹序列之间的相同片段的组合;
14、根据所述最长公共子序列的长度,确定该对移动目标的相似度。
15、可选地,根据所述时空特征网络,获取每个所述移动目标的嵌入向量,包括:
16、以所述节点为起点,在所述时空特征网络中进行随机游走,得到节点序列;
17、将所述节点序列输入skip-gram模型,得到所述节点对应的嵌入向量。
18、可选地,根据所述嵌入向量在表征空间中的分布情况,将所述嵌入向量确定为低活跃向量或高活跃向量,确定各个所述嵌入向量对应的移动目标属于低活跃度集合或高活跃度集合,包括:
19、随机选取两个所述嵌入向量,作为两个聚类中心;
20、随机选择另一所述嵌入向量,计算该嵌入向量在所述表征空间中分别与所述两个聚类中心的距离;
21、将所述嵌入向量分配给距离更近的所述聚类中心,更新所述聚类中心;
22、重复上述过程,直至所述两个聚类中心不再发生变化;
23、根据所述两个聚类中心,将所述嵌入向量分为两类,将数量多的一类所述嵌入向量确定为所述低活跃向量,将数量少的一类所述嵌入向量确定为所述高活跃向量;
24、将所述低活跃向量对应的移动目标确定为属于低活跃度集合的移动目标,将所述高活跃向量对应的移动目标确定为属于高活跃度集合的移动目标。
25、可选地,根据所述移动目标所在的活跃度集合,和该移动目标的目标事件项,生成该移动目标的候选序列集,包括:
26、根据所述多个移动目标的时空动向信息,获取多个事件项数据,每个所述事件项数据至少包括:参与该事件的移动目标信息,事件类型信息和发生时间信息;
27、将所述多个事件项数据按照时间顺序进行排序,得到事件项数据集;
28、根据所述目标事件项的事件类型,从所述事件项数据集中确定出符合所述事件类型的多个候选事件项数据;
29、在所述移动目标属于所述低活跃度集合的情况下,针对每个候选事件项数据,从所述事件项数据集中提取所述候选事件项数据之前多个事件项数据和之后多个事件项数据,与该候选事件项数据组成一条低活跃度候选序列;
30、针对所述多个候选事件项数据,重复上一步骤,得到低活跃度候选序列集。
31、可选地,在所述移动目标属于所述高活跃度集合的情况下,根据所述移动目标所在的活跃度集合,和该移动目标的目标事件项,生成该移动目标的候选序列集,包括:
32、将所述事件项数据集按照预设时间段进行划分,得到多个子事件项数据集;
33、针对每个所述子事件项数据集,根据所述目标事件项的事件类型,从所述事件项数据集中确定出符合所述事件类型的多个候选事件项数据;
34、从所述子事件项数据集中提取所述候选事件项数据的前1个事件项数据和后1个事件项数据,与该候选事件项数据组成一条短序列;
35、针对每个所述子事件项数据集中得到的所述短序列,按照时间顺序进行拼接,得到高活跃度候选序列;
36、针对所述多个子事件项数据集,重复上一步骤,得到高活跃度候选序列集。
37、可选地,根据所述移动目标所在的活跃度集合,将所述候选序列集输入对应的序列模式挖掘模型,得到频繁序列模式集,包括:
38、在所述移动目标属于所述低活跃度集合的情况下,将所述低活跃度候选序列集和支持度阈值一并输入prefixspan模型,得到该移动目标的低活跃度频繁序列模式集;
39、在所述移动目标属于所述高活跃度集合的情况下,将所述高活跃度候选序列集输入spade模型,得到该移动目标的高活跃度频繁序列模式集,所述高活跃度频繁序列模式集中的频繁序列模式按照支持度大小进行排序。
40、本实施例第二方面提供了一种移动目标的活动规律确定装置,所述装置包括:
41、获取模块,用于获取多个移动目标的时空动向信息,所述时空动向信息用于描述每个所述移动目标参与的多个时空动向事件;
42、相似度确定模块,用于根据所述多个移动目标的时空动向信息,确定每对所述移动目标的相似度,所述相似度表示该对移动目标在时空特征上的重叠程度;
43、时空特征网络构建模块,用于以每个所述移动目标为节点,连接每对相似度高于阈值的移动目标,构建时空特征网络;
44、嵌入向量获取模块,用于根据所述时空特征网络,获取每个所述移动目标的嵌入向量;
45、活跃度划分模块,用于根据所述嵌入向量在表征空间中的分布情况,将所述嵌入向量确定为低活跃向量或高活跃向量,确定各个所述嵌入向量对应的移动目标属于低活跃度集合或高活跃度集合;
46、候选序列生成模块,用于根据每个所述移动目标所在的活跃度集合,和该移动目标的目标事件项,生成该移动目标的候选序列集,所述事件项表示该移动目标参与的一种活动事件类型;
47、序列模式挖掘模块,用于根据所述移动目标所在的活跃度集合,将所述候选序列集输入对应的序列模式挖掘模型,得到频繁序列模式集;
48、确定模块,用于根据所述频繁序列模式集,确定所述移动目标参与所述目标事件项的活动规律。
49、可选地,所述相似度确定模块,包括:
50、轨迹序列确定子模块,用于根据每个所述移动目标的时空动向信息,确定该移动目标的轨迹序列,所述轨迹序列表示该移动目标先后到访的时间和空间序列;
51、最长公共子序列确定子模块,用于根据所述轨迹序列,确定每对所述移动目标的最长公共子序列,所述最长公共子序列表示该对移动目标的轨迹序列之间的相同片段的组合;
52、相似度确定子模块,用于根据所述最长公共子序列的长度,确定该对移动目标的相似度。
53、可选地,所述嵌入向量获取模块。包括:
54、随机游走子模块,用于以所述节点为起点,在所述时空特征网络中进行随机游走,得到节点序列;
55、嵌入向量获取子模块,用于将所述节点序列输入skip-gram模型,得到所述节点对应的嵌入向量。
56、可选地,所述活跃度划分模块,包括:
57、第一划分子模块,用于随机选取两个所述嵌入向量,作为两个聚类中心;
58、第二划分子模块,用于随机选择另一所述嵌入向量,计算该嵌入向量在所述表征空间中分别与所述两个聚类中心的距离;
59、第三划分子模块,用于将所述嵌入向量分配给距离更近的所述聚类中心,更新所述聚类中心;
60、第四划分子模块,用于重复上述过程,直至所述两个聚类中心不再发生变化;
61、第五划分子模块,用于根据所述两个聚类中心,将所述嵌入向量分为两类,将数量多的一类所述嵌入向量确定为所述低活跃向量,将数量少的一类所述嵌入向量确定为所述高活跃向量;
62、第六划分子模块,用于将所述低活跃向量对应的移动目标确定为属于低活跃度集合的移动目标,将所述高活跃向量对应的移动目标确定为属于高活跃度集合的移动目标。
63、可选地,所述序列模式挖掘模块,包括:
64、事件项数据获取子模块,用于根据所述多个移动目标的时空动向信息,获取多个事件项数据,每个所述事件项数据至少包括:参与该事件的移动目标信息,事件类型信息和发生时间信息;
65、事件项数据集获取子模块,用于将所述多个事件项数据按照时间顺序进行排序,得到事件项数据集;
66、候选事件项数据获取子模块,用于根据所述目标事件项的事件类型,从所述事件项数据集中确定出符合所述事件类型的多个候选事件项数据;
67、低活跃度候选序列生成子模块,用于在所述移动目标属于所述低活跃度集合的情况下,针对每个候选事件项数据,从所述事件项数据集中提取所述候选事件项数据之前多个事件项数据和之后多个事件项数据,与该候选事件项数据组成一条低活跃度候选序列;
68、低活跃度候选序列集生成子模块,用于针对所述多个候选事件项数据,重复上一步骤,得到低活跃度候选序列集;
69、可选地,在所述移动目标属于所述高活跃度集合的情况下,所述装置还包括:
70、子事件项数据集获取模块,用于将所述事件项数据集按照预设时间段进行划分,得到多个子事件项数据集;
71、候选事件项数据确定模块,用于针对每个所述子事件项数据集,根据所述目标事件项的事件类型,从所述事件项数据集中确定出符合所述事件类型的多个候选事件项数据;
72、短序列生成模块,用于从所述子事件项数据集中提取所述候选事件项数据的前1个事件项数据和后1个事件项数据,与该候选事件项数据组成一条短序列;
73、高活跃度候选序列生成模块,用于针对每个所述子事件项数据集中得到的所述短序列,按照时间顺序进行拼接,得到高活跃度候选序列;
74、高活跃度候选序列集生成模块,用于针对所述多个子事件项数据集,重复上一步骤,得到高活跃度候选序列集。
75、可选地,所述序列模式挖掘模块,包括:
76、第一序列模式挖掘子模块,用于在所述移动目标属于所述低活跃度集合的情况下,将所述低活跃度候选序列集和支持度阈值一并输入prefixspan模型,得到该移动目标的低活跃度频繁序列模式集;
77、第二序列模式挖掘子模块,用于在所述移动目标属于所述高活跃度集合的情况下,将所述高活跃度候选序列集输入spade模型,得到该移动目标的高活跃度频繁序列模式集,所述高活跃度频繁序列模式集中的频繁序列模式按照支持度大小进行排序。
78、本发明实施例第三方面还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上的计算机程序,所述处理器执行所述计算机程序以实现本发明实施例第一方面所述的移动目标的活动规律确定方法中的步骤。
79、本发明实施例第四方面还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现本发明实施例第一方面所述的移动目标的活动规律确定方法中的步骤。
80、本发明实施例提供了一种移动目标的活动规律确定方法,该方法包括:获取多个移动目标的时空动向信息,所述时空动向信息用于描述每个所述移动目标参与的多个时空动向事件;根据所述多个移动目标的时空动向信息,确定每对所述移动目标的相似度,所述相似度表示该对移动目标在时空特征上的重叠程度;以每个所述移动目标为节点,连接每对相似度高于阈值的移动目标,构建时空特征网络;根据所述时空特征网络,获取每个所述移动目标的嵌入向量;根据所述嵌入向量在表征空间中的分布情况,将所述嵌入向量确定为低活跃向量或高活跃向量,确定各个所述嵌入向量对应的移动目标属于低活跃度集合或高活跃度集合;根据所述移动目标所在的活跃度集合,和该移动目标的目标事件项,生成该移动目标的候选序列集,所述事件项表示该移动目标参与的一种活动事件类型;根据所述移动目标所在的活跃度集合,将所述候选序列集输入对应的序列模式挖掘模型,得到频繁序列模式集;根据所述频繁序列模式集,确定所述移动目标参与所述目标事件项的活动规律。
81、具体有益效果在于:
82、1)根据移动目标的活跃度分别进行序列模型挖掘,提高获取到的活动规律的准确性。本发明实施例通过将移动目标划分为低活跃度集合和高活跃度集合,从而根据移动目标的活跃度高低,利用不同的方法生成候选序列集,并进行序列模式挖掘。由此在确定移动目标的活动规律的过程中,充分考虑到了活跃度不同对最终结果的影响,使得到的活动规律更加准确全面。
83、2)利用嵌入向量的分布特性,实现对移动目标活跃度的区分。本发明实施例提出对移动目标进行嵌入向量表征,然后利用不同频次的嵌入向量在表征空间中会分布在不同子区域的特性,实现对移动目标的活跃度的划分。由此,本发明实施例提出了一种新的活跃度划分的方法,相比于直接计算各个移动目标的活跃程度,本发明实施例所提出的方法更加准确高效。
84、扩展了序列模式挖掘的信息维度。本发明实施例利用移动目标的时空动向信息,从时间、空间、事件、属性的多个维度去进行了序列模式挖掘,使最终得到的移动目标的活动规律更加准确可靠。