一种基于马尔科夫模型的位置预测方法

文档序号:10471583阅读:490来源:国知局
一种基于马尔科夫模型的位置预测方法
【专利摘要】本发明公开了一种基于马尔科夫模型的位置预测方法,包括以下步骤:采集历史轨迹,确定各个采样位置的数据集中概率,进行归一化处理,确定各个离散型概率分布,构建可变阶全局马尔科夫模型;根据每个移动对象的历史轨迹,构建每个移动对象的个体马尔科夫模型;通过线性回归将全局马尔科夫模型和个体马尔科夫模型进行组合,生成概率向量线性组合,划分时间段,将所有轨迹根据它们的时间戳映射到这些时间段中,计算各对象落入各个时间段的概率,进行聚类,结合聚类结果和马尔科夫模型进行预测下一位置。本发明将时间因素考虑在内,对不同时间段训练不同的模型,在预测下一个位置时,基于时间戳选择合适的模型,极大提高了预测准确率。
【专利说明】
-种基于马尔科夫模型的位置预测方法
技术领域
[0001] 本发明设及一种基于马尔科夫模型的位置预测方法。
【背景技术】
[0002] 定位技术的流行使得追踪人们和其他对象的移动成为可能,因此产生了各种基于 位置的应用程序。例如,使用安装在车辆上的定位装置进行GI^跟踪成为出租车车队管理的 首选方法。在许多社交网络应用程序(例如化ursquare)中,鼓励用户与其他用户分享自己 的地理位置。此外,在越来越多的城市,当车辆通过安装在高速公路和街道的监控摄像头时 会被拍照,包括车牌号码、时间和地点的车辆通行记录被传输到数据中屯、进行存储和做进 一步处理。
[0003] 在运些基于位置的应用程序中,能够准确地预测移动对象的下一个位置是非常重 要的。考虑一个基于位置的广告的例子,Lily刚刚在社交网络网站上与她的朋友们分享了 她的位置。如果可W提前知道她将要经过的区域,那么就可W把大量的信息推送给她,比如 附近最受欢迎的餐馆、该区域正在促销的商品。另外一个例子,如果我们能够预测道路上车 辆将要经过的下一个地点,那么我们就可W预测交通状况并且给司机推荐更合理的路线, 从而避免或减轻交通堵塞。
[0004] 现在已有一些方法可W用来预测下一个位置,运些方法大致可W分为两类:(1)仅 仅使用单个对象的历史轨迹发现个体的移动模式,(2)使用所有对象的历史轨迹识别集体 的移动模式。大多数现有的方法基于频繁模式和/或关联规则训练模型,发现移动模式,然 后用来进行预测。然而,现有方法存在几个主要问题:
[0005] 1、运些方法要么关注个人移动模式,要么关注集体移动模式,但是,对象的移动通 常既能反映个体的属性也能反映集体的属性。
[0006] 2、在某些情况(例如社交登录和车辆监控)下,数据点非常稀疏,一些对象的轨迹 可能仅包含一个记录,使用运些轨迹无法构造有意义的频繁模式。
[0007] 3、现有的方法没有正确地考虑时间因素。不同的时间存在不同的移动模式,例如, Bob要离开他的房子。如果是在工作日的早上8点,他最可能去工作。但是,如果是上午11: 30,他更有可能去一家餐馆;如果是在周末的下午3点,他则很可能去购物。在预测下一个位 置时,没有正确地考虑时间因素将导致更高的错误率。

【发明内容】

[000引本发明为了解决上述问题,提出了一种基于马尔科夫模型的位置预测方法,本发 明通过构建全局马尔科夫模型(GMM)和个体马尔科夫模型(PMM),根据历史轨迹序列来预测 移动对象的下一个位置。GMM利用所有可用的移动对象的轨迹发现全局行为,基于运样的假 设:不同个体经常共享相似的移动模式(例如,从A驾驶到B,人们经常开车走同样的路线)。 另一方面,PMM根据每一个移动对象自己的历史轨迹建模个体模式。两个模型使用线性回归 进行组合,W产生更完整和准确的预测。NLPMM的另一个独特特性在于其对时间因素的处 理。对象的移动模式随着时间段的不同而变化(例如工作日和周末)。与此同时,不同的时间 段也存在相似之处(例如运周一和下周一),并且移动对象的移动模式往往是周期性的。因 此,我们提出基于移动模式的相似性聚类时间段,并且为每个集群构建一个单独的模型。
[0009] 在进行具体阐述之前,先给出W下定义,W更好地说明技术方案。
[0010] 定义1、采样位置:对于一个给定的移动对象0,它通过一组采样位置,其中每个采 样位置指的是记录0的位置的一个点或一片区域(在一个二维的关注领域中)。例如,在交通 监测系统中,摄像机的位置可W被看作采样位置。
[0011] 定义2、轨迹单元:对于一个给定的移动对象0,轨迹单元U是其轨迹的基本组成部 分。每个轨迹单元U可W表示为(U. 1,u. t),其中,U. 1是移动对象在时间戳U. t时采样位置的 ID。
[0012] 定义3、轨迹:对于一个移动对象,其轨迹T被定义为一组按时间顺序排列的轨迹单 元序列:<山,"2,...,11。〉。根据定义2,轨迹1'也可^表示为<(111.1,山.1:),(112.1,112.1:),..., (Un. 1 ,Un. t)〉,其中,Ui. t<Ui+l. t(l < i < n-1)。
[001引定义4、候选的下一位置:对于采样位置Ui.l,如果一个移动对象可w从Ui.l直接到 达Uj. 1,那么我们就把Uj. 1定义为m. 1的候选的下一位置。候选的下一位置集合既可W通过 先验知识(例如,道路网络图W及监控摄像头的位置)也可W通过移动对象历史轨迹的归纳 推理来获取。
[0014]定义5、采样位置序列:对于一条给定的轨迹<(U1. 1,U1 . t),(U2 . 1,U2. t),..., (Un.l,Un.t)〉,其采样位置序列是指出现轨迹中的一系列采样位置,表示为<U1.1, U2.1, . . . , Un.1〉。
[0015] 定义6、前缀集合:对于一个采样位置m. 1和一组给定的轨迹Γ,其尺寸为N的前缀 集合表示为&W指的是运样的序列集合:每个序列都是在某条轨迹TE Γ的采样位置序列 ,' 中出现在UW. 1之前的长度为N的子序列。
[0016] 为了实现上述目的,本发明采用如下技术方案:
[0017] -种基于马尔科夫模型的位置预测方法,包括W下步骤:
[0018] (1)采集历史轨迹,确定各个采样位置的数据集中概率,进行归一化处理,确定各 个离散型概率分布,构建可变阶全局马尔科夫模型;
[0019] (2)根据每个移动对象的历史轨迹,构建0阶马尔科夫模型和可变阶马尔科夫模 型,进行数据的整合,形成每个移动对象的个体马尔科夫模型;
[0020] (3)通过线性回归将全局马尔科夫模型和个体马尔科夫模型进行组合,生成概率 向量线性组合;
[0021] (4)划分时间段,将所有轨迹根据它们的时间戳映射到运些时间段中,计算各对象 落入各个时间段的概率,进行聚类,结合聚类结果和马尔科夫模型进行预测下一位置。
[0022] 所述步骤(1)中,对于给定的轨迹数据集,采样位置的啡介全局马尔科夫模型的构 建训练方法包括:
[0023] (1-1)构建采样位置的前缀集合;
[0024] (1-2)对于前缀集合中每一个前缀,计算数据集中每个不同的采样位置出现在运 个前缀之后的频率,进行归一化处理,得到一个关于下一个采样位置的离散型概率分布;
[0025] (1-3)从1阶开始,依次开始训练,得到可变阶的全局马尔科夫模型。
[00%]所述步骤(2)中,其具体方法包括:
[0027] (2-1)将每个移动对象的长度大于1的轨迹训练一个可变阶的马尔科夫模型;
[00%] (2-2)对于每个移动对象,使用它自己的轨迹单元训练一个0阶马尔科夫模型,计 算移动对象在每个采样位置的出现概率;
[0029] (2-3)将0阶马尔科夫模型和可变阶马尔科夫模型整合在一起生成最终的个体马 尔科夫模型。
[0030] 所述步骤(2-1)中,具体为:每个移动对象使用它自己的轨迹构建前缀集合,计算 下一个采样位置的概率分布,通过将阶数从1变化到N来迭代训练可变阶的马尔科夫模型。 [0031 ]所述步骤(3)中,具体方法包括:
[0032] (3-1)分别使用概率向量来表示全局马尔科夫模型和个体马尔科夫模型的轨迹序 列的所有采样位置成为下一个采样位置的概率;
[0033] (3-2)构建轨迹序列的指示向量,使真正的实际下个位置处的向量值为1,其他为 0;
[0034] (3-3)将全局马尔科夫模型和个体马尔科夫模型的概率向量进行线性组合。
[0035] 优选的,所述步骤(3-3)中,全局马尔科夫模型和个体马尔科夫模型的概率向量组 合后为:
[0036] 其中,1是单位向量,β〇,βι和&是需要估计的系数,给定一个包含η条训练轨迹的集 合,通过标准线性回归最小化
?β十算扔的最优值,运里的II · II是欧几里得范 数,
w=l时代表全局马尔科夫模型的概率向量,w = 2时代表个体 马尔科夫模型的概率向量,其中,111表示采样位置的数目,/?^表示位置^'成为下一个采样位 置的概率。
[0037] 进一步的,对于特定的轨迹,通过标记估计量中的k个最大元素来预测top-k个下 一采样位置。
[0038] 所述步骤(4)中,具体方法包括:
[0039] (4-1)将时间跨度划分为给定数目的等长的时间箱;
[0040] (4-2)将所有轨迹根据它们的时间戳映射到划分的时间箱中,横跨多个时间箱的 轨迹被分割成更小的子轨迹,W使每个子轨迹中的轨迹单元都落入同一时间箱内;
[0041] (4-3)根据对象出现在各采样位置的时间点计算落入每个时间箱的概率;
[0042] (4-4)使用余弦相似度测量两个时间箱关于对象的相似性;
[0043] (4-5)根据采样位置在各个时间箱中的概率分布的相似性对时间箱执行聚类,计 算该对象移动到下一采样位置的概率分布。
[0044] 所述步骤(4-3)中,一个对象0在某一时间点出现在采样位置1,该时间点落入第i 个时间箱,是一个m维向量,表示0从1移动到另一个位置的概率,其中,m表示采样位置的 总数。
[0045] 所述步骤(4-5)中,聚类的具体方法包括:
[0046] (i)确定集群数目、时间箱数目和给定轨迹在每个时间箱中的概率分布;
[0047] (ii)随机选择集群数目个数的时间箱作为初始集群中屯、点;
[0048] (i i i)计算轨迹在每个时间箱中的概率分布和各个集群中屯、点的相似度;
[0049] (iv)将每个时间箱分配给和它相似度最大的集群;
[0050] (V)重新计算集群中屯、点的概率分布;
[0051] (Vi)如果前后两次聚类结果中的集群不再改变或者已达到最大循环次数,那么返 回聚类结果并且退出循环;否则返回到步骤(iii)。
[0052] 所述步骤(4-6)中,每个集群中的轨迹训练得到与集群数目个数相同的新模型,将 分布聚类和马尔科夫模型结合在一起,已经经过的位置序列和时间因素都被考虑在内。
[0053] -种基于马尔科夫模型的位置预测系统,包括采集模块、全局马尔科夫模型构建 模块、个体马尔科夫模型构建模块、线性组合模块和聚类模块,其中:
[0054] 所述采集模块,用于采集历史轨迹,确定各个采样位置的数据集中概率;
[0055] 所述全局马尔科夫模型构建模块,用于进行归一化处理,确定各个离散型概率分 布,构建可变阶全局马尔科夫模型;
[0056] 所述个体马尔科夫模型构建模块,用于根据每个移动对象的历史轨迹,构建0阶马 尔科夫模型和可变阶马尔科夫模型,进行数据的整合,形成每个移动对象的个体马尔科夫 模型;
[0057] 所述线性组合模块,用于通过线性回归将全局马尔科夫模型和个体马尔科夫模型 进行组合,生成概率向量线性组合;
[0058] 所述聚类模块,用于划分时间段,将所有轨迹根据它们的时间戳映射到运些时间 段中,计算各对象落入各个时间段的概率,进行聚类,结合聚类结果和马尔科夫模型进行预 测下一位置。
[0059] 本发明的有益效果为:
[0060] (1)不同于传统的下一位置预测方法,基于马尔科夫模型的下一位置预测(化PMM) 既考虑了个体移动模式(PMM)又考虑了集体移动模式(GMM),两个模型使用线性回归进行组 合,从而产生更完整和准确的预测;
[0061] (2)本发明将时间因素考虑在内,对不同时间段训练不同的模型,在预测下一个位 置时,基于时间戳选择合适的模型,极大提高了预测准确率;
[0062] (3)本发明使用范围广泛,可W应用于数据节点、航天器、列车、船舶W及人类的位 置预测,W及延伸应用于航海、路面、航天的交通控制,人员的监控定位等多个领域,具有较 高的市场前景。
【附图说明】
[0063] 图1为本发明的基本流程图;
[0064] 图2为本发明的全局马尔科夫模型的生成流程;
[0065] 图3为本发明的个体马尔科夫模型的生成流程;
[0066] 图4为本发明的两种模型的线性组合流程;
[0067] 图5为本发明的时间因素的加入流程;
[0068] 图6为对时间箱中的每个采样位置执行聚类的流程;
[0069] 图7为在现有方法(VMM和WhereNext)和本发明提出的化PMM-DC上进行实例检验的 实验结果。
【具体实施方式】:
[0070] 下面结合附图与实施例对本发明作进一步说明。
[0071] 如图1所示,一种基于马尔科夫模型的下一位置预测方法,包括W下步骤:
[0072] 步骤1.根据所有可W获得的历史轨迹训练一个全局马尔科夫模型(GMM),用W对 一个移动对象的下一个采样位置进行概率预测;
[0073] 步骤2.大多数人的移动是有规律可循的(例如上下班),他们通常有他们自己的个 人移动模式。因此,我们为每个移动对象训练一个个体马尔科夫模型(PMM),用来预测下一 个采样位置;
[0074] 步骤3.将步骤1和步骤2训练得到的两种模型(GMM和PMM)使用线性回归进行组合, W产生更完整和准确的预测;
[0075] 步骤4.人类的移动很大程度上展现了时间规律性,预测模型应该是时间感知的, 因此,我们将时间因素考虑在内,对不同时间段训练不同的模型,比如,可W把一天划分为 24个时间段,对每个时间段分别训练PMM和GMM,然后基于时间戳选择合适的模型进行预测。
[0076] 如图2所示,步骤1中的全局马尔科夫模型的生成具体包括W下步骤:
[0077] 对于一个给定的轨迹数据集,采样位置h的N阶GMM可W按照W下方式训练得到:
[007引(1-1)构建采样位置h的前缀集合I
[0079] (1-2)对于5'^中的每一个前缀,计算数据集中每个不同的采样位置出现在运个前 缀之后的频率;
[0080] (1-3)将(1-2)计算出的频率归一化,得到一个关于下一个采样位置Γ的离散型概 率分布,计算公式如下:
[0081]
[0082] 之后,对步骤1做出一定改进:从1阶G匪开始训练,紧随其后的是2阶(MM,等等,直 到取得N阶GMM,从而训练得到可变阶的GMM。与N阶GMM相比,可变阶的GMM可W学习阶数不断 变化的条件分布并且提供捕获基于观测数据的不同阶数的马尔科夫相关性的方法。
[0083] 如图3所示,步骤2中的个体马尔科夫模型的生成具体包括W下步骤:
[0084] (2-1)对于每个移动对象,使用它自己的长度大于1的轨迹训练一个可变阶的马尔 科夫模型。首先,为每个移动对象使用它自己的轨迹构建前缀集合,然后,计算下一个采样 位置的概率分布。特别地,我们通过将阶数从1变化到N来迭代训练可变阶的马尔科夫模型。
[0085] (2-2)对于每个移动对象,使用它自己的轨迹单元训练一个0阶马尔科夫模型。对 于一个移动对象,Ν0-)表示采样位置Γ出现在训练轨迹中的次数,Li'表示出现在训练轨迹 中的不同采样位置的集合,因此,有:
[0086] (2-3)将0阶马尔科夫模型和可变阶马尔科夫模型整合在一起生成最终的PMM。
[0087] 如图4所示,步骤3中使用线性回归组合两种模型具体包括W下步骤:
[0088] 3-1对于给定的第i个轨迹序列,计算GMM的概率向量
。其中, m表示采样位置的数目表示位置j成为下一个采样位置的概率。
[0089] 3-2同样地,对于第i个轨迹序列,计算PMM的概率向量
[0090] 3-3将由GMM和PMM生成的概率向量线性组合,得到
。其中, 1是单位向量,β〇,βι和阮是需要估计的系数。
是指示向量,如果实际的 下一个位置是j,那么3^二1,否则为0。
[0091] 3-4求解系数扣的最优值。给定一个包含η条训练轨迹的集合,可W通过标准线性 回归最小化
来计算扔的最优值,运里的II · II是欧几里得范数。
[0092] 3-5对于一条特定的轨迹,可W通过标记估计量度中的k个最大元素来预测前k个下 一采样位置。
[0093] 步骤4加入时间因素:
[0094] 人类的移动很大程度上展现了时间规律性,预测模型应该是时间感知的,因此,我 们将时间因素考虑在内,对不同时间段训练不同的模型。一个直接的方法是将时间跨度划 分为给定数目(M)的等长的时间箱,并且将所有轨迹根据它们的时间戳映射到运些时间箱 中。横跨多个时间箱的轨迹被分割成更小的子轨迹,W使每个子轨迹中的轨迹单元都落入 同一时间箱内。然后,对于每个不同的时间箱,使用落入它们中的轨迹训练一个模型,运样 可W得到Μ个独立的模型。基于时间戳,选择合适的模型进行预测。运种方法被称为时间箱 (Time Binning,TB)。
[0095] 然而,运种方法有一定的局限性:箱子的尺寸是相等的,因此很难找到适合时间跨 度内所有移动模式的正确的箱尺寸,因为一些模式时间跨度很长而另一些则很短。一个可 能的改进是从一个小的箱尺寸开始,然后逐步合并按照某些度量标准概率分布较相似的时 间箱。
[0096] 本发明提出一个称为分布聚类(Dishibutions Clustering,DC)的方法,基于每 个时间箱的概率分布的相似性对时间箱进行聚类。在运里,概率分布是指从一个位置到另 一个位置的转移概率。与TB相比,概率分布相似的轨迹被放入同一个集群中,从而更清晰地 掲示了移动模式。
[0097] 如图5所示,步骤4中时间因素的加入具体包括W下步骤:
[0098] (4-1)划分时间箱:将时间跨度划分为给定数目(M)的等长的时间箱;
[0099] (4-2)分配轨迹到各个时间箱:将所有轨迹根据它们的时间戳映射到运些时间箱 中,横跨多个时间箱的轨迹被分割成更小的子轨迹,W使每个子轨迹中的轨迹单元都落入 同一时间箱内;
[0100] (4-3)计算概率向量:一个对象〇在某一时间点出现在采样位置1,该时间点落入第 i个时间箱,巧W是一个m维向量,表示0从1移动到另一个位置的概率,其中,m表示采样位置 的总数。
[0101] (4-4)度量相似性:我们使用余弦相似度测量两个时间箱巧日j(关于0)的相似性, 公式天
[0102] (4-5)进行聚类:根据采样位置1在各个时间箱中的概率分布的相似性对时间箱执 行聚类。算法执行结果是一组集群,每个集群包含一组时间箱。
[0103] (4-6)计算移动对象下一采样位置的概率分布:对于一个给定的位置li,可W得到 Q个集群,定义为Cf,k = l,2, . . .,Q。结合N阶马尔科夫模型,一个移动对象0的下一个采样 位置Γ的概率分布P( Γ )可W通过如下公式计算:
[0104]
[0105] 本发明使用每个集群中的轨迹训练得到Q个模型,形成一种新的模型NLPMM-DC。在 运个新的模型中,通过把分布聚类和马尔科夫模型结合在一起,已经经过的位置序列和时 间因素都被考虑在内。
[0106] 如图6所示,其中第(4-5)步对时间箱中的每个采样位置执行聚类包括W下步骤:
[0107] a输入:集群数目Q,时间箱数目M,W及给定轨迹在每个时间箱中的概率分布;
[0108] b随机选择Q个时间箱作为初始集群中屯、点;
[0109] C计算轨迹在每个时间箱中的概率分布和各个集群中屯、点的相似度;
[0110] d将每个时间箱分配给和它相似度最大的集群;
[0111] e重新计算集群中屯、点的概率分布;
[0112] f如果前后两次聚类结果中的集群不再改变或者已达到最大循环次数,那么返回 聚类结果并且退出循环;否则返回到第C步。
[0113] 将提出的NL?M-DC和已有方法(VMM和WhereNext)作比较。VMM使用每个移动对象 自己的轨迹来预测下一位置,WhereNext则使用所有可W获得的轨迹来挖掘集体的移动模 式。在实验中,我们预测top-1下一义样位置。VMM的参数设置为:内存长度N = 3,0 = 0.3 ,Nmin =1。对于WhereNext,构建τ-模式树的支持度设为20。对于NLPMM-DC,阶数N设为3,分布聚类 的数目设为5。实验结果如附图7所示。NLPMM-DC表现最好,归功于两点,一是个体和集体移 动模式的结合,二是对时间因素的考虑与处理。
[0114] 上述虽然结合附图对本发明的【具体实施方式】进行了描述,但并非对本发明保护范 围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不 需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围W内。
【主权项】
1. 一种基于马尔科夫模型的位置预测方法,其特征是:包括以下步骤: (1) 采集历史轨迹,确定各个采样位置的数据集中概率,进行归一化处理,确定各个离 散型概率分布,构建可变阶全局马尔科夫模型; (2) 根据每个移动对象的历史轨迹,构建0阶马尔科夫模型和可变阶马尔科夫模型,进 行数据的整合,形成每个移动对象的个体马尔科夫模型; (3) 通过线性回归将全局马尔科夫模型和个体马尔科夫模型进行组合,生成概率向量 线性组合; (4) 划分时间段,将所有轨迹根据它们的时间戳映射到这些时间段中,计算各对象落入 各个时间段的概率,进行聚类,结合聚类结果和马尔科夫模型进行预测下一位置。2. 如权利要求1所述的一种基于马尔科夫模型的位置预测方法,其特征是:所述步骤 (1) 中,对于给定的轨迹数据集,采样位置的N阶全局马尔科夫模型的构建训练方法包括: (1-1)构建采样位置的前缀集合; (1-2)对于前缀集合中每一个前缀,计算数据集中每个不同的采样位置出现在这个前 缀之后的频率,进行归一化处理,得到一个关于下一个采样位置的离散型概率分布; (1-3)从1阶开始,依次开始训练,得到可变阶的全局马尔科夫模型。3. 如权利要求1所述的一种基于马尔科夫模型的位置预测方法,其特征是:所述步骤 (2) 中,其具体方法包括: (2-1)将每个移动对象的长度大于1的轨迹训练一个可变阶的马尔科夫模型; (2-2)对于每个移动对象,使用它自己的轨迹单元训练一个0阶马尔科夫模型,计算移 动对象在每个采样位置的出现概率; (2-3)将0阶马尔科夫模型和可变阶马尔科夫模型整合在一起生成最终的个体马尔科 夫模型。4. 如权利要求3所述的一种基于马尔科夫模型的位置预测方法,其特征是:所述步骤 (2-1)中,具体为:每个移动对象使用它自己的轨迹构建前缀集合,计算下一个采样位置的 概率分布,通过将阶数从1变化到N来迭代训练可变阶的马尔科夫模型。5. 如权利要求1所述的一种基于马尔科夫模型的位置预测方法,其特征是:所述步骤 (3) 中,具体方法包括: (3-1)分别使用概率向量来表示全局马尔科夫模型和个体马尔科夫模型的轨迹序列的 所有采样位置成为下一个采样位置的概率; (3-2)构建轨迹序列的指示向量,使真正的实际下个位置处的向量值为1,其他为0; (3-3)将全局马尔科夫模型和个体马尔科夫模型的概率向量进行线性组合。6. 如权利要求5所述的一种基于马尔科夫模型的位置预测方法,其特征是:所述步骤 (3-3)中,全局马尔科夫模型和个体马尔科夫模型的概率向量组合后为:其中,1是单位向量,是需要估计的系数,给定一个包含η条训练轨迹的集合, 通过标准线性回归最小化ΣΙΙΙμ-戈1来计算私的最优值,这里的11 · I I是欧几里得范数, = W , P丨,..., pU,w= 1时代表全局马尔科夫模型的概率向量,W = 2时代表个体马尔 科夫模型的概率向量,其中,m表示采样位置的数目,表示位置j成为下一个采样位置的 概率。7. 如权利要求1所述的一种基于马尔科夫模型的位置预测方法,其特征是:所述步骤 (4)中,具体方法包括: (4-1)将时间跨度划分为给定数目的等长的时间箱; (4-2)将所有轨迹根据它们的时间戳映射到划分的时间箱中,横跨多个时间箱的轨迹 被分割成更小的子轨迹,以使每个子轨迹中的轨迹单元都落入同一时间箱内; (4-3)根据对象出现在各采样位置的时间点计算落入每个时间箱的概率; (4-4)使用余弦相似度测量两个时间箱关于对象的相似性; (4-5)根据采样位置在各个时间箱中的概率分布的相似性对时间箱执行聚类,计算该 对象移动到下一米样位置的概率分布。8. 如权利要求7所述的一种基于马尔科夫模型的位置预测方法,其特征是:所述步骤 (4-3)中,一个对象〇在某一时间点出现在采样位置1,该时间点落入第i个时间箱,是一 个m维向量,表示〇从1移动到另一个位置的概率,其中,m表示采样位置的总数。9. 如权利要求7所述的一种基于马尔科夫模型的位置预测方法,其特征是:所述步骤 (4-5)中,聚类的具体方法包括: (i)确定集群数目、时间箱数目和给定轨迹在每个时间箱中的概率分布; (i i)随机选择集群数目个数的时间箱作为初始集群中心点; (i i i)计算轨迹在每个时间箱中的概率分布和各个集群中心点的相似度; (iv) 将每个时间箱分配给和它相似度最大的集群; (v) 重新计算集群中心点的概率分布; (vi) 如果前后两次聚类结果中的集群不再改变或者已达到最大循环次数,那么返回聚 类结果并且退出循环;否则返回到步骤(iii)。10. -种基于马尔科夫模型的位置预测系统,其特征是:包括采集模块、全局马尔科夫 模型构建模块、个体马尔科夫模型构建模块、线性组合模块和聚类模块,其中: 所述采集模块,用于采集历史轨迹,确定各个采样位置的数据集中概率; 所述全局马尔科夫模型构建模块,用于进行归一化处理,确定各个离散型概率分布,构 建可变阶全局马尔科夫模型; 所述个体马尔科夫模型构建模块,用于根据每个移动对象的历史轨迹,构建〇阶马尔科 夫模型和可变阶马尔科夫模型,进行数据的整合,形成每个移动对象的个体马尔科夫模型; 所述线性组合模块,用于通过线性回归将全局马尔科夫模型和个体马尔科夫模型进行 组合,生成概率向量线性组合; 所述聚类模块,用于划分时间段,将所有轨迹根据它们的时间戳映射到这些时间段中, 计算各对象落入各个时间段的概率,进行聚类,结合聚类结果和马尔科夫模型进行预测下 一位置。
【文档编号】G06Q50/30GK105825297SQ201610141578
【公开日】2016年8月3日
【申请日】2016年3月11日
【发明人】陈勐, 刘洋, 禹晓辉, 王月
【申请人】山东大学, 青岛观澜数据技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1