一种隐马尔可夫模型改进的路网匹配方法与流程

文档序号:17587240发布日期:2019-05-03 21:26阅读:299来源:国知局
一种隐马尔可夫模型改进的路网匹配方法与流程

本发明属于地理位置定位技术领域;具体涉及一种隐马尔可夫模型改进的路网匹配方法。



背景技术:

由于智能手机的普及使用和4g网络的广泛覆盖,再加上许多导航应用app的使用,如百度地图、高德地图等,手机数据可覆盖到非常大的人群和空间位置。将个人的轨迹匹配到道路网上是利用gps轨迹数据或手机信令数据,确定人在地图上准确的移动轨迹的一种定位技术。这一技术被广泛应用于人群流动监控、人群移动行为研究、群体异常事件检测等领域,准确的路网匹配结果对于这些领域可提供强有力的支撑和重要的决策意义。

目前,常见的路网匹配算法主要有基于几何分析、基于拓扑结构分析、基于概率统计、以及使用更为复杂数学理论的地图匹配算法,比如:基于d-s证据理论、基于模糊逻辑、基于贝叶斯推理、基于凸优化、基于卡尔曼滤波。基于几何分析的路网匹配算法是充分利用道路网的空间几何信息和路段的形状,可分成点到点的匹配,点到曲线的匹配和曲线到曲线的匹配,其缺点忽略了路段之间的连通性,实时性较差;基于拓扑结构分析的路网匹配算法全面考虑到移动方向和速度以及道路的连通性,但其受到道路网拓扑关系质量的影响,随着拓扑关系的复杂度增加,其匹配性能也随着下降。



技术实现要素:

本发明提供了一种基于隐马尔可夫模型的路网匹配方法,解决了现有随着拓扑关系复杂度的增加,路网匹配性能下降的问题,该方法具有快速匹配,且适用于更稀疏、误差更大的数据。

为了达到上述目的,本发明的技术方案是:一种隐马尔可夫模型改进的路网匹配方法,包括以下步骤:

s1,获取目标对象的历史蜂窝基站轨迹数据,对历史蜂窝基站轨迹上的基站进行编码,将已编码的基站作为隐马尔可夫模型中的观测变量;将目标对象实际移动的路段作为隐马尔可夫模型中的隐藏状态变量;

s2,基于基站密度和道路方向两个影响因子,考虑目标对象的方向和候选路段的方向作为权重参数,对隐马尔可夫模型的观测概率进行正态化处理;在转移概率中加入目标对象更倾向于最短路径的考量,对转移概率定义中的距离度量进行改进,得到转移概率;基于s1得到的蜂窝基站轨迹数据和正态化处理后的观测概率以及修改后的转移概率,对每条轨迹上的基站计算其与周围路段的观测概率和到下一个基站的转移概率;

s3,以s2所得每条轨迹上的基站与其周围路段的观测概率和到下一个基站的转移概率作为输入,采用viterbi算法进行处理得到与目标对象最为匹配的路段。

s1中建立基站编码的具体步骤如下:

s101,在需要进行匹配的区域定四个基点,形成包含基站的矩形区域,所述四个基点即矩形区域的顶点;

s102,以s101所述矩形区域的中心为原点,坐标轴平行于矩形区域的四条边,以象限数值编码区域的方法,使得每个区域只包含一个基站,编码所在位数表示基准点层级数和精度值,使用区域的编码替代基站的经纬度数值,使用四进制的数值来代替十进制对基站进行象限和区域编码;可得到每个基站的唯一标识,即基站编码。

s2中对隐马尔可夫模型观测概率进行正态化处理,对任一路段t时刻的观测点pt的观测概率正态化,考虑观测点与候选路段上的投影点之间的距离,具体计算方式如下:

其中,σt是高斯分布的标准差,与基站的密度正相关,是pt与之间的距离;wd和ws是通过道路方向得到的两个权重参数。

在观测概率中引入候选路段的方向参数,基于偏离原方向最小原则和更高限速路径原则确定权重参数wd和ws。

采用如下计算式将道路的方向映射成权重wd,

其中,dirs是运动对象的方向矢量,dirc是候选路段的方向矢量;对具有更高限速的道路赋予更大的权重,即

ws=1-c·rl

其中,c是常数,rl是限速道路的限速。

s2中,对运动对象从一个路段到另一个路段的转移概率作如下改进:

其中:β是一个常数;是两个基站在路段投影的路网距离和他们在路段投影的路网距离最小值之差,将基站密度与其分布的标准差关联;两个基站在路段投影的路网距离和他们在路段投影的路网距离最小值之差为:

其中,是路网上两个路段i和j之间的距离;是在两个连续的时间步中所有可能的路段组的最短距离。

s3中,根据两个路段之间的距离与两个基站之间的距离来决定输出路径的数量。

s3中对两个路段之间的距离与两个基站之间的距离设定阈值λ;当

其中,其中d(pt,pt-1)是两个基站之间的最短距离,是路网上基站的任一路径的长度,λ是常数,输出多个候选路径,当时,只输出具有最高隐马尔可夫模型概率的一条路径。

λ=1.2。

与现有技术相比,本发明的有益效果是:本发明不仅仅可以处理采样率高的gps轨迹数据,同时也可以处理采样率低的手机信令数据,对转移概率中的两个基站在路段投影的路网距离和他们在路段投影的路网距离最小值之差作出改进,使之能应用到手机信令数据采样率低的情况下在数据适用性方面具有很高的可拓展性;可以实现更快速度的路网匹配,形象直观,可以作为一种新的路网匹配方法;可以选择性地输出多条结果,在保证内存开销的同时,提高了模型匹配的准确率;可以准确的将所有用户基站位置序列匹配到位置地图的运动轨迹,确定出和某一用户伴行的用户,查找;也可以应用在城市交通规划中,获取每名用户的运动轨迹,掌握每条道路具体车流人流情况,优化道路交通;可应用在伴行查询中,以我们提出的路网匹配技术为基石,对用户基站序列进行匹配,分析用户伴行人员;另外,在建立基站编码时,编码所在位数表示基准点层级数和精度值,使用区域的编码替代基站的经纬度数值,使用四进制的数值来代替十进制,从而节省数据的储存空间。

附图说明

图1为本发明匹配过程示意图;

图2为建立基站编码示意图;

图3为本发明输出结果示意图。

具体实施方式

下面结合附图和具体实施例对本发明的技术方案进一步说明。

如图1所示,一种基于隐马尔可夫模型的改进的路网匹配方法,基于手机信令数据建立基站编码,将蜂窝基站轨迹点位置作为隐马尔可夫模型中的观测变量,而人群实际所在位置作为隐藏状态变量,通过实际数据训练模型再进行真实位置的预测;在此基础上,重新定义观测概率矩阵和转移概率矩阵,将搜索半径与基站密度相关联,最后使用viterbi算法进行预测,输出多条结果;具体包括以下步骤:

s1,获取目标对象的历史蜂窝基站轨迹数据,对历史蜂窝基站轨迹上的基站进行编码,将已编码的基站作为隐马尔可夫模型中的观测变量;将目标对象实际移动的路段作为隐马尔可夫模型中的隐藏状态变量;

s2,基于基站密度和道路方向两个影响因子,考虑目标对象的方向和候选路段的方向作为权重参数,对隐马尔可夫模型的观测概率进行正态化处理;在转移概率中加入目标对象更倾向于最短路径的考量,对转移概率定义中的距离度量进行改进,得到转移概率;基于s1得到的蜂窝基站轨迹数据和正态化处理后的观测概率以及修改后的转移概率,对每条轨迹上的基站计算其与周围路段的观测概率和到下一个基站的转移概率;

s3,以s2所得每条轨迹上的基站与其周围路段的观测概率和到下一个基站的转移概率作为输入,采用viterbi算法进行处理得到与目标对象最为匹配的路段。

每条轨迹是由每个点串成的,用每个点的经纬度来表示每条轨迹则出现信息过长,也不方便对轨迹进行查询;因此,使用区域编码来代替基站的经纬度,根据基站覆盖的范围来确定区域的大小,在对每个基站进行区域编码之后然后根据这些编码依次按轨迹上点的顺序串起来,形成每条轨迹的唯一标识,从而能进行快速的索引;具体如下:

s101,规定四个基点,形成包含基站的矩形区域,所述四个基点即矩形区域的顶点;

s102,如图2所示,以s101所述矩形区域的中心为原点,坐标轴平行于矩形区域的四条边,以象限数值编码区域的方法,使得每个区域只包含一个基站,如果出现多个基站出现在同个区域时,则继续往下细分,直到每个区域只包含一个基站为止;编码所在位数表示基准点层级数和精度值,使用区域的编码替代基站的经纬度数值,使用四进制的数值来代替十进制,从而节省数据的储存空间;

s103,根据已经进行区域编码的基站,根据轨迹上的基站的顺序来建立每条轨迹的唯一标识,即可得到基站编码,如图2中的弧线轨迹,基站编码可表示成:004-001-002。

s2中,在原有隐马尔可夫模型的观测概率的定义的基础上,对任一路段t时刻的观测点pt的观测概率正态化,然后考虑观测点与其相应路段上的投影点之间的距离。具体公式如下:

其中:σt是高斯分布的标准差,与基站的密度有关;是pt与之间的距离;

wd和ws是通过道路方向得到的两个权重参数;

基于以下两个原则来确定权重wd和ws:

(1)人们通常更喜欢遵循相同的方向或稍微偏离的移动方向的原则,在一条双向的道路,人们更可能保持不变前进的方向,而不是改变到另一侧的道路,为了将道路的方向映射成权重wd,现使用以下的函数:

其中,dirs是运动对象的方向矢量,dirc是候选路段的方向矢量。

人们通常更喜欢使用更宽的道路,如果多个道路可以通往目的地;因此,我们在观察概率中对具有更高的限速的道路赋予更大的权重,如下:

ws=1-c·rl

其中,c是常数,rl是限速道路的限速,120km/h是最大的限速。

转移概率是指运动对象在第t-1步状态i转移到下一步t的状态j的概率。现有的大多数工作都是使用newsonandkrumm的思路,即两个状态(路段)之间的测量距离应相似于两个基站之间的距离,运动对象从一个路段到另一个路段的转移概率定义成:

其中:β是一个常数参数,通常设置为0.0096;是两个基站在路段投影的路网距离和他们在路段投影的路网距离最小值之差,越小,转移概率也就越高;

上述方法适用于处理高采样率的gps轨迹数据,然而实际中的信令数据大部分都是具有很低的采样率,这造成在两个连续的时间步长之间,运动对象可能已经在路线上行驶了很长距离,因此基站之间的测量距离可能无法反映真实的行驶距离;而考虑到路网上某两个路段的所有可能通路,则认为运动对象更倾向于走其中最短的那条路径;因此对转移概率中的作出以下改进:

其中,是路网上两个路段i和j之间的距离;是在两个连续的时间步中所有可能的路段对的最短距离。在第t时刻,隐藏状态可以是该基站周围的任意路段。

本发明中,为了解决由于采样率低造成存在两个基站覆盖区域之间可能存在多条可能的路径的问题,在viterbi算法进行预测的过程中,选择性地输出多条路径。虽然基于hmm的地图匹配的转换概率为这些路径分配了不同的概率,但由于它们在路线图上具有相似的距离,所以hmm过程很难准确找到用户选择的真实路径。为了在最终结果中包含真实路径,并在以下相似性搜索过程中输出多条路径;而多个路径需要更多的计算时间来处理,为了减少计算开销,我们只在必要时输出多个路径;一个关键的观察结果是多路径的情况只有在两点之间存在迂回路径时才会发生;因此,如果两个路段之间的距离与两个基站之间的距离有很大不同(阈值设定如下),我们会考虑输出中的多个路径,

其中d(pt,pt-1)是两个基站之间的最短距离,是路网上基站的任一路径的长度,参数λ是常数,本发明优选的,λ取1.2;

时,只考虑输出具有最高hmm建模概率的一条路径作为结果。这种情况下一般都是路段比较笔直,而基站位于路的旁边,从而和d(pt,pt-1)比较接近,因此比较容易找到真实的行驶路径。

本发明中,首先执行hmm过程以获得路网上最可能的移动轨迹,然后通过公式是否成立来检测每条路径的必要性;如有必要,生成所有备选方案路径并通过该路径替换轨迹中的原始路径中的相应路径,其中每条路径都有自身的转移概率,接着通过拼接不同部分的多个路径,获得更多不同概率的轨迹;最后,输出概率值接近最大值的m条轨迹,m取5~10。

采用本发明所述方案实现将只有两个点的轨迹匹配到真实路网上并输出多条路径,由于蜂窝基站的数据样本率很低,所以从基站pt的覆盖区域到基站pt+1的覆盖区域可能存在着许多可能的移动路径;如图3所示,从基站pt到基站pt+1可匹配到四条可能的路径,如图中的path1到path4;这四条路径的概率不同,其中以path1那条路径的可能性最大,但是这四条路径有相似的距离,很难准确地断定path1那条路径就是用户所走的真实路径,为在最终结果中包含真实的轨迹,采取输出多条路径的方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1