基于移动用户轨迹分段和最热搜索的热点路径发现方法与流程

文档序号:13612328阅读:266来源:国知局
基于移动用户轨迹分段和最热搜索的热点路径发现方法与流程

本发明涉及一种基于轨迹分段和最热搜索的热点路径发现方法,技术特征包含路径识别和热点路径搜索。



背景技术:

热点路径通常指在特定时长内被人们频繁访问的道路段,专利文献1(专利公开号cn105258704)将热点路径定义为一种全局的路径,事实上热点路径的定义基本都是从起点到终点的全局路径,本发明的热点路径是指起始点带最大贡献度的线段的路径集合。热点路径与人们生活中的拥堵地区相似,它可以实时反映城市的交通状况,热点路径的识别是交通规划最重要的参考对象,具有非常高的实际意义。

近年来热点路径识别的相关研究发展很快,尤其是基于gps定位数据和车载数据的热点路径识别技术日趋成熟,但针对基于手机基站定位数据的热点路径识别和地图匹配方法的研究还不够深入,没有对其技术特征、实用性以及存在的问题等方面进行全面透析,还有待大量的实践进行实证。

利用移动基站定位用户精度最低,城市中基站的覆盖范围为0.5km-5km不等,其定位精度也在这个范围。然而,由于手机的普及特性,因此研究基于该数据特性的轨迹预测将为大量基于位置信息的应用提供支持。mit相关科研人员通过在手机安装客户端,记录下用户附近的基站信息,得到连续的轨迹。利用dbn,对用户的轨迹进行预测。该研究使用了志愿者提供的信息,实际上是低精度类似gps定位数据的连续轨迹预测,有着gps定位进行轨迹预测相同的缺陷。

综上,基于手机通信数据的城市交通分析是一个亟待解决的问题。



技术实现要素:

为了解决上述中的技术问题,本发明提供了一种基于轨迹匹配和最热搜索的热点路径识别方法,先通过基于轨迹分段方法和权重的路段标识方法,生成基于不同贡献度的交通线路集合,然后利用基于贡献度的最热搜索方法确定在固定起始点的情况下的最热路径,最后输出基于固定起始点的最热线路。

所述轨迹分段方法,是利用基站历史的用户轨迹数据集,通过基于轨迹分段的道路识别方法进行地图计算,得到轨迹段的无向图。

轨迹分段方法的具体步骤为:

s1:构造基站范围图并与道路网结合;

s2:利用s1得到的基站范围图与道路网结合得到的交点判别有效定位点,连接两个定位点的道路视为一条有效轨迹段;;

s3:利用s1、s2得到的内容,生成轨迹段无向图。

所述权重的路段标识方法,结合轨道分段方法得到的轨迹段无向图,对每条轨迹分段线路加上权重,并利用权重计算轨迹段线路的正反方向的两个贡献度,生成基于不同贡献度的交通线路集合。

权重的路段标识方法具体步骤为:先利用所述轨迹分段方法得出的轨迹图,结合基站历史数据特征,得到用户在一条有效轨迹段的行驶轨迹;再将所有用户的行驶轨迹相加,相同起始点的轨迹段更新其权值,得到基于历史轨迹数据的用户权值轨迹线路,并通过对每条轨迹段的不同行驶方向的权值进行细分,输出带不同方向权值的线路集合;最后利用权重判断轨迹段线路贡献度,生成基于不同方向的贡献度的交通线路集合。

所述利用基于贡献度的最热搜索方法,是在轨迹分段方法和权重的路段标识方法所生成基于不同贡献度的交通线路集合的基础上,在输入固定起始点的情况下的所搜最热路径,具体方法为:

s11:输入起点、终点和起始时刻;

s12:以所述基于轨迹分段方法和权重的路段标识方法生成基于不同贡献度的交通线路集合为基础,将起点作为一个根节点,计算起点到下一个节点的跨距;

s13:按行驶方向计算起点到各个节点的贡献度,同一层的节点按起点到节点的负贡献度大小从左到右排序;

s14:判断节点是否重复,将所有存在的路段在图中表示出来,将图转化成为等价树;

s15:修剪s14中等价树的重复节点,输出最小贡献度路径,即最热路径。本发明的优点及有益效果:

1.基于轨迹分段的道路匹配方法,具有较高的路径匹配率,将基站边缘范围与道路交点视为有效定位点能更好体现移动轨迹,通过接入、离开基站等轨迹数据能精确地计算每个轨迹在此道路段的行驶速度,这为基于移动通信数据进行交通信息提取、用户出行行为挖掘提供了应用的基础。

2.基于权重的路段标识方法,通过历史轨迹数据对道路段标上权重信息,将道路段按方向划分为两个带不同行驶方向的权重值和贡献度,更能体现此道路段在不同行驶方向上的热度系数,这是其他热点路径相关的研究中没考虑到的问题。

3.基于贡献度的最热路段搜索方法,提出的树修剪方法具有简单、直观的特点,通过贡献度来搜索最热路段,比基于权重的路段搜索方法更精确。

附图说明

图1是本发明的实施总体流程图;

图2是一条交通线路和基站覆盖的示意地图;

图3是生成无向轨迹段示意图;

图4是基于权重的路段标识流程图;

图5是贡献度算法示意图;

图6是排列和修剪过程图。

具体实施方式

下面结合附图做进一步说明。

下面将结合发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。

本发明首先提供了一种热点路径识别的核心特征,如果路径(a→a1→…→p→…→b)是起点a到终点b的最优路径,那么此最优路径有:

1.其从a到最优路径所经过的任何有效定位点都为最优,即子路径最优;

2.每两个有效定位点之间的路径段都有其特定方向的贡献度,即热度系数。

特征1中,子路径最优指的是如果路径(a→a1→…→p→…→b)是起点a到终点b的最优路径,那么路径(a→a1→…→p)必是从节点a到节点p的最优路径。

特征2中,特定热度系数即指通过计算每两个有效定位点的权重ω以及节点的出入度而得出的贡献度表示为此道路段被人们频繁访问的热度。

如图1所述,本发明总体流程为:

步骤1,利用基站历史的用户轨迹数据集和道路网,通过基于轨迹分段的道路识别方法进行地图计算。

步骤2,匹配定位点,将连接两个相邻定位点之间的道路视为一条有效轨迹段,然后生成用户轨迹道路集合。

步骤3,结合轨迹信息,利用基于权重的路段标识方法,对每条轨迹分段线路加上权重,并在图中表示出来。

步骤4,给定输入及输入的起始坐标、终点坐标,结合不同贡献度的交通线路集,利用基于贡献度的最热路径搜索方法,计算每条道路的贡献度con。

步骤5,结合用户行驶方向,按方向搜索相连接的最大贡献度,通过修剪的方法删除重复或者多余的线路,得出最热路径。

本发明的实施过程主要由三种方法来完成。方法一,利用基于轨迹分段的道路识别方法将道路分段;方法二,利用大规模历史轨迹数据构造基于权重的道路段网络;方法三,利用基于贡献度的最热搜索方法确定在固定起始点的情况下的最热路径。

方法一中利用基于轨迹分段的道路识别方法将道路分段,具体步骤为:

s1:构造基站范围图并与道路网结合。

根据基站的覆盖范围,简化地将移动设备定位在以基站为圆心,覆盖范围为半径的圆中,将划定基站范围的圆描绘到道路网,按照基站经纬度将区域s划分成为n个基站单元,每个基站单元都有相应的经纬度,即其中xi,yi分别表示基站i的经纬度,tower1(x1,y1)表示一个基站,sb表示一个网络空间区域,由不同基站覆盖范围组成,将划定基站范围的地图描绘到道路网,构成基站网络空间集。

s2:利用s1得到的基站范围图与道路网结合得到的交点判别有效定位点,并将交通线路分为轨迹段集合。

沿道路行驶方向,将道路中心线和发生基站切换所在范围的交点视为一个有效的定位点,给定进入基站i的toweri的覆盖范围的时间ti(1≤i≤n),一个有效定位点的表示方法为pi(ti,toweri(xi,yi)),定义历史有效定位点集合

y={p1(t1,tower1(x1,y1)),p2(t2,tower2(x2,y2)),...,pi(ti,toweri(xi,yi))}

每个有效定位点都有其固定的参数,即进入基站时间ti和进入基站的位置toweri(xi,yi),一条交通线路就被分为轨迹段p1p2,p2p3,p3p4,…,pi-1pi的集合,如图2所示。

s3:利用s1、s2得到的内容,生成轨迹段无向图。

沿道路连接的轨迹段p1p2,p2p3,p3p4,…,pi-1pi是弯曲的线段,为了生成无向图,将相邻p直线连接,如图3所示,沿道路中心线方向,连接各有效定位点,得到基于轨迹分段的道路集合

roadn={trajectory1,trajectory2,...,trajectoryn}

其中trajectoryi表示从pi-1→pi的轨迹段,trajectoryi=pi-1pi,然后连接每条路段的定位点,从而生成无向图。

方法二,利用大规模历史轨迹数据构造基于权重的道路段网络,基于权重的路段标识流程图如图4所示。

基于权重的路段标识具体实施步骤为,利用方法一所述的无向图生成方法,结合基站历史数据特征,即在特定时间内所有用户的历史轨迹,包含用户接入方向,离开方向,以及基站的经纬度towern(xn,yn),将一条行驶路径的两个端点即有效定位点分别记为pa和pb,因为此路径可能有很多用户经过且方向不同,所以谁是起点和终点取决于用户的行驶方向,如果当其中一个用户从pa进入第一个定位点p1时,此时将从pa到p1的线段权重ω1标记为1,即ω1=1,当用户从p1经过pa时,权重记为ω1′,所经过的时间为t1′,如果没有对应的道路段,权重则不更新,然后给此路段标上权重和时间,即trajectory1(ω1,ω1′),表示为一条道路段的权重。将用户1经过的所有有效定位点按上述方法给路段标上权重,则用户1的基于权重的历史轨迹路段集合user1为

user1={trajectory1(ω1,ω1′),trajectory2(ω2,ω2′),...,trajectoryn(ωn,ωn′)}

其中trajectory1(ωn,ωn′)表示第n条轨迹段的权重标记。

最后,将m个用户的历史轨迹相加,相同起始点的轨迹段更新其权值,得到基于历史轨迹数据的用户权值轨迹线路u,即

u=user1+user2+…+userm

从而将每条有效轨迹段标上权重w,即

其中,w表示每条轨迹段的权重表示,a=1,2,...,m表示用户,ωi和ωi′分别表示轨迹段i的不同方向的权重。

道路集合包含n条到两个权值的轨迹段,即每两个有效定位点之间的轨迹段被分为不同方向的两个权重值ωi和ωi′,通过对每条轨迹段的不同行驶方向的权值进行细分,能更好达到热点路径的探测效果。

最后输出带不同方向权值的线段集合。

方法三,利用基于贡献度的最热搜索方法确定在固定起始点的情况下的最热路径。

如图5所示,最热路径搜索在固定起始点情况下的最热路径具体实施步骤为:

1.输入起点a和终点b,起始时刻t0。

2.将输入的起点a作为树的根节点,记为layer0;计算从a到下一个节点的跨距d;跨距d的定义为其经过的轨迹段条数。

3.计算a到各个节点的贡献度,如图6所示,将每条边划分为两个有向线段,每条线段有不同的贡献度表示,贡献度的计算公式如下公式所示,

其中,i,j分别表示相邻的两个定位点,即一条轨迹段的两个端点;coni→j,conj→i分别表示从i→j和j→i方向的贡献度,visi→j和visj→i分别表示从i→j,j→i方向的访问次数,ωi→j=visi→j表示从i→j的权重,ωi+j=visi→j+visj→i表示轨迹段ij的总权重。

将负贡献度定义为贡献的负数,然后通过最优路径搜索方法,从而得到最热的路径计算。

4.将同一层的节点按起点a到节点的负贡献度大小从左到右排序;

5.判断节点是否重复;是,标记层次最小的节点为可扩展节点,其他所处层次位置高于它的重复节点标记为不可扩展节点;否,则保留路径。

6.将所有存在的路段在图中表示出来,将图转化成为等价树;

7.修剪树中重复节点;修剪的方法为:如果路径(a→a1→…→p→…→b)是起点a到终点b的最优路径,那么路径(a→a1→…→p)必是从节点a到节点p的最优路径,即所求最短路径经过的节点集中,根节点到该节点贡献度最小时所经过的路径必定是起点到终点的最短路径所经过的一段路径。因此,修剪重复节点时所用判据可如下述:如果该重复节点为k,road(a,...,k,i)(i=1,2,3,...)为第i条a到k经过的路径,则t(a,k,road(a,...,k,i))为第i条a到k的路径的用时,当t最小时,保留对应路径上的k节点,删去其他重复k节点及所连树枝。

8.输出最小贡献度路径,即最优路径。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1