基于手机信令数据的城市居民动态OD矩阵提取方法

文档序号:35288714发布日期:2023-09-01 10:17阅读:122来源:国知局
基于手机信令数据的城市居民动态OD矩阵提取方法

本发明涉及智能交通系统,具体为基于手机信令数据的城市居民动态od矩阵提取方法。


背景技术:

1、交通调查是获取居民出行信息最广泛使用的方法之一,传统的交通数据主要来源包括:家庭电话调查、人口普查数据和路边问卷调查。受访者将提供他们确切的旅行信息,例如出发地、目的地、出发时间、到达时间以及他们采用的交通方式。

2、然而,这类方法通常3-5年进行一次,存在成本高、抽样率有限、调查周期长等明显局限性,无法满足现代智能交通系统所需交通动态起讫点(origin-destination,od)矩阵需求;21世纪以来逐渐开始使用微波检测、浮动车数据和交通断面固定设备数据,此时数据收集周期明显缩短,但这类多源异构的交通数据获取成本高和覆盖率低,在初期的数据处理中融合难度较大。随后,gps的出现提供了高精度和带时间戳的位置数据,研究人员逐渐开始使用gps数据代替传统的交通调查来获取城市居民的出行特征。尽管如此,gps数据在大规模应用方面仍存在受到诸多限制。例如,gps数据收集需要志愿者携带专用的gps记录器或者获取智能手机上gps定位模块权限,这一要求可能导致参与人数的减少,进而影响调查的规模和持续时间。

3、近年来,随着移动通信网络的迅速发展和智能手机的广泛应用,基于手机定位的大数据为交通数据带来了新的活力。手机信令数据具有成本低、覆盖范围广和海量数据等特点,为动态od矩阵获取提供了良好的数据基础。现有的技术公开了,某地区使用电话账单数据获取od信息的可行性,利用账单数据中包含的基站的位置代替拨打电话的时间和地点,并且验证了从手机数据中获取od信息的可行性。使用手机位置数据库提取od矩阵的可行性,使用手机通信网络模拟器从电话网络中模拟和提取od矩阵。使用模拟的蜂窝探测器轨迹信息估计每od需求,并通过vissim模拟测试该方法。这些结果显示了使用手机数据作为分析od矩阵的巨大潜力,城市交通流在宏观和微观层面的流动性有着潜在的联系,针对上述问题,发明人提出基于手机信令数据的城市居民动态od矩阵提取方法用于解决上述问题。


技术实现思路

1、为了解决现有的城市居民出行调查周期较长,交通小区划分粒度粗糙,导致调查不能及时准确的获取居民出行信息的问题;本发明的目的在于提供基于手机信令数据的城市居民动态od矩阵提取方法。

2、为解决上述技术问题,本发明采用如下技术方案:基于手机信令数据的城市居民动态od矩阵提取方法,包括数据预处理,驻留点识别以及动态od矩阵构建,包括以下步骤:

3、s1、数据预处理

4、通过关键数据缺失、重复冗余数据、乒乓切换、漂移数据在数据处理阶段降低噪声数据引起的误差;

5、关键数据缺失:通过遍历表中所有关键字段,对于字段值为空的记录直接删除;

6、重复冗余数据:信令数据按照timestapmp字段顺序排列;依次遍历cellid字段,对于连续出现的同一cellid字段的数据只需保留第一条,并将其余冗余数据从表中删除;

7、乒乓切换:当手机位于多个通信基站的信号覆盖范围重叠区域内时,即使用户没有产生位移,手机信号也会在短时间内连接多个不同的基站,这种现象称为乒乓切换,发生乒乓切换时,信令数据中会存在两个或多个基站高频率切换的记录;

8、漂移数据:对信令数据集进行观察后,漂移数据在实际场景中主要表现形式分为两种:简单漂移数据和复杂漂移数据,如图4所示,对于简单的用户出行轨迹,漂移数据表现为较易识别的偏离点,从而使得过滤漂移点变得相对简单,复杂漂移数据指用户移动过程中,手机连接的基站出现长时间持续漂移现象,并在此过程中连接多个距离实际位置远超预期的基站,在信令数据中,复杂漂移情况下的漂移点频率远低于正常点,而非单点多次漂移;

9、s2、驻留点识别

10、算法首先应用等时化算法对出行过程中定位点的时间维度进行语义扩充,然后基于st-dbscan聚类算法进行改进,从而达到在时间和空间上同时聚类的效果;

11、数据等时化:通过使用线性插值法,在时间维度对dbscan算法进行扩充;

12、驻留点识别:通过于改进的st-dbscan的时空聚类方法,对于居民出行驻留点的定义为:以定位点pi为圆心,驻留点定义中出行距离阈值∈为半径的∈-邻域内,若包含某定位点在内的定位点数量m>minpts,那么称该邻域∈-内的所有定位点组成的点的集合s为驻留区域,同时该圆的中心点为停留点,到达时间为该圆内的第一个定位点的到达时间,等时化处理信令数据集后,居民出行过程中表达为驻留时间的时间维度信息转换成空间维度的定位点的密度大小,则驻留点时间判断阈值minpts即表达为的值;

13、s3、动态od矩阵构建

14、当od信息提取之后,从这些海量的od信息中抽取交通研究所需的特征信息,把微观的od数据聚合以相对宏观化的形式呈现,对研究区域内的od信息与城市道路网络关键节点进行匹配,从而构建动态od矩阵。

15、优选地,在s1中,基于时间窗的乒乓序列检测和等效位置替换算法,其算法步骤如下:

16、a:设置时间窗口阈值,将原始序列中的第一个点设置为基准点;

17、b:从基准点开始的时间窗口内的定位点提取为序列s;

18、c:判断序列s中基准点是否重新出现,是则转步骤d,否则转步骤e;

19、d:若基准点重新出现,则将序列s中基准点和其最后一次出现间的信令数据作为乒乓切换序列,该序列的下一个信令点作为新的基准点,针对乒乓切换序列,寻找等效位置:

20、d1):计算乒乓切换序列中每个点的停留时间比例,信令点的停留时间比例见公式(1)和公式(2),其中:lo、la为信令点的经纬度,tk为该点的停留时间;

21、d2):停留比例最高的信令点作为等效位置替换乒乓序列;

22、e:若序列s中基准点未再次出现,则将下一点作为基准点;

23、f:重复步骤c至步骤e直至所有信令点遍历结束。

24、优选地,在s1中,复杂漂移点检测算法的思想是基于高频率数据样本对信令数据进行判别,首先统计各轨迹点的频率,并且将出现频率特别高的点标记为高频正常点,通过引入高频正常点,可以保证部分正常点不会被标记为漂移点,同时在检测过程中将被误判为漂移点的高频正常点重新校正;

25、漂移序列检测示意图中,ni,di,j,ui为用户出行轨迹中序列点,其中n1为已被识别的正常轨迹点,d1,j是以n1为基准点识别为漂移点的漂移序列,u1为未被确认的正常点,复杂漂移点检测算法步骤如下:

26、a:设定漂移距离阈值、速度阈值、高频正常点频率阈值,对每个轨迹点出现的频率进行统计,若频率超过设定阈值,则将其识别为高频正常点;

27、b:计算当前基准轨迹点n2与下一未被确认轨迹点u1之间的距离dis、速度v,并判断是否均大于步骤一中阈值,若大于转步骤c,否则转步骤d;两轨迹点间距离和速度的计算见公式(3)至公式(6);

28、c:若该值均大于预设阈值,则继续判断下一个点u1是否在高频正常点中:

29、c1):若下一个点u1不在高频正常点中,则该点为漂移点d2,2,将未确认点u2作为下一点;

30、c2):若该值属于高频正常点中,则该正常点n2是漂移点,因为间隔时间较长而被判定为正常点,将该正常点n2修改为漂移点d1,4,该正常点为基准点所识别的第一个点d2,1设置为未被确认正常点u3,并将上一个正常点n1重新设置为基准点;

31、d:若该值不都大于预设阈值,则下一个点u1将被识别为正常点n3,并设置为基准点;

32、e:重复步骤b和步骤c直至所有轨迹点识别完成;

33、

34、

35、

36、

37、其中,距离计算采用haversine公式la、lo为轨迹点纬度和经度,r为地球半径,tp为轨迹点的时间戳。

38、优选地,在s2中,线性插值法,首先将时间间隔设定为t'(分钟),一天24小时共1440分钟,故整个时间片被分成1440/t'个时间片,数据等时化要求每个时间片都要有定位点,因此对于时间片不连续的情况,需要插入定位点作为补充,等时化处理方法如下:

39、若定位点pn位于时间片tn内,定位点pn1位于时间片tnk内,则需要插入t tn+k-t t-1个定位点,若相邻两定位点同处一时间片中,则保留前者,待插入的定位点的时间、经纬度表达式如公式(7)至公式(9)所示:

40、

41、

42、

43、其中:m∈{1,2,...,k-1}

44、优选地,在s2中,dbscan算法为:它由一个任意未被访问的点开始,然后探索这个点的∈-邻域,如果∈-邻域中有足够的点,则建立一个新的聚类,否则这个点被标签为噪声点,另外这个点之后可能被发现在其它点的∈-邻域里,而该∈-邻域可能有足够的点,届时这个点会被加入该聚类中,如果一个点位于一个聚类的密集区域里,它的∈-邻域里的点也属于该聚类,当这些新的点被加进聚类后,如果这些点也在密集区域里,则附属于∈-邻域里的点也会被加进聚类里。这个过程将一直重复,直至不能再加进更多的点为止,这样,一个密度连结的聚类被完整地找出来,然后,一个未曾被访问的点将被探索,从而发现一个新的聚类或噪声,利用dbscan聚类算法对居民出行定位点进行驻留点识别的伪代码如下表所示:

45、

46、

47、优选地,在s3中,动态od矩阵构建的具体步骤如下:

48、a:路网构建:首先通过osm(openstreetmap)api对各等级道路网络进行获取,其次,按照道路等级属性对关键路网进行筛选,城市道路网络按照功能可以分为:国道、县道、城市快速路、高速道路和一些低等级道路,通过将基本单元设定为关键道路交叉口以及道路端点,因此对于获取到的较为精细的路网,在对低等级道路进行筛选去除后,得到城市主干道矢量图,然后,利用地理信息系统(gis)工具arcmap对城市主干道矢量图进行拓扑检查,拓扑检查的是判断道路之间的关系以及检查出连接错误或者悬挂的线,经过拓扑检查后,路网中多余的错误路段将会被剪断,最后,将路网的交叉口或端点定义为节点,而路段则是两节点间的道路,此时整个路网被表示成了形成了节点-路段-节点的拓扑rd={rd1,rd1,...rdm-1};

49、b:动态od矩阵:利用上述的驻留点识别算法,提取研究区域内居民的出行起讫点集合ods={{o0,d0}},{01,d1},…,{on-1,dn-1}}结合上述路网拓扑节点集合rd={rd1,rd1,…rdm-1},计算出出行动态od矩阵,计算步骤如下:

50、b1):初始化一个二维od矩阵od[m+1][m+1],存储分配至节点的od信息;

51、b2):从出行起讫点集合od中依次取出ok,dk{ok,dk}(k=0,1,2,…n-1),分别将起点ok,终点dk匹配至最近邻的路网节点,ok的最近邻节点id为oid,dk的最近邻节点id为did,每个起点/讫点都会被分配至最近邻节点;

52、b3):若oid≠did,则认定{ok→dk}为一次有效出行,更新出行矩阵od[oid][did]的值:od[oid][did]=od[oid][did]+1,将关注从不同起始节点到不同结束节点之间的出行次数;若oid=did,表明出行仅发生在单个节点内部,节点内部出行,不将其计入统计数据,则认定忽略此次节点内部出行;通过将重点放在跨节点的出行上,我们可以更好地了解不同区域之间的出行需求和行为;

53、b4):处理完后统计每个路网拓扑节点的发生量、吸引量与总交通量,即对od矩阵第1~m~1行和第1~m~1列求和并赋值至矩阵最后一个元素得到每个节点发生量和吸引量,然后对第m-1行和第m-1列求和并赋值给od[m][m],如公式(10)至(12)所示。

54、

55、

56、

57、与现有技术相比,本发明的有益效果在于:

58、1、本发明中,法从海量的cdr数据中提取居民出行轨迹中的驻留点信息,然后把od信息与路网关键节点匹配推导出动态od矩阵,与传统的od矩阵获取方法相比优势显著,因此,研究基于手机定位数据的动态od矩阵获取方法对于交通规划与管理具有重要意义;

59、2、本发明中,在未来探讨不同交通工具之间的出行特征差异,包括公共交通、私家车、共享单车等,进一步揭示城市居民出行偏好及其影响因素,有助于交通规划部门在制定策略时更加全面地考虑居民出行需求,优化交通资源配置,提高城市交通效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1