一种基于手机三角定位数据的交通出行模式判别方法与流程

文档序号:14716225发布日期:2018-06-16 01:24阅读:338来源:国知局

本发明涉及交通大数据领域,尤其是一种基于手机三角定位数据的交通出行模式判别方法。



背景技术:

随着城市建设的快速推进,城市交通的时空分布与模式结构发生了深刻变化。多模式组合出行环境下,城市交通需求的变化直接决定了城市交通基础设施的规划与建设。客观掌握不同出行模式的交通需求,是科学评估城市交通系统建设水平和运行效果的关键。城市出行模式的结构决定了相关部门在设施建设与维护上的投入重心,为城市交通管理与交通规划提供重要的数据基础和评价参考。

传统出行模式调查通常采用居民出行家访调查方法,存在抽样率低、成本高昂的缺陷。随着大数据技术的不断成熟,基于海量交通大数据的出行分析为出行模式获取提供了新的途径。其中,手机定位数据具有低获取成本与高时空覆盖率的特点,是进行交通出行模式分析的最佳数据源。手机用户通过手机与基站进行交互时产生手机基站数据,通过三角定位算法,可以获取具有时空特征的手机三角定位数据,主要包含手机用户唯一识别码、记录基站号、记录时刻、记录经度、记录纬度等参数。在此数据基础上,通过提取手机用户全日出行链,挖掘用户出行交通特征,进一步识别用户出行模式。然而,受基站自身与用户环境的影响,手机三角定位数据存在大量“噪声”数据;受限于手机定位精度的限制,在高路网密度的城市市域,手机三角定位数据往往无法定位在准确的道路上,难以实现城市用户交通出行模式识别的需求。

目前,国内外在通过手机定位数据进行城市交通分析的研究主要集中于交通流参数的获取。在出行模式识别方面,大部分研究采用集计模式,获取用户总体中各类出行模式所占比重,识别准确性不高、模型迁移能力差;少量研究着眼于非集计层面,通过大量参数标定来提升用户个体交通模式的识别准确率,模型复杂,不易推广。综上,在城市人口交通模式的获取上,需要建立简洁的、基于非集计的交通出行模式判别方法。



技术实现要素:

本发明所要解决的技术问题在于,提供一种基于手机三角定位数据的交通出行模式判别方法,能够基于非集计层面获取用户个体的交通出行模式,用于降低模型复杂度并提高预测准确性。

为解决上述技术问题,本发明提供一种基于手机三角定位数据的交通出行模式判别方法,包括如下步骤:

(1)通过手机三角定位数据构建手机用户出行链,计算手机用户相邻定位间隔的时间、移动距离与移动速度;

(2)基于惩罚因子清洗所获取的手机用户出行链数据,去除包括“乒乓效应”数据和“长时驻留”冗余数据在内的“噪声”数据,重构手机用户全天出行链;

(3)基于重构的手机用户全天出行链,进行时间维度细粒度划分,形成若干个子出行时段,分别计算各子出行时段的总出行距离与直线出行距离,并以此获取各子出行时段的非直线系数;

(4)识别手机用户子出行时段多模式交通出行模式,所述多模式交通出行模式包含地铁模式、公交模式、机动车模式与慢行交通模式;

(5)基于已识别的手机用户子出行时段多模式交通出行模式比例,识别全日出行时段主要交通出行模式。

优选的,步骤(1)中,通过手机三角定位数据构建手机用户出行链,计算手机用户相邻定位间隔的时间、移动距离与移动速度具体为:

选取特定研究区域,获取研究区域覆盖范围所有基站记录的手机三角定位数据,以手机用户唯一识别码进行分组,并按时间顺序进行排序,提取手机用户全天出行链;

若手机用户出行链中,相邻的两条手机三角定位数据的时空坐标为(lngi,lati,ti)和(lngi+1,lati+1,ti+1),则可根据下式计算两条手机三角定位数据之间的时间间隔Δti、移动距离Di与移动速度vi:

Δti=ti+1-ti

其中,lngi为第i条手机三角定位数据的经度坐标,lati为第i条手机三角定位数据纬度坐标,R为地球半径。

优选的,步骤(2)中,基于惩罚因子清洗所获取的手机用户出行链数据,去除包括“乒乓效应”数据和“长时驻留”冗余数据在内的“噪声”数据,重构手机用户全天出行链具体为:

通过设置速度判别变量vi′,并求取对应速度判别阈值v′T,去除vi′>v′T的手机三角定位数据,以消除“乒乓效应”数据,具体计算公式如下:

其中,θv为速度惩罚因子,vmax为最大可接受速度,Δtmin为相邻手机三角定位数据最小时间间隔(单位:s),r为权重比率;

通过设置时间判别变量Δti′,并求取对应时间判别阈值Δt′T,去除Δti′>Δt′T的手机三角定位数据,以消除“长时驻留”冗余数据,具体计算公式如下:

其中,θt为时间惩罚因子,Δtmax为相邻手机三角定位数据最大可接受时间跨度,vmin为最小可接受速度,r为权重比率;

根据清洗后的手机三角定位数据,以手机用户唯一识别码进行分组,并按时间顺序进行排序,重构手机用户全天出行链。

优选的,步骤(3)中,基于重构的手机用户全天出行链,进行时间维度细粒度划分,形成若干个子出行时段,分别计算各子出行时段的总出行距离与直线出行距离,并以此获取各子出行时段的非直线系数具体为:

通过选取时间粒度T,将全天分割成若干个均等的子出行时段,各子出行时段的总出行距离DT、直线出行距离DL与非直线系数N根据以下公式计算:

其中,n为用户在子出行时段的手机三角定位数据量。

优选的,步骤(4)中,识别手机用户子出行时段多模式交通出行模式具体为:

(41)地铁模式

确定子出行时段中,手机三角定位数据记录基站号为地铁专用通信基站号的手机用户为地铁出行;

(42)公交模式

确定子出行时段中,手机三角定位数据记录基站号不为地铁专用通信基站号、移动速度符合公交运行速度特征且非直线系数N大于绕行阈值NT的手机用户为公交出行,具体确定条件如下:

N>NT

其中,为公交车运行平均速度,M为匹配常数,NT为绕行阈值;

(43)机动车模式

确定子出行时段中,手机三角定位数据记录基站号不为地铁专用通信基站号、移动速度符合机动车运行速度特征且非直线系数N不大于绕行阈值NT的手机用户为机动车出行,具体确定条件如下:

N≤NT

其中,为机动车运行平均速度;

(44)慢行交通模式

确定子出行时段中,手机三角定位数据记录基站号不为地铁专用通信基站号、移动速度符合慢行交通运行速度特征的手机用户为慢行交通出行,具体确定条件如下:

其中,为慢行交通平均速度。

优选的,步骤(5)中,基于已识别的手机用户子出行时段多模式交通出行模式比例,识别全日出行时段主要交通出行模式具体为:

(51)主出行模式为慢行交通模式

确定各子出行时段中,识别交通出行模式为慢行交通模式比例大于慢行比例阈值RT的手机用户的主出行模式为慢行交通模式,具体确定条件如下:

其中,CP为子出行模式识别为慢行交通模式的数量,CM为子出行模式识别为地铁模式的数量,CB为子出行模式识别为公交模式的数量,CC为子出行模式识别为机动车模式的数量,RT为比例阈值;

(52)主出行模式为地铁模式

确定各子出行时段中,识别交通出行模式为地铁模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为地铁模式,具体确定条件如下:

(53)主出行模式为公交模式

确定各子出行时段中,识别交通出行模式为公交模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为公交模式,具体确定条件如下:

(54)主出行模式为机动车模式

确定各子出行时段中,识别交通出行模式为机动车模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为机动车模式,具体确定条件如下:

本发明的有益效果为:本发明的基于手机三角定位数据的交通出行模式判别方法,以易获取、体量大的手机三角定位数据为数据源,弥补了传统出行模式调查采用的居民出行家访调查方法的抽样率低、成本高昂的缺陷;基于非集计层面的用户个体的交通出行模式预测模型,解决了集计模型准确性不高、迁移能力差的缺陷;发明方法模型简洁,避免了大量的参数标定,预测结果准确、可靠;同时,本发明的基于手机三角定位数据的交通出行模式判别方法是手机三角定位数据用于非集计用户个体交通出行模式识别的创新性应用。

附图说明

图1为本发明的方法流程示意图。

具体实施方式

如图1所示,一种基于手机三角定位数据的交通出行模式判别方法,具体包括如下步骤:

(1)通过手机三角定位数据构建手机用户出行链,计算手机用户相邻定位间隔的时间、移动距离与移动速度;

基于非集计层面的用户个体出行模式判别,需要获取每个手机用户全天出行链,以提取用户出行特征。本发明选取特定研究区域,获取研究区域覆盖范围所有基站记录的手机三角定位数据,以手机用户唯一识别码进行分组,并按时间顺序进行排序,提取手机用户全天出行链。

若手机用户出行链中,相邻的两条手机三角定位数据的时空坐标为(lngi,lati,ti)和(lngi+1,lati+1,ti+1),则可根据下式计算两条手机三角定位数据之间的时间间隔Δti、移动距离Di与移动速度vi:

Δti=ti+1-ti

其中,lng为经度坐标,lat为纬度坐标,R为地球半径(单位:km)。

(2)基于惩罚因子清洗所获取的手机用户出行链数据,去除包括“乒乓效应”数据和“长时驻留”冗余数据在内的“噪声”数据,重构手机用户全天出行链;

“乒乓效应”数据指的是手机用户在使用手机时,短时间内与多个基站同时发生交互产生的频繁切换数据,在进行手机定位数据移动距离与移动速度计算时,往往会得到过大的异常值。通过设置速度判别变量vi′,并求取对应速度判别阈值v′T,去除vi′>v′T的手机三角定位数据,以消除“乒乓效应”数据,具体计算公式如下:

其中,θv为速度惩罚因子,vmax为最大可接受速度(单位:km/h),Δtmin为相邻手机三角定位数据最小时间间隔(单位:s),r为权重比率。

“长时驻留”冗余数据指的是手机用户长时间在同一个基站覆盖范围内与该基站进行交互,在进行手机定位数据移动距离与移动速度计算时,往往会得到过小的异常值。通过设置时间判别变量Δti′,并求取对应时间判别阈值Δt′T,去除Δti′>Δt′T的手机三角定位数据,以消除“长时驻留”冗余数据,具体计算公式如下:

其中,θt为时间惩罚因子,Δtmax为相邻手机三角定位数据最大可接受时间跨度(单位:s),vmin为最小可接受速度(单位:km/h),r为权重比率。

根据清洗后的手机三角定位数据,以手机用户唯一识别码进行分组,并按时间顺序进行排序,重构手机用户全天出行链,并按步骤1重新计算手机用户相邻定位间隔的时间、移动距离与移动速度。

(3)基于重构的手机用户全天出行链,进行时间维度细粒度划分,形成若干个子出行时段,分别计算各子出行时段的总出行距离与直线出行距离,并以此获取各子出行时段的非直线系数;

多模式组合出行环境下,每个手机用户往往存在着一种以上的出行模式。在进行交通出行模式识别时,需要对不同出行模式的出行时段进行划分。理想情况下,同一种出行模式对应的出行速度保持在相近的范围内,可以通过速度聚类模式获取相应子出行时段的出行模式。然而,受限于手机三角定位误差与手机数据在产生时间上的随机性,获取的速度往往存在一定偏差,无法准确地分割子出行时段。通过选取时间粒度T,将全天分割成若干个均等的子出行时段,当T选取合理的长度时(如10分钟),能够合理识别各子出行时段的出行模式。

通常情况下,小汽车出行者为了节省出行成本,往往会避免出现绕行现象;公交出行为了服务更多的出行者,往往会出现较为明显的绕行现象。因此,计算出行非直线系数,有利于合理区分运行速度较为接近的小汽车出行与公交出行。具体地,各子出行时段的总出行距离DT、直线出行距离DL与非直线系数N根据以下公式计算:

其中,n为用户在子出行时段的手机三角定位数据量。

(4)识别手机用户子出行时段多模式交通出行模式,所述多模式交通出行模式包含地铁模式、公交模式、机动车模式与慢行交通模式;

具体模式识别如下:

41)地铁模式

确定子出行时段中,手机三角定位数据记录基站号为地铁专用通信基站号的手机用户为地铁出行。

42)公交模式

确定子出行时段中,手机三角定位数据记录基站号不为地铁专用通信基站号、移动速度符合公交运行速度特征且非直线系数N大于绕行阈值NT的手机用户为公交出行。具体确定条件如下:

N>NT

其中,为公交车运行平均速度,M为匹配常数,NT为绕行阈值。

43)机动车模式

确定子出行时段中,手机三角定位数据记录基站号不为地铁专用通信基站号、移动速度符合机动车运行速度特征且非直线系数N不大于绕行阈值NT的手机用户为机动车出行。具体确定条件如下:

N≤NT

其中,为机动车运行平均速度。

44)慢行交通模式

确定子出行时段中,手机三角定位数据记录基站号不为地铁专用通信基站号、移动速度符合慢行交通运行速度特征的手机用户为慢行交通出行。具体确定条件如下:

其中,为慢行交通平均速度。

(5)基于已识别的手机用户子出行时段多模式交通出行模式比例,识别全日出行时段主要交通出行模式。

通过分析手机三角定位数据产生特性,可以发现在移动速度较慢时使用手机与基站进行交互的频次较高,产生较多的三角定位数据,因此子出行时段较多地识别为慢行交通出行模式,在进行全日出行时段主要交通出行模式时需要进行修正。具体步骤如下:

51)主出行模式为慢行交通模式

确定各子出行时段中,识别交通出行模式为慢行交通模式比例大于慢行比例阈值RT的手机用户的主出行模式为慢行交通模式。具体确定条件如下:

其中,CP为子出行模式识别为慢行交通模式的数量,CM为子出行模式识别为地铁模式的数量,CB为子出行模式识别为公交模式的数量,CC为子出行模式识别为机动车模式的数量,RT为比例阈值。

52)主出行模式为地铁模式

确定各子出行时段中,识别交通出行模式为地铁模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为地铁模式。具体确定条件如下:

53)主出行模式为公交模式

确定各子出行时段中,识别交通出行模式为公交模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为公交模式。具体确定条件如下:

54)主出行模式为机动车模式

确定各子出行时段中,识别交通出行模式为机动车模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为机动车模式。具体确定条件如下:

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1