一种基于公交OD数据的公交换乘识别方法与流程

文档序号:12735506阅读:459来源:国知局

本发明涉及智能化公共交通技术领域,尤其涉及一种基于公交OD数据的公交换乘识别方法。



背景技术:

近年来,智能公交系统如公交IC卡收费系统和车辆GPS系统在各个城市的广泛应用,产生了海量数据,这些数据具有真实、准确、样本量大、更新快等特点,可以真实地描述城市公交运营情况和居民公交出行特征,越来越多的学者通过对这两个系统数据进行挖掘分析得到公交OD信息。而通过公交OD信息可以对公交系统进行换乘识别,公交系统的换乘识别分析可以获得更加完善的公交客流信息和换乘信息,这对于城市公共交通系统特别是公交换乘枢纽的规划和设计有着重要意义。

目前的公交IC卡收费系统有两种,一种是分段计费系统,其在乘客上车和下车都需刷卡从而可以记录乘客的上下车相关信息,另一种是一票制计费系统,其只要求乘客在上车时刷卡,因此只记录了乘客的上车信息,可知这两种系统都没有对公交乘客的换乘信息做记录。目前的公交系统中,大部分采用一票制收费系统,国内外最早是通过连续两次刷卡时间间隔来进行一票制收费系统的公交换乘识别,如将刷卡时间间隔小于60min的连续两次公交出行中的第2次乘车定义为换乘行为。这种方法简单易操作,但是若第一次乘车时间过长或过短,则会出现漏判或错判。针对这个问题,有研究提出通过GPS信息判断出下车站点及下车时间从而得到换乘时间,看是否小于给定的判断阈值,进而判断出乘客2次乘车是换乘行为还是出行行为。这种方法排除了前一次乘车车内时间的干扰,但用于判断的时间阈值大多是根据经验给出且为固定值,不能适应目前复杂多变的公交系统,且也可能错判一些短时间的活动行为。因此,后来有研究提出了可变参数换乘识别方法,即针对不同类型的换乘方式分别给出换乘时间参数的表达式,分别得到各线路公交车的时间约束阈值。当前关于换乘行为识别的研究基本都是从时间角度上进行判断,仅从时间角度,容易将乘客在下车站点附近进行的短时活动行为(如接送孩子上下学等)误判为换乘行为。有部分研究考虑了空间角度,但也仅仅考虑了换乘距离这一因素,没有分析乘客出行整个过程的空间特征,换乘识别准确性不够高。



技术实现要素:

为了克服现有技术存在的缺点与不足,本发明提供一种基于公交OD数据的公交换乘识别方法,在现有基于智能公交信息系统数据判断公交刷卡乘客上下车站点研究的基础上得到公交刷卡乘客的OD数据后,提取出单个公交刷卡乘客一天且大于一条刷卡记录的公交OD数据,从时间和空间两个方面综合时间方面对公交乘客进行换乘识别,时间方面主要是从乘客的站台候车时间及最大候车时间阈值进行比较识别,空间方面将乘客的换乘步行距离、迂回系数、直达系数三个参数与其分别设定的阈值进行比较识别,只有在时间和空间两个方面都满足要求才识别为换乘,提高了换乘识别的精度。

为解决上述技术问题,本发明提供如下技术方案:一种基于公交OD数据的公交换乘识别方法,包括如下步骤:

S1、提取单个乘客一天的公交OD数据,若该乘客当天的公交OD数据只有一条记录,则判定出行不是换乘,若超过一条记录,则按时间先后进行排序,并从第1条OD记录开始;

S2、顺序遍历该乘客相邻的两条OD记录的线路号是否相同,所述相邻的两条OD记录分别为第i条OD记录与第i+1条OD记录,若相同,则判定乘客没有进行换乘,数据指针移向下一条乘车记录,重复步骤S2;若不相同,则进入下一步;

S3、求当前一次乘车的下车站点与下一次乘车的上车站点间的步行距离,并将步行距离与步行换乘距离阈值进行比较,若步行距离大于步行换乘距离阈值,则判定乘客下一次乘车为二次出行,数据指针移向下一条乘车记录,回到步骤S2;若步行距离小于或等于步行换乘距离阈值,则进入下一步;

S4、计算相邻两次乘车记录间的迂回系数,并将迂回系数与迂回系数阈值进行比较,若迂回系数大于迂回系数阈值,则判定乘客第二次乘车为二次出行,数据指针移向下一条乘车记录,回到步骤S2;若迂回系数小于或等于迂回系数阈值,则进入下一步;

S5、将线路站点信息数据中每条线路的站点提取出来构成一个站点集合,提取当天乘客前一条乘车记录的上车站点和后一条乘车记录的下车站点构成公交出行OD集合;若OD集合属于任一线路的站点集合,则判定第二次乘车为二次出行,数据指针移向下一条乘车记录,回到步骤S2,否则,进入下一步;

S6、确定乘客到达下一个上车站点的时间;根据乘客到达下一个上车站点的时间,确定乘客在下一个上车站点的站台候车时间;确定乘客的最大候车时间阈值;进行公交换乘识别,若站台候车时间大于最大候车时间阈值,则第二次乘车为二次出行,反之,则为换乘行为;若当前记录不是当天乘客出行的最后一条OD记录,则数据指针移向下一条乘车记录,回到步骤S2;若当前记录是该乘客最后一条OD记录,则提取当天下一名乘客的乘车OD记录,回到步骤S1。

进一步地,所述步骤S1中的公交OD数据由公交IC卡数据挖掘分析所得到,所述公交OD数据包括:公交IC卡号、车牌号、线路号、上车站点、上车时间、下车站点、下车时间和公交车辆GPS运行数据;所述公交车辆GPS运行数据包括线路号、车牌号、站点名称、进站时间、出站时间以及各线路的站点信息、各站点的地理坐标信息。

进一步地,所述步骤S2具体为:

对当天乘客相邻两条记录的线路号Li及Li+1进行判断,若Li=Li+1,则判定相邻两次乘车的线路号相同,乘客并没有进行换乘行为,判定乘客为两次公交出行;若Li≠Li+1,则进入步骤S3;其中,在判定乘客第二次乘车为二次出行后,搜索下一乘客的一天的公交OD数据,若无下一乘客的公交OD数据,则停止结束,若有则返回步骤S1。

进一步地,所述步骤S3具体为:

求第i次乘车的下车站点与第i+1次乘车的上车站点间的步行距离D并与步行换乘距离阈值Dmax进行比较,若D>Dmax,则第i+1次乘车为二次出行,数据指针移向下一条乘车记录,返回步骤S2;若D≤Dmax,则进入步骤S4。

进一步地,所述换乘距离阈值Dmax取值范围为300-500m。

进一步地,所述步骤S4具体为:

计算相邻两次刷卡记录间的迂回系数C,将其与迂回系数阈值Cmax比较,若C>Cmax,则第二次乘车为二次出行,数据指针移向下一条乘车记录,返回步骤S2;若C<Cmax,则进入步骤S5。

进一步地,所述迂回系数,其表达式如下:

其中,Ki为乘客上一次乘坐公交的距离,即车辆从乘客上车站点至下车站点间的走行距离;Ki+1为乘客后次乘坐公交的距离;Di为乘客的步行距离;Ki,i+1为乘客上一次乘车的上车站点至后次乘车的下车站点间的直线距离。

进一步地,所述步骤S5具体为:

将线路站点信息数据中每条线路的站点提取出来构成一个站点集合Wj,Wj表示线路j的站点集合,1≤j≤N,N为城市公交线路的线路总数;提取当天前一条刷卡记录的上车站点Bi和后一条刷卡记录的下车站点Ai+1构成公交出行OD集合{Bi,Ai+1},若{Bi,Ai+1}属于任一线路站点集合Wj,则直达系数等于1,第二次乘车为二次出行,数据指针移向下一条乘车记录,返回步骤S2,否则,进入步骤S6。

进一步地,所述S6具体为:

S61)确定乘客到达下一个上车站点的时间:

根据前后两条记录的步行距离及乘客的平均步行速度v,可以得到乘客的步行时间Tw=D/v,乘客到达下一个上车站点的时间Tarr=TAi+Tw

S62、确定乘客在下一个上车站点的候车时间:

乘客的站台候车时间等于乘客在下个站点的上车时间减去其到达该站点的时间,即TL=TB(i+1)-Tarr

S63、确定乘客的最大候车时间阈值:

乘客最大候车时间阈值等于乘客在下个站点的上车时间与同一线路上个班次公交车到达该上车站点的时间间隔,根据线路号及上车站点名称及上车时间,可在GPS数据里查找得到上一班次公交车的的到站时间Tg,则最大候车时间阈值TLmax=TB(i+1)-Tg

S64、进行公交换乘识别:

若TL大于最大候车时间阈值TLmax,则第二次乘车为二次出行;反之,则为换乘行为,若当前记录不是当天乘客出行的最后一条OD记录,则数据指针移向下一条乘车记录,回到步骤S2;若当前记录是该乘客最后一条OD记录,则提取当天下一名乘客的乘车OD记录,回到步骤S1。

采用上述技术方案后,本发明至少具有如下有益效果:

(1)本发明根据乘客在公交出行时偏好选择不迂回、直达的路线,提出迂回系数和直达系数作为公交换乘识别的参数,可以有效的将进行短时活动的公交出行从换乘识别的结果中剔除出来,提高了公交换乘识别的准确率;

(2)与传统换乘识别采用的固定时间阈值不同,本发明采用两辆车实时的到站间隔作为候车时间阈值进行公交换乘时间方面的识别,针对复杂动态的公交系统,具有较强的灵活性;

(3)本发明分析的OD数据是通过融合公交IC卡和公交GPS数据进行数据挖掘分析可得,可较为完整和准确地提取公交乘客的出行信息,同时充分考虑公交乘客的出行特征,数据采集方便且准确率高,为公交换乘识别提供可靠的数据支持;

(4)本发明方法考虑因素全面,实用性强,很大程度地提高公交换乘识别的准确率,且为后面的公交换乘系统的优化提供丰富、及时的决策依据。

附图说明

图1是本发明一种基于公交OD数据的公交换乘识别方法的步骤流程图。

具体实施方式

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本申请作进一步详细说明。

如图1所示,本发明提供一种基于公交OD数据的公交换乘识别方法,其步骤如下:

(1)提取单个乘客一天的公交OD数据,并按时间进行排序;

(2)基于换乘识别的前提条件判断;

(3)基于换乘步行距离的换乘识别;

(4)基于迂回系数的换乘识别;

(5)基于直达系数的换乘识别;

(6)基于站台候车时间的换乘识别。

进一步地,所述步骤(1)的具体过程为:

提取单个乘客一天的公交OD数据,公交OD数据由公交IC卡数据挖掘分析所得到,所述公交OD数据包括:公交IC卡号、车牌号、线路号、上车站点、上车时间、下车站点、下车时间和公交车辆GPS运行数据;所述公交车辆GPS运行数据包括线路号、车牌号、站点名称、进站时间、出站时间以及各线路的站点信息、各站点的地理坐标信息,若该乘客当天只有一条记录,则该次出行不是换乘,若超过一条记录,则按时间先后进行排序;

所述步骤(2)的具体过程为:对当天乘客相邻两条记录的线路号Li及Li+1进行判断,若Li=Li+1,说明相邻两次乘车线路号相同,乘客并没有进行换乘行为,判断为两次公交出行;若Li≠Li+1,则进入第(3)步。

所述步骤(3)中,求第i次乘车的下车站点与第i+1次乘车的上车站点间的步行距离D并与步行换乘距离阈值Dmax进行比较,若D>Dmax,则第i+1次乘车为二次出行;若D≤Dmax,则进入第(4)步。所述换乘距离阈值通常取值范围为300-500m。

所述步骤(4)中,计算相邻两次乘车记录间的迂回系数C,将其与迂回系数阈值Cmax比较,若C>Cmax,则第二次乘车为二次出行;若C<Cmax,则进入第(5)步,迂回系数表达式如下:

其中,Ki为乘客前次乘坐公交的距离(即车辆从上车站点至下车站点间的走行距离),Ki+1为乘客后次乘坐公交的距离,Di为乘客的步行距离,Ki,i+1为乘客前次乘车的上车站点至后次乘车的下车站点间的直线距离。

所述步骤(5)中,将线路站点信息数据中每条线路的站点提取出来构成一个站点集,Wj表示线路j的站点集合,1≤j≤N,N为城市公交线路的线路总数,提取当天乘客前一条乘车记录的上车站点Bi和后一条乘车记录的下车站点Ai+1构成公交出行OD集{Bi,Ai+1},若{Bi,Ai+1}属于任一线路站点集合Wj,则直达系数等于1,第二次乘车为二次出行,否则,进入第(6)步。

所述步骤(6)中,具体过程如下:

(61)确定乘客到达下一个上车站点的时间:

根据前后两条记录的步行距离及乘客的平均步行速度v(取值1.2m/s),可以得到乘客的步行时间Tw=D/v,乘客到达下一个上车站点的时间Tarr=TAi+Tw

(62)确定乘客在下一个上车站点的站台候车时间:

乘客的站台候车时间等于乘客在下个站点的上车时间减去其到达该站点的时间,即TL=TB(i+1)-Tarr

(63)确定乘客的最大候车时间阈值:

乘客最大候车时间阈值等于乘客在下个站点的上车时间与同一线路上个班次公交车到达该上车站点的时间间隔,根据线路号及上车站点名称及上车时间,可在GPS数据里查找得到上一班次公交车的的到站时间Tg,则最大候车时间阈值TLmax=TB(i+1)-Tg

(64)进行公交换乘识别

若TL大于最大候车时间阈值TLmax,则第二次乘车为二次出行,反之,则为换乘行为。

有益效果:与现有技术相比,本发明具有以下优点:

(1)本发明根据乘客在公交出行时偏好选择不迂回、直达的路线,提出迂回系数和直达系数作为公交换乘识别的参数,可以有效的将进行短时活动的公交出行从换乘识别的结果中剔除出来,提高了公交换乘识别的准确率;

(2)与传统换乘识别采用的固定时间阈值不同,本发明采用两辆车实时的到站间隔作为候车时间阈值进行公交换乘时间方面的识别,针对复杂动态的公交系统,具有较强的灵活性;

(3)本发明分析的OD数据是通过融合公交IC卡和公交GPS数据进行数据挖掘分析可得,可较为完整和准确地提取公交乘客的出行信息,同时充分考虑公交乘客的出行特征,数据采集方便且准确率高,为公交换乘识别提供可靠的数据支持。

其中,上述步骤中,本方法针对的是每个乘客个体进行识别,输入数据为单个乘客某一天内的OD记录。

综上所述,本发明方法考虑因素全面,实用性强,很大程度地提高公交换乘识别的准确率,且为后面的公交换乘系统的优化提供丰富、及时的决策依据。

实施例

以某市已匹配完成上下车站点的公交OD数据为例,选取某乘客一天内公交OD记录,采用本发明对该乘客进行公交换乘识别,具体过程如下所示:

步骤一:提取乘客一天的公交OD记录如表1所示,由于乘车记录超过1条,因此将记录按时间先后顺序排列;

表1公交乘客出行OD信息表格

步骤二:基于换乘识别的前提条件判断中,由于第一条乘车记录的线路号L1=K5,第二条刷卡记录的线路号L2=609,L1≠L2,进入步骤三。

步骤三:基于换乘步行距离的换乘识别中,设步行换乘距离阈值Dmax=500米,计算得第一条记录与第二条纪录间的步行距离D=444米<500米,进入步骤四。

步骤四:基于迂回系数的换乘识别中,根据线路站点信息及各站点经纬度信息,可以算出第一条记录与第二条记录间的迂回系数为14.5,根据经验值将迂回系数阈值Cmax设定为1.7。迂回系数远远大于设定的阈值,说明乘客连续两次乘车路线过于迂回,第二次乘车不是换乘为二次出行,公交换乘识别结束。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解的是,在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种等效的变化、修改、替换和变型,本发明的范围由所附权利要求及其等同范围限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1