一种包含下车信息的公交出行数据生成方法与流程

文档序号:16635044发布日期:2019-01-16 06:56阅读:440来源:国知局
一种包含下车信息的公交出行数据生成方法与流程

本发明涉及交通运输工程领域,更具体地,涉及一种包含下车信息的公交出行数据生成方法。



背景技术:

公交出行数据在这里指出行者利用公共交通方式中的巴士(bus)出行产生的一系列数据记录。该数据主要包含出行人的唯一标识(id)、乘坐的公交线路、上下车站点以及对应的上下车时刻等信息。

大多数城市中的公交车采用的是“一票制”收费系统,少部分采用的是分段(按行驶距离)收费系统。因为“一票制”系统收取固定的车费,所以乘客只需要在上车时进行刷卡操作便能完成车费支付。这意味着在绝大多数使用“一票制”公交的城市,乘客的下车信息(包括下车站点和时刻)是缺失的,即单凭刷卡记录得到的乘客出行数据是不完整的。

在城市公交出行研究过程中,很多推断下车信息的算法被提出。然而,由于缺少包含乘客下车信息的出行数据集,算法的准确性难以被验证。因此需要完备的出行数据集(包含完整的乘客上下车站点和时刻的出行数据)来测试算法的准确度,从而进一步完善下车信息推断的算法。

目前,在交通领域中要获取完整的公交出行乘客出行数据是相当困难的,往往需要采用人工方法来收集完整的上下车信息。如较为传统的跟车调查法、车站询问调查法、家庭访问调查法,这些方法都需耗费大量人力物力,调查周期也很漫长,难以满足大数据时代的需求。



技术实现要素:

为克服上述现有公交系统难以获取完整的出行数据的缺陷,本发明提出了一种包含下车信息的公交出行数据生成方法。本发明能基于历史真实数据方便快速且低成本地生成大量虚拟可行的公交乘客出行数据,为乘客公交出行信息推断算法验证以及其他场景提供必要的数据条件。

为解决上述技术问题,本发明的技术方案如下:

一种包含下车信息的公交出行数据生成方法,包括以下步骤:

s1:确定乘客的出行区域序列,所述的出行区域序列是按照乘客经过区域的时间先后顺序排列而成的序列,通常用序列z1,z2,z3,…,zn来表示;

s2:根据s1中的出行区域序列,生成乘客对应的所有出行链方案;

出行链方案的生成规则具体如下:

(1)在出行链方案中,z1是每次出行的起始区域.

(2)在出行链方案中,首次出现的出行区域一定位于在区域序列中相邻的前一个出行区域之后,例如z1无法直接到z3,而必须经过z2才能到达z3,但z3可以直接回z1

s3:根据s2中的出行链方案,针对每一个出行链方案,生成所有的公交出行路线;

s4:根据每一个出行链方案的公交出行路线,进行以下判断:是否存在直达的公交出行线路,若是,选择所有直达的公交出行线路;若否,选择换乘次数最少的所有的公交出行线路;所述的直达的公交出行线路是指在相邻的出行区域中,可以通过一次公交完成出行动作;所述的换乘得的公交出行线路是指在相邻的出行区域中,通过至少两次公交完成出行动作;

s5:在s4的选择的所有的公交出行路线中,选择一个公交出行路线,构建公交出行路线对应的乘客的公交出行数据。

在一种优选的方案中,所述的s1包括以下内容:

根据出行区域序列中的区域范围,将所有包含在对应出行区域内的公交站点集合作为该区域的出行站点集合。

在一种优选的方案中,所述的s2中的出行链的节点来源于出行站点集合。

在一种优选的方案中,所述的s3中生成公交出行路线包括以下内容:

根据s2中的出行链方案,结合相邻出行区域中的公交站点对的全天报站数据(例如,第k路车在出行区域zi上车站点以及zj的下车站点)、地理信息数据和公交的发车频率信息,针对每一个出行链方案,生成所有的公交出行路线。

在一种优选的方案中,所述的s3包括以下内容:

将出行链方案中每个区域间的公交路线集做笛卡尔积,从而形成所有公交出行路线。

在一种优选的方案中,所述的s5包括以下流程:

根据公交出行路线计算得到起始出行时间范围,并根据首次出行时间范围随机生成乘客出行时间,按照路线顺序和车辆的历史报站数据以及给定的乘客停留信息生成出行者的出行链数据。

在一种优选的方案中,所述的起始出行时间范围通过以下流程进行求取:

流程1:若出行区域以及相邻的出行区域之间存在直达的公交出行线路,则计算直达的公交出行线路的平均行驶时间作为出行区域以及相邻的出行区域之间的总时间t1,执行流程3;若不存在直达的公交出行线路,执行流程2;

流程2:计算每天换乘的公交线路平均行驶时间;将全部的换乘的公交线路平均行驶时间加上间隔时间作为出行区域以及相邻的出行区域之间总时间t1;所述的间隔时间是公交路线在一天中最长的发班间隔时间;

流程3:执行t2=t1+换乘时间,所述的t2是对t1的进一步修正,所述的换乘时间包括站台间行走以及上下车时间,换乘时间是一个不小于0的变量;

流程4:执行t3=t2+活动时间,所述的t3是对t2的进一步修正,所述的活动时间表示出行区域进行活动的情况,活动时间是一个不小于0的变量;

流程5:设置不等式组,所述的不等式组的不等式的数量等于公交出行路线中公交出行线路的数量,所述的不等式组里面的每条不等式对应公交出行路线中的一条公交出行线路;不等式方程组的内容如下:

第一条不等式:

起始时间<第一条公交出行线路的最晚发车时间;

第二条不等式:

起始时间+第一条公交出行线路的t3<第二条公交出行线路的最晚发车时间;

第三条不等式:

起始时间+第一条公交出行线路的t3+第二条公交出行线路的t3<第三条公交出行线路的最晚发车时间;

第四条不等式:

起始时间+第一条公交出行线路的t3+第二条公交出行线路的t3+第三条公交出行线路的t3<第四条公交出行线路的最晚发车时间;

以此类推,直至完成整个不等式组;

流程6:通过解不等式组,取不等式组中各个不等式的解的交集的最大值作为出行时间的最迟时刻;出行时间的最早时刻是起始出行站点的最早报站时间减去发班间隔时间,由此得到关于起始出行时间范围。

与现有技术相比,本发明技术方案的有益效果是:

本发明提供的公交出行数据生成方法能够根据给定的出行区域序列和公交真实数据等数据生成虚拟乘客一天的出行数据,相对于传统的跟车记录调查法、公交站点问卷调查法等人工调查方法,本发明能基于历史真实数据方便快速且低成本地大量生成具有完整乘客公交出行信息数据,节约了大量的调查时间以及成本。

附图说明

图1为本实施例流程图。

图2为本实施例的出行方案说明图。

图3为本实施例中a区域的报站数据表。

图4为本实施例中乘客在a区域的乘坐车辆判断数据表。

图5为本实施例中乘客在a区域的乘坐车辆报站数据表。

图6为本实施例中乘客在c区域的乘坐车辆判断数据表。

图7为本实施例中乘客的出行链数据表。

具体实施方式

附图仅用于示例性说明,不能理解为对本专利的限制。

对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本发明的技术方案做进一步的说明。

如图1所示,一种包含下车信息的公交出行数据生成方法,包括以下步骤:

步骤1:确定一位乘客一天中出行的区域序列,包括起始区域z1、中间区域z2,…和终点区域zk,用序列z1,z2,z3,…,zn来表示,并确定该乘客在各出行区域中出行站点集合。

步骤2:根据步骤s1的区域序列,生成该乘客出行的所有出行链方案。并根据出行站点集合间的公交出行可能(组合)路线,优先选择换乘次数最少的路线(直达路线换乘次数为0;当最少换乘次数相同的路线具有多条时,则应全部选择),形成对应于不同方案下的备选路线集r。

步骤3:在步骤s2生成的乘客出行所有出行链方案中,随机选取一个方案,进而随机选取被选方案下备选路线集中的一条路线,根据出行链方案和路线信息完成整个出行链的首次出行时间范围的划定,并且完成乘客当天该路线出行的出行链数据的构建。

本实施例设定一个乘客的一天出行区域序列z1,z2,z3,其中z1=“a区域”,z2=“b区域”,z3=“c区域”。由于该3个区域序列是乘客一天内出行区域的有序排列,则可以生成的出行链轨迹(即出行链方案)有:(1)z1→z2,(2)z1→z2→z1,(3)z1→z2→z3,(4)z1→z2→z3→z2,(5)z1→z2→z3→z1,(6)z1→z2→z3→z2→z1。说明:如果是方案(1)则表示生成的记录只有该乘客从z1至z2的公交车上下车记录,无后续出行记录,出行链不完整;方案(2)表示生成了该乘客从z1到z2和乘客从z2返回到z1的出行记录,由于该乘客回到当天起始地,则认为该出行链完整;方案(3)表示生成了该乘客从z1到z2和从z2到z3的出行记录,出行链不完整。方案(4)表示生成了该乘客从z1到z2,再从z2到z3,最后从z3到z2的出行记录。方案(5)表示生成该乘客从z1到z2,再从z2到z3,最后从z3到z1的出行记录。方案(6)表示生成该乘客从z1到z2,再从z2到z3,接着从z3到z2,最后从z2返回到z1的出行记录,出行链完整。本实施例以方案(5)为基础,如图2所示。

随机提取得到某条公交线路的a站点(包含上下行方向的两个站点),以a公交站点为中心,50m为半径画圆生成a区域,在该区域的所有站点共同组成a区域站点集,分别有4条线路经过:45路,252路,270路以及764。同理,可得到b区域的站点集,分别有7条线路经过:44路、183路、811路(单向)、225路、40路、813(单向)和222路;c区域的站点集,分别有5条线路经过:194路、40路、45路、583路以及假日专线1。

生成备选路线集r的具体步骤如下(i表示第i条路径):遍历出发和到达区域内的所有站点(区分上下行)和计算各线路站点换乘距离,匹配生成出行路线(直达或者由两条公交线路组合,在本实施例中设置换乘距离小于等于50m进行匹配),优选直达公交出行路线,次选换乘一次出行路线。如果通过某条公交线路不能直达,或者匹配不到与之共同形成一次换乘的公交组合路线,则不生成该路线。最后将出行方案中每个区域间的公交路线集作笛卡尔积,生成备选路线集r。结果如下:

(1)a区域(z1)至b区域(z2)之间的公交出行可能路线:

(2)b区域(z2)至c区域(z3)之间的公交出行可能路线:

通过路线内站点遍历发现40路经过z2和z3区域,即直达车,且没有其他直达的路线,所以

(3)c区域(z3)至a区域(z1)之间的公交出行可能路线:

同上发现45路经过z3和z1两个区域为直达车,且没有其他直达的路线,则

再作笛卡尔积,得到11种方案(11=11*1*1)

在步骤s2生成的乘客出行所有出行链方案中,随机选取一个方案,进而随机选取被选方案下备选路线集中的一条路线,根据出行链方案和路线信息完成整个出行链的首次出行时间范围的划定,并且完成乘客当天该路线出行的出行链数据的构建,具体步骤如下:

先得到方案中区域间的所有公交线路在两区域间站点以及换乘站点(如果存在)的报站数据。采用这条路线为例(由于本实施例中换乘时间很短,则忽略不计,设定为零),出发时刻以t起始表示,如果有在某出行区域作停留则应该在下面4个不等式中具有从某出行地区作为出发点的不等式的不等号左边加上总停留时间:

(1)

(2)

(3)

(4)

由上面所有不等式,可以得到一个满足所有不等式且最大的t起始,作为起始出行的最迟时刻。其中,图3为a区域的45路的报站数据表;图4为乘客在a区域的乘坐车辆判断数据表;图5为图4所选的乘坐车辆报站数据表;图6为乘客在c区域的乘坐车辆判断数据表。出行时间的最早时刻是起始出行站点的最早报站时间减去发班间隔时间,由此得到关于起始出行时间范围。

设置在b区域停留了3小时;

由报站数据可得:45路(从a到c最末班车时间):21:57:34

40路(从b到c最末车时间):22:19:04

45路(从c到a最末车时间):22:05:20

同时满足4个不等式可得:maxt起始=(21:57:34-6:28:00)=15:29:34

所以,生成的随机出行时刻必须小于15:29并且大于当天最早报站(在a区域)时间减去即6:12:40-0:36:00=5:36:40

随机生成一名乘客在石榴岗出现的时刻为8:23,按照报站时间表如图4所示。由此可知,乘客会选择乘坐最先到的这趟车,则乘客坐上了8:25进站的buscode为“n1s33192”的公交车,并且在8:57下了车,如图5所示。

由40路车的报站记录可知,最符合的车辆为9:03分的buscode为“n1s13105”,如图6所示。

重复上述流程,得到下车时间为9:17。

假设在b区域外围停留了3小时也就是下次乘客出现在达道路的时刻为12:17,得到的结果如图7所示。

同理,可以随机生成不同出行链方案中乘客选用不同出行路线的一天出行数据。

附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。例如t3中包含更多的时间因素,上述的时间因素可以体现在乘客在不同行为上的花费时间,若没有,则为0。这样就更加真实地反映出对乘客在公交出行的时间消耗。在这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1