一种基于出租车GPS大数据的定制公交线路规划方法与流程

文档序号:13482504阅读:285来源:国知局

本发明涉及交通线路规划技术领域,特别涉及一种基于乘客出行起、终点的定制公交交通小区和上、下车站点的确定方法;一种基于已确定上、下车站点并且单站点对应单站点的定制公交线路规划方法;一种基于k-折交叉验证评价定制公交运行线路合理性的方法;一种基于出租车gps数据的定制公交线路规划方法。



背景技术:

目前,我国许多城市的公共交通系统的发展状况不是很理想,出现了转车不便、人员拥挤、服务质量差等问题,使得公交出行比例整体上低于其他出行方式。为了提高公共交通方式的竞争力和满足多样化、多层次的城镇居民和游客需求,定制公交在传统的公共交通系统上开始兴起。

然而,由于定制公交在我国出现的时间不长,并且已有的定制公交在国内城市的发展现状不理想,还没有科学有效的方法解决乘客数量差异较大、线网服务地区有限等问题。因此,线路规划作为定制公交开发的一个重要环节,其合理性可以直接影响定制公交的长远发展。选取出租车gps数据可以保证数据量大、准确率高,是用来研究定制公交线路规划的较好数据选择。国内外一些学者也对定制公交的线路规划做了研究,比如有提出基于节点重要度的方法,利用相似度高的两个节点作为起点和终点设置公交线路。

在“涂文苑.定制公交的线网规划研究[d].北京交通大学,2016.”的论文中,先根据网上采集到的乘客居住地点和工作地点,并在地图上将其标注出来,再利用层次聚类算法对乘客出行需求聚类。将聚类后的居住区域作为定制公交的起始交通小区,聚类后的工作区域作为定制公交的终到交通小区。在其交通小区划分半径确定时大圆代表一个类别即一个起始或终到交通小区,小圆代表起始或终到交通小区中一个停靠站点的覆盖范围。圆圈状相切的交通小区会丢失一些小区覆盖范围外的客流量。在“李艳梅.定制公交系统线网构建方法研究[d].西南交通大学,2016.”的论文中,其定制公交停靠点应尽量将周边的出行需求包含在正常吸引范围内(半径为750m的圆),其站点的确定总的来说就是对于每个典型区域结合居民调查意愿进行单个分析确定满足以上原则的站点。因此此站点的确定方法普适性极低。在“李汝佟.基于出租车gps数据的城市公交线网优化[d].电子科技大学,2014.”的论文中,其先将深圳市按照行政区域划分为7个大区,然后再对每个大区进行细分为100个小区域,进行k-means算法得到划分的结果。为了验证划分交通小区的准确性,其将乘客的上下车点以400*400米的大小划分为50个小方块,统计出每个小方块内的出租车进出量,以便说明该地区的区域功能。随后与现实情况进行比较说明小区划分比较合理。但在进行k-means算法划分交通小区时,每个大区没有客观的依据一定要分为100个交通小区,且k-means算法以欧式距离作为相似度测度,实际情况中人行走的路程要大于其到站点的欧式距离。

在“刘毅.城市定制公交线路规划及发展评价研究[d].西安建筑科技大学,2015.”的论文中,其提出在用改进型的节点重要度法来建立站点规划模型的基础上,建立以道路交通和运行时间的道路交通运行情况等为主要依据,按照公交运营费用最小的原则进行逐步优化的路线规划模型。在“涂文苑.定制公交的线网规划研究[d].北京交通大学,2016.”的论文中,其假设有m个起始交通小区,n个终到交通小区,则配对连接成mxn条公交线路,每一个起始交通小区到终到交通小区的路径表示为一条公交线路,运行线路是起始站点到终到站点的最短线路。其又根据定制公交的线路长度较短无意义设定了最小线路开行长度l,由mxn条公交线路中满足线路长度约束条件的所有a条线路构成初始路径集。随后,其建立由三部分组成的线路开行标准模型对初始路径集进行筛选,一是从运营公司考虑的运营成本,包括定制公交车运营里程花费成本和固定成本(包括司售人员工资、管理费、维修巧等);二是从社会效益考虑的环境污染成本,包括定制公交排放的污染成本和小汽车排放的污染成本;三是从社会效益考虑的道路拥堵成本,包括由道路拥堵造成的乘坐定制公交车和小汽车出行乘客的时间额外支出成本。并采用分支定界法进行求解算法、结合计算机求解得出最终线网开行方案。在“李艳梅.定制公交系统线网构建方法研究[d].西南交通大学,2016.”的论文中,其在针对"多对一"(或一对多)类型的定制公交线网构建线路优化模型时兼顾了乘客的出行需求和企业运营成本两方面,使得定制公交网络覆盖率最大和定制公交车辆总收益最大(综合考虑了运输企业的收益、客票总收入与运输成本),并设置了5个约束条件:时间窗约束、上座率约束、节点数约束、载客能力约束以及车辆在i小区的服务量小于等于i小区的出行需求总量及01约束,最后采用蚁群算法对该模型进行求解。在“李汝佟.基于出租车gps数据的城市公交线网优化[d].电子科技大学,2014.”中,其主要运用了解忧和证优法作公交线路调整,包括线路优化调整目标分析、线路约束条件分析和基于现有公交线网的线路走向调整。其主要对于现有公交线网进行的调整与优化,并不是针对定制公交。在“巴兴强,姜博瀚,朱海涛,等.基于出租车运营gps数据的城市公交线路优化方法研究[j].森林工程,2015,31(3):124-127.”的论文中,其分别基于时间和基于空间对公交线路进行了优化。在研究基于时间的优化时得到两个结论:高峰时段公交车不够密集达不到居民需求;末班车过后仍有大量出行需求无法满足。基于空间的公交线路优化主要分为两部分:站点布设的优化和线路的优化。其中,单条公交线路优化的目标主要包括两个方面:一是车辆在线路上的出行距离尽可能的短,即尽量缩短乘客总的出行时间;二是以最少的投入运送尽可能多的乘客。公交车线路大多会选择在城市主干线、干线或城市一类街道上,因为这些道路路面宽、车道多、通行能力较强。但是,伴随着城市汽车保有量的不断上升,城市主干道由于其是城市核心路网具有强大的交通吸引能力,使其成为交通拥堵的高发区。由于公交车采用定线定点的运营方式,在城市主干道行驶的公交车易进入堵车区域反而降低公交出行的效率,增加乘客出行所需时间。因此利用出租车gps数据可以得到道路上不同时段的平均车速,发现和预测拥堵地点和拥堵时段,为公交车路线选择及优化的依据,可以合理地为公交车设计绕行路线,减少由于道路拥堵所耗费的时间。在“吴镇宇.面向通勤需求的城市定制公交线网优化[d].合肥工业大学,2017.”中,其主要考虑了多站点对多站点的定制公交线网规划。其将定制公交行车路径的优化分为上车集散区域和下车集散区域进行考虑,在上车区域行车路径规划模型中,考虑居民通勤出行的时间窗特性,以路径花费的总成本最低作为目标函数,设计了一种启发式算法对模型进行求解;在下车区域行车路径规划模型中,考虑单车辆行车特点,以车辆与乘客的时间成本效益最低为目标函数,基于经典的遗传算法对模型进行求解。上车区域与下车区域之间的行驶路线不固定,根据道路拥挤状况及时调整。

在“刘毅.城市定制公交线路规划及发展评价研究[d].西安建筑科技大学,2015.”的论文中,其对已开行的定制公交设置了一套发展评价指标体系,主要包括三个方面:乘客感知层面、运营企业层面和综合效益层面,乘客感知层面的指标有:安全运行间隔里程、公交车辆安全系数、出行时间差、公交车辆满载率、车内环境与设施水平、定制预约方便度、服务跨度、服务拒绝或服务遗漏、平均步行时间、平均等候发车时间、候车舒适度、信息传递及时性和公交准时性;运营企业层面的指标有:运营企业收益比例、公交车辆完好率和公交专用道设置率;综合效益层面的指标有:运力替代效益、节约时间效益、出行费用节约效益、环境效益指数。在“涂文苑.定制公交的线网规划研究[d].北京交通大学,2016.”的论文中,其建立了以站点覆盖率、平均上座率和乘客服务率为指标来评价定制公交线网的服务水平的模型,分别对某市定制公交线网现状和利用其所述方法求解出的某市定制公交线网规划方案进行评价,并将现状和规划方案进行对比,说明其定制公交线网规划方法的有效性和合理性。在“李佳玲.定制公交服务的规划方法研究[d].昆明理工大学,2014.”的论文中,其建立得定制公交服务综合评价指标体系包括六大指标,分别为:线路设置评价指标(包括线路吸引度和线网密度)、设施投入评价指标(包括站点覆盖率、专用道投入率和车辆利用率)、服务水平评价指标(包括运营速度、时间偏移、出发时间满足率、车辆余座率)、运营水平评价指标(包括退订率、短\长期周转率、百公里人次和客运周转率)、员工效率评价指标(包括工时有效率和劳动输出率)和社会效益评价指标(包括交通方式转移率和交通方式成本对比率)。在“李汝佟.基于出租车gps数据的城市公交线网优化[d].电子科技大学,2014.”的论文中,其对于现有公交线网建立了一套指标来进行评价、分析,包括:线路长度、公交线网密度、线路重复数、公交线网覆盖率、线路非直线系数和公交线网连通度。上述的方法都是在已经开行交通线路的基础上进行的,然而对于从未开通过定制公交的城市,如何有效的预测其线路开通的合理性,是一个关键。

常用的定制公交乘客需求获取方法有很多种,表1中对于各种方法进行了介绍和比较。

表1定制公交乘客需求获取方法比较

由以上的对比可以发现,出租车平台购买的gps数据更适合于定制公交乘客的起始点分析。



技术实现要素:

本发明的目的在于克服现有技术的不足,提出提供一种定制公交交通小区和上、下车站点的确定方法;一种基于已确定上、下车站点并且单站点对应单站点的定制公交线路规划方法;一种基于k-折交叉验证评价定制公交运行线路合理性的方法;一种基于出租车gps数据的定制公交线路规划方法,更大限度地利用了已有的出租车gps大数据,提出了更好的交通小区划分方法、线路规划方法及线路评价方法,为定制公交的发展提供了更好的参考依据。

本发明解决其技术问题所采用的技术方案是:

一种定制公交交通小区和上、下车站点的确定方法,在交通小区划分时,选取x轴或y轴方向与主干道方向一致,使得更多的乘客沿曼哈顿距离到达中心时也在最短距离范围内,即交通小区最远处到达上、下车站点的距离为定值;并且,这种交通小区图形在空间上可以无缝拼接,不会在预测交通小区客流量的时候丢失客流量;所述交通小区图形为正方形旋转45度的特殊菱形;具体步骤如下:

步骤101)确定路网地图上的主干道,选取合适的主干道方向作为x轴,与x轴垂直的方向作为y轴;

步骤102)在gis里对路网地图进行无缝拼接的直角菱形划分,使得每个菱形的四个角都在x轴或y轴上,且四个角到其中心的直线距离皆相同,由此得到的每个直角菱形区域即为交通小区,其中心即为该交通小区的上、下车站点。

一种基于已确定上、下车站点并且单站点对应单站点的定制公交线路规划方法,基于所述的定制公交交通小区和上、下车站点的确定方法;以最短路程内到达目的地为线路规划的目标,采用迪杰斯特拉算法来确定线路,尽可能多的选择城市快速路或主干道;对于城市确定的主干道和快速路的每个交叉路口都作为一个顶点,设所求区域范围内顶点集合为v、已求出最短路径的顶点集合为s、未求出最短路径的顶点集合为u,因此有公式(1):

s+u=v(1)

具体步骤如下:

步骤201)对于上车站点与下车站点进行两两匹配,每一个上车站点到终到下车站点表示为一条公交线路,设有m个上车站点、n个下车站点,则配对连接成m×n条公交线路;令l(i)为第i∈{1,2,…,(m×n)}条公交线路,其上车站点为start(i),下车站点为end(i);

步骤202)判断是否满足公式(2):

llong(i)≥lminlong(2)

其中,llong(i)为第i∈{1,2,…,(m×n)}条公交线路的长度,lminlong为定制公交线路的最小开行长度,满足条件的线路l(i)组成路径集lone;

步骤203)判断是否满足公式(3):

lnumber(i)≥lminnumber(3)

其中,lnumber(i)为路径集lone中第i条线路对应的有同样出行需求的乘客数量,lminnumber为定制公交线路的最小开行乘客数量,满足条件的线路l(i)组成路径集ltwo;若此条线路双向流动客流量都满足最小开行乘客数量,则双向通车,若只有一向满足,则单向通车;

步骤204)对于路径集ltwo中第i条线路ltwo(i),判断上、下车站点是否在主干道或者快速路上;若上、下车站点不在主干道上,根据实际情况找到其分别到主干道或者快速路最近的路口vstart(i)及vend(i);若上车站点就在主干道或者快速路上,则vstart(i)=start(i);若下车站点就在主干道或者快速路上,则vend(i)=end(i);

步骤205)初始时,s中只有主干道或快速路上的一个源点vstart(i),即s={vstart(i)},u包含除vstart外的其他顶点,即u={其余顶点};若vstart(i)与u中任一顶点u有边,则弧<u,vstart(i)>正常有权值,若u不是vstart(i)的出边邻接点,则弧<u,vstart(i)>权值为∞;

步骤206)从u中选取一个到s中任一顶点s有关连边且距离最短的顶点t,把t加入s中,该选定的距离就是s到t的最短路径长度;

步骤207)以t为新考虑的中间顶点,若从源点vstart(i)到经过顶点t的顶点u的距离比不经过顶点t的原来距离短,则修改顶点u的距离值,修改后的距离值等于经过顶点t到vstart(i)的距离值;

步骤208)重复步骤206)~步骤207),直到顶点vend(i)包含在s中;

步骤209)步骤209)此时到达顶点vend(i)的最短路径即为第i条线路在主干道或快速路上所求最短线路;若上、下车站点不在主干道上,则第i条线路的最短行驶线路为start(i)到vstart(i)点的最短线路、在主干道或快速路上所求最短线路、vend(i)到end(i)的最短线路三者之和;若上车站点就在主干道或者快速路上,则第i条线路的最短行驶线路为第i条线路在主干道或快速路上所求最短线路;

步骤210)重复步骤204)~步骤29),直到路径集ltwo中的所有线路都确定了其线路走向;

步骤211)确定线路行驶方向及最短路径的线路l(i)组成最终的开行线路集合line。

一种基于k-折交叉验证评价定制公交运行线路合理性的方法,基于所述的基于已确定上、下车站点并且单站点对应单站点的定制公交线路规划方法;k-折交叉验证在一开始的均匀取样中可减少训练集和测试集与原数据集之间的偏差,且可以使每一个样本数据都既被用作训练数据,也被用作测试数据,避免过度学习和欠学习状态的发生,得到的结果比较具有说服力;数据以天为最小单位,设共有d天的数据,dtrain为训练集的总天数,dtest为测试集的总天数;具体步骤如下:

步骤301)将原始数据以天为最小单位平均分成为k个子集数据,每个子集数据包含天;

步骤302)设第j∈{1,2,…,k}个子集数据作为测试集,其余的k-1组子集作为训练集;由k-1组子集作为训练集得到开行线路集合lj={lj1,lj2,…,lji}和每一条线路lji在dtrain内的总乘客数量为ntrain(lji),其中,

步骤303)对每一条线路lji将乘客人数平均到每一天,则每一天的乘客数量为nptrain(lji);由此确定在以第j个子集数据作为测试集时开行线路lji的定制公交车车型及额定载客量netrain(lji),其中,

步骤304)由相应数据求得在每一条线路lji上dtest内的总乘客数量为ntest(lji);对每一条线路lji将乘客人数平均到每一天,则每一天的乘客数量为nptest(lji),其中,

步骤305)由线路lji平均每一天的乘客数量nptest(lji)和在以第j个子集数据作为测试集时开行线路lji的定制公交车额定载客量netrain(lji)可以得到此条线路的满载率εji;若满载率大于等于线路开行最小的满载率ε,则这条线路的开行合理,将此类线路归为第j个子集作为测试集的开行合理线路集合ljgood;若这条线路满载率小于ε,则这条线路开行不合理;其中,

步骤306)将k个子集轮流作为测试集,重复步骤302)~步骤305),得到了最终线路开行合理的集合lgood,其为所有开行合理线路集合里所包含的不重复线路。

一种基于出租车gps大数据的定制公交线路规划方法,具体步骤如下:

步骤401)确定路网地图上的主干道,选取合适的主干道方向作为x轴,与x轴垂直的方向作为y轴;

步骤402)在gis里对路网地图进行无缝拼接的直角菱形划分,使得每个菱形的四个角都在x轴或y轴上,且四个角到其中心的直线距离皆相同,由此得到的每个直角菱形区域即为交通小区,其中心即为该交通小区的上、下车站点;

步骤403)对于上车站点与下车站点进行两两匹配,每一个上车站点到终到下车站点表示为一条公交线路,设有m个上车站点、n个下车站点,则配对连接成m×n条公交线路;令l(i)为第i∈{1,2,…,(m×n)}条公交线路,其上车站点为start(i),下车站点为end(i);

步骤404)判断是否满足如下公式:

llong(i)≥lminlong(9)

其中,llong(i)为第i∈{1,2,…,(m×n)}条公交线路的长度,lminlong为定制公交线路的最小开行长度,满足条件的线路l(i)组成路径集lone;

步骤405)将测试集或训练集相应天数的全部出租车gps乘客上、下车数据导入gis里,可以得到每个交通小区有同样出行需求的乘客数量,由此判断是否满足如下公式:

lnumber(i)≥lminnumber(10)

其中,lnumber(i)为路径集lone中第i条线路对应的有同样出行需求的乘客数量,lminnumber为定制公交线路的最小开行乘客数量,满足条件的线路l(i)组成路径集ltwo;若此条线路双向流动客流量都满足最小开行乘客数量,则双向通车,若只有一向满足,则单向通车;

步骤406)对于路径集ltwo中第i条线路ltwo(i),判断上、下车站点是否在主干道或者快速路上;若上、下车站点不在主干道上,首先根据实际情况找到其分别到主干道或者快速路最近的路口vstart(i)及vend(i);若上车站点就在主干道或者快速路上,则vstart(i)=start(i);若下车站点就在主干道或者快速路上,则vend(i)=end(i);

步骤407)初始时,已求出最短路径的顶点集合s中只有主干道或快速路上的一个源点vstart(i),即s={vstart(i)},未求出最短路径的顶点集合u包含除vstart外的其他顶点,即u={其余顶点};若vstart(i)与u中任一顶点u有边,则弧<u,vstart(i)>正常有权值,若u不是vstart(i)的出边邻接点,则弧<u,vstart(i)>权值为∞;

步骤408)从u中选取一个到s中任一顶点s有关连边且距离最短的顶点t,把t加入s中,该选定的距离就是s到t的最短路径长度;

步骤409)以t为新考虑的中间顶点,若从源点vstart(i)到经过顶点t的顶点u的距离比不经过顶点t的原来距离短,则修改顶点u的距离值,修改后的距离值等于经过顶点t到vstart(i)的距离值;

步骤410)重复步骤408)~步骤409,直到顶点vend(i)包含在s中;

步骤411)此时到达顶点vend(i)的最短路径即为第i条线路在主干道或快速路上所求最短线路;若上、下车站点不在主干道上,则第i条线路的最短行驶线路为start(i)到vstart(i)点的最短线路、在主干道或快速路上所求最短线路、vend(i)到end(i)的最短线路三者之和;若上车站点就在主干道或者快速路上,则第i条线路的最短行驶线路为第i条线路在主干道或快速路上所求最短线路;

步骤412)重复步骤406)~步骤411),直到路径集ltwo中的所有线路都确定了其线路走向;

步骤413)确定线路行驶方向及最短路径的线路l(i)组成最终的开行线路集合line;

步骤414)将原始数据以天为最小单位平均分成为k个子集数据,每个子集数据包含天;

步骤415)设第j∈{1,2,…,k}个子集数据作为测试集,其余的k-1组子集作为训练集;由k-1组子集作为训练集重复步骤403)~步骤413)得到开行线路集合lj=line={lj1,lj2,…,lji}和线路集合lj中第i条线路lji在dtrain内的总乘客数量ntrain(lji)=lnumber(i);其中,

步骤416)对每一条线路lji将乘客人数平均到每一天,则每一天的乘客数量为nptrain(lji);由此确定在以第j个子集数据作为测试集时开行线路lji的定制公交车车型及额定载客量netrain(lji);其中,

步骤417)由相应数据求得在每一条线路lji上dtest内的总乘客数量为ntest(lji),则对每一条线路lji将乘客人数平均到每一天,则每一天的乘客数量为nptest(lji);其中,

步骤418)由线路lji平均每一天的乘客数量nptest(lji)和在以第j个子集数据作为测试集时开行线路lji的定制公交车额定载客量netrain(lji)可以得到此条线路的满载率εji;若满载率大于或等于线路开行最小的满载率ε,则这条线路的开行合理,将此类线路归为第j个子集作为测试集的开行合理线路集合ljgood;若这条线路满载率小于ε,则这条线路开行不合理;其中,

步骤419)将k个子集轮流作为测试集,重复步骤415)~步骤18),得到了最终线路开行合理的集合lgood,其为所有开行合理线路集合里所包含的不重复线路;

步骤420)判断lgood里每条线路在所有开行合理线路集合里出现的次数ncishu(l(i)),并从高到低进行排序;次数越高的线路越优先考虑开通,集合lgood里的其余线路作为备选线路。

本发明具有如下有益效果:

(1)本发明选择以交通小区为单位进行接下来的工作是因为其相比于暴力穷举等方法获得上、下车站点或者线路减少了计算量,并且具有较强的推广性,可以根据不同城市的大小改变区域划分的大小就可将模型应用,对于定制公交成本以及资源的节约都有益无害。

(2)本发明利用直角棱形划分交通小区相比于利用正方形划分交通小区:由1范数的性质,可以知道在交通小区中,沿直角棱形四边任意一点到达中心(定制公交站点)的曼哈顿距离相等且为定值,并且x轴、y轴方向与主干道方向一致可以最大可能的保证乘客到达中心的距离为沿路行走的距离;而正方形为∞范数下的单位向量图形,其边上任意一点到达中心的曼哈顿距离不一定相等,因此正方形无直角棱形的此性质;

本发明利用直角棱形划分交通小区相比于利用圆形划分交通小区:直角棱形即为由正方形旋转45度的特殊菱形,在空间上可以无空隙拼接,不会在预测交通小区客流量的时候丢失客流量。然而,圆圈状相切的交通小区会丢失一些相切覆盖范围外的客流量;

本发明利用直角棱形划分交通小区相比于常见的利用聚类算法划分交通小区有如下所述不同:利用直角菱形确定交通小区的所有步骤都是参考国家相关规定或者实际车辆情况设定的,比较客观,减少了由主观因素造成的误差;常见的利用聚类算法划分交通小区有两种:k-means聚类算法和层次聚类算法,前者需要根据调查情况与运营经验选取n个初始聚类中心,耗时耗力,容易出现误差;后者需要根据专家意见、经验或有关规定确定区域划分半径,从而确定最大类别距离取值,再根据最大类别距离确定类别数m的取值,在这几个量进行确定的转换之间误差容易逐渐增大,最终结果会有较大误差。

(3)本发明是基于已确定上、下车站点并且单站点对应单站点的定制公交线路规划方法,是一个从无到有的过程,因此与背景技术所用方法或针对对象的都有不同。由于公交快线的运行道路主要为城市快速路或主干道,因此本发明的定制公交线网规划时,尽可能多的选择城市快速路、主干道,使得定制公交可以在最短路程内到达目的地。

(4)本发明提出的一种基于k-折交叉验证评价定制公交运行线路合理性的方法不仅可以评估已开通线路的合理性,还可以预测线路开通的合理性,避免实际运营后进行评估而造成的损失;

(5)本发明选取了出租车gps数据用来研究定制公交线路规划,更适合于定制公交乘客的起始点分析。

以下结合附图及实施例对本发明作进一步详细说明,但本发明的一种基于出租车gps大数据的定制公交线路规划方法不局限于实施例。

附图说明

图1是1范数在单位向量下的图;

图2是一种基于已确定上、下车站点并且单站点对应单站点的定制公交线路规划方法的流程图;

图3是一种基于k-折交叉验证评价定制公交运行线路合理性的方法的流程图;

图4是深圳市某一区域的定制公交交通小区划分示意图;

图5是深圳市快速路、主干道道路图;

图6是深圳市某一区域的定制公交交通小区划分及小区编号示意图;

图7是深圳市某工作日7:30-8:30由出租车gps数据得到乘客在16个交通小区的上车人数通过arcgis显示在路网地图上的示意图;

图8是深圳市某工作日7:30-8:30由出租车gps数据得到乘客在16个交通小区的下车人数通过arcgis显示在路网地图上的示意图;

图9是线路l(13)的最短线路示意图;

图10是线路l(15)的最短线路示意图;

图11是线路l(16)的最短线路示意图;

图12是线路l(64)的最短线路示意图。

具体实施方式

本发明一种定制公交交通小区和上、下车站点的确定方法,在交通小区划分时,考虑到人只能沿路行走,不可能因为两点之间距离最短就穿墙而过,因此选取x轴或y轴方向与主干道方向一致,使得更多的乘客沿曼哈顿距离到达中心时也在最短距离范围内,即交通小区最远处到达中心(上、下车站点)的距离为定值;并且,这种交通小区图形(正方形旋转45度的特殊菱形)在空间上可以无缝拼接,不会在预测交通小区客流量的时候丢失客流量。具体步骤如下:

步骤101)确定路网地图上的主干道,选取合适的主干道方向作为x轴,与x轴垂直的方向作为y轴;

步骤102)在gis里对路网地图进行无缝拼接的直角菱形划分,使得每个菱形的四个角都在x轴或者y轴上,且四个角到其中心的直线距离皆为a米,由此得到的每个直角菱形区域即为交通小区,其中心即为该交通小区的上、下车站点。

具体的,如图1所示为1范数在单位向量下的图,由1范数的性质,可以知道在交通小区中,沿直角棱形四边任意一点到达中心(定制公交站点)的曼哈顿距离相等且为定值,并且x轴、y轴方向与主干道方向一致可以最大可能的保证乘客到达中心的距离为沿路行走的距离。

如图2所示,本发明的一种基于已确定上、下车站点并且单站点对应单站点的定制公交线路规划方法,基于上述定制公交交通小区和上、下车站点的确定方法,以最短路程内到达目的地为线路规划的目标,采用迪杰斯特拉算法来确定线路,尽可能多的选择城市快速路、主干道。对于城市确定的主干道和快速路的每个交叉路口都作为一个顶点,设所求区域范围内顶点集合为v,s表示已求出最短路径的顶点集合,u表示未求出最短路径的顶点集合,因此有公式(1):

s+u=v(1)

具体步骤如下:

步骤201)对于上车站点与下车站点进行两两匹配,每一个上车站点到终到下车站点表示为一条公交线路,设有m个上车站点、n个下车站点,则配对连接成m×n条公交线路。l(i)为第i∈{1,2,…,(m×n)}条公交线路,其上车站点为start(i)、下车站点为end(i)。

步骤202)判断是否满足公式(2):

llong(i)≥lminlong(2)

其中,llong(i)为第i∈{1,2,…,(m×n)}条公交线路的长度,lminlong为定制公交线路的最小开行长度,满足条件的线路l(i)组成路径集lone。

步骤203)判断是否满足公式(3):

lnumber(i)≥lminnumber(3)

其中,lnumber(i)为路径集lone中第i条线路对应的有同样出行需求的乘客数量,lminnumber为定制公交线路的最小开行乘客数量,满足条件的线路l(i)组成路径集ltwo。若此条线路双向流动客流量都满足最小开行乘客数量,则双向通车,若只有一向满足,则单向通车。

步骤204)对于路径集ltwo中第i条线路ltwo(i),判断上、下车站点是否在主干道或者快速路上:若上、下车站点不在主干道上,首先根据实际情况找到其分别到主干道或者快速路最近的路口vstart(i)及vend(i),若上车站点就在主干道或者快速路上,则vstart(i)=start(i);若下车站点就在主干道或者快速路上,则vend(i)=end(i)。

步骤205)初始时,s中只有主干道或快速路上的一个源点vstart(i),即s={vstart(i)},u包含除vstart外的其他顶点,即:u={其余顶点}。若vstart(i)与u中任一顶点u有边,则弧<u,vstart(i)>正常有权值,若u不是vstart(i)的出边邻接点,则弧<u,vstart(i)>权值为∞。

步骤206)从u中选取一个到s中任一顶点s有关连边且距离最短的顶点t,把t加入s中(该选定的距离就是s到t的最短路径长度)。

步骤207)以t为新考虑的中间顶点,若从源点vstart(i)到顶点u的距离(经过顶点t)比原来距离(不经过顶点t)短,则修改顶点u的距离值,修改后的距离值等于经过顶点t到vstart(i)的距离值。

步骤208)重复步骤206)~步骤207,直到顶点vend(i)包含在s中。

步骤209)此时到达顶点vend(i)的最短路径即为第i条线路在主干道或快速路上所求最短线路;若上、下车站点不在主干道上,则第i条线路的最短行驶线路为start(i)到vstart(i)点的最短线路、在主干道或快速路上所求最短线路、vend(i)到end(i)的最短线路三者之和;若上车站点就在主干道或者快速路上,则第i条线路的最短行驶线路为第i条线路在主干道或快速路上所求最短线路。

步骤210)重复步骤204)~步骤209),直到路径集ltwo中的所有线路都确定了其线路走向。

步骤211)确定线路行驶方向及最短路径的线路l(i)组成最终的开行线路集合line。

如图3所示,本发明一种基于k-折交叉验证评价定制公交运行线路合理性的方法,基于所述一种基于已确定上、下车站点并且单站点对应单站点的定制公交线路规划方法,k-折交叉验证在一开始的均匀取样中可以减少训练集、测试集与原数据集之间的偏差,且可以使每一个样本数据都既被用作训练数据,也被用作测试数据,避免过度学习和欠学习状态的发生,得到的结果比较具有说服力。数据以天为最小单位,设共有d天的数据,dtrain为训练集的总天数,dtest为测试集的总天数。具体步骤如下:

步骤301)将原始数据以天为最小单位平均分成为k个子集数据,每个子集数据包含天。

步骤302)设第j∈{1,2,…,k}个子集数据作为测试集,其余的k-1组子集作为训练集。由k-1组子集作为训练集得到开行线路集合lj={lj1,lj2,…,lji}和每一条线路lji在dtrain内的总乘客数量为ntrain(lji)。其中,

步骤303)对每一条线路lji将乘客人数平均到每一天,则每一天的乘客数量为nptrain(lji)。由此确定在以第j个子集数据作为测试集时开行线路lji的定制公交车车型及额定载客量netrain(lji)。其中,

步骤304)由相应数据求得在每一条线路lji上dtest内的总乘客数量为ntest(lji)。则对每一条线路lji将乘客人数平均到每一天,则每一天的乘客数量为nptest(lji)。其中,

步骤305)由线路lji平均每一天的乘客数量nptest(lji)和在以第j个子集数据作为测试集时开行线路lji的定制公交车额定载客量netrain(lji)可以得到此条线路的满载率εji。若满载率大于或等于线路开行最小的满载率ε,则这条线路的开行合理,将此类线路归为第j个子集作为测试集的开行合理线路集合ljgood;若这条线路满载率小于ε,则这条线路开行不合理。其中,

步骤306)将k个子集轮流作为测试集,重复步骤302)~步骤305),得到了最终线路开行合理的集合lgood,其为所有开行合理线路集合里所包含的不重复线路。

本发明一种基于出租车gps数据的定制公交线路规划方法,基于一种定制公交交通小区和上、下车站点的确定方法、一种基于已确定上、下车站点并且单站点对应单站点的定制公交线路规划方法及一种基于k-折交叉验证评价定制公交运行线路合理性的方法,具体步骤如下:

步骤401)确定路网地图上的主干道,选取合适的主干道方向作为x轴,与x轴垂直的方向作为y轴。

步骤402)在gis里对路网地图进行无缝拼接的直角菱形划分,使得每个菱形的四个角都在x轴或者y轴上,且四个角到其中心的直线距离皆为a米,由此得到的每个直角菱形区域即为交通小区,其中心即为该交通小区的上、下车站点。

步骤403)对于上车站点与下车站点进行两两匹配,每一个上车站点到终到下车站点表示为一条公交线路,设有m个上车站点、n个下车站点,则配对连接成m×n条公交线路。l(i)为第i∈{1,2,…,(m×n)}条公交线路,其上车站点为start(i)、下车站点为end(i)。

步骤404)判断是否满足如下公式:

llong(i)≥lminlong(9)

其中,llong(i)为第i∈{1,2,…,(m×n)}条公交线路的长度,lminlong为定制公交线路的最小开行长度,满足条件的线路l(i)组成路径集lone。

步骤405)将测试集或训练集相应天数的全部出租车gps乘客上、下车数据导入gis里,可以得到每个交通小区有同样出行需求的乘客数量。判断是否满足如下公式:

lnumber(i)≥lminnumber(10)

其中,lnumber(i)为路径集lone中第i条线路对应的有同样出行需求的乘客数量,lminnumber为定制公交线路的最小开行乘客数量,满足条件的线路l(i)组成路径集ltwo。若此条线路双向流动客流量都满足最小开行乘客数量,则双向通车,若只有一向满足,则单向通车。

步骤406)对于路径集ltwo中第i条线路ltwo(i),判断上、下车站点是否在主干道或者快速路上:若上、下车站点不在主干道上,首先根据实际情况找到其分别到主干道或者快速路最近的路口vstart(i)及vend(i),若上车站点就在主干道或者快速路上,则vstart(i)=start(i);若下车站点就在主干道或者快速路上,则vend(i)=end(i)。

步骤407)初始时,s中只有主干道或快速路上的一个源点vstart(i),即s={vstart(i)},u包含除vstart外的其他顶点,即:u={其余顶点}。若vstart(i)与u中任一顶点u有边,则弧<u,vstart(i)>正常有权值,若u不是vstart(i)的出边邻接点,则弧<u,vstart(i)>权值为∞。

步骤408)从u中选取一个到s中任一顶点s有关连边且距离最短的顶点t,把t加入s中(该选定的距离就是s到t的最短路径长度)。

步骤409)以t为新考虑的中间顶点,若从源点vstart(i)到顶点u的距离(经过顶点t)比原来距离(不经过顶点t)短,则修改顶点u的距离值,修改后的距离值等于经过顶点t到vstart(i)的距离值。

步骤410)重复步骤408)~步骤409),直到顶点vend(i)包含在s中。

步骤411)此时到达顶点vend(i)的最短路径即为第i条线路在主干道或快速路上所求最短线路;若上、下车站点不在主干道上,则第i条线路的最短行驶线路为start(i)到vstart(i)点的最短线路、在主干道或快速路上所求最短线路、vend(i)到end(i)的最短线路三者之和;若上车站点就在主干道或者快速路上,则第i条线路的最短行驶线路为第i条线路在主干道或快速路上所求最短线路。

步骤412)重复步骤406)~步骤411),直到路径集ltwo中的所有线路都确定了其线路走向。

步骤413)确定线路行驶方向及最短路径的线路l(i)组成最终的开行线路集合line。

步骤414)将原始数据以天为最小单位平均分成为k个子集数据,每个子集数据包含天。

步骤415)设第j∈{1,2,…,k}个子集数据作为测试集,其余的k-1组子集作为训练集。由k-1组子集作为训练集重复步骤403)至步骤413)得到开行线路集合lj=line={lj1,lj2,…,lji}和线路集合lj中第i条线路lji在dtrain内的总乘客数量ntrain(lji)=lnumber(i)。其中,

步骤416)对每一条线路lji将乘客人数平均到每一天,则每一天的乘客数量为nptrain(lji)。由此确定在以第j个子集数据作为测试集时开行线路lji的定制公交车车型及额定载客量netrain(lji)。其中,

步骤417)由相应数据求得在每一条线路lji上dtest内的总乘客数量为ntest(lji)。则对每一条线路lji将乘客人数平均到每一天,则每一天的乘客数量为nptest(lji)。其中,

步骤418)由线路lji平均每一天的乘客数量nptest(lji)和在以第j个子集数据作为测试集时开行线路lji的定制公交车额定载客量netrain(lji)可以得到此条线路的满载率εji。若满载率大于或等于线路开行最小的满载率ε,则这条线路的开行合理,将此类线路归为第j个子集作为测试集的开行合理线路集合ljgood;若这条线路满载率小于ε,则这条线路开行不合理。其中,

步骤419)将k个子集轮流作为测试集,重复步骤415)~步骤18),得到了最终线路开行合理的集合lgood,其为所有开行合理线路集合里所包含的不重复线路。

步骤420)判断lgood里每条线路在所有开行合理线路集合里出现的次数ncishu(l(i)),并从高到低进行排序。次数越高的线路越可以优先考虑开通,集合lgood里的其余线路可以作为备选线路。

实施例1

如图4所示,选取深圳市某一区域在gis中的arcgis软件里进行定制公交交通小区的划分。因为定制公交是公交的一种,且具有直达性,因此乘客到达乘车站点的接受范围会比较大,在此设a=1000米,则其共有76个交通小区,分别标号为1-76,每个交通小区的上下车站点即为它的中心。

实施例2

选取深圳市某工作日7:30-8:3出租车gps数据得到乘客在这16个交通小区的上、下车人数进行单站点对应单站点的定制公交线路规划。如图5所示,尽可能多的选择城市快速路、主干道,对于深圳市主要考虑城市快速路、高速公路、国道、省道和县道。因此配对连接成256=16×16条公交线路,l(i)为第i∈{1,2,…,256}条公交线路,其上车站点为start(i)、下车站点为end(i)。根据《城市道路交通规划设计规范》的相关规定,市区电车与公共汽车的主要线路长度宜为8—12km,因此本文中设定最小的线路开行长度设lminlong=12km,则有从第1个小区到第13个小区的线路l(13)、从第1个小区到第14个小区的线路l(14)、从第1个小区到第15个小区的线路l(15)、从第1个小区到第16个小区的线路l(16)、从第2个小区到第14个小区的线路l(30)、从第2个小区到第15个小区的线路l(31)、从第2个小区到第16个小区的线路l(32)、从第3个小区到第15个小区的线路l(47)、从第3个小区到第16个小区的线路l(48)、从第4个小区到第16个小区的线路l(64)满足开行条件,因此有lone={l(13),l(14),l(15),l(16),l(30),l(31),l(32),l(47),l(48),l(64)}。结合客车座椅布置规范与原则,确定了lminnumber=5。出租车gps数据得到乘客在这16个交通小区的上、下车人数通过arcgis显示在路网地图上,分别如图7和图8所示。则在lone中,有如表2所示的有同样出行需求的乘客数量。

表2

因此有ltwo={l(13),l(15),l(16),l(64)},且这四条线路为单向通车。然后由迪杰斯特拉算法得到了线路l(13)的最短线路、线路l(15)的最短线路、线路l(16)的最短线路及线路l(64)的最短线路,分别如图9、如图10、如图11和如图12所示。

实施例3

选取深圳市某四天工作日7:30-8:30的出租车gps数据得到乘客在16个交通小区的上、下车人数对第1个小区到第13个小区的线路l(13)、从第1个小区到第15个小区的线路l(15)、从第1个小区到第16个小区的线路l(16)、从第4个小区到第16个小区的线路l(64)这四条定制公交线路进行评价其开行是否合理。共有d=4天的数据,将原始数据以天为最小单位平均分成为k=2个子集数据,每个子集数据包含天。

第1个子集数据作为测试集时,第2个子集作为训练集,此时由训练集得到开行线路集合l1={l1,13,l1,15,l1,16,l1,64}和每一条线路在dtrain=2内的总乘客数量,并且结合客车座椅布置规范与原则,确定了定制公交各米数段最大座椅数如表3所示,可得每条线路的车型与额定载客量,如表4所示。

表3定制公交各车型及配置最佳座位数

表4

在每一条线路上dtest=2内的总乘客数量为ntest(l1i),每一条线路l1i将乘客人数平均到每一天的乘客数量为nptest(l1i),以及此条线路的满载率ε1i如表5所示。

表5

线路开行最小的满载率ε=70%营运部门才有开通此条线路的积极性,因此l1good={l1,13,l1,15,l1,16,l1,64}。

第2个子集数据作为测试集时,第1个子集作为训练集,此时由训练集得到开行线路集合l2={l2,13,l2,15,l2,16,l2,64}和每一条线路在dtrain=2内的总乘客数量,并且结合客车座椅布置规范与原则,确定了定制公交各米数段最大座椅数如表3所示,可得每条线路的车型与额定载客量,如表6所示。

表6

在每一条线路上dtest=2内的总乘客数量为ntest(l2i),每一条线路l2i将乘客人数平均到每一天的乘客数量为nptest(l2i),以及此条线路的满载率ε2i如表7所示。

表7

线路开行最小的满载率ε=70%营运部门才有开通此条线路的积极性,因此l2good={l2,13,l2,15,l2,16,l2,64}。

得到了开行合理的线路集合lgood={l(13),l(15),l(16),l(64)},因此这四条线路开行合理。

实施例4

如图6所示,选取深圳市某一区域在gis中的arcgis软件里进行定制公交交通小区的划分,因为定制公交是公交的一种,且具有直达性,因此乘客到达乘车站点的接受范围会比较大,在此设a=1000米,则其共有16个交通小区,分别标号为1-16,每个交通小区的上下车站点即为它的中心。

选取某工作日7:30-8:3出租车gps数据得到乘客在这16个交通小区的上、下车人数进行单站点对应单站点的定制公交线路规划。尽可能多的选择城市快速路、主干道,对于深圳市主要考虑城市快速路、高速公路、国道、省道和县道,如图5所示。因此配对连接成256=16×16条公交线路,l(i)为第i∈{1,2,…,256}条公交线路,其上车站点为start(i)、下车站点为end(i)。根据《城市道路交通规划设计规范》的相关规定,市区电车与公共汽车的主要线路长度宜为8—12km,因此本文中设定最小的线路开行长度设lminlong=12km,则有从第1个小区到第13个小区的线路l(13)、从第1个小区到第14个小区的线路l(14)、从第1个小区到第15个小区的线路l(15)、从第1个小区到第16个小区的线路l(16)、从第2个小区到第14个小区的线路l(30)、从第2个小区到第15个小区的线路l(31)、从第2个小区到第16个小区的线路l(32)、从第3个小区到第15个小区的线路l(47)、从第3个小区到第16个小区的线路l(48)、从第4个小区到第16个小区的线路l(64)满足开行条件,因此有lone={l(13),l(14),l(15),l(16),l(30),l(31),l(32),l(47),l(48),l(64)}。结合客车座椅布置规范与原则,确定了lminnumber=5。出租车gps数据得到乘客在这16个交通小区的上、下车人数通过arcgis显示在路网地图上如图7、图8所示。则在lone中,有表2所示的有同样出行需求的乘客数量。

因此有ltwo={l(13),l(15),l(16),l(64)},且这四条线路为单向通车。然后由迪杰斯特拉算法得到了线路l(13)的最短线路如图9所示,线路l(15)的最短线路如图10所示,线路l(16)的最短线路如图11所示,线路l(64)的最短线路如图12所示。

另外选取深圳市某四天工作日7:30-8:30的出租车gps数据得到乘客在这16个交通小区的上、下车人数对l(13),l(15),l(16),l(64)这四条定制公交线路进行评价其开行是否合理。共有d=4天的数据,将原始数据以天为最小单位平均分成为k=2个子集数据,每个子集数据包含天。

第1个子集数据作为测试集时,第2个子集作为训练集,此时由训练集得到开行线路集合l1={l1,13,l1,15,l1,16,l1,64}和每一条线路在dtrain=2内的总乘客数量,并且结合客车座椅布置规范与原则,确定了定制公交各米数段最大座椅数如表3所示,可得每条线路的车型与额定载客量,如表4所示。

在每一条线路上dtest=2内的总乘客数量为ntest(l1i),每一条线路l1i将乘客人数平均到每一天的乘客数量为nptest(l1i),以及此条线路的满载率ε1i如表5所示。

线路开行最小的满载率ε=70%营运部门才有开通此条线路的积极性,因此l1good={l1,13,l1,15,l1,16,l1,64}。

第2个子集数据作为测试集时,第1个子集作为训练集,此时由训练集得到开行线路集合l2={l2,13,l2,15,l2,16,l2,64}和每一条线路在dtrain=2内的总乘客数量,并且结合客车座椅布置规范与原则,确定了定制公交各米数段最大座椅数如表3所示,可得每条线路的车型与额定载客量,如表6所示。

在每一条线路上dtest=2内的总乘客数量为ntest(l2i),每一条线路l2i将乘客人数平均到每一天的乘客数量为nptest(l2i),以及此条线路的满载率ε2i如表7所示。

线路开行最小的满载率ε=70%营运部门才有开通此条线路的积极性,因此l2good={l2,13,l2,15,l2,16,l2,64}。

得到了开行合理的线路集合lgood={l(13),l(15),l(16),l(64)},并且ncishu(l(13))=2,ncishu(l(15))=2,ncishu(l(16))=2,ncishu(l(64))=2,因此这四条线路可以全部优先考虑开通。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进,这些改进也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1