基于出租车gps记录的机场巴士站点及路线规划方法

文档序号:6630090阅读:402来源:国知局
基于出租车gps记录的机场巴士站点及路线规划方法
【专利摘要】本发明公开了一种基于出租车GPS记录的机场巴士站点及路线规划方法,包括以下步骤:步骤1:获取数据集;步骤2:采用数据过滤算法对所有的出租车GPS记录进行过滤;步骤3:对过滤后的数据集合按照上车和下车地点为机场进行分类,分为进入机场数据集和出机场数据集;步骤4:对进入进场数据集的PDRs通过聚类算法进行聚类,得到聚类中心和聚类集合,聚类中心集合即为机场巴士候选站点;步骤5:根据站点设置规则和优化算法对候选站点集进行修正优化;步骤6:对于优化后的站点,通过路径规划算法对机场巴士的进入机场线路进行规划;步骤7:对于出进场数据集,重复步骤4,5,6得到机场巴士的出机场巴士线路规划方案。
【专利说明】基于出租车GPS记录的机场巴士站点及路线规划方法

【技术领域】
[0001]本发明涉及计算机大数据领域,特别是一种基于出租车GPS记录的机场巴士站点及路线规划方法。

【背景技术】
[0002]大数据(Big data),或称巨量数据、海量数据、大资料,指的是所涉及的数据规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。在总数据量相同的情况下,与个别分析独立的小型数据集(data set)相比,将各个小型数据集合并后进行分析可得出许多额外的信息和数据关系性,可用来察觉商业趋势、判定研究质量、避免疾病扩散、打击犯罪或测定实时交通路况等;这样的用途正是大型数据集盛行的原因。
[0003]大数据在交通领域的发展是随着近年来机动车辆的爆炸式增加、车载GPS设备的大面积普及、交通摄像头、RFID等设备的部署同步发展的。尤其是近年来,城市建设的加快,交通压力越来越大,环境污染越来越严重,发展公共交通刻不容缓,亟待改善城市交通规划,而应用大数据方法解决交通问题越来越普遍而有效。
[0004]对于公交线路规划和设计是一个大数据潜在的应用场景。传统的公交线路规划往往需要在前期投入大量的人力进行OD调查和数据收集。特别是在出租车大面积普及后,对于OD流量数据完全可以从车载GPS设备中采集到相关的交通流量和流向数据,包括乘客的起点、终点以及时间等信息。对于一个上千万人口的大城市而言,每天的流量数据都会相当大,单一分析一天的数据可能没有相关的价值,而分析一个周期的数据趋势变化则会相当有价值。结合交通流量流向数据趋势变化,可以很好的帮助公交部门进行公交运营线路的设计规划和调整,换乘站的设计等很多内容。这个方法可能很早就有人想到,但是在出租车OD信息采集没有普及或海量数据处理和计算能力没有跟上的时候确实很难实际落地操作,而现在随着大数据技术的成熟和OD信息收集可以进行实际操作。
[0005]据IBM行业分析显示,使用出租车和自备车进出机场的旅客占到了 80% ;在中国2013年旅客吞吐量超过一千万人次以上的机场已多达24个,而出租车和自备车出行会给交通带来极大的压力以及带来更多的环境问题。本文中通过对基于出租车GPS记录的研究,通过大数据处理方法确定机场巴士站点位置,并在此基础上给出一个机场巴士线路规划方案来解决旅客进出机场问题。之前的很多针对于GPS记录的数据挖掘工作有很多:研究乘客出行模式,如 H.Wen Chang 等人在 “Context-aware taxi demand hotspotspredict1n (Int.J.Bus.1ntell.Data Mining, vol.5, n0.1, pp.3 - 18, Dec.2010)中使用GPS记录来挖掘城市热点问题;研究交通状况,如J.Aslam等人在“City-scale trafficestimat1n from a roving sensor network (in Proc.ACM SenSys, 2012, pp.141 - 154.),,中对交通状况信息的预测;研究出租车出行轨迹,如H.Hu等人在“Pick-up tree basedroute recommendat1n from taxi trajectories(in Proc.Web-Age Inf.Manage., 2012, v
ol.7418,pp.471 - 483.) ”提供建议让乘客更快找到出租车或者出租车更快找到乘客。
[0006]目前的对于出租车GPS记录的研究领域主要是出租车乘客的OD出行模式、交通状况预测以及出行轨迹研究等方面。而本文着眼于旅客公交出行方面的考虑,运用大数据处理来设计机场巴士线路,解决以往巴士停靠站点不合理、线路规划不完善等问题,达到减少自备车和出租车进出进场比例、引导公共交通出行的目的。
[0007]随着大数据技术的发展和成熟,城市规模的发展和交通压力以及日益严重环境问题,研究机场巴士站点设置和线路规划问题是比较符合当前实际情况的。


【发明内容】

[0008]本发明旨在克服现有机场巴士站点设置和线路规划存在的不足,提供一种基于出租车GPS记录的机场巴士站点及路线规划方法。
[0009]本发明公开了一种基于出租车GPS记录的机场巴士站点及路线规划方法,包括以下步骤:
[0010]步骤1:获取数据集,数据集由一个城市的所有出租车GPS的历史记录组成,GPS记录包括数据即乘客的上、下车数据,即出租车的OD信息都通过GPS设备上传到服务器,所述OD信息包括出发地和目的地信息;
[0011]步骤2:采用数据过滤算法对所有的出租车包含OD信息的GPS记录数据进行筛选,过滤掉乘车记录中无效信息和无关信息数据;
[0012]步骤3:对过滤后的数据集合按照上车和下车地点为机场进行分类,分为进入机场数据集和出机场数据集;
[0013]步骤4:对于进入机场数据集,对得到的TORs数据进行聚类得到聚类中心和聚类集合,聚类中心集合即为进入机场巴士候选站点集;
[0014]步骤5:对聚类算法得到的聚类中心,根据站点设置规则和优化算法对候选站点集进行修正优化;
[0015]步骤6:对于优化后的站点,在现有线路信息的基础条件下,通过路径规划算法规划机场巴士的进入机场路线的规划;
[0016]步骤7:对于出机场数据集,重复步骤4,5,6得到机场巴士的出机场线路规划方案。
[0017]本发明中,所述的包含OD信息的出租车GPS记录数据,每条记录具体描述为rn =(X1, X2,…,Xm),其中,rn表示出租车GPS记录的第η条历史记录,Xm表示第m维出租车记录PDR属性值,m表示出租车记录PDR属性的维数,m、η取值自然数。
[0018]本发明中,采用数据过滤算法对包含OD信息的GPS记录数据进行筛选过滤,祛除无效信息和无关信息,分为两歩:
[0019]第一步过滤掉OD信息中和机场无关的GPS记录,判断出租车GPS记录是否是进出机场的乘车记录,即上车点或下车点位置是否在机场范围内的记录;
[0020]第二步在第一步结果基础上过滤掉无效记录,无效记录包括时间和路线完全相同的重复记录,以及历史记录中乘车距离dist(r)小于阈值Sci或者乘车时间Time Cr)小于阈值Tci的记录;
[0021]将筛选后得到的TORs数据集合记为Suse,描述为Ir1, r2, r3,…,rj,其中,z表示筛选后的GPS记录的个数。
[0022]本发明中,对于数据集合S.,根据是进入还是出机场把数据集分为进入机场数据集Sd和出机场数据集S。。
[0023]本发明中,对进入机场数据集Sd采用k-means方法进行聚类;
[0024]随机从进入机场数据集Sd选取k个聚类中心点集Iu1, U2,…,Uk},k的取值为I?SdI之间的自然数,Uk表示第k个中心点;
[0025]K-means是基于距离的聚类方法,对距离的计算采用欧氏距离,对于每个乘车记录IV计算其和聚类中心的距离,公式为:
[0026]d(r,u/) = ^(X1-y{)2+(X2-V2)2+...+ (\ -ym),
[0027]其中,(Kri, Uj)表示记录A和聚类中心点Uj的距离,j取值范围为I?k, !Ti表示为(XpX2,…xm),其中xm表示记录A的第m维属性值,m是记录!Ti的维度;聚类中心点Uj表示为(yi,y2,…ym),其中ym表示记录?的第m维属性值,属性值包括经度和纬度;
[0028]根据以下公式确定记录&所属的类别:

k
[0029]Ci 二 arg min d( u.),
j=i J
[0030]其中Ci表示记录ri所属的类别,选择k个距离中与聚类中心距离最小的那个聚类中心所在的类作为记录^的类别;
[0031]确定所有记录的类别后,得到一个类集合{P},类集合{P}拥有k个子集合,对于每一个类别下的所有记录的集合{Pk},计算新的聚类中心点:
Σ化'
[0032]JJ _ Ir=I
k— I巧I,
[0033]其中,IpJ表示聚类后属于类别Ck的记录个数;Pkw表示集合Pk中第W个元素,Uk即为类别Ck新的中心点;
[0034]重复进行聚类,直到达到聚类停止条件,即所有的聚类中心点都不再变化。
[0035]本发明中,首先,对于在进入机场数据集Sd上聚类后得到的类集合{P},类集合{P}拥有k个子集合;
[0036]{PJ是集合{P}的一个子集合,a是自然数,取值范围I?k;从子集合中选取子集合区域内的点所在区域每小时出租车TORs数据中在此地停靠次数大于50条的地点为站点的候选集L,得到的候选点集合表示为L = (I1, I2,…,IJ ,通过可达性的度量值来选择最优的点作为本集合区域的站点,根据可达性的计算公式候选站点Iil的可达性为:

I
[0037]Al = ~

—-YjClistOn,lu]), /1 = 1,2,...,5,

mI ~ lUl=I

ul^i
[0038]其中Hi1是集合{Pa}元素数目,Ul是集合{Pa}中的元素下标,取值范围为I?Hi1 ;s是站点的候选集L中元素数目,s取值范围为I?HinAil表示第il个候选站点Iil的可达性值;
[0039]根据公式计算站点的候选集L中所有候选站点的可达性值,值最小的点即为最优的点,即为本区域集合的机场巴士站点;
[0040]对于类集合{P}中所有子集合,通过上述可达性指标进行优化得到进入机场的巴士站点集合A1 ;
[0041]对于通过k-means算法在出机场数据集S。上获得的类集合{Q},类集合{Q}拥有t个子集合:
[0042]首先,对于在出机场数据集S。上聚类后得到的类集合{Q},{QJ是集合{Q}的一个子集合,b是自然数,取值范围I?t;从集合中选取集合区域内人流量每小时的roRs数据大于50条的地点作为站点的候选集D,将站点的候选集表示为D = W1, d2,…,dv},通过可达性的度量值来选择最优的点作为本集合区域的站点,根据可达性的计算公式候选站点di2的可达性为:
I mI
[0043]Ai2 — 2 dist、dj2,dul), 12 —1,2,...,v,

m2 _ J "2=1

η?φ?
[0044]其中m2是集合{Qa}中元素数目,u2是集合{Qa}中的元素下标,取值范围为I?m2 ;v是站点的候选集D中元素数目,V取值范围为I?m2, Ai2表示第i2个候选站点di2的可达性值;
[0045]根据公式计算站点的候选集D中所有候选站点的可达性值,可达性值最小的点即为最优的点,即为本区域集合的机场巴士站点;
[0046]对于类集合{Q}中所有子集合区域,通过上述可达性值进行优化得到出机场的巴士站点集合A2。
[0047]本发明中,对修正后的进入机场巴士站点集合A1,按照公交公司给定的去机场线路条数B1,以及所述B1条机场线路的起点,根据得到的进入机场巴士站点集合A1,随机生成B1条到达机场的运营线路图;把所述线路图作为初始线路,采用模拟退火算法对初始线路进行路径的优化,得到优化的进入机场的机场巴士线路规划方案。
[0048]本发明中,对于出机场数据集,对修正后的出机场的机场巴士站点集合A2,按照公交公司给定的出机场线路条数B2以及所述B2条机场线路的终点,根据得到的站点集合A2,随机生成B2条出机场的运营线路图;把这些线路图作为初始线路,采用模拟退火算法对初始线路进行路径的优化,得到优化的出机场的机场巴士线路规划方案。
[0049]本发明的思想为:首先通过对出租车GPS记录集合的筛选得到本次实验的数据集合,即OD信息是机场的有效I3DRs ;对于OD信息时机场的有效I3DRs分为进入机场数据集和出机场数据集;对于以上两个数据集分别采用k-means聚类算法进行聚类,然后对每个聚类的中心进行修正优化;最后对得到的优化后的机场巴士站点候选集进行机场巴士线路规划,得到机场巴士的进入机场路线规划方案和出机场两个路线规划方案。
[0050]与现有技术相比,本发明的效果体现在:
[0051]I)机场巴士站点确定方法是基于出租车GPS的OD信息数据,数据量比较大,采用大数据处理方式,是可信的、科学的。
[0052]2)采用出租车的GPS记录可以有效挖掘用户出行模式和OD规律,通过此方式设置的机场巴士站点比较符合乘客需求和城市公共交通建设要求的,大大减少乘客出行费用,同时还能减少环境污染,大力发展公共交通。
[0053]3)本次路径规划分为进入机场线路和出机场线路,从乘客对进、出不同的需求进行了满足,既方便了进入机场的乘客也方便了出机场的乘客的需求。

【专利附图】

【附图说明】
[0054]图1本发明流程图。

【具体实施方式】
:
[0055]本发明基于出租车GPS记录的机场巴士站点设置和路径规划方法包括以下步骤:
[0056]步骤1:获取数据集,数据集由某城市的所有出租车GPS记录组成,GPS记录包括乘客的上 / 下车信息(pick/drop records, F1DRs),即出租车的 OD (origin-destinat1n)信息都会通过GPS设备上传到服务器;包含出租车OD信息的GPS记录来源与一个城市所有出租车,并且数据采集时间足够长,从而保证了设计方案的科学性和可信度。出租车的TORs的属性包含很多信息,例如上车时间、设备号、车牌号、上车点经纬度、下车时间、下车点经纬度等信息。
[0057]本发明包含机场巴士站点选择、进入机场巴士线路规划方案和出机场巴士线路规划,即机场巴士站点选择完成后进行进/出机场巴士线路规划。包含出租车OD信息的乘车记录集合F1DRs记为为Sall,可以描述为Ir1, r2, r3,…,rh,…,rn},其中,rh表示第h个记录,η表示GPS记录的个数。每条记录具体描述为rn = (X1, x2,…,xm),其中,rn表示出租车GPS记录的第η条历史记录,xm表示第m维出租车记录PDR属性值表示出租车记录PDR属性的维数,m、η取值自然数。
[0058]步骤2:采用数据过滤算法对所有的出租车包含OD信息的乘车记录TORs进行筛选,过滤掉乘车记录中无效信息和无关信息数据。过滤主要分为两歩:第一步过滤掉OD信息和机场无关的GPS记录;第二步在第一步结果基础上过滤掉无效记录。
[0059]步骤2中采用数据筛选算法主要是为了降低无关数据对实验准确性的干扰。首先判定是否是相关信息,即判断出租车GPS记录是否是进出机场的乘车记录,上车点或下车点经纬度在机场范围内的记录;
[0060]Loc (rh) E Loc (airport)
[0061]其中rh是GPS记录的第h条记录,Loc (rh)表示这条记录的起点或终点,本公式判断上车点或下车点是否在机场的地理范围内,机场的位置根据官方的经纬度来确定;其次,过滤掉无效记录,无效记录有以下几个方面原因:某一时刻乘客乘坐出租车,出租车GPS设备可能会上传多条相同记录,这些记录是重复的,需要过滤掉;历史记录中乘车距离dist (rh)小于阈值Stl或者乘车时间Time (rh)小于阈值Ttl的记录需要过滤来降低对实验精确性的干扰,公式如下:
[0062]dist(rh)>S。andTime (rh) >T0
[0063]筛选后得到的TORs数据集合记为Suse,描述为Ir1, r2, r3,…,rj,z表示筛选后的GPS记录的个数。每个PDR记录仍表示为rz = (X1, x2,…,xm),其中,rz表示过滤后的出租车GPS的第z条历史记录,Xm表示出租车GPS记录第m维属性值,m表示出租车GPS记录F1DR的维数,m取值自然数,z取值I?η之间的自然数。
[0064]步骤3:筛选后得到的TORs数据集合记为Suse,根据是进入还是出机场把数据集合分为进入机场数据集Sd和出机场数据集S。;
[0065]步骤4:对进入机场的出租车GPS记录集St^P S。,采用k-means聚类算法进行聚类得到聚类中心和类集合,聚类算法停止后得到的聚类中心集合即为机场巴士候选站点集,得到的类集合即为每个候选站点的GPS记录集;
[0066]在对筛选后的出租车GPS记录筛选后得到的数据集Sd采用k-means方法进行聚类时,首先要随机从进入机场数据集Sd选取k个聚类中心点集Iu1, U2,…,uk},k的取值为I?|Sd|之间的自然数,Uk表示第k个中心点;
[0067]在本发明中要通过算法自我收敛找到最优的k值I^pt,一般难以直接找到最佳聚类数k_,因此需要确定一个搜索范围,就是设定一fkmax,如何确定kmax尚无明确理论公式,多数学者采用经验规则为公式:
[0068]and kopl < kmax
[0069]其中,n是聚类集合的元素个数,初始值设定k = 2 ;
[0070]K-means是基于距离的聚类方法,对距离的计算采用欧氏距离,对于每个乘车记录IV计算其和聚类中心的距离,公式为:
[0071]CiirnUj) ^ -J1)2+(Y - ! ) +…丄(Y -Jffl)2,
[0072]其中,(Kri, Uj)表示记录A和聚类中心点Uj的距离,j取值范围为I?k, !Ti表示为(XpX2,…xm),其中xm表示记录A的第m维属性值,m是记录!Ti的维度;聚类中心点Uj表示为(yi,y2,…ym),其中ym表示记录七的第m维属性值,属性值有经度和纬度;
[0073]根据以下公式确定记录ri所属的类别:

k
[0074]Cj = arg min d( Ui),
j=i J
[0075]其中Ci表示记录ri所属的类别,选择k个距离中与聚类中心距离最小的那个聚类中心所在的类作为记录^的类别;
[0076]确定所有记录的类别后,得到一个类集合{P},对于每一个类别下的所有记录的集合{Pk},计算新的聚类中心点:
[0077]U — w=l
k I巧 I,
[0078]其中,IpJ表示聚类后属于类别Ck的记录个数;Pkw表示集合Pk中第W个元素,Uk即为类别Ck新的中心点;
[0079]重复进行聚类,直到达到聚类停止条件,即所有的聚类中心点都不再变化。
[0080]如果聚类中心的距离不满足站点设置规则,即任意两个相邻聚类中心点的距离要大于阈值S1,公式如下:
[0081]dist (ue, uf) >S!
[0082]ue和Uf表示聚类中心集合中的任意两个元素,e和f的取值范围为I?k ;如果不满足上式,则k = k+Ι,重复步骤4过程,直到满足所有条件。
[0083]通过k-means算法,在进入机场数据集Sd上得到一个类集合{P},拥有k个子集合;在出机场数据集S。上得到一个类集合{Q},拥有t个子集合。
[0084]步骤5:由聚类算法k-means得到的聚类中心即为机场巴士站点候选集,根据站点设置规则和优化算法对候选站点集进行修正优化;
[0085]步骤5中通过k-means方法获得的聚类中心集合C是通过算法计算出来的,需要进行优化,优化步骤如下:
[0086]首先,对于在进入机场数据集Sd上聚类后得到的类集合{P},类集合{P}拥有k个子集合。
[0087]{PJ是集合{P}的一个子集合,a是自然数,取值范围I?k;从集合中选取集合区域内的点所在区域每小时出租车TORs记录中在此地停靠次数大于50条的地点为站点的候选集L,得到的候选点集合表示为L = (I1, I2,…,IJ,通过可达性的度量值来选择最优的点作为本集合区域的站点,根据可达性的计算公式候选站点Iil的可达性为:
I mI
[0088]Al = IT Σ d_n ,U, Π = 1,2,…,.V,
肌I _ I wl=l
[0089]其中Hi1是集合{Pa}元素数目,Ul是集合{Pa}中的元素下标,取值范围为I?Hi1 ;s是站点的候选集L中元素数目,s取值范围为I?HinAil表示第il个候选站点Iil的可达性;
[0090]根据公式计算站点的候选集L中所有候选站点的可达性值,值最小的点即为最优的点,即为本区域集合的机场巴士站点;
[0091]对于类集合{P}中所有子集合,通过上述可达性指标进行优化得到进入机场的巴士站点集合A1 ;
[0092]对于通过k-means算法在出机场数据集S。上获得的类集合{Q},类集合{Q}拥有t个子集合:
[0093]首先,对于在出机场数据集S。上聚类后得到的类集合{Q},{QJ是集合{Q}的一个子集合,b是自然数,取值范围I?t;从集合中选取集合区域内人流量每小时的roRs记录大于50条的地点作为站点的候选集D,将站点的候选集表示为D = W1, d2,…,dv},通过可达性的度量值来选择最优的点作为本集合区域的站点,根据可达性的计算公式候选站点di2的可达性为:
j m2
[0094]4-2 = -—7 Σ dist〈di2,0, ?2 = h 2,...,V,

m2 — 1 m2=1
Η?Φ?
[0095]其中m2是集合{Qa}中元素数目,u2是集合{Qa}中的元素下标,取值范围为I?m2 ;v是站点的候选集D中元素数目,V取值范围为I?m2, Ai2表示第i2个候选站点di2的可达性值;
[0096]根据公式计算站点的候选集D中所有候选站点的可达性值,可达性值最小的点即为最优的点,即为本区域集合的机场巴士站点;
[0097]对于类集合{Q}中所有子集合区域,通过上述可达性值进行优化得到出机场的巴士站点集合A2。
[0098]步骤6:对优化后的进入机场巴士站点集合A1,首先按照公交公司给定的去机场线路条数B1,以及这&条线的起点,根据得到的站点集合A1,随机生成B1条到达机场的运营线路图,即为初始线路;
[0099]采用模拟退火算法对初始线路进行路径的优化:
[0100]本发明采用的模拟退火法(Simulated Annealing, SA)是模拟热力学中经典粒子系统的降温过程,来求解规划问题的极值。当孤立粒子系统的温度以足够慢的速度下降时,系统近似处于热力学平衡状态,最后系统将达到本身的最低能量状态,即基态,这相当于能量函数的全局极小点。模拟退火求解局部最优解的过程如下:
[0101]①设定初始温度h为100度;使用上一阶段获得的初始线路集合,并计算该初试线路的目标函数值f(x),目标函数f(x)为线路距离的和函数f(x) =Σ Clij,
[0102]其中i,j为某一线路上两个不同的站点,Clij为站点之间的距离。
[0103]②随机产生扰动Λ χ,即随机替换改变线路中的某个站点,得到新线路集合X’,计算新线路集合目标函数值f(x’),及函数值差Af = f(X’)_f(x)。
[0104]③若Λ f〈 = 0,则接受新的线路,并作为下一次模拟的初始线路。
[0105]④若Δ?>0,则计算新线路的接受概率:P (Af) = exp(_Af/t),其中t为当前温度;产生[0,1]区间上均勻分布的伪随机数r, r[0, I],如果p(Af)> = r,则接受新点作为下一次模拟的初始线路;否则放弃新线路,仍取原来的线路作为下一次模拟的初始线路。
[0106]按照每次退火温度Λ t = 2的退火方案减低温度,重复②③④过程直到当前温度t = 0,就构成了完整的模拟退火算法,最终获得线路则为优化后的规划方案。
[0107]通过本算法得到优化的进入机场的机场巴士线路规划方案。
[0108]步骤7:对于出机场数据集,对于出机场数据集,对修正后的出机场的机场巴士站点集合A2,按照公交公司给定的出机场线路条数B2以及这B2条线的终点,根据得到的站点集合A2,随机生成B2条出机场的运营线路图;再把这些线路图作为初始线路,采用模拟退火算法对初始线路进行路径的优化,得到优化的出机场的机场巴士线路规划方案。
[0109]实施例
[0110]本实施例使用了 A城市的所有出租车在一周时间里产生的数据集进行实验。
[0111]对于拿到的原始数据集,首先过滤掉无效数据:在地图上用蓝色的圆点代表起点,红色的圆点代表终点,把这些数据记录显示到地图后,有许多记录的起点和终点都不在机场出租车停靠点区域内;此时以机场停靠点为中心,Ikm为半径画一个圆形区域,把起点或终点在这个圆形区域内的数据筛选出来;筛选出来的数据把部分起点和终点距离小于Ikm以及一条记录的行车时间小于5min的数据进行剔除,最重得到需要的数据集S.。
[0112]其次,把数据集Suse拆分成两部分数据集,根据在机场停靠点区域的圆点显示的颜色是蓝色或红色来归类,即起点是蓝色的圆点集是出机场数据集S。和终点是红色的圆点集是进入进场数据集sd。
[0113]再次,进行聚类,对Sd和S。进行聚类,首先根据A城市的实际情况进行聚类,A城市有三条机场巴士线进出机场,进机场三条线一共有9个站点,出机场的三条线路中一共有12个站点;在对Sd进行聚类时选择的聚类中心为9,对Sd进行聚类时选择的聚类中心为12,并把聚类后的中心和区域显示在地图上。
[0114]接下来是站点的优化,上一步得到的聚类中心需要修正优化,以Sd的一个聚类中心和区域为例:选取了区域内符合人流量大于50的条件的四个酒店作为本区域站点的候选点,分别为君乐大酒店、楚源大酒店、翠湖大酒店和银天大酒店,计算的可达性值为{900.97,955.67,1105.29,1049.81},所以选择可达性值最小的君乐大酒店所在的位置为本区域的机场巴士站点。在本过程中对Sd的所有聚类中心进行优化得到进入机场站点集A1,对S。的所有聚类中心进行优化得到出机场站点集A2。
[0115]最后,对得到的站点集进行路径规划,由于在A城市中进出机场都只有三条线路,本次实例中仍旧以三条线为例。对优化后的进机场的机场巴士站点集合A1,按照已有三条线以及这三条机场线路的起点,随机生成三条到达机场的运营线路图;把这三条线路图作为初始线路,采用模拟退火算法对初始线路进行路径的优化,得到优化的进入机场的机场巴士线路规划方案;对优化后的出机场的机场巴士站点集合A2,按照已有的三条线以及这三条条机场线路的终点,随机生成三条出机场的运营线路图;把这三条线路图作为初始线路,采用模拟退火算法对初始线路进行路径的优化,得到优化的出机场的机场巴士线路规划方案。
【权利要求】
1.一种基于出租车GPS记录的机场巴士站点及路线规划方法,其特征在于:包括以下步骤: 步骤1:获取数据集,数据集由一个城市的所有出租车GPS的历史记录组成,GPS记录包括数据即乘客的上、下车数据,即出租车的OD信息都通过GPS设备上传到服务器,所述OD信息包括出发地和目的地信息; 步骤2:采用数据过滤算法对所有的出租车包含OD信息的GPS记录数据进行筛选,过滤掉乘车记录中无效信息和无关信息数据; 步骤3:对过滤后的数据集合按照上车和下车地点为机场进行分类,分为进入机场数据集和出机场数据集; 步骤4:对于进入机场数据集,对得到的TORs数据进行聚类得到聚类中心和聚类集合,聚类中心集合即为进入机场巴士候选站点集; 步骤5:对聚类算法得到的聚类中心,根据站点设置规则和优化算法对候选站点集进行修正优化; 步骤6:对于优化后的站点,在现有线路信息的基础条件下,通过路径规划算法规划机场巴士的进入机场路线的规划; 步骤7:对于出机场数据集,重复步骤4,5,6得到机场巴士的出机场线路规划方案。
2.根据权利要求1所述的方法,其特征在于,所述的包含OD信息的出租车GPS记录数据,每条记录具体描述为rn = (X1, x2,…,xm),其中,rn表示出租车GPS记录的第η条历史记录,Xm表示第m维出租车记录F1DR属性值,m表示出租车记录PDR属性的维数,m、η取值自然数。
3.根据权利要求2所述的方法,其特征在于,采用数据过滤算法对包含OD信息的GPS记录数据进行筛选过滤,祛除无效信息和无关信息,分为两歩: 第一步过滤掉OD信息中和机场无关的GPS记录,判断出租车GPS记录是否是进出机场的乘车记录,即上车点或下车点位置是否在机场范围内的记录; 第二步在第一步结果基础上过滤掉无效记录,无效记录包括时间和路线完全相同的重复记录,以及历史记录中乘车距离dist (r)小于阈值Sci或者乘车时间Time (r)小于阈值Ttl的记录; 将筛选后得到的TORs数据集合记为Suse,描述为Ir1, r2, r3,…,rj,其中,z表示筛选后的GPS记录的个数。
4.根据权利要求3所述的方法,其特征在于,对于数据集合S.,根据是进入还是出机场把数据集分为进入机场数据集Sd和出机场数据集S。。
5.根据权利要求4所述的方法,其特征在于,对进入机场数据集Sd采用k-means方法进行聚类; 随机从进入机场数据集Sd选取k个聚类中心点集{Ul,u2,…,uk},k的取值为I?|Sd|之间的自然数,Uk表示第k个中心点; K-means是基于距离的聚类方法,对距离的计算采用欧氏距离,对于每个乘车记录ri;计算其和聚类中心的距离,公式为:
d(η,Uj)=」(-V1 — V1 )2 +U2 -J2)2 +...+ (\ -y,u), 其中,(Kri, Uj)表示记录η和聚类中心点Uj的距离,j取值范围为I?k, η表示为(XpX2,…xm),其中Xm表示记录A的第m维属性值,m是记录!Ti的维度;聚类中心点Uj表示为(yi,y2,…ym),其中7111表示记录屮的第m维属性值,属性值包括经度和纬度; 根据以下公式确定记录A所属的类别:
k
C1- aminint/(r., u;),
j=l J 其中Ci表示记录^所属的类别,选择k个距离中与聚类中心距离最小的那个聚类中心所在的类作为记录^的类别; 确定所有记录的类别后,得到一个类集合{P},类集合{P}拥有k个子集合,对于每一个类别下的所有记录的集合{Pk},计算新的聚类中心点:
TJ — ^=1 r Iill ’ 其中,IPkI表示聚类后属于类别ck的记录个数屮!?表示集合Pk中第w个元素,Uk即为类别Ck新的中心点; 重复进行聚类,直到达到聚类停止条件,即所有的聚类中心点都不再变化。
6.根据权利要求5所述的方法,其特征在于,首先,对于在进入机场数据集Sd上聚类后得到的类集合{P},类集合{P}拥有k个子集合; {PJ是集合{P}的一个子集合,a是自然数,取值范围I?k ;从子集合中选取子集合区域内的点所在区域每小时出租车TORs数据中在此地停靠次数大于50条的地点为站点的候选集L,得到的候选点集合表示为L = (I1, I2,…,IJ,通过可达性的度量值来选择最优的点作为本集合区域的站点,根据可达性的计算公式候选站点Iil的可达性为: 4, = —?.Σ dist(lnJu[), /I = 1,2”
mi —1 wl=l
uM 其中Hl1是集合{PJ元素数目,Ul是集合{PJ中的元素下标,取值范围为I?Hl1 ;s是站点的候选集L中元素数目,S取值范围为I?HI1, Ail表示第il个候选站点Iil的可达性值; 根据公式计算站点的候选集L中所有候选站点的可达性值,值最小的点即为最优的点,即为本区域集合的机场巴士站点; 对于类集合{P}中所有子集合,通过上述可达性指标进行优化得到进入机场的巴士站点集合A1 ; 对于通过k-means算法在出机场数据集S。上获得的类集合{Q},类集合{Q}拥有t个子集合: 首先,对于在出机场数据集S。上聚类后得到的类集合{Q},{QJ是集合{Q}的一个子集合,b是自然数,取值范围I?t ;从集合中选取集合区域内人流量每小时的TORs数据大于50条的地点作为站点的候选集D,将站点的候选集表示为D = W1, d2,…,dv},通过可达性的度量值来选择最优的点作为本集合区域的站点,根据可达性的计算公式候选站点di2的可达性为:
I mI All =-- Y dist(dnJlP), il = 1,2,...,ν,
W2-1 急 L

ιι?ψι 其中m2是集合{Qa}中元素数目,u2是集合{Qa}中的元素下标,取值范围为I?m2 ;v是站点的候选集D中元素数目,V取值范围为I?m2,Ai2表示第i2个候选站点di2的可达性值; 根据公式计算站点的候选集D中所有候选站点的可达性值,可达性值最小的点即为最优的点,即为本区域集合的机场巴士站点; 对于类集合{Q}中所有子集合区域,通过上述可达性值进行优化得到出机场的巴士站点集合A2。
7.根据权利要求6所述的方法,其特征在于,对修正后的进入机场巴士站点集合A1,按照公交公司给定的去机场线路条数B1,以及所述B1条机场线路的起点,根据得到的进入机场巴士站点集合A1,随机生成B1条到达机场的运营线路图;把所述线路图作为初始线路,采用模拟退火算法对初始线路进行路径的优化,得到机场巴士的进入机场的优化的线路规划方案。
8.根据权利要求7所述的方法,其特征在于,对于出机场数据集,对修正后的出机场的机场巴士站点集合A2,按照公交公司给定的出机场线路条数B2以及所述B2条机场线路的终点,根据得到的站点集合A2,随机生成B2条出机场的运营线路图;把这些线路图作为初始线路,采用模拟退火算法对初始线路进行路径的优化,得到机场巴士的出机场的优化的线路规划方案。
【文档编号】G06Q10/04GK104318324SQ201410539844
【公开日】2015年1月28日 申请日期:2014年10月13日 优先权日:2014年10月13日
【发明者】窦万春, 刘岩 申请人:南京大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1