预测方法和系统的制作方法

文档序号:6700177阅读:181来源:国知局
专利名称:预测方法和系统的制作方法
技术领域
本申请涉及数据处理领域,更具体地说,涉及预测方法和系统。
背景技术
“脱班”指定时运行的交通工具误点,更具体的,在公交线网运营中的脱班,是指公交线路上的班次因种种原因无法跟从编订的班次行走,比如在编订班次中,某公交应该15:30到达某一站点,结果却16 00乃至在更晚的时刻到达该站点。造成公交车辆脱班的原因很多,交通堵塞(即出现堵点),即是造成公交车辆脱班的一个重要因素。为此,在现有技术中,经常采用人工蹲点的方式来确定某一路段是否发生交通堵塞(也即产生堵点),以及是否发生脱班。
上述人工蹲点的方式存在错误率高、误差大的问题。也很难根据人工采集的信息,寻找出脱班的发生规律,从而无法对由堵点引发的脱班进行预测。而近年来,许多城市建成了智能公交系统,智能公交系统可通过RFID设备采样及车载GPS/GPRS模块采样,来获取公交车辆的海量动态运营参数的采样数据。这些海量动态运营采样数据,为准确地预测某一路段是否发生由堵塞引发的脱班提供了契机。

发明内容
有鉴于此,本申请提供一种预测方法和系统,以解决现有人工蹲点方式存在的错误率高、误差大,以及很难对由堵点引发的脱班进行预测的问题。为实现上述目的,本申请提供如下技术方案—种预测方法,至少用于预测由交通堵塞引起的公交脱班,所述方法包括至少获取公交线网的运营参数所对应的数据,所述运营参数所对应的数据包括公交线网的静态运营参数数据以及公交线网的动态运营参数的采样数据,所述静态运营参数至少包括公交线路发车间隔和到站名称;对所述运营参数所对应的数据进行预处理,从而确定出公交车辆的公交运行轨迹,所述公交运行轨迹由公交运行轨迹点构成;以路段为最小单位对公交车辆的公交运行轨迹进行扫描,以扫描出具有堵点脱班特征的公交运行轨迹段,所述具有堵点脱班特征的公交运行轨迹段至少包括两个公交运行轨迹点;以所述具有堵点脱班特征的公交运行轨迹段为中心,对所述公交运行轨迹进行聚类分析,得到聚类结果,所述聚类结果包括与所述具有堵点脱班特征的公交运行轨迹段属于同一类的公交运行轨迹段;对聚类结果进行关联分析,得到关联分析结果,所述关联分析结果包括由堵塞引发公交脱班的相应知识,所述知识至少包括由堵塞引发公交脱班的前件;根据所述知识进行预测,得到预测结果,所述预测结果包括发生堵塞的路段、由堵塞引发公交脱班的路段、由堵塞引发公交脱班的路段所影响的公交车辆,以及,由堵塞引发公交脱班的路段所影响的公交路线中的至少一个。一种预测系统,至少用于预测由交通堵塞引起的公交脱班,所述系统包括数据获取单元、预处理单元、预测分析单元,所述预测分析单元包括扫描单元、聚类单元、关联分析单元、堵点脱班预测单元,其中所述数据获取单元用于,至少获取公交线网的运营参数所对应的数据,所述运营参数所对应的数据包括公交线网的静态运营参数数据以及公交线网的动态运营参数的采样数据,所述静态运营参数至少包括公交线路发车间隔和到站名称;所述预处理单元用于,对所述运营参数所对应的数据进行预处理,从而确定出公交车辆的公交运行轨迹,所述公交运行轨迹由公交运行轨迹点构成;所述扫描单元用于,以路段为最小单位对公交车辆的公交运行轨迹进行扫描,以扫描出具有堵点脱班特征的公交运行轨迹段,所述具有堵点脱班特征的公交运行轨迹段至少包括两个公交运行轨迹点;·所述聚类单元用于,以所述具有堵点脱班特征的公交运行轨迹段为中心,对所述公交运行轨迹进行聚类分析,得到聚类结果,所述聚类结果包括与所述具有堵点脱班特征的公交运行轨迹段属于同一类的公交运行轨迹段;所述关联分析单元用于,对聚类结果进行关联分析,得到关联分析结果,所述关联分析结果包括由堵塞引发公交脱班的相应知识,所述知识至少包括由堵塞引发公交脱班的前件;所述堵点脱班预测单元用于,根据所述知识进行预测,得到预测结果,所述预测结果包括发生堵塞的路段、由堵塞引发公交脱班的路段、由堵塞引发公交脱班的路段所影响的公交车辆,以及,由堵塞引发公交脱班的路段所影响的公交路线中的至少一个。一种智能公交系统,至少包括第一服务器和第二服务器,所述第一服务器、第二服务器通过网络数据交换设备相连接,其中所述第一服务器存储有公交线网的静态运营参数数据以及公交线网的动态运营参数的采样数据,所述静态运营参数至少包括公交线路发车间隔和到站名称;所述第二服务器用于执行上述预测方法中的步骤。可见,在本申请实施例提供的技术方案中,在本申请实施例提供的技术方案中,主要基于公交线网的动态运营参数的采样数据和静态运营参数数据,进行聚类分析和关联分析,并根据关联分析结果进行预测。由于公交线网的动态运营参数的采样数据是公交车辆在运行过程中实时实地的采样数据,属于非人为介入的客观数据,而静态运营参数数据也属于客观数据,因此,其在数据来源上首先保证了客观以及准确性。而在后续的步骤中,先以具有堵点脱班特征的公交运行轨迹段为中心进行聚类分析得到聚类结果,从而快速、高效得提取出与上述具有堵点脱班特征的公交运行轨迹段属于同一类的公交运行轨迹段。然后,对聚类结果进行关联分析,以期发现同一类轨迹段相关数据中频繁出现的数据关联,得到关联分析结果,并且,该关联分析结果中至少包括由堵塞引发公交脱班的前件。最后,可根据由堵塞引发公交脱班的前件进行预测,从而预测出发生堵塞的路段、由堵塞引发公交脱班的路段、由堵塞引发公交脱班的路段所影响的公交车辆,以及,由堵塞引发公交脱班的路段所影响的公交路线中的至少一个。也即,实现了对由堵塞引发公交脱班的预测。


为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I为本申请实施例提供的预测方法流程图;图2为本申请实施例提供的公交轨迹点示意图;图3为本申请实施例提供的公交轨迹点与r—t所标识路段的起始点O的沿道路中线的距离的示意图;图4为本申请实施例提供的预测方法另一流程图;
图5为本申请实施例提供的因堵点引发单一公交线路脱班示意图;图6为本申请实施例提供的不同路段发生堵点引发的脱班示意图;图7为本申请实施例提供的聚类分析具体流程图;图8为本申请实施例提供的预处理具体流程图;图9为本申请实施例提供的预处理另一具体流程图;图IOa为本申请实施例提供的某公交车辆全程平均行驶速度统计图;图IOb为本申请实施例提供的某公交车辆全程平均行驶速度半点统计图;图IOc为本申请实施例提供的某公交车辆路全程行驶时间统计图;图IOd为本申请实施例提供的某公交线路的路半点平均发车班次对照图;图Ila为本申请实施例提供的预测系统结构示意图;图Ilb为本申请实施例提供的预测系统另一结构示意图;图Ilc为本申请实施例提供的预测系统又一结构示意图;图Ild为本申请实施例提供的预测系统又一结构示意图;图12为本申请实施例提供的预测系统又一结构示意图;图13为本申请实施例提供的预测系统又一结构示意图;图14为本申请实施例提供的智能公交系统结构示意图。
具体实施例方式为了引用和清楚起见,下文中使用的技术名词、简写或缩写总结如下聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类分析的目标就是在相似的基础上收集数据来分类;关联分析从给定的数据集发现频繁出现的项集模式知识(又称为关联规则,association rules).两个或两个以上变量的取值之间存在某种规律性,就称为关联;前件前件又称条件部分、模式部分或左部(Left Hand Side,LHS),即触发的条件。前件与后件相对应。后件,又称右部(Right Hand Side,RHS),是规则触发时要执行的一系列行为;重复线网长度公交线网中不同公交线路中重复路段的长度;公交车通行流量某区域内选定时间的公交车通行量;RFID Radio Frequency Identification,射频识别。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请实施例所提供的预测方法可由智能公交系统的服务器执行,也可由第三方服务器执行。本申请下述实施例将以第三方服务器作为执行主体,对上述方法进行详细介绍。为区别起见,将智能公交系统的服务器称为源数据库服务器,将第三方服务器称为目标服务器。参见图1,上述预测方法至少包括S1-S6这六个步骤SI、至少获取公交线网的运营参数所对应的数据。上述“公交线网的运营参数所对应的数据”存储于源数据库中,可细分为“公交线网的静态运营参数数据”以及“公交线网的动态运营参数的采样数据”。 静态运营参数数据表明城市公交的一种拓扑形态,动态运营参数数据表明城市公交运行轨迹的演变。其中,静态运营参数至少可包括公交线路发车间隔和到站名称。此外,还可包括首末班时间、发车间隔、核算运营里程、到站名称、公交车辆通行流量和站点覆盖状况(某一选定区域内站点的数量、选区面积、站点有效覆盖面积、站点覆盖率)、线路站点信息、线网统计信息(某一选定区域内内线路网长度、道路网长度、重复线网长度、线网密度)等。上述静态运营参数在公交线网规划时通过调查方式获取。 至于动态运营参数,则至少包括公交车辆基础参数(公交线路标识、公交车辆标识bid及采样时刻标识t)、实际运营趟次、各运营趟次的实际到站名称、公交车辆的到站时间(进站时间)、公交车辆的行驶状态。而公交车辆的行驶状态至少包括经纬度,除了经纬度夕卜,其还可包括速度(或平均速度)、行驶方向dir等。当然,行驶状态中的速度(或平均速度)、行驶方向dir也可通过分析公交车辆经纬度的变化而得出。此外,上述动态运营参数还可包括公交车辆的出站时间、开关车门时间、各个运营趟次的实际未到站名称等。可由公交车上的GPS/GPRS模块对行驶状态数据进行采样,采样周期一般为3分钟,也即3分钟采集一次,而由公交车或站点的RFID设备对进出站时间数据、开关车门数据、实际运营趟次数据、各运营趟次的实际到站名称数据进行采集后传给公交车上的GPS/GPRS模块。GPS/GPRS模块以无线方式将数据发送至智能公交系统的控制中心/调度中心,最后存储于源数据库服务器中。需要说明的是,在获取上述“运营参数所对应的数据”时,以获取“公交线路首班时间”所对应的数据为例,假定某一公交线路的首班时间为6 :30,获取时可以仅获取6 30这一参数值,也可以参数和相关参数值一并获取。目标服务器可以年/季度/月/日为一期,将数据导出,最少导出一期数据,在导出时可进行必要的格式转换。S2、对上述运营参数所对应的数据进行预处理,从而确定出公交车辆的公交运行轨迹。上述公交运行轨迹由公交运行轨迹点构成。而公交运行轨迹点可由六元组(£ ΓΘ£ ν [A,Ii dk e B,bid,Rj- ^ g, dir, ) 识
在上述六元组中areav e A表示bid所标识公交车辆在t采样时刻的所在区域;Rj e E是一个集合,包括当前路段编号r—(也即bid所标识公交车辆在t采样时刻所在路段的编号)和相邻公交线路的上下游路段编号,所谓的相邻公交线路,是指以rcurrent为中心,方圆O. 2^0. 7公里内的公交线路,与Iramnt相邻的公交线路并不一定通过rcurrent所标识的路段;dir表示bid所标识公交车辆在t采样时刻的行驶方向; 114^是一个集合,包括所有通过上述1^_、与dir同方向的公交车辆所属的公交线路。以公交轨迹点(A,{4,5011,501-1, {rcurrent, rs, rj , up, 2011-11-02:17:30:55)为例,请参见图2 A与areav e A相对应,是具体的所在区域;{4,501}与Rj e E相对应,可知,4路和501路公交线路通过reiment所标识的路段;501-1与bid相对应,为公交车辆标识。更具体的,501-1所标识的公交车在501路公交线路上运营;up与dir相对应,表示行驶方向为上行方向(相应的,down表示下行方向)。由首站发往末站方向为下行,而由末站发往首站方向为上行;Ircurrent, rs, rj与Iidke B相对应,其中,rs表示所有通过r—的公交线路(也即4路和501路)的上游路段编号(与行驶方向同向为上游,反向为下游),rx表示所有通过
的公交线路(也即4路和501路)的下游路段编号,其中,下标S表示上游,下标X表示下游;2011-11-02:17:30:55与上述t相对应,是具体的采样时刻。除六元组后,在本申请其他实施例中,还可用五元组(lidkeB, bid, Rj e E, dir, t)、/HZI^IeL (£ !ΓΘ£ ν ε a,I i dk eB,L,bid,Rj ee,dir, )、y ( !Γθ£ ν e a,Ii eb,D,bid,Rj ^ g diir, )
标识公交运行轨迹点。参见图3,L表示公交运行轨迹点M所在的车道的编号,D表示上述公交运行轨迹点与r t所标识路段的起始点O的沿道路中线的距离,或者上述公交运行轨迹点与上述r t所属公交线路的起始点的沿道路中线的距离,本领域技术人员可根据需要进行灵活设置,在此不作赘述。在本申请一实施例中,上述六元组(areaveA, lidkeB, bid, Rj e E, dir, t)是以参考坐标系r t,1,D, t为基准的。当然,在其他实施例中,也可以建立rmt,I, t参考坐标系作为基准。如无特殊声明,下述将以六元组(areaveA, Iidke B, bid, Rj e E, dir, t)标识公交运行轨迹点,并且六元组是以参考坐标系r—,I, D, t为基准的。S3、以路段为最小单位对公交车辆的公交运行轨迹进行扫描,以扫描出具有堵点脱班特征的公交运行轨迹段(上述公交运行轨迹段至少包括两个公交运行轨迹点)。在进行打描时,可以选取某公交车辆作为观察对象,逐路段进行扫描。当观察对象全部的公交运行轨迹段均无堵点脱班特征时,选取其他任一公交车辆作为观察对象,逐路段扫描。此外,一辆公交车在一天中的实际运营趟次一般为多次。可优先选择高峰时段的运营趟次进行扫描。另外,也可对一些路线途经繁华地段的公交路线进行优选扫描,目的都是更快速得扫描出具有堵点脱班特征的公交运行轨迹段。S4、以上述具有堵点脱班特征的公交运行轨迹段为中心,对上述公交运行轨迹进行聚类分析,得到聚类结果。
上述聚类结果至少包括与具有堵点脱班特征的公交运行轨迹段属于同一类的公交运行轨迹段。需要说明的是,在本申请中,可以对所有区域、所有时段的公交运行轨迹进行聚类分析。当然,为了节省运算时间,在保证精确度的情况下,也可以选择一定的区域和时段,对落在选定区域、选定时段的公交运行轨迹进行聚类分析。上述全部或部分公交运行轨迹可视为公交运行轨迹集D。如无特殊声明,本申请下文的技术方案均是对公交运行轨迹集D中的公交运行轨迹进行聚类分析,乃至关联分析的。经过聚类分析后,至少可从公交运行轨迹集D中,找出与上述具有堵点脱班特征的公交运行轨迹段相类似的公交运行轨迹段,这些相类似的公交运行轨迹段聚在一起,形成具有堵点脱班特征的公交运行轨迹类(或者称为具有堵点脱班特征的公交运行轨迹子集),从而得到了聚类结果。S5、对聚类结果进行关联分析,得到关联分析结果。在得到具有堵点脱班特征的公交运行轨迹类后,对该类中所有公交运行轨迹段进行关联分析,以发现两个或两个以上变量的取值之间所存在的天然的规律性,从而得到关联分析结果。所得到的关联分析结果中,可包括由堵塞引发公交脱班的相应知识,而上述知识可至少包括由堵塞引发公交脱班的前件。在具体实现时,可基于六元组(areaveA, lidkeB, bid, Rj eE, dir, t)进行关联分析,以找到六元组中某一或某些参数与“由堵塞引发公交脱班”之间的关联性。例如可得到在某一时段某一区域内某一路段,公交运行某些状态,如速度、位移、保持低速、小位移的持续时间等的出现或变化,易出现堵点。S6、根据上述知识(关联分析结果)进行预测,得到预测结果。上述预测结果包括发生堵塞的路段、由堵塞引发公交脱班的路段、由堵塞引发公交脱班的路段所影响的公交车辆,以及,由堵塞引发公交脱班的路段所影响的公交路线中的至少一个。由上可知,在本申请实施例提供的技术方案中,主要基于公交线网的动态运营参数的采样数据和静态运营参数数据,进行聚类分析和关联分析,并根据关联分析结果进行预测。由于公交线网的动态运营参数的采样数据是公交车辆在运行过程中实时实地的采样数据,属于非人为介入的客观数据,而静态运营参数数据也属于客观数据,因此,其在数据来源上首先保证了客观以及准确性。而在后续的步骤中,先以具有堵点脱班特征的公交运行轨迹段为中心对上述客观数据进行聚类分析得到聚类结果,从而快速、高效得从海量客观数据中,将与具有堵点脱班特征的公交运行轨迹段属于同一类的公交运行轨迹段提取出来。然后,对聚类结果进行关联分析,以期发现同一类轨迹段相关数据中频繁出现的数据关联,得到关联分析结果,并且,该关联分析结果中至少包括由堵塞引发公交脱班的前件。最后,可根据由堵塞引发公交脱班的前件进行预测,从而预测出发生堵塞的路段、由堵塞引发公交脱班的路段、由堵塞引发公交脱班的路段所影响的公交车辆,以及,由堵塞引发公交脱班的路段所影响的公交路线中的至少一个。也即,实现了对由堵塞引发公交脱班的预测。需要说明的是,在进行关联分析时,除分析六元组中的参数外,还可分析其他参数与“由堵塞引发脱班”之间的关联性。例如,可分析静态运营参数中的公交线路发车间隔、首末班时间、核算运营里程、公交车辆通行流量、选定区域内站点的数量、站点有效覆盖面积、站点覆盖率、线路网长度、道路网长度、重复线网长度、线网密度等参数,与“由堵塞引发公交脱班”之间的关联性,以得到关联性结果。这些关联性结果可为公交资源优化提供支持,因此,可称之为“与公交资源优化相关的知识”(也即,前述的关联分析结果还可包括与公交资源优化相关的知识)。上述所谓的“公交资源优化”,至少可包括公交资源分配和公交资源调度中的至少一种。公交资源分配又可细化包括公交线路发车间隔分配、公交线路首末班时间分配、公交线路核算运营里程分配、站点分配、公交线路的取消/添加中的至少一个;而公交资源调度则至少包括公交运力调度。 因此,上述与公交资源优化相关(特别是与公交资源分配相关)的知识也可包括公交线路发车间隔分配与由堵塞引发公交脱班之间的关联性、公交线路首末班时间分配与由堵塞引发公交脱班之间的关联性、公交线路核算运营里程分配与由堵塞引发公交脱班之间的关联性、站点分配与由堵塞引发公交脱班之间的关联性、公交线路的取消/添加与由堵塞引发公交脱班之间的关联性。此外,前述的“由堵塞引发公交脱班的相应知识”或“由堵塞引发公交脱班的前件”,也可视为“与公交资源优化相关的知识”。这是因为,可根据“由堵塞引发公交脱班的相应知识”或“由堵塞引发公交脱班的前件”来生成调度预案(调度预案通常以IF. . . THEN的形式进行描述)。这样,当某一时段某一区域内某一路段,公交运行某些状态(如速度、位移、持续时间等)出现或发生变化时,可启动相应的调度预案对公交资源进行调度。例如,某4路公交线路在满足由堵塞引发公交脱班的前件下,预测该线路的某路段可能或已出现堵点,并且该堵点可能或已经造成公交车脱班,此时,启动相应的调度预案。当然,除调度预案外,也可以根据“与公交资源优化相关的知识”,基于实际情况进行紧急调度,在此不再赘述。在很多情况下,可供调度的公交资源是有限的,在多处路段均同时出现脱班现象时,可能会发生调度资源冲突。因此,在本申请其他实施例中,可按轻重缓急情况对公交资源予以调度,例如,可根据公交车脱班时间长短,发生堵点的路段/区域是否处于客流集散中心,发生脱班的站点的前、后站点所聚集客流的信息,以及公交运力现状等实际情况来进行调度。更具体的,可依据脱班持续时间的不同而分配不同的权重,依据发生堵点的路段/区域是否处于客流集散中心而分配不同的权重,依据发生脱班站点的前、后站点所聚集客流的不同而分配不同的权重。在进行调度时,根据各参数的权重,启动调度预案或进行紧急调度。另外,还可结合公交线路所属公交运营公司的站场空闲资源,至堵点距离,堵点权重,沿途站点所处区域类型(本文后续将对区域类型进行介绍)数据等,确定或变换调度线路(中途调运)、调度资源数,从而达到疏导沿线客流的目的。在调度时,可由调度中心发送调度指令至公交企业运营系统,上述调度指令可包括车辆标识、车牌号、调度内容、发送时间。然后,再由公交企业运营系统将调度指令发至指定车辆的车载控制系统。或者,可公交企业运营系统在收到调度中心的调度指令后,再根据该调度指令拟定符合公交企业运营系统要求的调度指令,再发至指定车辆的车载控制系统。综上,参见图4,上述预测方法还可包括如下步骤S7、根据关联分析结果,进行公交资源优化。上述“所聚集客流的信息”是通过站台客流传感器获取各站点聚集客流数据,再传送给智能公交系统的控制中心/调度中心,最后存储于源数据库服务器中的。因此,在本申请其他实施例中,上述所有实施例在执行步骤S7之前,还可先获取各站点聚集客流数据。
在本申请其他实施例中,还可使用关联分析结果,预测公交资源优化后的情况。比如,拟定了某公交资源优化方案,该优化方案中对公交线路发车间隔和公交线路首末班时间进行了更新分配。可代入不同的动态运营参数数据,利用关联分析结果来预测执行该公交资源优化方案后,在不同的动态运营参数数据下,可能发生堵塞的路段、出现脱班的路段、所影响的公交路线。从而观察上述公交资源优化方案是否合理。同理,也可使用关联分析结果,预测公交调度预案的合理性。下面,将对本申请的技术方案进行更详细的介绍。现先对提取“具有堵点脱班特征的公交运行轨迹段”,并以该轨迹段为中心进行聚类分析所遵循的客观自然规律,进行详细介绍。路段实际运营中,当公交线路的某一路段出现堵点时,其对前后路段的交通流基本参数(速度、路段通行时间占有率、路段流量等)将产生很大的影响。例如,当在某路段发生交通拥堵(也即出现堵点时),其前后路段的速度下降比较明显,路段通行时间占有率将出现较大的上升,路段流量也持续上升(可通过估计路段上公交车辆运行位置的变化来估计路段流量),并最终达到或超过路段的通行能力。参见图5,假设501路公交线路途经路段Rl、R2和R3,B1-B3为站点。当R2路段出现堵点时,公交车501-2在R2路段上,乃至R3路段上,将以低速率行驶(有时甚至是不动),并且,可能会因发生堵点,公交车501-2与公交车501-1到达同一站点B3的到站时间的时间间隔大于最大预设值,或者,公交车501-2到达站点B3的到站时间远晚于预计到站时间,从而发生脱班。由于R2路段上的堵点,公交车501-3至少在R2路段上也将以低速率行驶,如果堵点处聚集的车辆较多,造成整个R2路段上的公交车辆均无法行驶的话,可能会因堵点,公交车501-3与公交车501-2到达同一站点B2的时间间隔大于最大预设值,或者,公交车501-3到达站点B2的到站时间远晚于预计到站时间,从而发生脱班。由此可知,某一路段发生堵点,将可能造成该路段,或者其上、下游路段,或者该堵点的上下游站点发生脱班。请再参照图6,假设4路公交线路途经路段R4、R2和R6 ;而201路公交线路途经路段R5、R2和R7。可知,501路、4路和201路的重复路段为R2。那么,当Rl路段发生堵点时,公交车4-1和201-1并不会受到影响,只是公交车501-1在Rl路段,乃至R2-R3上,会因堵点而脱班。同理,当R4和/或R6路段发生堵点时,公交车501-1和201-1并不会受到影响,只是公交车4-1可能会因堵点而脱班。同理,当R5和/或R7路段发生堵点时,公交车4-1和501_1并不会受到影响,只是公交车201-1可能会因堵点而脱班。而如果R2路段发生堵点时,则公交车4-1、501_1和201_1均可能会因堵点而脱班。由此可知,由交通拥堵而引发脱班具有如下特点特点一,在发生脱班时,不同公交车到达同一站点的时间间隔大于或远大于两车·间的发车间隔,或者,同一公交车到达站点的到站时间远晚于预计到站时间。特点二,某一路段发生堵点,将可能造成本路段,或者上下游路段,或者该堵点上下游站点发生脱班(脱班的具体特点可参见特点一);特点三,当某一路段为多条公交线路的重复路段,并且该重复路段出现堵点时,将可能引发通过该重复路段的部分公交线路乃至全部公交线路发生脱班(脱班的具体特点可参见特点一);特点四,公交车至少在出现堵点的路段上以低速率行驶。基于上述特点,堵点脱班特征可包括堵点特征和脱班特征。而堵点特征又可包括单车行车不畅特征和/或路段行车不畅特征。也即,堵点脱班特征可包括堵点特征和单车行车不畅特征,或者包括堵点特征和路段行车不畅特征,或者同时包括堵点特征、单车行车不畅特征和路段行车不畅特征。其中基于上述特点一,脱班特征至少满足针对同一站点,上述bid所标识公交车辆的到站时间与前一公交车辆的到站时间的时间间隔至少应大于发车间隔或大于预设值(比如20分钟),当然,在其他实施例中,也可以设计成bid所标识公交车辆的实际到站时间与预计到站时间的时间间隔大于预设值,在此不作赘述。基于上述特点二和四,单车行车不畅(也即不存在重复路段时)至少满足span (areav e A, Iidk eB, bid, Rj e E, dir, T) ( Φ ;上述T表示时间窗,上述span( ·)表示公交车辆在时间窗内的行驶距离或者平均行驶速率,上述Φ表示预设行驶距离阈值或者预设平均行驶速率阈值,当span (areaveA, Iidk eB, bid, Rj e E, dir, T) ( Φ 时,表示在 relOTent 路段上,bid 所标识公交车辆以低速率行驶,如果rmt路段的相邻路段或就在rmt路段上发生脱班,则可认定该脱班是由发生交通拥堵而引发的。也即,设置一个时间窗T (例如T=20分钟),时间窗的取值需要保证至少令同一公交车辆的两个公交运行轨迹点落于该窗内,以公交运行轨迹的参考坐标为基准,记录bid所标识的公交车辆在时间窗T内、在Gurrait路段上的行驶距离或者平均行驶速率的变化,当其行驶距离或者平均行驶速率低于某一阈值时,可认定其以低速率行驶,并可能在上下游站点或路段上发生脱班。当bid所标识的公交车辆确实在其上下游路段或站点上发生脱班时,即可认定发生由堵塞引发公交脱班。基于上述特点三和四,路段行车不畅(也即重复路段发生堵点时)至少满足I span(areave A, lidkeB, bid, Rj e E, dir, T) < Φ | 彡 a ;
上述I span( ·) ( Φ |表示r—路段的路段行车不畅率。该路段行车不畅率由M/N决定,其中,M表示同一时间窗T内、通过rmt路段的发生单车行车不畅的所有公交车辆的数目,而N表示路段附近区域内所有公交车辆的数目。而α表示预设的路段行车不畅率阈值。附近区域定义并不统一,与公交行驶区域类型有关(繁华区、工业区或居民区),一般在O. 2^0. 7平方公里范围内。span (areav e A, Iidk eB, bid, Rj e E, dir, T)彡 φ| 彡 α 表明 rcurrent 路段出现的堵塞点,将引发若干公交线路发生公交脱班现象。另外,路段行车不畅特征也可用其他的方式表示。比如,除bid所标识公交车辆夕卜,其他在同一时间窗内通过Iramnt路段的公交车辆的运行轨迹具有单车行车不畅特征,同时,其他具有单车行车不畅特征的公交车辆在rcu mt路段或者路段的上、下游路段的运行轨迹具有脱班特征(也即发生脱班),则亦可表明rmt路段出现的堵塞点,将引发若干公交线路发生公交脱班现象。 当一轨迹段同时具有上述脱班特征和堵点特征时,则可认定公交车在该轨迹段所对应的路段上发生脱班,并且该脱班是由交通拥堵引发的。由此可知,本申请所提取的具有堵点脱班特征的公交运行轨迹段,是遵循了自然规律的。为加快扫描速度,针对某一观察对象,可先寻找,针对同一站点,本观察对象实际到站时间与前一公交车辆(该前一公交车辆与观察对象可在同一公交线路上运营,也可在不同的公交线路上运营)的到站时间的时间间隔是否大于预设值,如大于,则判定具有脱班特征,将发生脱班的站点简称为脱班站点。然后,再去寻找脱班站点所在路段或脱班站点所在路段的上下游路段是否存在堵点(也即具有上述堵点特征),若具有堵点特征,则判定该观察对象在脱班站点与堵点之间的运行轨迹具有堵点脱班特征,从而至少提取脱班站点与堵点之间的运行轨迹段作为具有堵点脱班特征的公交运行轨迹段。另外,还可结合拥挤流量、路段通行时间占有率和路段流量中的一个或几个来判断某轨迹段是否具有堵点脱班特征。在介绍完具有堵点脱班特征的公交运行轨迹段后,本文将介绍聚类分析。在面临海量数据时,使用聚类分析具有高效性。聚类分析所采用的算法主要分为四种基于划分的算法,例如K-mean算法,K-mediods法;基于层次的算法;基于密度的算法;以及,基于网格的算法。上述算法均可用于本申请中。现重点介绍K-mean算法。参见图7,采用K-mean算法进行聚类分析的具体流程如下S41、确定类别数,在本申请中,可确定两个类别(或称为两个簇)。具有堵点脱班特征的公交运行轨迹簇(简称簇A),以及,不具有堵点脱班特征的公交运行轨迹簇(简称簇B)。S42,将具有堵点脱班特征的公交运行轨迹段,作为簇A的初始中心;任选不具有堵点脱班特征的公交运行轨迹段,作为簇B的初始中心。S43、分别计算公交运行轨迹集D中公交运行轨迹段到两个簇的初始中心的相似度,将这些公交运行轨迹段分别划归到相似度最大的簇。在完成步骤S43后,公交运行轨迹集D中的所有公交运行轨迹段要么划归到簇A,要么划归到簇B。
S44,根据聚类结果,计算每一个簇的新中心。计算方法是取簇中所有元素各自维度的算术平均数。S45,判断每一个簇的新中心是否与其初始中心相同,如果是,则结束流程,否则,将新中心作为初始中心(S46 ),返回步骤S43。k-means算法与处理混合正态分布的最大期望算法很相似,即试图找到数据中自然聚类的中心。因此,采用K-Means算法进行聚类分析,可在聚类后找到待聚类轨迹段的自然聚类的中心。而需要说明的是,自然聚类的中心,是不以人的意志为转移的。现有技术在采用k-means算法进行聚类分析时,其初始中心是随机选择的。由于采用k-means算法得到的聚类结果的好坏直接取决于初始中心的选择,因此,现有技术在进行聚类分析时容易造成算法陷入局部最优解。而在本申请实施例中,明确选择具有堵点脱班特征的公交运行轨迹段作为初始中 中心进行聚类分析所得到的聚类结果,与自然聚类的结果相吻合。而上述步骤S43-S45,进一步保证了聚类结果与自然聚类的结果相吻合。这是因为,以堵点脱班特征包括堵点特征和单车行车不畅特征为例,在提取同时具有堵点特征和单车行车不畅特征的轨迹段作为初始中心,并以该初始中心进行聚类后,一些因抛锚而导致span (areav e A, Iidk eB, bid, Rj e E, dir, T) ^ Φ ,并导致脱班的公交运行轨迹段也因满足堵点脱班特征而被划归至簇A。但因抛锚等非交通拥堵原因而引发脱班,并被划归至簇A的公交轨迹段,在自然发生概率上属于小概率事件。因此,在步骤S43中,根据簇A中所有元素各自维度的算术平均数重新计算簇A的新中心后,与大概率出现的因交通拥堵而脱班的轨迹段相比,新中心与小概率出现的因非交通拥堵原因而引发脱班的公交轨迹段的距离将比较远。这样,在以新中心重新为初始中心,对公交运行轨迹集D中的公交运行轨迹段进行划归后,将能避免一部分因非交通拥堵原因而引发脱班的公交轨迹段划归至簇A。反复执行步骤S43至S46,可逐步减小因非交通拥堵原因而引发脱班的公交轨迹段划归至簇A的概率。当簇A计算出的新中心与前一次的初始中心相同时,因非交通拥堵原因而引发脱班的公交轨迹段划归至簇A中的概率已经变得非常小。此时,簇A的新中心与自然聚类的中心已经非常吻合了。由此亦可见,本申请实施例的聚类结果与自然聚类的结果非常吻合。需要指出的是,聚类分析、关联分析所基于的原始数据(即步骤SI获得的运营参数所对应的数据),可以是历史数据,也可以是实时数据,至于后续的预测、公交资源分配、调度预案的生成所基于的数据,可以是实时数据,也可以是实时数据。而公交资源的紧急调度所基于的数据,一般为实时数据。例如,可基于历史数据进行预处理、聚类分析以及关联分析,得到关联分析结果。然后,基于关联分析结果,进行公交资源分配,例如发车间隔分配,以形成稳定的发车间隔,使得客运能力的分布应与客流分布规律基本一致。或者,在基于历史数据得到关联分析结果后,利用该关联分析结果对实时数据进行在线预测,实时预测出可能发生堵塞的路段、发生脱班的路段、由堵塞引发公交脱班的路段所影响的公交车辆,以及,由堵塞引发公交脱班的路段所影响的公交路线等等。以便实时处理突发交通堵塞,通过调度(调点、安排机动车、临时拟定行车计划等),分散聚集客流。基于上述方案,还可扩展出其他技术方案,比如,可获取公交线网的实时动态运营参数以及公交线网的静态运营参数数据,对数据进行预处理后,得到公交车辆的实时运行轨迹,对其进行扫描提取出具有堵点脱班特征的公交运行轨迹段,并以其为中心进行聚类分析,所得到的聚类结果即是所有可能发生由堵塞引发公交脱班的轨迹段。根据轨迹段的数据确定其对应的路段、公交车辆、公交路线,即在线预测出了发生堵塞的路段、发生脱班的路段、受影响的公交车辆及公交路线。
前已述及,动态运营参数的采样数据采样周期一般为3分钟,一个城市可能有上百条公交线路,几千辆公交车,因此,一天之中,动态运营参数的采样数据就已经很庞大了,更不论及一月、一季或一年的数据了。因此,本文下述将介绍如何对海量数据进行预处理。前述“利用关联分析结果对实时数据进行在线预测”中的“实时数据”可不进行下述预处理。参见图8,上述预处理至少包括S21、对动态运营参数的采样数据进行清洗、抽取;由于噪音或RFID设备故障影响,使得GPS/GPRS模块会重复发送数据或没发送数据造成数据丢失。上述清洗主要包括滤除重复数据以及无关数据(无关数据主要指RFID设备采集的噪音数据),对丢失数据按规则进行补遗。上述规则主要包括公交线路的站点次序标识规则。例如,如果公交车途经某站点时,站点报站传感器或公交车传感器由于种种原因,没有通过GPS/GPRS模块向控制中心/调度中心发送到站数据、出站时间、开关车门时间中的至少一种,则可根据前后站次序标识规则对丢失的数据进行补遗。在对数据进行清洗后,动态运营参数的采样数据仍然很庞大。此可,可对数据按公交线路标识、公交车辆标识及采样时刻标识进行抽取。并且,对于不同区域、不同时段、不同公交路线,甚至不同路段的采样数据,可以以不同的预设抽取频率抽取。例如,对于2011-11-02:17:30:55、2011-11-02:17:33:55、2011-11-02:17:36:55、2011-11-02:17:39:55四个采样时刻所采集的数据,如以6分钟抽取一次的抽取频率进行抽取,可抽取到2011-11-02:17:30:55和2011-11-02:17:36:55这两个采样时刻采集的数
据,从而可对数据进行精简。上述预设抽取频率的取值由“影响抽取频率的参数”所对应的数据而确定,本文下述将结合分类汇总对抽取操作进行更详尽的描述。S22、将经抽取的动态运营参数的采样数据与静态运营参数数据相结合,进行分类汇总;更具体的,上述分类汇总包括按区域、公交线路标识对经抽取的动态运营参数的采样数据与静态运营参数数据进行滤除以及统计分类,得到基础数据集、描述公交车辆运行地理信息特征的GPS/GIS辅助数据集和公交运营动态数据集;有些公交线路可能途经多个不同的区域,在分类汇总时,也是按区域对该公交线路的动态运营参数采样数据进行统计分类。其中基础数据集至少包括用于确定城市的活动中心、客流集散中心和吸引中心的数据(譬如,城市总体规划数据、城市总体结构数据、城市交通走廊数据),以及,公交动态运营宏观特征数据。更具体的,活动中心一般为大型体育中心、影院等;客流中心一般为长途汽车站、火车站、换乘站等;吸引中心一般为商业服务中心。在公交车发生脱班时,可优先向活动中心、客流集散中心和吸引中心分配公交运力资源。而公交动态运营宏观特征数据与抽取频率有关,本文下述将进行介绍。GPS/GIS辅助数据集至少用于对公交车辆进行定位,对公交车辆途经的路段的经纬度、途经区域、途经站点的经纬度进行标注;GPS/GIS辅助数据集中的数据,由城市的GIS地图数据、公交车途径区域的经纬度数据(如经度“120. 123456”纬度“31. 123456”)转化而 来。GPS/GIS辅助数据集可对公交运行位置(经纬度)及位置变化提供定位技术,对公交所经历路段的经纬度及所处商圈,站点经纬度进行标注等。通过定位,可确定公交车辆当前所在区域(也即t时刻所在区域)的区域特征,以及各站点的位置特征。所谓的区域特征,主要是指区域类型。区域类型具体包括繁华商业区、一般商业区、工业区、居民区等等;所谓的站点位置特征,指站点经纬度信息、所在区域及所在区域的区域类型。当然,每一站点的位置特征也可作为静态运营参数数据而事先存储于源服务器中,这样可减少运算。公交运营动态数据集用于存储与公交运行轨迹相关的原始数据,至少包括公交车辆的经纬度和到站时间。此外,还可包括速度、开门时间、离站时间/关门时间等。S23、将经分类汇总的数据,转换成上述六元组(areave A, Iidk eB, bid, Rj e E,dir,t)。如以前述参考坐标系I, D, t为基准,参见图9,步骤S23可具体包括S231、结合基础数据集、GPS/GIS辅助数据集和公交运营动态数据集,建立参考坐
系 rcuri:ent,I,Dj ο可应用线性参考系统和道路分段技术建立上述参考坐标系。S232、基于 rcurrent, I, D, t 确定上述六元组(areave A, Iidke B, bid, Rj e E, dir, t)。现重点介绍公交动态运营宏观特征数据与抽取频率的关系。前已述及,预设抽取频率的取值由影响抽取频率的参数所对应的数据而确定。影响抽取频率的参数包括采样时刻、公交线路所在区域的区域类型中的至少一种。之所以将区域类型纳入影响抽取频率的参数,是因为,繁华商业区、一般商业区、工业区、居民区这几个区域的车流量和客流量是不同的,车流量、客流量较大,发生交通拥塞,并因此引发公交脱班的机率就越高。鉴于繁华商业区易发生交通拥塞而引发公交脱班,对该区域的采样数据的抽取频率一般应高于其他地区。这即是将区域类型纳入影响抽取频率的参数的原因。而之所以将采样时刻纳入影响抽取频率的参数,是因为,车辆和客流出行有高、平、低峰分布,而脱班多发生于车辆和客流出行的高峰时段,在平峰时段和低峰时刻则脱班现象发生较少。一般情况下,高峰时段的抽取频率要高于平峰和低峰,例如,高峰I次/3分钟,平峰I次/6分钟,低峰I次/10分钟。因此,在本申请其他实施例中,确定预设抽取频率的取值可具体包括
预先设定高、平、低峰时段所对应的抽取频率;根据采样时刻所处的时段,确定相应的抽取频率。当然,设定高、平、低峰时段所对应的抽取频率的前提是,确定一天中的高、平、低峰时段,而简单确定高、平、低峰时段的方法是按公交线路判断全程平均行驶速度。请参见图IOa或者图10b,如果,针对某一公交车辆,其路全程平均行驶速度或路全程平均行驶速度(半点)的最低谷处所对应的时段,一般为高峰时段。或者,也可按同一公交车辆在不同时段的路全程行驶时间判断,请参见图10c,路全程行驶时间的最高峰处所对应的时段,一般为高峰时段。图IOd还示出某公交线路的路半点平均发车班次对照图。同一公交线路的路半点平均发车班次可以与前述的路全程平均行驶速度、路全程平均行驶速度(半点)和路全程行驶时间中的一个或多个结合起来,来更为精确的确定高、平、低峰时段。
举例来讲,如果,在路全程平均行驶速度或路全程平均行驶速度(半点)的低谷所对应的时段上,路半点平均发车班次也较多,则可判定该时段为高峰时段。或者,在路全程行驶时间的峰值所对应的时段上,路半点平均发车班次也较多,则可判定该时段为高峰时段。或者,在路全程平均行驶速度或路全程平均行驶速度(半点)的低谷、路全程行驶时间的峰值、以及路半点平均发车班次峰值,对应同一时段,则可判定该时段为高峰时段。上述路全程平均行驶速度、路全程平均行驶速度(半点)、路全程行驶时间即属于公交动态运营宏观特征,因此,公交动态运营宏观特征可为抽取频率的取值提供客观理论基础。在进行数据抽取时,前一次所确定的公交动态运营宏观特征可用于决定本次的抽样频率的取值。由于城市公交网络的硬件、道路设施、软件等方面不断发生着变化,因此,公交动态运营宏观特征也随着发生变化。因此,可在每次进行分类汇总时,都根据所获得的数据来获取公交动态运营宏观特征。当然,不排除存在如下情况在高峰时段,由于路段出现堵点,导致该路段的路段流量持续上升,并最终超过路段的通行能力,以致,在路段中的公交车辆在20分钟、30分钟、乃至几小时内均无法前进一步。在这种情况下,对落在高峰时段的采样数据,反而不需要以I次/3分钟的频率进行抽取。在本申请其他实施例中,可基于前述的聚类结果,进行关联分析,得到抽取频率与其他参数(譬如高平低峰、区域类型)之间的关联性。并可根据关联程度由高到低对影响抽取频率的参数赋予不同的权重。在进行抽取时,依照权重确定抽取频率的取值。与之相对应,本发明还提供一种执行上述预测方法的预测系统,参见图11a,上述预测系统至少包括数据获取单元I、预处理单元2、预测分析单元3。参见图11b,上述预测分析单元又可包括扫描单元31、聚类单元32、关联分析单元33、堵点脱班预测单元34。其中数据获取单元I主要用于执行前述步骤SI,预处理单元2主要用于执行前述步骤S2,扫描单元31主要用于执行前述步骤S3,聚类单元32主要用于执行前述步骤S4,关联分析单元33主要用于执行前述步骤S5,堵点脱班预测单元34主要用于执行前述步骤S6。具体内容请参见本文前述方法的记载,在此不作赘述。
需要注意的是,参见图11c,上述预处理单元2可包括第一至第三预处理单元,其中第一预处理单元21,用于对动态运营参数的采样数据进行清洗、抽取;第二预处理单元22,用于将经抽取的动态运营参数的采样数据与静态运营参数数据相结合,进行分类汇总;第三预处理单元23,用于将经分类汇总的数据,转换成前述的六元组(areav e A, Iidk e B, bid, Rj e E, dir, t)。具体内容请参见本文前述方法中图8至图IOd所对应的记载,在此不作赘述。 需要指出的是,本申请在前文还述及,在按区域、公交线路标识对经抽取的动态运营参数的采样数据与静态运营参数数据进行滤除以及统计分类后,可得到基础数据集、描 述公交车辆运行地理信息特征的GPS/GIS辅助数据集和公交运营动态数据集。参见图lld,上述三数据集可分别由基础数据存储单元41、GPS/GIS辅助数据存储单元42和公交运营动态数据存储单元43进行存储。在本申请其他实施例中,参见图12,上述预测系统还可包括公交资源优化单元5,公交资源优化单元5可用于根据关联分析结果,进行公交资源优化。具体内容请参见本文前述方法的记载,在此不作赘述。上述预测系统可内置于前述的源数据库服务器,也可内置于目标服务器中。除此之外,预测系统中的各个单元还可作为独立的物理实体或逻辑模块分散存在于多个设备/装置中,由这多个设备/装置进行分工协作。例如,上述数据获取单元I可属于某一网络交换设备(例如路由器、三层交换机、二层交换机等具备数据包转发功能的设备),上述预处理单元2可属于某一服务器或网关,上述预处理单元3和存储单元41-43可属于另一服务器,而公交资源优化单元5可属于其他服务器。或者,参见图13,上述数据获取单元I属于网络交换设备1301,而其他单元属于某一服务器1302,也可同样进行分工协作,进行预测。本领域技术人员可根据需要对上述各单元的归属进行灵活设置,在此不作赘述。此外,本申请还提供一种智能公交系统,该智能公交系统集成了现有智能公交系统的功能,并至少可预测由交通堵塞引起的公交脱班。本申请欲保护的智能公交系统的一种具体结构如图14所示,可至少包括第一服务器1401、第二服务器1402。第一服务器1401、第二服务器1402通过网络数据交换设备1403相连接,其中第一服务器1401存储有公交线网的静态运营参数数据以及公交线网的动态运营参数的采样数据,静态运营参数至少包括公交线路发车间隔和到站名称。第一服务器1401相当于前述的源数据库服务器。第二服务器1402用于执行前述的预测方法。在本发明其他实施例中,网络交换设备1403还可接入GPS/GPRS网络。GPS/GPRS网络包括集全球卫星定位系统(GPS)、地理信息系统(GIS)以及GPRS无线通信技术于一体的软、硬件综合系统及互联网络。前述提及,车载GPS/GPRS模块以无线方式所发送的进出站时间数据、开关车门数据、实际运营趟次数据、各运营趟次的实际到站名称数据、数据、行驶状态数据即可通过GPS/GPRS网络进行发送,由网络交换设备1403转给第一服务器1401。网络交换设备1403,具体可以是路由器、三层交换机、二层交换机等具备数据包转发功能的设备。通过该网络交换设备,第一服务器1401和/或第二服务器1402可获取各种数据,例如公交动态运营数据、GPS定位数据、GIS数据等。更具体的,网络交换设备1403可通过光纤端口或集线器与第一服务器1401相连接,第一服务器1401开启相应的一个数据通道端口。与之相类似,网络交换设备1403亦可通过光纤端口或集线器与第二服务器1402相连接,第一服务器1402开启相应的一个数据通道端口。第二服务器1402的具体结构可参照前述图Ila至图13的结构,在此不作赘述。而第一服务器1401呢,除用于实时公交运营数据存储、静态基础数据存储外,还可用于GIS数据存储及查询分析。此外,第一服务器1401和第二服务器1402的功能可完全相同,这样,第一服务器1401和第二服务器1402可互为备用,当某一服务器发生故障时,可由另一服务器执行工作。
·
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
权利要求
1.一种预测方法,其特征在于,至少用于预测由交通堵塞引起的公交脱班,所述方法包括 至少获取公交线网的运营参数所对应的数据,所述运营参数所对应的数据包括公交线网的静态运营参数数据以及公交线网的动态运营参数的采样数据,所述静态运营参数至少包括公交线路发车间隔和到站名称; 对所述运营参数所对应的数据进行预处理,从而确定出公交车辆的公交运行轨迹,所述公交运行轨迹由公交运行轨迹点构成; 以路段为最小单位对公交车辆的公交运行轨迹进行扫描,以扫描出具有堵点脱班特征的公交运行轨迹段,所述具有堵点脱班特征的公交运行轨迹段至少包括两个公交运行轨迹占. 以所述具有堵点脱班特征的公交运行轨迹段为中心,对所述公交运行轨迹进行聚类分析,得到聚类结果,所述聚类结果包括与所述具有堵点脱班特征的公交运行轨迹段属于同一类的公交运行轨迹段; 对聚类结果进行关联分析,得到关联分析结果,所述关联分析结果包括由堵塞引发公交脱班的相应知识,所述知识至少包括由堵塞引发公交脱班的前件; 根据所述知识进行预测,得到预测结果,所述预测结果包括发生堵塞的路段、由堵塞引发公交脱班的路段、由堵塞引发公交脱班的路段所影响的公交车辆,以及,由堵塞引发公交脱班的路段所影响的公交路线中的至少一个。
2.如权利要求I所述的方法,其特征在于 所述关联分析结果还包括与公交资源优化相关的知识; 所述公交资源优化至少包括公交资源分配和公交资源调度,其中,所述公交资源分配包括公交线路发车间隔分配、公交线路首末班时间分配、公交线路核算运营里程分配、站点分配、公交线路的取消/添加中的至少一个,所述公交资源调度至少包括公交运力调度;所述与公交资源优化相关的知识,包括公交线路发车间隔分配与由堵塞引发公交脱班之间的关联性、公交线路首末班时间分配与由堵塞引发公交脱班之间的关联性、公交线路核算运营里程分配与由堵塞引发公交脱班之间的关联性、站点分配与由堵塞引发公交脱班之间的关联性、公交线路的取消/添加与由堵塞引发公交脱班之间的关联性; 所述方法还包括根据关联分析结果,进行公交资源优化。
3.如权利要求I或2所述的方法,其特征在于 所述动态运营参数至少包括公交车辆基础参数、实际运营趟次、各运营趟次的实际到站名称、公交车辆的到站时间、公交车辆的行驶状态,所述基础参数包括公交线路标识、公交车辆标识bid及采样时刻标识t,所述公交车辆的行驶状态至少包括所在经纬度; 所述公交运行轨迹点由六元组(areav e A, Iidk e B, bid, Rj e E, dir, t)标识; 所述areav e A表示所述bid所标识公交车辆在t采样时刻的所在区域; 所述& e E是一个集合,包括当前路段编号Iramnt和相邻公交线路的上下游路段编号,所述Hsm为所述bid所标识公交车辆在t采样时刻所在路段的编号; 所述dir表示所述bid所标识公交车辆在t采样时刻的行驶方向; 所述lidkeB是一个集合,包括所有通过所述r—、与所述dir同方向的公交车辆所属的公交线路的集合。
4.如权利要求3所述的方法,其特征在于 所述堵点脱班特征包括堵点特征和脱班特征; 所述堵点特征包括单车行车不畅特征和/或路段行车不畅特征; 所述脱班特征至少包括,针对同一站点,所述bid所标识公交车辆的到站时间与前一公交车辆的到站时间的时间间隔大于所述发车间隔; 所述单车行车不畅满足 span(areaveA, lidkeB, bid, Rj eE, dir, T) ≤Φ ;所述路段行车不畅满足 I span(areaveA, lidkeB, bid, Rj eE, dir, T) ≤Φ I ≥a ; 所述T表示时间窗,所述span( ·)表示公交车辆在时间窗内的行驶距离或者平均行驶速率,所述Φ表示预设行驶距离阈值或者预设平均行驶速率阈值; 所述I span ( ·) ≤Φ I表示所述!"—,所标识路段的路段行车不畅率,所述路段行车不畅率由M/N决定,所述M表示同一时间窗T内、通过Iramnt路段的所有发生单车行车不畅的公交车辆的数目,所述N表示所述Iramnt所标识路段附近区域内所有公交车辆数目N ;所述α表示预设的路段行车不畅率阈值。
5.如权利要求3所述的方法,其特征在于,所述预处理至少包括 对所述动态运营参数的采样数据进行清洗、抽取; 将经抽取的动态运营参数的采样数据与静态运营参数数据相结合,进行分类汇总; 将经分类汇总的数据,转换成所述六元组(areaveA, Iidk eB, bid, Rj e E, dir, t)。
6.如权利要求5所述的方法,其特征在于,所述六元组(areav e A, lidkeB, bid, Rj e E, dir, t)以参考坐标系rcu ent,I, D, t为基准,所述I表示公交运行轨迹点所在的车道的编号,所述D表示所述公交运行轨迹点与所述rmt所标识路段的起始点的沿道路中线的距离,或者所述公交运行轨迹点与所述r t所属公交线路的起始点的沿道路中线的距离。
7.如权利要求5或6所述的方法,其特征在于,所述抽取包括按公交线路标识、公交车辆标识及采样时刻标识,以预设抽取频率抽取所述动态运营参数的采样数据,所述预设抽取频率的取值由影响抽取频率的参数所对应的数据而确定; 所述影响抽取频率的参数包括采样时刻、公交线路所在区域的区域类型中的至少一种;所述区域类型包括繁华商业区、工业区、居民区中的至少一种。
8.如权利要求7所述的方法,其特征在于, 确定所述预设抽取频率的取值具体包括 设定高、平、低峰时段所对应的抽取频率; 根据所述采样时刻所处的时段,确定相应的抽取频率。
9.如权利要求6所述的方法,其特征在于, 所述分类汇总包括 按区域、公交线路标识对经抽取的动态运营参数的采样数据与静态运营参数数据进行滤除以及统计分类,得到基础数据集、描述公交车辆运行地理信息特征的GPS/GIS辅助数据集和公交运营动态数据集; 所述基础数据集至少包括用于确定城市的主要活动中心、客流集散中心和吸引中心的数据,以及,公交动态运营宏观特征数据; 所述GPS/GIS辅助数据集至少用于对公交车辆进行定位,对公交车辆途经的路段的经纬度、途经区域、途经站点的经纬度进行标注; 所述公交运营动态数据集用于存储与公交运行轨迹相关的原始数据,至少包括公交车辆的经纬度和到站时间; 所述将经分类汇总的数据,转换成所述六元组(areaveA, Iidk eB, bid, Rj e E, dir, t)具体包括 结合基础数据集、GPS/GIS辅助数据集和公交运营动态数据集,建立所述参考坐标系rcurrent, I, D, t,并基于所述 rciment, I, D, t 确定所述六元组(areav e A, Iidk e B, bid, Rj e E, dir, t)。
10.一种预测系统,其特征在于,至少用于预测由交通堵塞引起的公交脱班,所述系统包括数据获取单元、预处理单元、预测分析单元,所述预测分析单元包括扫描单元、聚类单元、关联分析单元、堵点脱班预测单元,其中 所述数据获取单元用于,至少获取公交线网的运营参数所对应的数据,所述运营参数所对应的数据包括公交线网的静态运营参数数据以及公交线网的动态运营参数的采样数据,所述静态运营参数至少包括公交线路发车间隔和到站名称; 所述预处理单元用于,对所述运营参数所对应的数据进行预处理,从而确定出公交车辆的公交运行轨迹,所述公交运行轨迹由公交运行轨迹点构成; 所述扫描单元用于,以路段为最小单位对公交车辆的公交运行轨迹进行扫描,以扫描出具有堵点脱班特征的公交运行轨迹段,所述具有堵点脱班特征的公交运行轨迹段至少包括两个公交运行轨迹点; 所述聚类单元用于,以所述具有堵点脱班特征的公交运行轨迹段为中心,对所述公交运行轨迹进行聚类分析,得到聚类结果,所述聚类结果包括与所述具有堵点脱班特征的公交运行轨迹段属于同一类的公交运行轨迹段; 所述关联分析单元用于,对聚类结果进行关联分析,得到关联分析结果,所述关联分析结果包括由堵塞引发公交脱班的相应知识,所述知识至少包括由堵塞引发公交脱班的前件; 所述堵点脱班预测单元用于,根据所述知识进行预测,得到预测结果,所述预测结果包括发生堵塞的路段、由堵塞引发公交脱班的路段、由堵塞引发公交脱班的路段所影响的公交车辆,以及,由堵塞引发公交脱班的路段所影响的公交路线中的至少一个。
11.如权利要求10所述的预测系统,其特征在于,还包括 公交资源优化单元,用于根据关联分析结果,进行公交资源优化; 所述公交资源优化至少包括公交资源分配和公交资源调度,其中,所述公交资源分配包括公交线路发车间隔分配、公交线路首末班时间分配、公交线路核算运营里程分配、站点分配、公交线路的取消/添加中的至少一个,所述公交资源调度至少包括公交运力调度;所述关联分析结果还包括与公交资源优化相关的知识; 所述与公交资源优化相关的知识包括公交线路发车间隔分配与由堵塞引发公交脱班之间的关联性、公交线路首末班时间分配与由堵塞引发公交脱班之间的关联性、公交线路核算运营里程分配与由堵塞引发公交脱班之间的关联性、站点分配与由堵塞引发公交脱班之间的关联性、公交线路的取消/添加与由堵塞引发公交脱班之间的关联性。
12.—种智能公交系统,其特征在于,至少包括第一服务器和第二服务器,所述第一服务器、第二服务器通过网络数据交换设备相连接,其中所述第一服务器存储有公交线网的静态运营参数数据以及公交线网的动态运 营参数的采样数据,所述静态运营参数至少包括公交线路发车间隔和到站名称; 所述第二服务器用于执行如权利要求1-9任一项所述的预测方法中的步骤。
全文摘要
本发明提供一种预测方法和系统,以解决现有人工蹲点方式存在的错误率高、误差大,以及很难对由堵点引发的脱班进行预测的问题。上述预测方法至少以公交线网的静态运营参数数据以及公交线网的动态运营参数的采样数据作为数据来源,在数据来源上保证了客观和准确;在后续的步骤中,上述预测方法以具有堵点脱班特征的公交运行轨迹段为中心进行聚类,提取出与具有堵点脱班特征的公交运行轨迹段属于同一类的公交运行轨迹段,对其进行关联分析,以至少获得由堵塞引发的公交脱班的前件。最后,根据上述前件预测出发生堵塞的路段、由堵塞引发的脱班的路段、所影响的公交车辆,以及,所影响的公交路线中的至少一个,从而实现了对由堵塞引发公交脱班的预测。
文档编号G08G1/00GK102842219SQ20121031232
公开日2012年12月26日 申请日期2012年8月29日 优先权日2012年8月29日
发明者张宏斌, 葛娟, 常宇春, 张书奎 申请人:苏州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1