一种城市轨道交通客流高峰持续时间预测方法

文档序号:6546880阅读:238来源:国知局
一种城市轨道交通客流高峰持续时间预测方法
【专利摘要】本发明公开了一种城市轨道交通客流高峰持续时间预测方法,包括以下步骤:首先选择足够样本量的历史客流数据,然后对原始数据进行处理,处理过程包括流量统计、高峰时间计算、数据清洗、数据区间分类,接着建立关联客流高峰事件属性集,接着计算每一个区间的客流高峰事件的概率分布,再使用贝叶斯分类的方法确定属性分类界限,最后对每一类客流高峰事件建立时间序列模型,并对方法的有效性进行检验。本发明可用于预测城市轨道交通常发和突发的客流高峰事件的持续时间,为轨道交通企业的客流高峰管理提供数据支持,能缓解通行能力浪费和服务水平降低的矛盾,跟随轨道交通客流的变化。
【专利说明】一种城市轨道交通客流高峰持续时间预测方法
【技术领域】
[0001]本发明涉及一种城市轨道交通客流高峰持续时间预测方法,属于城市轨道交通智能化技术。
【背景技术】
[0002]随着我国各大中城市新线的不断建成和投入使用、轨道网络的逐渐形成,城市轨道交通在城市发展和人民日常工作生活中发挥着越来越重要的作用,城市公共交通的轨道化程度已成为一个城市现代化的重要标志之一。而我国的城市轨道交通事业发展还处于初期,运营管理水平还比较低,尤其在轨道交通客流高峰事件管理方面还比较欠缺,主要依靠管理人员主观经验,缺少必要的理论支持,存在不能及时反应客流需求变化、通行能力浪费和服务水平低相矛盾的问题。
[0003]目前,国内外在交通事件持续时间预测方面已经做了一定的研究,这些事件持续时间预测技术之间彼此差异较大,它们使用不同的数据源,不同的变量,不同的样本大小和各种不相同的预测技术。这些预测方法包括:基于统计的预测方法,回归分析,决策树模型,模糊逻辑法,生存分析等。基于统计的方法是统计交通事件持续时间的均值、方差,将事件持续时间值作为随机变量并分析是否满足某一概率密度函数,拟合后可以做出基于概率的事件持续时间预测;回归分析一般是提取交通事件的重要影响因素进行多元线性回归或者多项式回归;决策树模型通过历史交通事件持续时间及其影响因素数据的样本进行大量的模式训练,确定每种模式划分以及每种模式下交通事件持续时间的最大、最小值、平均值及预测置信区间的上下限值;生存分析模型是用来描述关于从一个明确定义的时间原点直到某个特定事件发生的时间节点之间的时间的数据的分析方法,这种方法也经常用于预测交通事件的结束时间。但这些现有成果的研究对象主要是针对道路交通事件的持续时间,鲜有关于客流事件持续时间的研究。
[0004]对于我国城市轨道交通而言,轨道线网建设还未成熟完善,客流模式还处于发展之中。由于城市人口密度大,选择轨道交通出行的乘客迅速增加,高峰时段拥挤时有发生。因此,为合理的节省企业资源和提高运营的管理水平迫切需要一种简单迅速、准确性高,同时又能跟随轨道交通客流模式发展变化的城市轨道交通客流高峰持续时间预测方法。

【发明内容】

[0005]发明目的:为了克服现有技术中轨道交通运营对于客流高峰管理的不足,本发明提供一种城市轨道交通客流高峰持续时间预测方法,该方法使用贝叶斯分类方法对客流进行分类,并结合时间序列模型提高客流高峰持续时间预测的准确性。
[0006]技术方案:为实现上述目的,本发明采用的技术方案为:
[0007]一种城市轨道交通客流高峰持续时间预测方法,包括如下步骤:
[0008](I)客流统计:设定单位时间Λ t,按单位时间Λ t对时间进行分段;对历史客流数据,统计各个单位时间段内的全线进站流量,将统计数据分为两个集合,分别为训练集和测试集;
[0009](2)高峰时间计算:对所有单位时间段内的全线进站流量的统计结果由低到高进行排序,取85%分位点的全线进站流量作为高峰阈值Qt ;当连续5个单位时间段的全线进站流量高于Qt时,则确定首次全线进站流量高于Qt的单位时间段开始时刻出现客流高峰;在出现客流高峰后,若连续5个单位时间段内有两个单位时间段的全线进站流量低于Qt时,则确定第二次全线进站流量低于Qt的单位时间段开始时刻退出客流高峰;客流高峰持续时间Td为出现客流高峰和退出客流高峰的差值,对所有训练集和测试集计算客流高峰持续时间;
[0010](3)建立客流高峰事件属性集:根据数据库信息(包括客流数据、事故、施工、天气等信息数据),对客流高峰事件建立对应的属性集;
[0011](4)训练数据处理:对训练集数据进行清洗,剔除明显的孤立点;设定最小的客流高峰持续时间STdMIN,最大的客流高峰持续时间STdm,按一定的间隔宽度将[TdMIN,Tdm]划分为连续的区间[T祖N, Y1) '[Y1, Y2) > — [ Y c-!, Yc) , Y c-1<TdMAX ≤Y。,按时间长度由短至长,对区间进行依次编号为1,2,…,C ;将所有训练集数据中客流高峰持续时间落在同一区间内的客流高峰事件归为一类;
[0012](5)确定属性分类界限 :对每一类客流高峰事件分析属性集的概率分布,建立客流高峰事件的损失函数,使用贝叶斯分类器方法确定属性分类界限;
[0013](6)建立时间序列预测模型:对训练集客流高峰事件按照步骤(5)所得的属性分类界限进行重新分类;重新分类后,同一类客流高峰事件按发生的时间依次排序,对于每一类客流高峰事件建立时间序列预测模型;
[0014](7)预测方法检验:使用测试集数据对步骤(6)得到的时间序列预测模型进行检验:若未能通过检验,则回到步骤(4)重新设置区间的时间长度;若通过检验,则确定所建立的时间序列预测模型是有效的,可以用于实际轨道交通运营管理。
[0015]具体的,所述步骤(1)中,历史客流数据需要有足够的样本量,能够反映尽量多的规律,减少样本不足带来的随机误差;一般训练集数据应选择一年或两年的客流数据。
[0016]具体的,所述步骤(3)中的属性集,其元素以向量形式表示,每个客流高峰事件对应一个多维属性向量,各属性以数值形式表示,属性包括平均线路全日进站客流量、线路站点数量、季节、是否工作日、是否节假日、天气、是否施工、有无大型活动、是否发生事故等。
[0017]具体的,所述步骤(5)中,贝叶斯分类器采用基于最小风险的贝叶斯决策方法,根据各城市不同的要求确定损失函数的参数,从而平衡企业资源的浪费和服务质量的下降。
[0018]更为具体的,所述步骤(5)中,对于某一客流高峰事件,设对其做决策所属的区间编号为i,其实际所属的区间编号为j,i, j = 1,2,…,c,损失函数分为两段:当i≥j时,损失主要来源于多余运能、管理、人员调度的造成的直接浪费,呈线性关系;当i〈j时,站台拥挤度增加,损失主要来源与服务质量的下降,呈指数增加。
[0019]具体的,所述步骤(6)中,时间序列预测模型是在贝叶斯分类的基础上对每一类事件建立单独的预测模型,将分类预测和趋势预测相结合,以挖掘客流模式的发展趋势。
[0020]具体的,所述步骤(7)中,检验采用平均绝对百分比误差(MAPE)法,当测试集数据实际值与预测值的平均绝对百分比误差值在允许的范围内时(如〈30% ),则认为方法是可行的。[0021] 有益效果:本发明提供的城市轨道交通客流高峰持续时间预测方法,其优点在于:通过分类的方法进行预测,使用过程简单快捷,能实时迅速的得到预测结果为客流高峰管理提供决策支持;通过选择合适的损失函数参数可以有效的平衡企业经济效益和企业社会形象;在贝叶斯分类的基础上结合时间序列模型可以使预测结果更好的符合当地轨道交通客流模式的发展趋势,进一步提高预测的精确度。
【专利附图】

【附图说明】
[0022]图1为本发明的方法操作流程示意图;
[0023]图2为本发明的建模及模型训练步骤示意图。
【具体实施方式】
[0024]下面结合附图对本发明作更进一步的说明。
[0025]如图1所示为一种城市轨道交通客流高峰持续时间预测方法,下面结合实施例对本发明做出进一步的说明。
[0026]Step 1、客流统计
[0027]设定单位时间Δ t = Imin,按单位时间Δ t对时间进行分段;选取一条线路连续两年的历史客流数据,统计各个单位时间段内的全线进站流量,将统计数据分为两个集合,第一年的数据作为训练集,第二年的数据作为测试集。
[0028]Step2、高峰时间计算
[0029]对所有单位时间段内的全线进站流量的统计结果由低到高进行排序,取85%分位点的全线进站流量作为高峰阈值Qt ;当连续5个单位时间段(即连续5min)的全线进站流量高于Qt时,则确定首次全线进站流量高于Qt的单位时间段开始时刻出现客流高峰;在出现客流高峰后,若连续5个单位时间段内有两个单位时间段(即5min内有2min)的全线进站流量低于Qt时,则确定第二次全线进站流量低于Qt的单位时间段开始时刻退出客流高峰;客流高峰持续时间Td为出现客流高峰和退出客流高峰的差值,对所有训练集和测试集计算客流高峰持续时间。
[0030]St印3、建立客流高峰事件属性集
[0031]根据数据库信息,对客流高峰事件建立对应的属性集;属性包括平均线路全日进站客流量、线路站点数量、季节、是否工作日、是否节假日、天气、是否施工、有无大型活动、是否发生事故等;各个属性以数值的形式表示,例如季节用[1,2,3,4]分别表示[春,夏,秋,冬]四个季节;属性集中的元素以向量形式表示,每个客流高峰事件对应一个d维属性向量文= [.U2,...V,]
[0032]St印4、训练数据处理
[0033]对训练集数据进行清洗,剔除明显的孤立点;针对本案,孤立点的判定方法是:在以一个客流高峰事件的持续时间为中心,半径为IOmin的时间段内搜索其他客流高峰事件,若搜索到的高峰客流事件数量不大于2,则将该客流高峰事件视为孤立点。
[0034]设定最小的客流高峰持续时间TdMIN = 5min,最大的客流高峰持续时间为TdMAX,按IOmin的间隔宽度将[T_,TdMAX]划分为连续的区间[5min, 15min)、[15min, 25min)、…,当最后一个区间长度不足时按时间长度IOmin向后延长,对区间进行依次编号为l,2^“,c;将所有训练集数据中客流高峰持续时间落在同一区间内的客流高峰事件归为一类。
[0035]St印5、确定属性分类界限
[0036]对每一类客流高峰事件分析属性集的概率分布,建立客流高峰事件的损失函数,采用基于最小风险的贝叶斯决策方法确定属性分类界限,要求所有的决策活动使得期望风险R最小,对于属性向量作决策Vi,其期望风险R为:
[0037]
【权利要求】
1.一种城市轨道交通客流高峰持续时间预测方法,其特征在于:包括如下步骤: (1)客流统计:设定单位时间At,按单位时间At对时间进行分段;对历史客流数据,统计各个单位时间段内的全线进站流量,将统计数据分为两个集合,分别为训练集和测试集; (2)高峰时间计算:对所有单位时间段内的全线进站流量的统计结果由低到高进行排序,取85%分位点的全线进站流量作为高峰阈值Qt ;当连续5个单位时间段的全线进站流量高于Qt时,则确定首次全线进站流量高于Qt的单位时间段开始时刻出现客流高峰;在出现客流高峰后,若连续5个单位时间段内有两个单位时间段的全线进站流量低于Qt时,则确定第二次全线进站流量低于Qt的单位时间段开始时刻退出客流高峰;客流高峰持续时间Td为出现客流高峰和退出客流高峰的差值,对所有训练集和测试集计算客流高峰持续时间; (3)建立客流高峰事件属性集:根据数据库信息,对客流高峰事件建立对应的属性集; (4)训练数据 处理:对训练集数据进行清洗,剔除明显的孤立点;设定最小的客流高峰持续时间为TdMIN,最大的客流高峰持续时间为Tdm,按一定的间隔宽度将[TdMIN,Tdm]划分为连续的区间[TdMIN, Y1), [ 1; Y2) >...[ Yc_!, yc), Yc-1<TdMAX ^ Y。,按时间长度由短至长,对区间进行依次编号为1,2,…,c ;将所有训练集数据中客流高峰持续时间落在同一区间内的客流高峰事件归为一类; (5)确定属性分类界限:对每一类客流高峰事件分析属性集的概率分布,建立客流高峰事件的损失函数,使用贝叶斯分类器方法确定属性分类界限; (6)建立时间序列预测模型:对训练集客流高峰事件按照步骤(5)所得的属性分类界限进行重新分类;重新分类后,同一类客流高峰事件按发生的时间依次排序,对于每一类客流高峰事件建立时间序列预测模型; (7)预测方法检验:使用测试集数据对步骤(6)得到的时间序列预测模型进行检验:若未能通过检验,则回到步骤(4)重新设置区间的时间长度;若通过检验,则确定所建立的时间序列预测模型是有效的。
2.根据权利要求1所述的城市轨道交通客流高峰持续时间预测方法,其特征在于:所述步骤(3)中的属性集,其元素以向量形式表示,每个客流高峰事件对应一个多维属性向量,各属性以数值形式表示,属性包括平均线路全日进站客流量、线路站点数量、季节、是否工作日、是否节假日、天气、是否施工、有无大型活动、是否发生事故。
3.根据权利要求1所述的城市轨道交通客流高峰持续时间预测方法,其特征在于:所述步骤(5)中,贝叶斯分类器采用基于最小风险的贝叶斯决策方法,根据各城市不同的要求确定损失函数的参数,从而平衡企业资源的浪费和服务质量的下降。
4.根据权利要求3所述的城市轨道交通客流高峰持续时间预测方法,其特征在于:所述步骤(5)中,对于某一客流高峰事件,设对其做决策所属的区间编号为i,其实际所属的区间编号为j,i,j = 1,2,…,c,损失函数分为两段:当i≥j时,损失主要来源于多余运能、管理、人员调度的造成的直接浪费,呈线性关系;当i〈j时,站台拥挤度增加,损失主要来源与服务质量的下降,呈指数增加。
【文档编号】G06Q10/04GK103984994SQ201410211258
【公开日】2014年8月13日 申请日期:2014年5月19日 优先权日:2014年5月19日
【发明者】张宁, 石庄彬, 何铁军 申请人:东南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1