一种基于轨道IC卡和手机信令数据的轨道交通客流预测方法与流程

文档序号:11708180阅读:303来源:国知局
一种基于轨道IC卡和手机信令数据的轨道交通客流预测方法与流程

本发明属于数据分析技术领域,特别是轨道交通运行领域,涉及一种基于轨道ic卡和手机信令数据的轨道交通客流预测方法。



背景技术:

进入21世纪,随着我国城市化水平的不断,城市人口密度将迅速加大,由此产生的交通拥堵问题也会越来越严峻,这将成为制约经济、社会、文化发展的重要因素之一。城市轨道交通作为公共交通的重要组成部分,将成为解决城市交通拥堵的有效交通方式。由于轨道交通具有节能、省地、运量大、全天候、准点、无污染又安全等特点,可以得出这样的结论:城市轨道交通的发展安全符合可持续发展原则。因此未来很长一段时间将会是城市轨道交通蓬勃发展的黄金时期。据资料显示,到2016年底我国运营轨道交通的城市达到26个,运行总里程3748.67公里。其中上海运营城市轨道交通(包括城市地铁和轻轨,下同)总长达到617公里,已成为目前世界上运营轨道交通线路最长的城市。北京运营了554公里,广州运营了308公里,都进入了世界运营轨道交通最长的城市行列。现在,轨道交通已经成为许多城市中不可或缺的、最主要的交通工具。根据远期规划,到2020年全国城市轨道交通总里程将达到6100公里,其中北京市城市轨道交通的总里程将超过1000公里,公共交通将成为80%左右市民的主要出行交通工具,其中有50%左右的人将经常使用城市轨道交通作为出行工具。

城市轨道交通作为城市公益性设施,影响着城市空间结构的发展模式与全局规划,城市轨道交通建设是周期长、涉及面广的综合系统。其中,城市轨道交通客流预测作为该系统的投资决策基础,不仅能衡量建设项目经济成本,而且是预测建设项目投入运营后经济效益的关键指标。客流预测过程也是将先进的通信技术与信息技术相融合的过程。

随着客流量的逐年递增,虽然城市轨道交通网络不断的扩大和完善,但依然难以实现供需平衡。在工作日早、晚高峰时段及重大节假日期间,客流过饱和状态成为城市轨道交通运营中的常态现象。对轨道交通客流进行科学而准确的预测,使得合理编制运力配置方案、客流组织方案以及突发事件的预警与疏散方案成为可能,从而能够充分的利用城市中已有的轨道交通资源。

客流预测决定了城市轨道交通系统中所有设计和要素的选择,比如:通行能力的大小,轨道布局的方式,列车型号的选择,信号控制和工程造价等,甚至是运营后的收益和服务效率。客流预测结果的精确度在建设科学高效的城市轨道交通系统中起着非常重要的作用。



技术实现要素:

有鉴于此,本发明的目的在于提供一种基于轨道ic卡和手机信令数据的轨道交通客流预测方法,该方法先对预处理数据做od匹配;对匹配好的od数据进行通勤识别;对轨道交通客流进行统计;对客流统计结果进行分析;最后根据客流统计结果与结果分析进行客流预测。该方法为轨道交通相关决策者对轨道交通的合理布局提供参考,有助于达到客流量与列车的供需平衡。

为达到上述目的,本发明提供如下技术方案:

一种基于轨道ic卡和手机信令数据的轨道交通客流预测方法,该方法包括以下步骤:

s1:采集轨道交通乘客ic卡数据信息,原始数据经过切分整理后成为预处理数据,对预处理数据进行od匹配;

s2:通勤识别,输入多个工作日的数据,按用户进行分组,判断多个工作日中每个用户的通勤规律:当该用户相同进站站点与出站站点天数达到总天数的50%(可配置),即可判断该出行为该用户为通勤出行;

s3:对轨道交通客流进行统计,统计指标包括:站点客流,线路客流,断面客流,换乘客流,客流od,通勤站点客流,通勤线路客流,通勤站点od客流,通勤线路od客流;

s4:客流分析:分为常态客流量分析与节假日客流量分析;

s5:客流预测:分为常态客流量预测与节假日客流量预测。

进一步,在步骤s1中,对所述预处理数据进行od匹配,主要以时间序列为主,对每个用户分别按时间进行先后排序,结合进出站标识来确定用户的每对od;在匹配过程中对异常数据进行处理,具体包括:

1)剔除只有进站记录或只有出站记录的数据;

2)进出站标识与时间序列相反,将根据出站记录中的上次进站时间信息进行修正匹配,如果修正不了则剔除;

3)多次进站一次出站或一次进站多次出站,将进出站按最接近时间进行匹配(只需要将时间最接近的两条数据匹配到一起即可);

4)进进出出的情况,即单个用户经过时间排序后连续两次进站连续两次出站的情况;根据出站记录中的上次进站时间信息进行修正匹配,如果修正不了则剔除该情况的四条数据;

5)对于每天凌晨0点前后的数据要结合后一天的数据进行匹配,如果仍然匹配不上则剔除;

6)剔除匹配后同站进同站出的od;匹配成功的数据须作为中间结果输出。

进一步,在步骤s3中,具体包括:

1)站点客流统计:统计各个站点进出站客流量(按进出站时间字段统计即可):

按半小时统计输出结构为:站点名称varchar;时间date(半小时的开始时间);进站客流number;出站客流number;

按天统计输出结构为:站点名称varchar;时间date(天);进站客流number;出站客流number;

2)线路客流:统计各条轨道线路客流量,根据用户路径来统计,如果一个用户的某次出行路径经过了1号线、2号线、3号线,那么1号线客流+1、2号线客流+1、3号线客流+1;

按半小时统计输出结构为:线路编号varchar;时间date(半小时的开始时间);线路客流number;

按天统计输出结构为:线路编号varchar;时间date(天);线路客流number;

3)断面客流:分方向统计轨道线网断面客流量(相邻站点间的流量);计算方法,如计算观音桥-华新街断面流量,就要在最终路径中找出所有经过观音桥-华新街断面的人,然后再求和。

按半小时统计输出结构为:站点名称avarchar;站点名称bvarchar;时间date(半小时的开始时间);线路客流number;

按天统计输出结构为:站点名称avarchar;站点名称bvarchar;时间date(天)线路客流number;

4)换乘客流:统计换乘站点及线路换乘客流量,注意换乘站点有1个或者多个编号(现在一般是2个编号),根据路径去检索当路径中出现换乘站点的编号,且换乘站点相邻前后两个站点编号对应的站点不在一条线路上,即记为换乘客流;

按半小时统计输出结构为:换乘站点名称varchar;换乘站点编号varchar;线路avarchar;线路bvarchar;时间date(半小时的开始时间);换乘客流number;

按天统计输出结构为:换乘站点名称varchar;换乘站点编号varchar;线路avarchar;线路bvarchar;时间date(天);换乘客流number;

5)客流od:

1、统计各站点od客流

按半小时统计输出结构为:ovarchar(站点名称);dvarchar(站点名称);时间date(半小时的开始时间);od客流number;

按天统计输出结构为:ovarchar(站点名称);dvarchar(站点名称);时间date(天);od客流number;

2、统计各线路od客流

按半小时统计输出结构为:olinevarchar;dlinevarchar;时间date(半小时的开始时间);od客流number

按天统计输出结构为:olinevarchar;dlinevarchar;时间date(天);od客流number;

6)通勤客流:

1、通勤站点客流

按半小时统计输出结构为:站点名称varchar;时间date(半小时的开始时间);进站客流number;出站客流number;

按天统计输出结构为:站点名称varchar;时间date(天);进站客流number;出站客流number;

2、通勤线路客流

按半小时统计输出结构为:线路编号varchar;时间date(半小时的开始时间);线路客流number;

按天统计输出结构为:线路编号varchar;时间date(天);线路客流number;

3、通勤站点od客流

按半小时统计输出结构为:ovarchar(站点名称);dvarchar(站点名称);时间date(半小时的开始时间);od客流number;

按天统计输出结构为:ovarchar(站点名称);dvarchar(站点名称);时间date(天);od客流number;

4、通勤线路od客流

按半小时统计输出结构为:olinevarchar;dlinevarchar;时间date(半小时的开始时间);od客流number。

按天统计输出结构为:olinevarchar;dlinevarchar;时间date(天);od客流number。

进一步,在步骤s4中,具体包括:

1)为了更好的分析平常日地铁客流的变化趋势,选取20个完整周140天的日进站客流量分析变化规律,常态客流变化波动是有规律的,即以周为周期上下波动变化的;为了更准确的分析常态客流的变化规律,在此基础上选取了以周为对象进行具体分析;

2)节假日客流量分析包括:春节客流量统计分析;劳动节客流量统计分析;中秋节与国庆节客流量统计分析;圣诞节和元旦客流量统计分析。

进一步,在步骤s5中,具体包括:

1)常态客流量预测:城市轨道交通系统是一个有人参与的主观能动系统,根据对常态客流的统计分析,城市轨道交通常态客流具有不均衡性、非线性和时变性等特征;对于传统的线性模型近似拟合这种非线性系统,可简化计算量,但是预测结果却大相径庭。基于此考虑到bp神经网络风险性映射能力极强、模型预测精度较高的特点,选用bp神经网络对轨道交通常态客流进行预测;

2)节假日客流量预测:非参数回归模型的本质是:模型不由先验知识而是由历史数据决定的,“非参数”并不代表无参数,而是参数形式及数目可变。该模型中回归函数不受变量的分布关系的影响,且充分利用了所有保存的可能状态信息,当有重大事件发生或者状态不稳定时,该预测模型的精确度较高。因此选用非参数回归模型对节假日客流量进行预测。

本发明的有益效果在于:本发明考虑到节假日对轨道交通客流量的影响,建立了常态客流量预测模型与节假日客流量预测模型,能够更为准确地预测轨道交通的客流量,对合理编制运力配置方案、客流组织方案等有重要作用。

附图说明

为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:

图1为od匹配算法流程图;

图2为客流统计内容框图;

图3为bp神经网络算法流程框图

图4为非参数回归模型框图;

图5为本发明所述方法的流程示意图。

具体实施方式

下面将结合附图,对本发明的优选实施例进行详细的描述。

图5为本发明所述方法的流程示意图,如图所示,本发明提供的方法包括以下步骤:

s1:采集轨道交通乘客ic卡数据信息,原始数据经过切分整理后成为预处理数据,对预处理数据进行od匹配;

s2:通勤识别,输入多个工作日的数据,按用户进行分组,判断多个工作日中每个用户的通勤规律:当该用户相同进站站点与出站站点天数达到总天数的50%(可配置),即可判断该出行为该用户为通勤出行;

s3:对轨道交通客流进行统计,统计指标包括:站点客流,线路客流,断面客流,换乘客流,客流od,通勤站点客流,通勤线路客流,通勤站点od客流,通勤线路od客流;

s4:客流分析:分为常态客流量分析与节假日客流量分析;

s5:客流预测:分为常态客流量预测与节假日客流量预测。

具体来说:

在步骤s1中,对所述预处理数据进行od匹配,主要以时间序列为主,对每个用户分别按时间进行先后排序,结合进出站标识来确定用户的每对od;在匹配过程中对异常数据进行处理,如图1所示,具体包括:

1)剔除只有进站记录或只有出站记录的数据;

2)进出站标识与时间序列相反,将根据出站记录中的上次进站时间信息进行修正匹配,如果修正不了则剔除;

3)多次进站一次出站或一次进站多次出站,将进出站按最接近时间进行匹配(只需要将时间最接近的两条数据匹配到一起即可);

4)进进出出的情况,即单个用户经过时间排序后连续两次进站连续两次出站的情况;根据出站记录中的上次进站时间信息进行修正匹配,如果修正不了则剔除该情况的四条数据;

5)对于每天凌晨0点前后的数据要结合后一天的数据进行匹配,如果仍然匹配不上则剔除;

6)剔除匹配后同站进同站出的od;匹配成功的数据须作为中间结果输出。

图2为客流统计内容框图,在步骤s3中,具体包括:

1)站点客流统计:统计各个站点进出站客流量(按进出站时间字段统计即可):

按半小时统计输出结构为:站点名称varchar;时间date(半小时的开始时间);进站客流number;出站客流number;

按天统计输出结构为:站点名称varchar;时间date(天);进站客流number;出站客流number;

2)线路客流:统计各条轨道线路客流量,根据用户路径来统计,如果一个用户的某次出行路径经过了1号线、2号线、3号线,那么1号线客流+1、2号线客流+1、3号线客流+1;

按半小时统计输出结构为:线路编号varchar;时间date(半小时的开始时间);线路客流number;

按天统计输出结构为:线路编号varchar;时间date(天);线路客流number;

3)断面客流:分方向统计轨道线网断面客流量(相邻站点间的流量);计算方法,如计算观音桥-华新街断面流量,就要在最终路径中找出所有经过观音桥-华新街断面的人,然后再求和。

按半小时统计输出结构为:站点名称avarchar;站点名称bvarchar;时间date(半小时的开始时间);线路客流number;

按天统计输出结构为:站点名称avarchar;站点名称bvarchar;时间date(天)线路客流number;

4)换乘客流:统计换乘站点及线路换乘客流量,注意换乘站点有1个或者多个编号(现在一般是2个编号),根据路径去检索当路径中出现换乘站点的编号,且换乘站点相邻前后两个站点编号对应的站点不在一条线路上,即记为换乘客流;

按半小时统计输出结构为:换乘站点名称varchar;换乘站点编号varchar;线路avarchar;线路bvarchar;时间date(半小时的开始时间);换乘客流number;

按天统计输出结构为:换乘站点名称varchar;换乘站点编号varchar;线路avarchar;线路bvarchar;时间date(天);换乘客流number;

5)客流od:

1、统计各站点od客流

按半小时统计输出结构为:ovarchar(站点名称);dvarchar(站点名称);时间date(半小时的开始时间);od客流number;

按天统计输出结构为:ovarchar(站点名称);dvarchar(站点名称);时间date(天);od客流number;

2、统计各线路od客流

按半小时统计输出结构为:olinevarchar;dlinevarchar;时间date(半小时的开始时间);od客流number

按天统计输出结构为:olinevarchar;dlinevarchar;时间date(天);od客流number;

6)通勤客流:

1、通勤站点客流

按半小时统计输出结构为:站点名称varchar;时间date(半小时的开始时间);进站客流number;出站客流number;

按天统计输出结构为:站点名称varchar;时间date(天);进站客流number;出站客流number;

2、通勤线路客流

按半小时统计输出结构为:线路编号varchar;时间date(半小时的开始时间);线路客流number;

按天统计输出结构为:线路编号varchar;时间date(天);线路客流number;

3、通勤站点od客流

按半小时统计输出结构为:ovarchar(站点名称);dvarchar(站点名称);时间date(半小时的开始时间);od客流number;

按天统计输出结构为:ovarchar(站点名称);dvarchar(站点名称);时间date(天);od客流number;

4、通勤线路od客流

按半小时统计输出结构为:olinevarchar;dlinevarchar;时间date(半小时的开始时间);od客流number。

按天统计输出结构为:olinevarchar;dlinevarchar;时间date(天);od客流number。

在步骤s4中,具体包括:

1)为了更好的分析平常日地铁客流的变化趋势,选取20个完整周140天的日进站客流量分析变化规律,常态客流变化波动是有规律的,即以周为周期上下波动变化的;为了更准确的分析常态客流的变化规律,在此基础上选取了以周为对象进行具体分析;

2)节假日客流量分析包括:春节客流量统计分析;劳动节客流量统计分析;中秋节与国庆节客流量统计分析;圣诞节和元旦客流量统计分析。

在步骤s5中,具体包括:

1)常态客流量预测:城市轨道交通系统是一个有人参与的主观能动系统,根据对常态客流的统计分析,城市轨道交通常态客流具有不均衡性、非线性和时变性等特征;对于传统的线性模型近似拟合这种非线性系统,可简化计算量,但是预测结果却大相径庭。基于此考虑到bp神经网络风险性映射能力极强、模型预测精度较高的特点,选用bp神经网络对轨道交通常态客流进行预测,如图3所示;

2)节假日客流量预测:非参数回归模型的本质是:模型不由先验知识而是由历史数据决定的,“非参数”并不代表无参数,而是参数形式及数目可变。该模型中回归函数不受变量的分布关系的影响,且充分利用了所有保存的可能状态信息,当有重大事件发生或者状态不稳定时,该预测模型的精确度较高。因此选用非参数回归模型对节假日客流量进行预测,如图4所示。

最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1