地铁客流的预测方法及系统与流程

文档序号:19420717发布日期:2019-12-14 01:24阅读:905来源:国知局
地铁客流的预测方法及系统与流程
本发明涉及数据处理
技术领域
,特别涉及一种地铁客流的预测方法及系统。
背景技术
:随着城市的快速发展,人们在城市生活中的活动范围越来越大,地铁系统在城市交通中也扮演着越来越重要的角色。随之产生的大量的交通卡数据,为分析地铁网络提供了数据驱动的方法,利用记录的不同时刻的乘客进站和出站时间信息,研究人员可以更好地了解地铁运营的一些模式和现象;其中,主要包括预测客流、发现站点功能、发现乘客出行特征等。但是,由于地铁网络越来越复杂,也使得对于地铁的相关研究变得更加困难。例如:某地铁线a的a站点发生事件(如:恶劣天气、因车门夹物、牵引故障等),该事件不仅只是对相邻站点或沿线的站点产生影响,还会在整个地铁网络中传播产生影响,使得其他线路的站点(不一定有位置上的关系,如b线b站点、c号线c站点等)的站点客流也受到影响。而现有技术中,对某站点的客流进行预测时,仅考虑相邻、或该站点所在的沿线站点的历史客流数据;在某条地铁线的某站点发生事件时,仅仅考虑对相邻、或该站点所在的沿线站点产生的影响,来预测下一时间段的相邻或沿线站点的客流走势变化;例如:当遇到恶劣天气或某站点发生事故时,不能合理且有效地分析出当前站点与整个地铁网络结构中的其他每个站点产生的影响,合理预测每个站点的客流的走势变化,进而决定是否需要实施“加空”或“载客通过”等决策,因而不能为地铁运营管理提供有用的参考信息。技术实现要素:本发明要解决的技术问题是为了克服现有技术中存在对某站点的客流进行预测时,仅考虑相邻、或该站点所在的沿线站点的历史客流数据,且在发生事件后,仅仅考虑对相邻、或该站点所在的沿线站点产生的影响,而不能合理地根据整个地铁网络中的各个站点的历史客流情况预测各个站点在下一时间段的客流情况;且在发生事件后,不能考虑当前站点对整个地铁网络结构中的其他每个站点产生的影响,不能合理预测每个站点的客流的走势变化等缺陷,目的在于提供一种地铁客流的预测方法及系统。本发明是通过下述技术方案来解决上述技术问题:本发明提供一种地铁客流的预测方法,所述预测方法包括:s1、获取地铁网络中每个站点在不同时间段内的交通卡数据;s2、根据所述交通卡数据,获取每个所述站点在不同时间段内的历史客流数据;s3、根据所述历史客流数据,获取客流特征数据;其中,所述客流特征数据是指每个设定时间段内的客流数据;s4、根据所述客流特征数据,获取与每个所述设定时间段对应的历史客流图像;其中,所述历史客流图像用于表征每个所述设定时间段内每个所述站点的进站情况和出站情况;s5、采用卷积神经网络算法对所述历史客流图像进行处理,获取第一客流预测模型;s6、根据所述第一客流预测模型,获取每个所述站点在下一时间段内的第一客流预测结果。较佳地,步骤s6之后还包括:s7、获取所述地铁网络中每个站点在所述设定时间段内和当前时间段内的事件数据;其中,所述事件数据包括事故数据、天气数据和日期数据中的至少一种;s8、将所述第一客流预测结果和所述事件数据进行处理,获取每个所述站点在下一时间段内的第二客流预测结果。较佳地,步骤s5具体包括:采用卷积神经网络算法和残差神经网络算法对所述历史客流图像进行处理,获取第一客流预测模型。较佳地,步骤s8具体包括:s81、采用lda(一种文档主题生成模型)对所述事故数据进行处理,获取事故向量;采用one-hot方法(一种数据处理方法)对所述天气数据进行处理,获取天气向量;确定所述日期数据为工作日或非工作日,并获取对应的日期向量;s82、将所述事故向量、所述天气向量和所述日期向量进行结合处理,获取事件向量;s83、采用全连接神经网络算法对所述事件向量进行转换处理,获取事件矩阵;s84、将所述第一客流预测结果和所述事件矩阵进行处理,获取每个所述站点在下一时间段内的第二客流预测结果;其中,获取所述第二客流预测结果的公式如下:表示所述第二客流预测结果,xpf表示第一客流预测结果,xinc表示事件矩阵。较佳地,所述历史客流图像的宽度方向表示所述地铁网络中的每个进站站点;所述历史客流图像的高度方向表示所述地铁网络中的每个出站站点;所述历史客流图像中每个像素点的数值为每个所述设定时间段内每个进出站点对的历史客流数据;其中,所述进出站点对表示所述进站站点和与所述进站站点对应的所述出站站点。本发明还提供一种地铁客流的预测系统,所述预测方法系统包括交通卡获取模块、客流数据获取模块、客流特征获取模块、客流图像获取模块、预测模型获取模块和第一结果获取模块;所述交通卡获取模块用于获取地铁网络中每个站点在不同时间段内的交通卡数据;所述客流数据获取模块用于根据所述交通卡数据,获取每个所述站点在不同时间段内的历史客流数据;所述客流特征获取模块用于根据所述历史客流数据,获取客流特征数据;其中,所述客流特征数据是指每个设定时间段内的客流数据;所述客流图像获取模块用于根据所述客流特征数据,获取与每个所述设定时间段对应的历史客流图像;其中,所述历史客流图像用于表征每个所述设定时间段内每个所述站点的进站情况和出站情况;所述预测模型获取模块用于采用卷积神经网络算法对所述历史客流图像进行处理,获取第一客流预测模型;所述第一结果获取模块用于根据所述第一客流预测模型,获取每个所述站点在下一时间段内的第一客流预测结果。较佳地,所述预测方法系统还包括事件数据获取模块和第二结果获取模块;所述事件数据获取模块用于获取所述地铁网络中每个站点在所述设定时间段内和当前时间段内的事件数据;其中,所述事件数据包括事故数据、天气数据和日期数据中的至少一种;所述第二结果获取模块用于将所述第一客流预测结果和所述事件数据进行处理,获取每个所述站点在下一时间段内的第二客流预测结果。较佳地,所述预测模型获取模块用于采用卷积神经网络算法和残差神经网络算法对所述历史客流图像进行处理,获取第一客流预测模型。较佳地,所述第二结果获取模块包括事故向量获取单元、天气向量获取单元、日期向量获取单元、事件获取单元、事件矩阵获取单元和预测结果获取单元;所述事故向量获取单元用于采用lda对所述事故数据进行处理,获取事故向量;所述天气向量获取单元用于采用one-hot方法对所述天气数据进行处理,获取天气向量;所述日期向量获取单元用于确定所述日期数据为工作日或非工作日,并获取对应的日期向量;所述事件获取单元用于将所述事故向量、所述天气向量和所述日期向量进行结合处理,获取事件向量;所述事件矩阵获取单元用于采用全连接神经网络算法对所述事件向量进行转换处理,获取事件矩阵;所述预测结果获取单元用于将所述第一客流预测结果和所述事件矩阵进行处理,获取每个所述站点在下一时间段内的第二客流预测结果;其中,获取所述第二客流预测结果的公式如下:表示所述第二客流预测结果,xpf表示第一客流预测结果,xinc表示事件矩阵。较佳地,所述历史客流图像的宽度方向表示所述地铁网络中的每个进站站点;所述历史客流图像的高度方向表示所述地铁网络中的每个出站站点;所述历史客流图像中每个像素点的数值为每个所述设定时间段内每个进出站点对的历史客流数据;其中,所述进出站点对表示所述进站站点和与所述进站站点对应的所述出站站点。本发明的积极进步效果在于:本发明中,根据整个地铁网络的每个站点的交通卡数据,获取每个站点的历史客流数据和历史客流图像,并采用卷积神经网络和残差神经网络向相结合对历史客流图像进行处理,得到下一时间段的第一客流预测结果;同时,将每个站点发生的事件与第一客流预测结果进行合并处理,得到下一时间段的第二客流预测结果,即考虑了每个站点发生的事件对地铁网络中每个站点的影响,更符合实际场景,合理地预测各个站点的客流走势变化,从而为在事件影响下的地铁客流组织的应急处理提供大数据方法支撑,为地铁运营管理提供有用的参考信息。附图说明图1为本发明实施例1的地铁客流的预测方法的流程图;图2为本发明实施例2的地铁客流的预测方法的流程图;图3为本发明实施例3的地铁客流的预测系统的结构示意图;图4为本发明实施例4的地铁客流的预测系统的结构示意图。具体实施方式下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。实施例1如图1所示,本实施例的地铁客流的预测方法包括:s101、获取地铁网络中每个站点在不同时间段内的交通卡数据;具体地,在对地铁网络中在换乘站点不进行重复计数的情况下(如某两条地铁线路上都包括站点a,则将站点a视为地铁网络中的一个站点)。s102、根据交通卡数据,获取每个站点在不同时间段内的历史客流数据;历史客流数据用{xt|t=0,…,n-1}表示,t代表不同时间段,xt表示历史客流数据,n表示整数。其中,通过每隔相同时间段获取一次整个地铁网络中n个站点的乘客流动情况,从而得到整个地铁网络中n个站点在一天当中的各个时间段的乘客流动情况。在时间段的选取上,一方面考虑到数据稀疏性,因此时间段不能过小,另一方面选取的时间段不能过大,否则会使事件影响性表现不明显,因此,结合实际情况的客流数据,一般选取的时间段为15分钟,即每天(24小时)会有96张图像来表示整个地铁网络每15分钟的各个站点的乘客流动情况。s103、根据历史客流数据,获取客流特征数据;其中,客流特征数据是指每个设定时间段内的客流数据;客流特征数据包括隔时段特征数据、隔天特征数据和隔周特征数据(即设定时间段包括隔时段、隔天和隔周),如要预测当前时间段(周四9:00am)下一个时间段(9:00-9:15am)的客流情况,则需要考虑上两个时间段(8:30-8:45am和8:45-9:00am)对应的客流数据,前两天(周二9:00am和周三9:00am)对应的客流数据,以及前一周(上一周9:00am)对应的客流数据。s104、根据客流特征数据,获取与每个设定时间段对应的历史客流图像;其中,历史客流图像用于表征每个设定时间段内每个站点的进站情况和出站情况;假设地铁网络中包括n个站点,可以利用n×n型矩阵组成的图像来表示每个时段内地铁网络中n个站点的乘客流动情况。此处,每个设定时间段对应的历史客流图像,即表示每个设定时间段内地铁网络中n个站点的乘客流动情况。s105、采用cnn(卷积神经网络算法)对历史客流图像进行处理,获取第一客流预测模型;s106、根据第一客流预测模型,获取每个站点在下一时间段内的第一客流预测结果。本实施例中,根据整个地铁网络的每个站点的交通卡数据,获取每个站点的历史客流数据和历史客流图像,并采用卷积神经网络对历史客流图像进行处理,得到下一时间段的第一客流预测结果,即通过考虑地铁网络中每个站点的历史客流数据来预测下一时间段的地铁网络中每个站点的客流情况,更符合实际场景,从而为在事件影响下的地铁客流组织的应急处理提供大数据方法支撑,为地铁运营管理提供有用的参考信息。实施例2如图2所示,本实施例在实施例1的基础上作进一步改进,具体地:历史客流图像的宽度方向表示地铁网络中的每个进站站点;历史客流图像的高度方向表示地铁网络中的每个出站站点;历史客流图像中每个像素点的数值为每个设定时间段内每个进出站点对的历史客流数据;其中,进出站点对表示进站站点和与进站站点对应的出站站点。步骤s105具体包括:s1051、采用卷积神经网络算法和残差神经网络算法对历史客流图像进行处理,获取第一客流预测模型。具体地,由于各个站点之间的距离有很大区别,需要足够的深度卷积层来发现远距离的站点之间的关系;但是,单独采用卷积神经网络算法对历史客流图像进行处理,当卷积层数过深时得到的预测模型的预测结果会变差,所以,这里引入残差神经网络算法,使得随着卷积层数的增加,在保证了发现远距离的站点之间的关系的同时,得到的预测模型的预测结果也不会变差。步骤s106之后还包括:s107、获取地铁网络中每个站点在设定时间段内和当前时间段内的事件数据;其中,事件数据包括事故数据、天气数据和日期数据中的至少一种;s108、将第一客流预测结果和事件数据进行处理,获取每个站点在下一时间段内的第二客流预测结果。其中,步骤s108具体包括:s1081、采用lda对事故数据进行处理,获取事故向量;事故数据对应的事故细节内容字段属于文字描述,需要采用lda将文字转换为向量形式,然后结合其它维度的离散特征可以得到事故数据的向量形式,记为accident=(c1,c2,…,cm)。ci(i=1,2…,m,m为正整数)表示事故数据的不同维度的离散特征。采用one-hot方法对天气数据进行处理,获取天气向量;采用one-hot方法将天气数据对应的天气情况的描述内容转换为向量形式,然后结合其它维度的离散特征可以得到天气数据的向量形式,记为weather=(e1,e2,…,em)。ei(i=1,2…,m,m为正整数)表示天气数据的不同维度的离散特征。确定日期数据为工作日或非工作日,并获取对应的日期向量;由于在工作日和非工作日时,客流情况具有明显的区别,需要额外添加特征进行标注区分,记为workday=0/1。s1082、将事故向量、天气向量和日期向量进行结合处理,获取事件向量;具体地,当前时间段的事件向量表示公式如下:incident1=(accident0,accident1,weather0,weather1,workday1)其中,incident1表示当前时间段的事件向量,accident0,weather0表示上一时间段的事故与天气的情况,accident1,weather1表示当前时间段的事故与天气的情况,workday1表示当前时间段对应的日期情况。s1083、采用全连接神经网络算法对事件向量进行转换处理,获取事件矩阵;利用一个两层的全连接神经网络将incident1转换为与xt大小一致的矩阵,输出结果记为xinc,xinc即为事件矩阵。s1084、将第一客流预测结果和事件矩阵进行处理,获取每个站点在下一时间段内的第二客流预测结果;其中,获取第二客流预测结果的公式如下:表示第二客流预测结果,xpf表示第一客流预测结果。当一个或多个事件发生时,输入历史客流数据和事件数据,即可输出下一时间段的地铁网络中各个站点的进出站客流情况的预测结果。另外,为了预测模型的预测结果,以最小化均方误差为训练目标对预测模型进行训练,即通过如下公式:其中,θ是预测模型中需要学习的参数,来提高预测模型的预测客流情况的精度和效果。下面结合一例子说明:如表1所示,为地铁网络中的部分交通卡数据。将各个站点id映射为数值idfsi:si→{1,2,…,n},进站站点作为纵坐标,出站站点作为横坐标,按日期、时间段对数据进行划分并统计数量。如日期为20150302,进站时间为10:00:00(进站站点id:121),出站时间为10:40:32(出站站点id:329)的客流人数为1;日期为20150302,进站时间为10:00:00(进站站点id:126),出站时间为10:46:03(出站站点id:323)的客流人数为1;日期为20150302,进站时间为10:00:01(进站站点id:131),出站时间为10:46:36(出站站点id:1048)的客流人数为1;日期为20150302,进站时间为10:00:01(进站站点id:1049),出站时间为10:52:10(出站站点id:132)的客流人数为1;日期为20150302,进站时间为10:00:02(进站站点id:121),出站时间为10:40:34(出站站点id:329)的客流人数为1。表1日期进站时间出站时间进站站点id出站站点id人数20150302100000104032121329120150302100000104603126323120150302100001104636131104812015030210000110521010491321201503021000021040341213291此时,整个数据集可以由多个客流图像进行表示(为了减少数据量从而方便数据处理,仅考虑共32个站点的历史客流数据),即图像的宽度方向表示32个站点的出站客流数据,图像的高度方向表示32个站点的进站客流数据。如表2所示,为不同日期的不同时刻对应的地铁事故数据以及产生的影响情况:其中,事故数据的不同维度的离散特征包括月份、日期、时间、故障细节、发晚、到晚、减客、减空、加客、加空、加客、载客通过、掉线、换表等。表2利用lda的方法将事故数据(如:1月12号11:18时)不同维度的离散特征转换为向量进行表示,如:表3将表3中的不同维度的离散特征转换为向量(0.63,0.08,0.11,0.15,0.03,0,1,0,0,0,0,0,1)。其中,将“11:18am23405次0212#车下行,在s1站点因车门夹物造成该车该站推迟了3分钟发车(造成晚点:0/1)”的细节内容转换成向量(0.63,0.08,0.11,0.15,0.03)。如表4所示,不同日期的不同时刻对应的天气数据(包括天气、湿度、压力、风力、年月日等):表4采用one-hot方法将天气数据中的不同维度的离散特征转换为向量进行表示,如:表5天气温度(℃)湿度气压风速(km/h)时刻年份月份日期阴天487%1026110:00201531将表5中的不同维度的离散特征转换为向量(1,0,0,0,4,0.87,1026,11)。其中,天气通过向量(a,b,c,d)表示,a表示是否是阴天(0表示不是阴天,1表示阴天)、b表示是否晴天(0表示不是晴天,1表示是晴天)、c表示是否有雾(0表示没有雾,1表示有雾),d表示是否下雨(0表示不下雨,1表示下雨),即向量(1,0,0,0)表示阴天、不是晴天、没有雾、没有下雨的天气情况。然后,根据历史客流数据,获取客流特征数据即考虑隔时段特征数据、隔天特征数据和隔周特征数据,同时不仅考虑最近邻时间段,还要考虑次近邻时间段,所以输入是6通道的历史客流数据,分别为:其中,表示最近邻时间段的历史客流数据,表示次近邻时间段的历史客流数据;表示昨天的历史客流数据,表示前天的历史客流数据;表示最近邻周的历史客流数据,表示次近邻周的历史客流数据。卷积神经网络算法中卷积层的滤波器参数设为64,kernel窗口(内核层窗口)大小设置为3×3,为了保证输出的客流预测结果与实际结果大小相同,卷积层的步长设为1,残差网络算法中的卷积层参数也设为64,另外残差单元的深度设为12层(其中,一个残差单元对应两卷积层)。事件数据包括事故数据、天气数据、日期数据三部分组成,由于要考虑事件影响的滞后性,除了要考虑时刻t,还要考虑时刻[t-1,t-2,…]等,事件数据:[accident(t),weather(t),workday(t),accident(t-1),weather(t-1),…]。考虑各类数据的长度,事件数据的形式生成59维向量,训练的全连接神经网络第一层要59个节点与输入保持一致,第二层节点作为输出,则要和xt保持一致,即1024个节点(预测矩阵大小为32×32,将1024维输出向量转换为矩阵即可),将第一客流预测结果和事件数据进行处理,获取每个站点在下一时间段内的第二客流预测结果。将t+1时刻对应的历史数据和事件数据作为输入,根据即可得到预测结果,获取各个站点的进出站客流情况,进一步计算各个站点的进出站乘客数量等。本实施例中,根据整个地铁网络的每个站点的交通卡数据,获取每个站点的历史客流数据和历史客流图像,并采用卷积神经网络和残差神经网络向相结合对历史客流图像进行处理,得到下一时间段的第一客流预测结果;同时,将每个站点发生的事件与第一客流预测结果进行合并处理,得到下一时间段的第二客流预测结果,即考虑了每个站点发生的事件对地铁网络中每个站点的影响,更符合实际场景,合理地预测各个站点的客流走势变化,从而为在事件影响下的地铁客流组织的应急处理提供大数据方法支撑,为地铁运营管理提供有用的参考信息。实施例3如图3所示,本实施例的地铁客流的预测系统包括交通卡获取模块1、客流数据获取模块2、客流特征获取模块3、客流图像获取模块4、预测模型获取模块5和第一结果获取模块6。交通卡获取模块1用于获取地铁网络中每个站点在不同时间段内的交通卡数据;具体地,在对地铁网络中在换乘站点不进行重复计数的情况下(如某两条地铁线路上都包括站点a,则将站点a视为地铁网络中的一个站点)。客流数据获取模块2用于根据交通卡数据,获取每个站点在不同时间段内的历史客流数据;历史客流数据用{xt|t=0,…,n-1}表示,t代表不同时间段,xt表示历史客流数据,n表示整数。其中,通过每隔相同时间段获取一次整个地铁网络中n个站点的乘客流动情况,从而得到整个地铁网络中n个站点在一天当中的各个时间段的乘客流动情况。在时间段的选取上,一方面考虑到数据稀疏性,因此时间段不能过小,另一方面选取的时间段不能过大,否则会使事件影响性表现不明显,因此,结合实际情况的客流数据,一般选取的时间段为15分钟,即每天(24小时)会有96张图像来表示整个地铁网络每15分钟的各个站点的乘客流动情况。客流特征获取模块3用于根据历史客流数据,获取客流特征数据;其中,客流特征数据是指每个设定时间段内的客流数据;客流特征数据包括隔时段特征数据、隔天特征数据和隔周特征数据(即设定时间段包括隔时段、隔天和隔周),如要预测当前时间段(周四9:00am)下一个时间段(9:00-9:15am)的客流情况,则需要考虑上两个时间段(8:30-8:45am和8:45-9:00am)对应的客流数据,前两天(周二9:00am和周三9:00am)对应的客流数据,以及前一周(上一周9:00am)对应的客流数据。客流图像获取模块4用于根据客流特征数据,获取与每个设定时间段对应的历史客流图像;其中,历史客流图像用于表征每个设定时间段内每个站点的进站情况和出站情况;假设地铁网络中包括n个站点,可以利用n×n型矩阵组成的图像来表示每个时段内地铁网络中n个站点的乘客流动情况。此处,每个设定时间段对应的历史客流图像,即表示每个设定时间段内地铁网络中n个站点的乘客流动情况。预测模型获取模块5用于采用卷积神经网络算法对历史客流图像进行处理,获取第一客流预测模型;第一结果获取模块6用于根据第一客流预测模型,获取每个站点在下一时间段内的第一客流预测结果。本实施例中,根据整个地铁网络的每个站点的交通卡数据,获取每个站点的历史客流数据和历史客流图像,并采用卷积神经网络对历史客流图像进行处理,得到下一时间段的第一客流预测结果,即通过考虑地铁网络中每个站点的历史客流数据来预测下一时间段的地铁网络中每个站点的客流情况,更符合实际场景,从而为在事件影响下的地铁客流组织的应急处理提供大数据方法支撑,为地铁运营管理提供有用的参考信息。实施例4如图4所示,本实施例在实施例3的基础上作进一步改进,具体地:历史客流图像的宽度方向表示地铁网络中的每个进站站点;历史客流图像的高度方向表示地铁网络中的每个出站站点;历史客流图像中每个像素点的数值为每个设定时间段内每个进出站点对的历史客流数据;其中,进出站点对表示进站站点和与进站站点对应的出站站点。预测模型获取模块5用于采用卷积神经网络算法和残差神经网络算法对历史客流图像进行处理,获取第一客流预测模型。具体地,由于各个站点之间的距离有很大区别,需要足够的深度卷积层来发现远距离的站点之间的关系;但是,单独采用卷积神经网络算法对历史客流图像进行处理,当卷积层数过深时得到的预测模型的预测结果会变差,所以,这里引入残差神经网络算法,使得随着卷积层数的增加,在保证了发现远距离的站点之间的关系的同时,得到的预测模型的预测结果也不会变差。预测方法系统还包括事件数据获取模块7和第二结果获取模块8。事件数据获取模块7用于获取地铁网络中每个站点在设定时间段内和当前时间段内的事件数据;其中,事件数据包括事故数据、天气数据和日期数据中的至少一种;第二结果获取模块8用于将第一客流预测结果和事件数据进行处理,获取每个站点在下一时间段内的第二客流预测结果。其中,第二结果获取模块8包括事故向量获取单元81、天气向量获取单元82、日期向量获取单元83、事件获取单元84、事件矩阵获取单元85和预测结果获取单元86。事故向量获取单元81用于采用lda对事故数据进行处理,获取事故向量;事故数据对应的事故细节内容字段属于文字描述,需要采用lda将文字转换为向量形式,然后结合其它维度的离散特征可以得到事故数据的向量形式,记为accident=(c1,c2,…,cm)。ci(i=1,2…,m,m为正整数)表示事故数据的不同维度的离散特征。天气向量获取单元82用于采用one-hot方法对天气数据进行处理,获取天气向量;采用one-hot方法将天气数据对应的天气情况的描述内容转换为向量形式,然后结合其它维度的离散特征可以得到天气数据的向量形式,记为weather=(e1,e2,…,em)。ei(i=1,2…,m,m为正整数)表示天气数据的不同维度的离散特征。日期向量获取单元83用于确定日期数据为工作日或非工作日,并获取对应的日期向量;由于在工作日和非工作日时,客流情况具有明显的区别,需要额外添加特征进行标注区分,记为workday=0/1。事件获取单元84用于将事故向量、天气向量和日期向量进行结合处理,获取事件向量;具体地,当前时间段的事件向量表示公式如下:incident1=(accident0,accident1,weather0,weather1,workday1)其中,incident1表示当前时间段的事件向量,accident0,weather0表示上一时间段的事故与天气的情况,accident1,weather1表示当前时间段的事故与天气的情况,workday1表示当前时间段对应的日期情况。事件矩阵获取单元85用于采用全连接神经网络算法对事件向量进行转换处理,获取事件矩阵;利用一个两层的全连接神经网络将incident1转换为与xt大小一致的矩阵,输出结果记为xinc,xinc即为事件矩阵。预测结果获取单元86用于将第一客流预测结果和事件矩阵进行处理,获取每个站点在下一时间段内的第二客流预测结果;其中,获取第二客流预测结果的公式如下:表示第二客流预测结果,xpf表示第一客流预测结果。当一个或多个事件发生时,输入历史客流数据和事件数据,即可输出下一时间段的地铁网络中各个站点的进出站客流情况的预测结果。另外,为了预测模型的预测结果,以最小化均方误差为训练目标对预测模型进行训练,即通过如下公式:其中,θ是预测模型中需要学习的参数,来提高预测模型的预测客流情况的精度和效果。下面结合一例子说明:如表1所示,为地铁网络中的部分交通卡数据。将各个站点id映射为数值idfsi:si→{1,2,…,n},进站站点作为纵坐标,出站站点作为横坐标,按日期、时间段对数据进行划分并统计数量。如日期为20150302,进站时间为10:00:00(进站站点id:121),出站时间为10:40:32(出站站点id:329)的客流人数为1;日期为20150302,进站时间为10:00:00(进站站点id:126),出站时间为10:46:03(出站站点id:323)的客流人数为1;日期为20150302,进站时间为10:00:01(进站站点id:131),出站时间为10:46:36(出站站点id:1048)的客流人数为1;日期为20150302,进站时间为10:00:01(进站站点id:1049),出站时间为10:52:10(出站站点id:132)的客流人数为1;日期为20150302,进站时间为10:00:02(进站站点id:121),出站时间为10:40:34(出站站点id:329)的客流人数为1。表1日期进站时间出站时间进站站点id出站站点id人数20150302100000104032121329120150302100000104603126323120150302100001104636131104812015030210000110521010491321201503021000021040341213291此时,整个数据集可以由多个客流图像进行表示(为了减少数据量从而方便数据处理,仅考虑共32个站点的历史客流数据),即图像的宽度方向表示32个站点的出站客流数据,图像的高度方向表示32个站点的进站客流数据。如表2所示,为不同日期的不同时刻对应的地铁事故数据以及产生的影响情况:其中,事故数据的不同维度的离散特征包括月份、日期、时间、故障细节、发晚、到晚、减客、减空、加客、加空、加客、载客通过、掉线、换表等、晚点五分钟发车、晚点五分钟到达、晚点五到十五分钟发车、晚点十五到三十分钟发车、晚点三十分钟发车等。表2利用lda的方法将事故数据(如:1月12号11:18时)不同维度的离散特征转换为向量进行表示,如:表3将表3中的不同维度的离散特征转换为向量(0.63,0.08,0.11,0.15,0.03,0,1,0,0,0,0,0,1)。其中,将“11:18am23405次0212#车下行,在s1站点因车门夹物造成该车该站推迟了3分钟发车(造成晚点:0/1)”的细节内容转换成向量(0.63,0.08,0.11,0.15,0.03)。如表4所示,不同日期的不同时刻对应的天气数据(包括天气、湿度、压力、风力、年月日等):表4天气温度(℃)湿度气压风速(km/h)时刻年份月份日期阴天487%1026110:00201531阴天487%1026130:30201531阴天481%1026131:00201531阴天487%1026111:30201531阴天487%1026112:00201531多云481%1026132:30201531多云387%1025113:00201531阴天387%102593:30201531阴天381%1026114:00201531阴天381%1026114:30201531阴天381%1026115:00201531少云381%102695:30201531少云381%1027116:00201531少云381%102796:30201531无云387%102897:00201531采用one-hot方法将天气数据中的不同维度的离散特征转换为向量进行表示,如:表5天气温度(℃)湿度气压风速(km/h)时刻年份月份日期阴天487%1026110:00201531将表5中的不同维度的离散特征转换为向量(1,0,0,0,4,0.87,1026,11)。其中,天气通过向量(a,b,c,d)表示,a表示是否是阴天(0表示不是阴天,1表示阴天)、b表示是否晴天(0表示不是晴天,1表示是晴天)、c表示是否有雾(0表示没有雾,1表示有雾),d表示是否下雨(0表示不下雨,1表示下雨),即向量(1,0,0,0)表示阴天、不是晴天、没有雾、没有下雨的天气情况。然后,根据历史客流数据,获取客流特征数据即考虑隔时段特征数据、隔天特征数据和隔周特征数据,同时不仅考虑最近邻时间段,还要考虑次近邻时间段,所以输入是6通道的历史客流数据,分别为:其中,表示最近邻时间段的历史客流数据,表示次近邻时间段的历史客流数据;表示昨天的历史客流数据,表示前天的历史客流数据;表示最近邻周的历史客流数据,表示次近邻周的历史客流数据。卷积神经网络算法中卷积层的滤波器参数设为64,kernel窗口(内核层窗口)大小设置为3×3,为了保证输出的客流预测结果与实际结果大小相同,卷积层的步长设为1,残差网络算法中的卷积层参数也设为64,另外残差单元的深度设为12层(其中,一个残差单元对应两卷积层)。事件数据包括事故数据、天气数据、日期数据三部分组成,由于要考虑事件影响的滞后性,除了要考虑时刻t,还要考虑时刻[t-1,t-2,…]等,事件数据:[accident(t),weather(t),workday(t),accident(t-1),weather(t-1),…]。考虑各类数据的长度,事件数据的形式生成59维向量,训练的全连接神经网络第一层要59个节点与输入保持一致,第二层节点作为输出,则要和xt保持一致,即1024个节点(预测矩阵大小为32×32,将1024维输出向量转换为矩阵即可),将第一客流预测结果和事件数据进行处理,获取每个站点在下一时间段内的第二客流预测结果。将t+1时刻对应的历史数据和事件数据作为输入,根据即可得到预测结果,获取各个站点的进出站客流情况,进一步计算各个站点的进出站乘客数量等。本实施例中,根据整个地铁网络的每个站点的交通卡数据,获取每个站点的历史客流数据和历史客流图像,并采用卷积神经网络和残差神经网络向相结合对历史客流图像进行处理,得到下一时间段的第一客流预测结果;同时,将每个站点发生的事件与第一客流预测结果进行合并处理,得到下一时间段的第二客流预测结果,即考虑了每个站点发生的事件对地铁网络中每个站点的影响,更符合实际场景,合理地预测各个站点的客流走势变化,从而为在事件影响下的地铁客流组织的应急处理提供大数据方法支撑,为地铁运营管理提供有用的参考信息。虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式作出多种变更或修改,但这些变更和修改均落入本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1