一种基于双向长短期记忆网络的地铁短期客流量预测方法与流程

文档序号：18902288发布日期：2019-10-18 22:06阅读：738来源：国知局

本发明涉及地铁短时客流预测技术领域，特别涉及一种基于双向长短期记忆网络的地铁短期客流量预测方法。

背景技术：

随着轨道交通的迅猛发展，地铁逐渐成为一种不可缺少的通勤方式。随着地铁客流的逐渐增加，地铁客流量也呈现出一定的时间特性，平峰时期与高峰时期的客流量存在着较大的区别，并且高峰时期部分地铁站人流相对拥挤。因此，为了满足不同时期客流的需求，合理配置地铁运力，以及制定客流高峰情况下的紧急疏散方案等，需要有效、准确地对短时间内地铁客流量的变化进行预测。

对于交通流量及客流量等交通数据的预测，较为常用的方法有两类，一类是传统统计学方法，另一类是基于计算机学习的智能计算方法，如机器学习等。传统统计学方法在时序数据预测中较为常见，如卡尔曼滤波模型、arima模型、sarima模型等。这类模型易于操作、相对简单。但是，不同时段的地铁进站客流量是波动变化的，而传统的统计学方法大部分都受到线性假设的限制。目前应用较多的机器学习模型虽然能够解决上述问题。但是在实际环境下，这些算法容易出现因为追求预测精度导致训练时间较长，或对数据样本要求过高等问题，如决策树模型、支持向量机模型、以及k-最近邻模型等。

随着近年来深度学习的兴起，长短期记忆网络(longshort-termmemory，lstm)因为较为适合对时序数据进行预测，从而被频繁的运用于交通流量及客流量的预测中。lstm模型的准确性较高，并且实用价值更高。然而，lstm模型在时序数据训练中，容易丢失部分前后时段记忆关联的信息。

地铁系统是一个复杂的系统，地铁客流量也受到多种因素的影响，而且与各因素之间的关系较为复杂，导致以影响因素为主要考虑对象的模型出现预测效果不好的情况。而时间序列预测方法一方面能够根据历史客流量的变化来对短时客流量进行预测，另一方面突出了时间因素在预测中的作用，即所有因素的综合作用体现在了时间这一因素上，使得时间序列预测方法能够有效地对复杂系统的数据进行预测。然而传统的时间序列预测方法受到线性假设的限制，浅层的神经网络则存在对不同时段的输入信息无记忆关联作用或者对样本数据要求较高等问题。

技术实现要素：

为了克服现有技术中地铁短时客流量预测中，传统时间序列模型存在线性假设的限制及常用的神经网络无法对不同时段客流量相关联的问题，本发明提供一种基于双向长短期记忆网络的地铁短期客流量预测方法。

本发明采用如下技术方案：

一种基于双向长短期记忆网络的地铁短期客流量预测方法，包括：

s1采集交通流数据，根据工作时间特性，对历史数据集进行分类；

s2采用历史数据集训练bi-lstm神经网络，得到相应分类的模型参数，所述模型参数为bi-lstm神经网络层数以及时间步长参数；

s3根据模型参数构建bi-lstm神经网络，输入预测日进行bi-lstm神经网络预测模型的迭代优化得到预测结果，并评估模型误差。

所述s1中，采集交通流数据具体通过地铁闸机对乘客刷卡进站进行采集，以30min为时间间隔，记录不同时段的地铁进站客流量数据。

s1中根据工作时间特性，对历史数据集进行分类，具体为：

将进站客流量数据根据不同日期分为“周一至周四”、“周五”以及“周末”三类数据；

国家法定节假日，其中节假日前一日归为“周五”一类，节假日归为“周末”一类。

所述s2中，采用历史数据集训练bi-lstm神经网络，以训练数据的均方根误差为训练结果指标，并选取均方根误差最小时，对应的参数为模型参数。

所述s3根据模型参数构建bi-lstm神经网络，输入预测日进行bi-lstm神经网络预测模型的迭代优化得到预测结果，具体为：

判断待预测数据的类别，根据优化后的时间步长参数和bi-lstm神经网络层数，构建与类别相对应的bi-lstm神经网络；

待预测数据输入对应的bi-lstm神经网络，采用adam优化算法进行梯度计算，得到预测结果。

模型误差采用平均绝对百分比误差和均方根误差两项指标。

平均绝对百分比误差：

均方根误差：

n是数据个数，yj是真实数据，是预测数据。

本发明的有益效果：

1、对历史数据根据星期进行分类，使用拥有不同特性的地铁客流数据分开预测，预测更加合理，数据更加准确；

2、采用bi-lstm神经网络模型预测交通流，模型具有长期数据记忆的优势，并且能够反映后面时段对前面时段的数据影响，提高预测精度。

附图说明

图1是本发明的工作流程图；

图2是本发明的bi-lstm神经网络参数优化图；

图3(a)、图3(b)、图3(c)及图3(d)分别是是四种模型的预测对比图；

图4是四种模型均方根误差示意图。

图5是四种模型平均绝对百分比误差示意图。

具体实施方式

下面结合实施例及附图，对本发明作进一步地详细说明，但本发明的实施方式不限于此。

实施例1

如图1所示，一种基于双向长短期记忆网络的地铁短期客流量预测方法，包括如下步骤：

s1采集交通流数据，根据工作时间特性，对历史数据集进行分类；

所述交通流数据来源于地铁闸机进站刷卡数据，在特定的地铁站点，在30min内进入的乘客数量，分别统计不同时间段进站客流量，xi＝(xi,1,xi,2,…,xi,n)，其中i为样本日期的时间序列编号，m为样本数据的天数，n为每天的时间间距数，i∈[1,m]。

提取不同日期的客流量时间序列后，根据周一至周四、周五及周末来分类，分别得到数据库集z1、z2、z3，以数据库中无节假日且从周一开始为例，如式(1)—式(3)所示。

z1＝(x1,…,x4,x8,…)(1)

z2＝(x5,x12,x19,…)(2)

z3＝(x6,x7,x13,x14,…)(3)

如果国家法定节假日，其中节假日前一日归为“周五”一类，节假日归为“周末”一类。

s2采用历史数据集训练bi-lstm神经网络，得到相应分类的模型参数，所述模型参数为bi-lstm神经网络层数以及时间步长参数；

在使用bi-lstm神经网络进行训练和预测之前，由于模型对数据较为敏感，需要对输入数据进行标准化处理。

根据式(4)将客流量数据映射到0-1的范围内，获得标准化后的时间序列其中x∈xi(t)，i∈[1,m]，m为样本数据的天数，t∈[1,n]，n为每天的时间间距数。

对不同类别的历史数据进行训练，调整时间步长参数和bi-lstm神经网络层数，用评估指标rmse(均方根误差)来确定训练结果。

在计算评估指标之前，为了能够更加直观的观察到预测效果，需要将已经标准化的预测后的数据进行反标准化，以确保性能评估指标能够与原始数据直接对应，式(5)为函数表达式，其中为标准化后的预测结果，xi(t)为原始输入数据序列。

选取rmse最小时的参数作为模型的预测参数，bi-lstm神经网络预测模型的所需优化参数包括：bi-lstm神经网络层数以及时间步长参数。

s3根据模型参数构建bi-lstm神经网络，输入预测日进行bi-lstm神经网络预测模型的迭代优化得到预测结果，并评估模型误差，具体为：

判断预测日数据的类别，选取相应数据库，将历史数据库数据和预测日数据进行标准化；

根据优化后的时间步长参数和bi-lstm神经网络层数，构建与类别相对应的bi-lstm神经网络；

待预测数据输入对应的bi-lstm神经网络，采用adam优化算法进行梯度计算，得到预测数据。

将预测数据进行反标准化，得到最终结果。

采用平均绝对百分比误差(mape)和均方根误差(rmse)作为评估指标，在预测中，mse和rmse的值越小，代表预测精度越高。其中，

平均绝对百分比误差：

均方根误差：

n是数据个数，yj是真实数据，是预测数据。

实施例2

本发明的有效性可以通过下面的实验来进一步说明，实验中的参数不影响本发明的一般应用性。

实验平台：处理器为inteli7-4790k，内存为16.0gb；系统是windows7(64位)；程序语言版本为python3.6.2；集成开发环境为anaconda包中的spyder3.28版本。

广州某地铁站2017年5月份的地铁进站客流量数据作为时间序列训练样本。实验以6月1日(周四)——6月4日(周日)为测试样本。

采用bi-lstm模型参数取值，dropout设置为0.1，输入层为1层，输出层为1层，batchsize设置为1，迭代次数设置为100，优化器为“adam”，训练模型中的评估指标为rmse。

参数优化：工作日期间，地铁进站客流量会出现早高峰，早高峰主要出现在7：30-9：00，峰值出现在8：30左右，而且首班列车在6：00左右，数据时间间距为半小时。为了避免对早高峰预测的遗漏，时间长度区间设置为[1,4]。另外，神经网络结构中bi-lstm层数区间设置为[1,10]，结合时间长度及bi-lstm层数进行训练，以5月份的周一至周四数据测试为例，结果如图2所示。根据测试结果可以知道，当时间长度为4，bi-lstm层数为5层时，训练效果最好。

实验选取了在地铁客流量预测中经典预测模型作为对照：支持向量机算法(svm)、决策树模型(tree)，以及lstm算法同本发明的算法(bi-lstm)进行预测性能对比。图3(a)、图3(b)、图3(c)及图3(d)是四种模型在6月1日——6月4日的预测结果。图4是四种模型均方误差示意图，图5是四种模型均方根误差示意图。

表1为现有算法交通流预测性能对比

上述分析说明，本发明提出的一种基于双向长短期记忆网络的地铁短时客流量预测方法，能够获得比现有方法更低的预测误差，改进了地铁短时客流量预测精度。本发明所提出的方法，在四个算法中预测效果相对最好，证明了方法具有良好的适用性。具有一定的参考价值和实际经济效益。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受所述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：温惠英;罗晨伟;黎景壮
技术所有人：华南理工大学
我是此专利的发明人

上一篇：利用模型固定的神经网络处理的制作方法
上一篇：一种电池壳热流道模具结构及其成型方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。