一种基于时滞NARX神经网络的客流预测方法与流程

文档序号:11520342阅读:641来源:国知局
一种基于时滞NARX神经网络的客流预测方法与流程
本发明涉及轨道客流预测领域,特别涉及到一种基于时滞narx神经网络的客流预测方法。
背景技术
:随着城市化进程的快速发展,城市人口的出行需求与城市交通运载量之间的冲突愈发突出。城市轨道交通以其特有的高速、高容量以及环保等优势,从多种交通方式中脱颖而出,成为解决交通拥堵的主要交通工具。各城市纷纷投入建设,令城市轨道交通从单线运营向线网运营转型,其规模和复杂性提升的同时,也对轨道交通的网络化管理和发展提出挑战。而快速准确的客流预测既是科学制定行车计划的基础,也是实时调整运营计划的重要依据,它有助于交通运营管理更全面优质的发挥其作用。支持向量机,即svm,作为一个凸二次规划问题,可保证得到的极值解就是全局最优解。这些特性使svm足够成为优秀的基于数据的机器学习方法。svm在解决对于小样本与高维模式识别等问题中具有突出表现,且能将应用推广至函数拟合等相关机器学习研究中。与传统的机器学习算法不同,svm将原始样本空间映射到高维特征空间,并在新空间内求得最优线性分类面。这种映射转换即非线性转换是采用适当内积函数实现。svm成功解决了局部极小值问题与高维问题。通过定义不同的内积函数即可实现贝叶斯分类器、径向基函数法、多层感知器网络等多种学习算法。svm采用大间隔因子来控制机器学习的训练过程,令它仅选择分类间隔最大的分类超平面。svm算法具备较为完整的理论基础,在某些领域的应用中展现了非常好的泛化性能,鉴于此,它在解决分类、回归以及密度函数估测中均获得不俗效果,且成功的应用到了回归估计、模式识别等方面。如文本分类、语音识别等。svm最早是为分类问题而设计并得到广泛应用。近年来,它在回归问题方面也表现出非常好的性能。现有的轨道交通实时客流预测方法包括roosj提出一个动态贝叶斯网络方法用于预测巴黎铁路网络中的短期客流,该方法对系统故障造成的数据不全情况有较好的处理效果。现有的轨道交通实时客流预测方法存在预测准确率低,计算量大的技术问题。因此,提供一种预测准确率高的轨道交通实时客流预测方法就很有必要。技术实现要素:本发明所要解决的技术问题是现有技术中存在的准确率低的问题。提供一种新的基于时滞narx神经网络的客流预测方法,该基于时滞narx神经网络的客流预测方法具有预测的精度准确度高、计算量小的特点。为解决上述技术问题,采用的技术方案如下:一种基于时滞narx神经网络的客流预测方法,所述方法包括:(1)从自动售检票系统采集n个历史数据作为原始样本,对原始样本进行预处理得到预处理样本;(2)依据步骤(1)中预处理样本,依据带有外部输入的非线性自回归网络,建立关于时间序列的narx短时客流预测模型p(t),所述外部输入为外部印象因素u(t):p(t)=f(p(t-1),p(t-2),...,p(t-n),u(t-1),u(t-2),...,u(t-n),w);=f[p(t),u(t),w](3)根据步骤(2)中的narx短时客流预测模型,以及训练算法,进行实时客流预测,所述实时客流预测包括短时客流预测、高峰预测及代表性的客流分布站点预测;其中,t表示时间,p表示客流量,n为延时阶数,n为正整数,w表示权重矩阵。本发明的工作原理:将原始样本中任意时间序列向量和它所对应的客流向量作为输入,对未来短期内某时间段内客流量进行预测,以及高峰时段客流量预测。根据时空分布规律,为时滞非线性自回归神经网络模型增加了具有代表性的客流分布站点预测。时滞非线性自回归神经网络在处理时序的非线性数据上有更好表现,且能弥补支持向量机样本的局限性问题。narx模型全称为带有外部输入的非线性自回归模型。narx神经网络比全回归神经网络更有优势,narx神经网络可以与全回归神经网络进行相互转换,narx在模型中引入了与时间序列密切相关的外部输入,使得预测的精度更为准确。上述技术方案中,为优化,进一步地,所述步骤(2)中延时阶数n=30。进一步地,所述隐藏层数量为1,隐藏层神经元数量l=20。进一步地,所述训练算法为scg算法。进一步地,所述激励函数为s型函数。进一步地,所述激励函数为telloits函数。进一步地,所述激励函数为tan-sigmoid函数。进一步地,所述数据预处理包括关键信息提取、数据整理及分钟级出入客流量统计。进一步地,所述关键信息提取包括提取刷卡时间、站台与交通卡类型三种参数作为关键信息。narx模型全称为带有外部输入的非线性自回归模型。narx神经网络比全回归神经网络更有优势,且它可以做到与全回归神经网络进行相互转换,这使得它在非线性动态系统中颇受欢迎、广为应用。与非线性自回归模型nar模型不同的是,narx在模型中引入了与时间序列密切相关的外部输入,这使得预测的精度更为准确。其模型表示为:y(t)=f(y(t-1),y(t-2),...,y(t-ny),u(t-1),u(t-2),...,u(t-nu))第n+1个y(t)的值由前n个y(t)值和前n个u(t)值共同决定。narx神经网络主要包括输入层、隐藏层、输出层和输入输出滞时几个部分,其基本结构如图3。x(t)是神经网络的外部输入,y(t)是神经网络的输出,1:30是延时阶数n,w表示链接的权值,b表示阈值。如图4为narx神经网络的网络结构图,该模型不仅具备良好的模拟性能,在预测性能上也拥有突出的表现,能够对未来趋势做出较为准确的判断,且与其他神经网络比较,它收敛更快,归一性更好,十分适合轨道交通这样复杂的线网客流数据的预测。本发明的有益效果:效果一,进一步提高预测的精度准确性;效果二,减小计算量与预测难度。附图说明下面结合附图和实施例对本发明进一步说明。图1,人工神经元结构示意图。图2,数据预处理流程示意图图3,narx神经网络结构示意图。图4,narx神经网络的网络结构图图5,0321号站台进站预测narx神经网络模型示意图。图6,0321号站台出站预测narx神经网络模型示意图。图7,0212号站台进站预测narx神经网络模型示意图。图8,0212号站台出站预测narx神经网络模型示意图。图9,0315号站台进站预测narx神经网络模型示意图。图10,0315号站台出站预测narx神经网络模型示意图。图11,0613号站台的早高峰预测图。图12,0210号站台的早高峰预测图。图13,0613号站台的晚高峰预测图。图14,0210号站台的晚高峰预测图。图15,0104号站点进站示意图。图16,0104号站点出站示意图。图17,0114号站点代表进站示意图。图18,0114号站点代表出站示意图。图19,误差自相关示意图。图20,网络训练效果误差图。图21,narx神经网络客流预测模型有效性示意图。。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。实施例1一种基于时滞narx神经网络的客流预测方法,其特征在于:所述方法包括:(1)从自动售检票系统采集n个历史数据作为原始样本,对原始样本进行预处理得到预处理样本;(2)依据步骤(1)中预处理样本,依据带有外部输入的非线性自回归网络,建立关于时间序列的narx短时客流预测模型p(t),所述外部输入为外部印象因素u(t):p(t)=f(p(t-1),p(t-2),...,p(t-n),u(t-1),u(t-2),...,u(t-n),w)=f[p(t),u(t),w],narx短时客流预测模型p(t)增添了与训练样本密切相关的外部输入u(t);(3)根据步骤(2)中的narx短时客流预测模型,以及训练算法,进行实时客流预测,所述实时客流预测包括短时客流预测、高峰预测及代表性的客流分布站点预测;其中,t表示时间,p表示客流量,n为延时阶数,n为正整数,w表示权重矩阵。人工神经元结构如图1。输入x=(x1,x2,…,xn)t:神经元的输入端将引入其他人工神经元包含的信息,也能够引入自身输出信号、外部信息。权重w=(wij)n×n:权重能够反映输入对与神经元的影响程度,神经元之间的连接权重可以调节自某一神经元到另一神经元的信号强度,它对从某个神经元到另一个的作用量造成直接影响。连接函数wx:处理多个输入量和对应权重并将结果传输给传递函数。连接函数一般为加权求和函数。传递函数f(wx):作用函数或激活函数,映射连接函数的结果为神经元输出。输出y=(y1,y2,…,ym)t:输出是传递函数的结果,一个神经元仅有一个输出。人工神经元根据拓扑结构衔接而成为人工神经网络,具有以下优点:大规模并行计算与分布式存储能力:在神经网络中,整个神经网络甚至单个神经元都具有信息的处理与存储能力,计算过程的并行性对信息的高速处理能力具有决定性作用。鲁棒性和容错性:信息的分布式存储与集体协作计算导致每一个信息处理单元在含有对集体的贡献以外不能确定整个网络状态,这令神经网络的局部故障对整体网络输出而言并无影响。非局域性:多个神经元衔接成为一个完整的神经网络,系统的整体行为由单个神经元特征和神经元之间相互作用、相互连接共同决定。非线性映射能力:神经网络中的各个神经元之间的映射特征属于非线性,个别神经元之间采用了复杂的非线性连接。因此,人工神经网络是大规模非线性的,且拥有极强的非线性处理能力。非凸性:特定的状态函数在一定条件下决定了系统的演化方向。系统的能量函数具有多个极值,因此具备多个较为稳定的平衡状态,使得系统演化具备多样性。自组织、自适应和自学习能力:人工神经网络可以处理各种变化的信息,与此同时,非线性动力系统也在不断更新变化,能够经过对信息数据的有监督学习与无监督学习,实现对复杂函数的映射以适应变化的环境。由于原始样本是从现实世界采集到的大量数据,而现实生产与实际生活以及科学研究之间存在多样性、不确定性和复杂性,导致采集到的原始数据较为散乱,符合预测算法进行知识获取研究的程度低。优选地,如图2,所述预处理包括关键信息提取、数据整理及分钟级出入客流量统计。具体地,本实施例中所述关键信息提取包括提取刷卡时间、站台与交通卡类型三种参数作为关键信息。原始样本从实际应用自动售检票系统中获取,由于数据量大,获取的任意时刻乘客进出信息杂乱。因此,需要对庞大的数据集进行一个整合与关键信息提取。在关键信息的选择上,本实施例在7种标签中选取了更具研究价值的三种作为关键信息,他们包括刷卡时间、站台与交通卡类型。本实施例在实验过程中遍历了所有实验数据,整理了关键信息的所有内容。根据表5中的原始数据,整理结果为:表1为数据样本关键词时间列表,表2为数据样本关键词站台列表,表3为数据样本关键词卡类号列表。时间时间20140101201401172014010220140118201401032014011920140104201401202014010520140121201401062014012220140107201401232014010820140124201401092014012520140110201401262014011120140127201401122014012820140113201401292014011420140130201401152014013120140116表1站台号站台号站台号站台号01020201030106090103020203020610010402030303061101050204030406130106020503050614…………0120021503360623012102160337062501220217033806260123021803390628表2卡类号卡类型卡类号卡类型00宜居普通卡05宜居月票14宜居免费卡77宜居免费计数卡15宜居员工卡82公务票20爱心优惠卡88员工票03宜居学生卡89单程纪念票44轨警执勤卡94轨道定次票48轨道服务卡98单程票表3表1所示证实数据采集时间范围为2014年1月1日到2014年1月31日。从表2可以看出,统计数据的站台,前两位表示轨道交通线路名,后两位表示站台号且从头至尾一次递增。其中,缺失站台号表示该线路上该站台还未开通。交通卡类型统计在表3中,号码对应的卡类型名也相应展示出来。由于原始数据形式杂乱,不利于进行实验预测。因此,将数据按一定规律整理有利于后续实验的进行。计划对不同站点的出行客流量进行预测,鉴于此,将前一步骤整理的站点列表中的站点号作为分类标签,对轨道交通线网在一个月内的出入记录进行分类。每一个站点文件包含了该站点在2014年1月份的客流出入记录。原始数据多,而每条信息仅记录了某乘客某时刻的出入行状态。若要建立预测模型进行客流量预测,先对原始数据进行统计能够减少计算量。因此,遍历每个整理后的站台数据文件。优选地,每5分钟统计一次该站点的入站人数和出站人数,统计结果如表4。统计开始时间统计截止时间入站人数出站人数20140112-07000020140112-070500296320140112-07050020140112-071000186720140112-07100020140112-071500232520140112-07150020140112-072000188620140112-07200020140112-0725002114320140112-07250020140112-0730002411220140112-07300020140112-073500253620140112-07350020140112-0740004314220140112-07400020140112-07450030135表4表5narx神经网络在模型中引入了与时间序列密切相关的外部输入,外部输入为外部印象因素,这使得预测的精度更为准确。其模型表示为:y(t)=f(y(t-1),y(t-2),...,y(t-ny),u(t-1),u(t-2),...,u(t-nu))根据模型可以得出,第n+1个y(t)的值由前n个y(t)值和前n个u(t)值共同决定。narx神经网络包括输入层、输入滞时、隐藏层、输出层及输出滞时,模型使用前确定隐藏层神经元数量、输入滞时和输出滞时,神经网络结构如图3。图3中,y(t)表示神经网络的输入或输出,w表示链接的权值;b则表示阈值。优选地,所述步骤(2)中延时阶数n=30。图4为narx神经网络的网络结构图,该模型不仅具备良好的模拟性能,在预测性能上也拥有突出的表现,能够对未来趋势做出较为准确的判断,且与其他神经网络比较,它收敛更快,归一性更好,可以说是非常好的一种预测手段,十分适合轨道交通这样复杂的线网客流数据的预测。为验证narx预测模型的有效性,课题同样以0114站点2014年1月6日至1月12日一周内8点到10点的数据进行训练,预测2014年1月13日该时段的客流,实现效果如图21,实验表明narx预测模型同样能够有效的进行客流预测。在神经网络中,隐藏层的作用相对抽象,源于其主要工作在于提取输入数据中的特征,以至于适当的增加隐藏层数量能够增强网络的数据处理能力,但不是其结构越复杂,性能越好。因为隐藏层数量的增加在提高其预测性能的同时,也是将神经网络复杂化的过程,它将大大增加了它的计算量,增加了神经网络的训练时间,甚至引起反传误差。在此基础上,依靠增加隐藏层节点数来降低误差。如此选择的主要原因有:隐藏层个数极大程度影响了误差曲面梯度的稳定性,全部的梯度下降优化算法对参数变化存在依赖性,层数过量会影响梯度的稳定性,因此,过多的隐藏层将会使网络处在非稳定的状态之中导致训练效果的不佳;多余的隐藏层将会置神经网络于一种极端状态,增加其陷入局部极小点的概率,从而对神经网络的性能造成影响;隐藏层越多,神经网络在训练中的训练量也越多,训练时间也越长。因此,作为优选,所述隐藏层数量为1。通过调整该层神经元数量对网络进行优化。设定隐藏层数为1,隐藏层神经元为20,时延参数将根据实验的样本数量进行调整。训练算法的选择通常要考虑多方面因素,如样本数量、网络复杂性。其性能评价的参考指标主要包括算法的收敛速度以及内存消耗。本实施例以0321站点的数据作为样本,分别使用lm、bfg、rp、scg和gdx五种常用的激励函数对2014年1月1日到1月10日的数据进行训练,预测1月11日的客流量趋势。结合相关资料对比结果:当神经网络权值小于100个的时候,lm算法是最优选择。相比其他算法速度,lm算法能够提速3~4倍,并且,当神经网络的期望误差比较小的时候,lm算法能够表现出很好的训练效果。但它在使用时,在内存消耗上相比其它算法多出很多,以至于需要以训练时间为代价提高精度。bfg算法与lm算法存在相似性,但消耗的内存比lm算法少。而它的缺陷在于当神经网络权重值增加时,成几何倍数增加它的计算量。rp算法则是模式识别中建模速度最快的算法,但它在函数拟合上略有不足。尤其当网络的期望误差比较小时,rp算法效果通常表现不好,但它所消耗的内存较小。gdx算法在训练速度上最慢,其内存消耗与rp算法类似,针对个别特殊问题有较好的表现,如不需要收敛过快的神经网络训练等。。scg算法则在多方面都表现不俗,特别是大型的有大量权重的网络训练中。在函数拟合中,scg算法拥有几乎与lm算法媲美的速度,而模式识别中又与rp算法速度相似,在神经网络期望误差较为小的训练中,scg算法通常比rp算法更为稳定。值得一提的是,scg算法的内存消耗也较为适中。因此,在全面考虑了收敛速度以及内存消耗两方面因素下,优选地,所述训练算法为scg算法。神经网络中,激励函数的选择对网络的性能结构以及计算复杂性都造成直接的影响。它主要分为全局核函数和局部核函数。全局逼近的神经网络,其激励函数也选择全局函数较为合适。在激励函数的选择中,优先考虑便于计算函数值与一阶导数值的函数。优选地,所述激励函数为s型函数。在本实施例s型函数进行包括log-sigmoid函数、tan-sigmoid函数以及elloits函数,三种s型函数的一阶导数如下:三种激励函数的输出范围,log-sigmoid函数的导数值域令误差修正信号只能在0到1/4之间。而tan-sigmoid和elloits函数输出范围在-1到1,修正信号取值范围在0到1之间。当训练算法的步长一定时,激励函数的一阶导数可以决定权值更新的频率。三种函数的一阶导数形状相似,仅在0点周围的幅值有差异,介于神经网络初始权值往往取较小的随机数,因此,导数的幅值差异则会对权值的收敛速度造成影响。因此,tan-sigmoid函数或是elloits函数作为激励函数时,网络收敛更快。优选地,所述激励函数为telloits函数。优选地,所述激励函数为tan-sigmoid函数。进一步地,所述隐藏层数量为1,隐藏层神经元数量l=20。进一步地,所述训练算法为scg算法。进一步地,所述激励函数为s型函数。进一步地,所述激励函数为telloits函数。进一步地,所述激励函数为tan-sigmoid函数。进一步地,所述数据预处理包括关键信息提取、数据整理及分钟级出入客流量统计。进一步地,所述关键信息提取包括提取刷卡时间、站台与交通卡类型三种参数作为关键信息。本实施例的预测结果为:短时客流预测如图5-图10:实验选择0321号站台、0212号站台以及0315号站台作为预测对象,对各站点2014年1月6日到1月21日中每天15时至21时的进站/出站数据进行训练,并对2014年1月22日相同时段进站/出站客流量进行预测,训练数据每15分钟统计一次。图5为0321号站台进站预测narx神经网络模型,图6为0321号站台出站预测narx神经网络模型,图7为0212号站台进站预测narx神经网络模型,图8为0212号站台出站预测narx神经网络模型,图9为0315号站台进站预测narx神经网络模型,图10为0315号站台出站预测narx神经网络模型。其中,虚线为预测值,实线为训练值。高峰预测,包括早高峰预测及晚高峰预测:早高峰预测:选择0613号站台和0210号站台作为预测对象,对该站点2014年1月6日到1月21日中每天6时30分至9时30分的进站数据进行训练,并对2014年22日相同时段进站客流量进行预测,训练数据每15分钟统计一次。其实验结果如图11及图12,图11是0613号站台的预测图,图12是0210号站台的早高峰预测图。其中,横坐标是该时间段内每20分钟一个刻度。其中虚线为预测值,实线为训练值。晚高峰预测:选择0613号站台和0210号站台作为预测对象,对该站点2014年1月6日到1月21日中每天17时至20时的进站数据进行训练,并对2014年22日相同时段进站客流量进行预测,训练数据每15分钟统计一次。其实验结果如图13及图14,图13是0613号站台的晚高峰预测图,图14是0210号站台的晚高峰预测图。其中,横坐标是该时间段内每20分钟一个刻度。其中虚线为预测值,实线为训练值。代表性的客流分布站点预测:以通学、通勤为主站点:预测了0104号站点进站客流量,该次以2014年1月6日到1月19日每天营业时间内的客流数据作为训练集,预测1月20日到1月26日时段内每日营业时间内的客流量,每60分钟统计一次进站/出站客流。预测效果如图15及图16所示,图15图代表0104号站点进站,图16图代表0104号站点出站。横坐标是以每60分钟进行客流量统计的时间序列,纵坐标表示进站人流量。该站点工作日进站或出站人数明显多于双休日,符合该类型客流分布特点。而narx神经网络客流预测模型的预测效果十分精准。其中虚线为预测值,实线为训练值。商圈景点周围站点:在该类站点中,选取0114号站点进出站数据作为预测对象。以2014年1月6日到1月19日每天营业时间内的客流数据作为训练集,预测1月20日到1月26日时段内每日营业时间内的客流量,每60分钟统计一次进站/出站客流。其进站预测效果如图17及图18所示,图17图0114号站点代表进站,图18图0114号站点代表出站。0114号站点作为商圈周末的进出站人数明显比周一至周五要多,符合其客流分布特征。而narx神经网络客流预测模型在第三周的客流量预测上效果突出。其中虚线为预测值,实线为训练值。本实施例引入误差自相关性进行评估。误差自相关函数用于描述预测误差与时间之间的相关性。对于一个准确度高的预测模型,其自相关函数值一定只能拥有一个非零值,并且该值发生于零阶处。这便表示预测的误差与误差之间完全不相关。若是预测误差间相关性较为显著,则可通过延长滞时对预测效果进行改进。除去零阶外,其余所有阶数的相关性皆应在95%置信区间之内,即表示模型足够合格。若是想要精确的预测结果,则需要对初始权值和阈值进行修改并再次训练神经网络。本实施例的模型的误差自相关如图18所示。该narx神经网络的误差自相关性是控制在置信区间中,并无阶数超出置信区间范围,该神经网络符合精度要求。图19中,纵坐标表示均方误差(mse),通常采用它评价数据的变化幅度,该网络在训练了48次之后验证集误差达最小,其中,第42次效果最佳。图20为网络训练效果误差图,误差整体保持在[-150,150]内,训练效果较好。本实施例建立的narx神经网络成功完成建模任务,准确度高、误差小。表6和表7是svr预测模型、nar神经网络以及narx神经网络关于mape、rmse两种指标的对比情况。表6是在城市轨道交通短时客流预测中,三种模型在0321站点、0212站点及0315站点对于进站/出站人流量的预测,从预测结果的mape和rmse值对比结果可以看出,nar神经网络的两种评估值全面小于支持向量回归预测,从性能指标值可知,svr在对应预测中平均相对误差在0.4%~1%范围左右,而nar神经网络则基本保持在0.5%左右,narx网路的指标值则略小于nar网络。观察rmse值,svr模型的预测值与每15分钟统计的数据值相差人数在100人左右不等;而nar和narx神经网络的预测值与每15分钟统计的数据值相差人数保持在50人以内,且narx网络的预测效果略好于nar网络。表7是是svr预测、nar神经网络模型与narx神经网络模型在0210站点和0613站点于高峰时段对于进站人流量的预测。预营业时段的客流预测相比,高峰时段的预测效果更好,即表明高峰时段中,客流在时间和空间上更具备相关性。分析其分布特征,由于高峰时段中通勤通学乘客占了绝大部分,其出行时间与出行路径较为稳定。从预测结果的mape和rmse值对比结果可以看出,两种神经网络的评估值同样几乎全部小于svr预测,从性能指标值可知,svr在对应预测中平均相对误差在0%~3%范围左右,而nar神经网络则基本保持在2%以内,narx网络的指标略小于nar网络。对于rmse值,narx神经网络预测的人数误差在三种模型中是最小的。narx神经网络模型由于加入了带有关联性的外部输入,使得预测准确率进一步提升。表6表7尽管上面对本发明说明性的具体实施方式进行了描述,以便于本
技术领域
的技术人员能够理解本发明,但是本发明不仅限于具体实施方式的范围,对本
技术领域
的普通技术人员而言,只要各种变化只要在所附的权利要求限定和确定的本发明精神和范围内,一切利用本发明构思的发明创造均在保护之列。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1