一种基于列车运行秩序的列车晚点人工神经网络识别方法与流程

文档序号:15853562发布日期:2018-11-07 10:34阅读:449来源:国知局
一种基于列车运行秩序的列车晚点人工神经网络识别方法与流程

本发明属于列车监测技术领域,具体涉及一种基于列车运行秩序的列车晚点人工神经网络识别方法。

背景技术

高铁的发展极大地方便了居民出行,随着铁路网运营规模的扩大,铁路运营管理也面临着新的挑战。尽管随着铁路信息化管理建设发展,铁路服务水平已得到很大的提高,但其中高铁晚点的预测仍是重点和难点,把握列车晚点情况能更好地从全局实现铁路智能调度,方便经营管理。

目前所有的相关技术中,有通过对晚点传播理论研究,分析列车晚点原因与规律,高速铁路仿真实验系统,模拟列车晚点的传播与影响;也有基于轨道区段锁闭时间理论的基础上,计算相邻列车间晚点传播,进而给出针对多列车的构建晚点树的方法;还有先通过基于k-s拟合优度检验方法,采用启发式微调参数概率拟合方法,对列车的到达晚点分布和出发晚点分布进行拟合,再在此基础上构建基于随机森林的列车到站晚点预测模型。

由此可见,在大多数上述现有技术中,有的存在有以下缺点:过程繁琐,需先通过概率分布拟合求得晚点分布,再在晚点分布的基础上对列车到站晚点进行预测;预测过程涉及参数种类繁多,参数需通过不同样本数据采集获得,且参数需通过不断微调估算并检验,直至得出经验分布良好的参数集;规模有限,用于晚点预测的随机森林算法的精度受决策树数目的影响较大,在决策树数目过多时,预测的准确率会出现瓶颈。且高速铁路仿真系统实验中,模拟规模过大,计算与预测也会出现瓶颈问题。



技术实现要素:

为了解决现有技术存在的上述问题,本发明提供了一种基于列车运行秩序的列车晚点人工神经网络识别方法。

本发明的技术方案如下:

一种基于列车运行秩序的列车晚点人工神经网络识别方法,所述方法包括以下步骤:

获得多条列车运行晚点信息数据,生成列车运行晚点信息数据表;

对所述列车运行晚点信息数据表中的数据进行预处理,提取列车晚点信息作为bp神经网络预测模型的训练集合;

输入所述训练集合到所述bp神经网络预测模型中,采用批梯度下降法与adam优化器训练神经网络参数,训练完成后输出并保存训练后相应的带权重参数集合和偏值参数集合;

综合分析所述带权重参数集合和所述偏值参数集合,获取其中最优的一组带权重参数和偏值参数;

输入最优的所述带权重参数和所述偏值参数至所述bp神经网络预测模型中,进行后续列车晚点预测。

优选的,所述获得多条列车运行晚点信息数据的方法包括:

以到达时间与图定到达时间为参考,从列车运行图数据库中选取历史运行途中晚点较多的列车;

查询列车经过站点,划定晚点列车所经行区域范围;

找寻该范围内晚点发生最为频繁的几天,以天窗时间作为分割点;

区分上下行,去除支线部分,并去除经过3个站以下的列车,获得所述多条列车运行晚点信息数据。

优选的,对所述列车运行晚点信息数据表中的数据进行预处理,提取列车晚点信息作为bp神经网络预测模型的训练集合的方法包括:

引用数据预处理工具,读取所述列车运行晚点信息数据表构建dataframe,进行数据的批量处理;

比较一日内列车到达时间与列车图定到达时间的差值,判断列车是否晚点;若没有,则标记所述差值为0;若晚点,则记录晚点时间,更新所述列车运行晚点信息数据表;

将更新后的所述列车运行信息数据表中包含的站点,到站时间,晚点情况判断抽象为列车晚点矩阵,其中,所述列车晚点矩阵的行表征区域内站点,列表征有列车到站信息的时刻点;

将所述列车晚点矩阵展开为向量,并贴上标签作为bp神经网络预测模型的一个训练集;

选取多天列车运行数据,重复上述步骤,扩大训练集,构成所述训练集合。

进一步优选的,将所述列车晚点矩阵展开为向量,并贴上标签作为bp神经网络预测模型的一个训练集的方法包括:

从所述列车晚点矩阵中随机选取多个子矩阵作为样本矩阵;

对所述样本矩阵中的数据进行归一化处理;

将处理后的所述样本矩阵展开为向量,并贴上标签作为bp神经网络预测模型的一个训练集。

优选的,采用批梯度下降法与adam优化器训练神经网络参数的具体计算过程包括:

中间变量初始化:vdw=0,sdw=0,vdb=0,sdb=0;

每次迭代t的过程完成以下计算:

vdw=β1·vdw+(1-β1)·dw...........(1)

vdb=β1·vdb+(1-β1)·db..........(2)

sdw=β2·sdw+(1-β2)·dw2.........(3)

sdb=β2·sdb+(1-β2)·db2.........(4)

其中dw与db为每次迭代当前mini-batch中价值函数j(w,b)在w与b方向上的变化速率,w为带权重,b为偏值;公式(1)、(2)分别为更新w与b方向上的一阶有偏动量矩估计,公式(3)、(4)为更新w与b方向上的二阶有偏动量矩估计,公式(5)、(6)为计算w与b方向上的一阶无偏动量矩估计,公式(7)、(8)为计算w与b方向上的二阶无偏动量矩估计;公式(9)、(10)为本次迭代中最后w与b参数的更新;其中α为训练过程中需要调节的下降速率,β1、β2为常数,t为迭代次数,ε为常数。

与现有技术相比,本发明提供的技术方案具有如下有益效果或优点:

本发明提供的基于列车运行秩序的列车晚点人工神经网络识别方法的应用过程简单,不用先拟合晚点的分布,也不用选取某路段进行仿真测试,对晚点进行预测,直接输入现有运行秩序矩阵图,即可预测后续列车的运行情况;适用性广,可应用于任意一段铁路。

附图说明

图1是本发明实施例提供的基于列车运行秩序的列车晚点人工神经网络识别方法的方法流程图。

图2为本发明实施例中的列车运行晚点信息数据表的示意图;

图3为本发明实施例中构建的dataframe的示意图;

图4为本发明实施例中更新后的列车运行晚点信息数据表的示意图;

图5为本发明实施例中列车晚点矩阵的示意图;

图6为本发明实施例中样本矩阵的结构示意图;

图7为本发明实施例中样本矩阵展开为向量的结构示意图;

图8为本发明实施例中bp神经网络预测模型的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例

如图1所示,本发明实施例提供了一种基于列车运行秩序的列车晚点人工神经网络识别方法,所述方法包括以下步骤:

步骤s1:获得多条列车运行晚点信息数据,生成列车运行晚点信息数据表;

步骤s2:对所述列车运行晚点信息数据表中的数据进行预处理,提取列车晚点信息作为bp神经网络预测模型的训练集合;

步骤s3:输入所述训练集合到所述bp神经网络预测模型中,采用批梯度下降法与adam优化器训练神经网络参数,训练完成后输出并保存训练后相应的带权重参数集合和偏值参数集合;

步骤s4:综合分析所述带权重参数集合和所述偏值参数集合,获取其中最优的一组带权重参数和偏值参数;

步骤s5:输入最优的所述带权重参数和所述偏值参数至所述bp神经网络预测模型中,进行后续列车晚点预测。

在具体的实施过程中,由于列车运行图是以所经车站,到达时间,图定到达时间,出发时间,图定出发时间等的形式存储于数据库中的,并不能直接获取某个区段内某一时间段内的列车运行秩序,为获取最典型的晚点预测数据,作为优选的,本发明实施例的步骤s1中通过参考习惯性晚点列车所处区间列车运行信息数据,构建神经网络训练样本,其具体的方法步骤包括:

首先,以到达时间与图定到达时间为参考,从列车运行图数据库中选取历史运行途中晚点较多的列车;

其次,查询列车经过站点,划定晚点列车所经行区域范围;

再次,找寻该范围内晚点发生最为频繁的几天,以天窗时间作为分割点;

最后,区分上下行,去除支线部分,并去除经过3个站以下的列车,获得所述多条列车运行晚点信息数据。

完成步骤s1后,执行步骤s2:对所述列车运行晚点信息数据表中的数据进行预处理,提取列车晚点信息作为bp神经网络预测模型的训练集合。

在具体的实施过程中,作为优选的,本发明实施例步骤s2中对所述列车运行晚点信息数据表中的数据进行预处理,提取列车晚点信息作为bp神经网络预测模型的训练集合的方法具体包括:

引用数据预处理工具,读取所述列车运行信息数据表构建dataframe,进行数据的批量处理。其中,所述列车运行信息数据表如图2所示,所述dataframe如图3所示。

在具体的实施过程中,本发明实施例中引用的数据预处理工具可以是pythonpandas,tensorflow,也可以用其他的数据预处理工具代替,在此不做限定。此外,为了便于本领域的技术人员理解,本发明实施例以pythonpandas作为数据预处理工具为例,为后续的数据处理进行讲解。

构建好dataframe后,比较一日内列车到达时间与列车图定到达时间的差值,判断列车是否晚点;若没有,则标记差值δt为0;若晚点,则记录晚点时间,更新所述列车运行信息数据表。更新所述列车运行信息数据表如图4所示。

更新完所述列车运行信息数据表后,将更新后的所述列车运行信息数据表中包含的站点,到站时间,晚点情况判断抽象为列车晚点矩阵am×n,其中,m表示区域内站点数目,n表示有列车到站信息的时刻点数目,如图5所示。其中,矩阵的每一行ai·代表该区域内按上行/下行依次排列的每个站点,每一列a·表示每日从第一辆列车开始运行直至最后一辆列车到站之间,有列车到站信息的每个时刻,aij则表示在j时刻到达i站列车的晚点情况。

然后,将列车晚点矩阵am×n展开为向量,并贴上标签作为bp神经网络的一个训练集;

最后,选取多天列车运行数据,重复上述步骤,扩大训练集,构成所述训练集合。

在具体的实施过程中,因为所述区域内站点繁多,且有列车到站信息的时刻点也很多,为了避免大型矩阵参与运算,提高运算效率,需要对以矩阵形式呈现的数据进行相应的模块化处理。因此,进一步优选的,本发明实施例中将列车晚点矩阵am×n展开为向量,并贴上标签作为bp神经网络预测模型的一个训练集的方法具体还包括以下步骤:

首先,从所述列车晚点矩阵中随机选取多个子矩阵作为样本矩阵。

本发明实施例中选取多个子矩阵的具体方式是:

从现有矩阵am×n中选取小型矩阵a'p×q,其中p<m,q<n,另设定步长(stride)s,按照规定步长s从左到右,从上往下一次选取a'p×q,对于矩阵am×n,在相应的步长s下,一共能生成个子矩阵,分别由水平方向和竖直方向计算得出。

为了便于理解,本发明实施例中选取了k个子矩阵作为样本矩阵b20×20,k为不小于2的整数如图6所示。

然后,对样本矩阵b20×20中的数据进行归一化处理。

本发明实施例中对样本矩阵b20×20中的数据进行归一化处理是为了消除变量自身变异和数值大小的影响,同时也为了方便神经网络中的传播与激活函数计算,将晚点时间数值落于[0,1]区间,用于表示列车晚点的程度。与此同时,将选取的k个样本矩阵b20×20中缺少值的部分替换为0。即在pandas中通过条件判断,ifaij=null,aij=0。本发明实施例中选择:

式中以晚点60分钟及其以上设定为最严重晚点程度,其晚点数值则以60分钟为参考。经此处理,列车晚点矩阵中所有晚点数值都落在[0,1]区间之中。

在深度学习中,数据的归一化可以防止模型梯度爆炸,尤其是在离散变量的反向传播过程中,使得最后的值趋于收敛。

最后,将处理后的样本矩阵b20×20展开为向量xi,并贴上标签yi作为bp神经网络的一个训练集,如图7所示。

本发明实施例中,如果以bi20×20判断列车是否晚点,从现有运行秩序预测列车后续正晚点情况,则bi20×20不应该参与神经网络的输入训练,即应把bi20×20当作已知,为方便计算,去掉所在列,输入向量维度为19×20,从bi20,20,i∈[0,k-1]中选取bi20,20为晚点参考,样本标签如下:

也就是说,本发明实施例中的所述样本标签具体为晚点与否的布尔值判断。

完成步骤s2后,执行步骤s3:输入所述训练集合到所述bp神经网络预测模型中,如图8所示,采用批梯度下降法与adam优化器训练神经网络参数,训练完成后输出并保存训练后相应的带权重参数集合和偏值参数集合。

本发明实施例中采用批梯度下降法与adam优化器训练神经网络参数的主要计算过程如下:

中间变量初始化:vdw=0,sdw=0,vdb=0,sdb=0;

每次迭代t的过程完成以下计算:

vdw=β1·vdw+(1-β1)·dw...........(1)

vdb=β1·vdb+(1-β1)·db..........(2)

sdw=β2·sdw+(1-β2)·dw2.........(3)

sdb=β2·sdb+(1-β2)·db2.........(4)

其中dw与db为每次迭代当前mini-batch中价值函数j(w,b)在w与b方向上的变化速率,w为带权重,b为偏值;公式(1)、(2)分别为更新w与b方向上的一阶有偏动量矩估计,公式(3)、(4)为更新w与b方向上的二阶有偏动量矩估计,公式(5)、(6)为计算w与b方向上的一阶无偏动量矩估计,公式(7)、(8)为计算w与b方向上的二阶无偏动量矩估计;公式(9)、(10)为本次迭代中最后w与b参数的更新;其中α为训练过程中需要调节的下降速率;β1、β2为常数,本发明实施例中β1、β2的取值常为0.9和0.999(趋近于1);t为迭代次数;ε为常数,为了避免公式中分母为0,本发明实施例中的ε取10-8即可。

在进行模型训练中,本发明实施例调用tensorflow中的adamoptimizer,以上参数部分会在tensorflow中默认给定,另一部分需要手动调节,如下降速率α,迭代次数t,mini-batch的大小(32/64/128等)。

adam优化器本质上是带有动量项的rmsprop,通过对梯度的一阶矩估计和二阶矩估计调整每个参数的学习率,其有点在于经过偏置校正之后,每一次的迭代学习率被确定在固定的范围,减少迭代过程中的震荡,使参数平稳变化。adam优化器结合了adagrad善于处理稀疏梯度和rmsprop善于处理非平稳目标的优点,且对内存需求较小,更适用于大数据集和高维空间。

在给定的迭代次数下完成了模型的训练,输出测试的准确率,完成参数训练。用于后续测试。

选择不同的学习步长,mini-batch的大小,与迭代的次数,训练过程中代价函数的变化结果不同。

每次训练完成后,输出并保存训练后相应的带权重参数集合和偏值参数集合。

完成步骤s3后,执行步骤s4:综合分析所述带权重参数集合和所述偏值参数集合,获取其中最优的一组带权重参数和偏值参数。

不同的铁路区间的情况不同,每个区间中最优的一组带权重参数和偏值参数都不尽相同,其具体需要根据训练结果而定。

完成步骤s4后,执行步骤s5:输入最优的所述带权重参数和所述偏值参数至所述bp神经网络预测模型中,进行后续列车晚点预测。

在具体的实施过程中,本发明实施例中进行后续列车晚点预测的步骤为:输入最优的所述带权重参数和所述偏值参数至所述bp神经网络预测模型中;然后再输入某一时刻某一区域列车晚点矩阵所展开的向量,其中,所述向量与样本数据构造方式相同;然后所述bp神经网络预测模型会输出预测信息。

本发明实施例提供的上述基于列车运行秩序的列车晚点人工神经网络识别方法,其应用过程简单,不用先拟合晚点的分布,也不用选取某路段进行仿真测试,对晚点进行预测,直接输入现有运行秩序矩阵图,即可预测后续列车的运行情况;适用性广,可应用于任意一段铁路。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1