一种基于深度递归神经网络的城市道路超车预测方法与流程

文档序号:16887202发布日期:2019-02-15 22:44阅读:308来源:国知局
一种基于深度递归神经网络的城市道路超车预测方法与流程

本发明属于机器学习领域,特别是涉及一种基于深度递归神经网络的城市道路超车率预测方法。



背景技术:

城市道路超车一直是社会普遍关注的问题,尤其是大面积超车现象,不仅埋下了安全隐患,甚至危害到人们的生命财产安全。实现对城市道路超车问题的及时管控是目前亟需解决的问题。精准预测城市特定路段的超车流将为执法部门提供强有力地决策支持,极大的保证了城市道路中交通秩序的稳定与安全。城市道路超车是驾驶过程中最常见的行为,对于超车问题国内外学者开展了广泛和深入的研究。

游峰等基于backstepping控制算法选取lyapunov函数设计智能车辆换道及超车轨迹跟踪控制器,实现对车辆换道与超车轨迹的跟踪控制。刘江通过对双车道公路的超车行为试验研究,得到不同驾驶员在超车过程中的行为特征。朱秀娟等利用驾驶模拟器模拟动态超车过程,判断驾驶员的某些行为是否安全。afshin等根据伊朗事故数据统计了超车过程发生事故的人类工程学特征。elenii分析了男性和女性驾驶员在双车道公路上的超车持续时间,并建立了考虑司机性别以及车速的超车时间模型。

近年来,深度学习作为一种新的机器学习算法受到人们的广泛关注,各种深度学习的框架运用于人工智能领域,如图像分类、语音识别、自然语言处理、计算机游戏、癌症检测等。深度学习也在交通大数据挖掘方面体现出越来越强大的应用价值。如zhang等针对高速公路旅行时间的预测提出一种基于栈式自动编码器模型。通过高速公路收费站获取车辆每小时平均旅行时间,利用历史数据采用无监督学习方式训练模型,用梯度下降法调整和优化预测层的参数,最后使用过去三小时的旅行时间来预测未来一小时的旅行时间。该方法的均方根误差为13.6%,优于传统的bp神经网络预测模型。kumar等人提出了一种基于季节性自回归移动平均模型(sarima)。该模型相比于传统的arima模型考虑了季节以及早晚高峰对车流量的影响,该模型仅使用少量的输入数据对交通流进行短期预测。jeong等利用车辆自动定位数据,使用回归模型、人工神经网络(ann)以及时间序列模型来预测公交车到达时间。结果表明,ann模型在预测精度方面优于时间序列模型和回归模型。张威威等选择长短期记忆神经网络(lstm),固定lstm隐藏节点数、模型的输入长度,测试在不同隐藏层节点数和考虑空间相关性条件下的lstm预测性能,并与传统bp神经网络、arima模型,knn方法进行对比和分析,结果表明,lstm具有更好的拟合和训练能力。

深度学习在智能交通建设方面的应用越来越广泛,但深度学习在城市道路预测中的应用并不广泛。综上,为实现更加智能化、精准化的城市道路管理,本发明基于苏州工业园区星湖街-现代大道路段电子警察数据,以深度学习的理论框架,提出一种基于gru递归神经网络(gatedrecurrentunit,gru)的超车预测模型,对于规范驾驶行为以及为交警提供决策辅助支持具有重要的意义。



技术实现要素:

本发明提供了一种基于深度递归神经网络的城市道路超车预测,创新性地融合,旨在充分解决精准预测的问题。

本发明采用如下技术方案:

步骤s1、采集数据。本发明采用的数据来源是基于电子警察所检测到的车牌识别信息。电子警察安装在各十字路口、人行道口、主要的主辅路进出口等都会安装,当车辆驶过停车线,高清数字摄像机拍到车辆尾部照片,电子警察系统会根据照片进行处理,提取车辆信息,将记录信息传送到数据服务器上。系统从交通信号控制器输入实时电子警察数据和信号时序数据,着重分析和处理车牌识别数据和时间数据。

步骤s1.1、交叉口a与b四个方向均配备电子警察,且覆盖所有车道。当车辆通过停车线时,电子警察将记录车辆的车牌号码与时间戳t。以从交叉口a到b的路段lab为例,一辆车从a交叉口驶出停车线时间为ta,到b路口驶出停车线时间为tb,其路段ab的行程时间tab=tb-ta。

步骤s1.2、在交叉口a与b均被电子警察捕获的车辆,称为匹配车辆。匹配车辆之间可以方便的进行超车分析。车辆1与车辆2,如果t1b<t2b且t1a>t2a。则认为车辆1在路段lab超过了车辆2。

步骤s2、统计超车数。超车以车道组(lanegroup,lg)为单位进行统计,本发明所谓车道组是指被同一信号灯组控制的进口车道的组合。只有在同一车道组的车辆才进行超车对比,不同车道组的车辆因为通行的信号相位阶段不同,相互之间的超车关系不计入超车统计。统计某一车道组某一时间段的超车,如7点到8点的超车。算法如下:

1.取7点到8点15分的匹配数据,每辆车都有本车道时间戳与上游路口时间戳,然后根据本车道时间戳从早到晚进行排序。

2.对于每辆车和后面15分钟的车辆进行对比,如果后面车辆的上游时间戳比自己早,则认为是超车,记录被超车辆牌照。

3.如果一辆车的上下游时间戳差值超过15分钟,超过它的车辆不算超车。因为它可能在中间短时停车。

步骤s3、数据预处理。对所有数据进行了归一化处理,见如下的公式:

式中:x表示本发明涉及的超车数据,xmin表示输入超车数据中的最小值;xmax表示超车数据中的最大值;x′表示超车数据进行归一化后的数据。其次本发明分析的主要超车对象是普通车辆间的超车,因此需要过滤掉一些特殊车辆。特殊车辆包括警车、救护车、军车、外籍车等。通过采用超车与被超车之间的路段行程时间差,并不能完全真实有效的反映车辆的超车情况,需要剔除一些异常数据,以下几种情况可能会产生异常数据:

①车辆在中途行驶过程中,因为某些特殊原因而停车(车辆抛锚,中途载客等)产生高于正常行驶车辆的时间延误;

②车辆行驶途中从未安装检测设备的支路离开检测区间,导致电子警察系统未能匹配到车牌识别数据;

③车辆在路段中二次或多次出行,致使同一车牌数据在电子警察系统中多次出现。

步骤s4、构建深度递归神经网络模型用于超车数据预测。

深度递归神经网络模型是gru神经网络,该gru神经网络的输入是历史超车数据,网络的输出是未来时刻的超车数据,gru神经网络通过记忆单元来更新数据,一个记忆单元由更新门和重置门构成,来控制中间结果的流动,具体步骤如下,

ft=sigm(wf[ht-1,xt]+bf)

it=sigm(wi[ht-1,xt]+bi)

其中,i,f是gru神经网络结构中的参数分别起到了遗忘和更新历史超车数据的作用,w是在gru神经网络中对超车数据的加权参数,b是偏置值,起到了临时控制参数的作用,即为基于当前输入和前一个状态计算,通过gru神经网络的损失函数训练得到。

相对于现有技术,本发明方法具有以下优势:

(1)采用深度递归网络较浅层模型更能挖掘出超车数据中潜在的规律。

(2)采用深度递归神经网络gru较传统的递归网络具有对有效信息的筛选机制,更能消除超车数据中噪声的扰动,使得模型具有更强的健壮性。

(3)通过电子警察与卡口等车牌识别系统的广泛应用,与传统的车辆检测器相比可以利用上下游交叉口间车牌对比获取众多有价值的数据,提供精细化的数据进行超车预测

附图说明

图1是超车预测模型的流程图;

图2是深度神经网络的进化图;

图3是灰色系统模型在测试集上的效果图;

图4是路段电子警察安装示意图;

图5是深度递归神经网络的架构图;

图6是全量数据折线图;

图7是任意两个月的超车数散点图。

具体实施方式

为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。

现结合附图和具体实施方式对本发明进一步说明。

参阅图1所示,超车预测模型的流程图。

数据来源:

本发明采用的数据来源是基于电子警察所检测到的车牌识别信息。电子警察安装在各十字路口、人行道口、主要的主辅路进出口等都会安装,当车辆驶过停车线,高清数字摄像机拍到车辆尾部照片,电子警察系统会根据照片进行处理,提取车辆信息,将记录信息传送到数据服务器上。系统从交通信号控制器输入实时电子警察数据和信号时序数据,着重分析和处理车牌识别数据。

步骤s1、超车数据采集

如图4所示,为路段电子警察安装示意图。交叉口a与b四个方向均配备电子警察,且覆盖所有车道。当车辆通过停车线时,电子警察将记录车辆的车牌号码与时间戳t。以从交叉口a到b的路段lab为例,一辆车从a交叉口驶出停车线时间为ta,到b路口驶出停车线时间为tb,其路段行程时间tab=tb-ta。

步骤s1.2、在交叉口a与b均被电子警察捕获的车辆,称为匹配车辆。匹配车辆之间可以方便的进行超车分析。车辆1与车辆2,如果t1b<t2b且t1a>t2a。则认为车辆1在路段lab超过了车辆2。

步骤s2、统计超车数

超车以车道组(lanegroup,lg)为单位进行统计,本发明所谓车道组是指被同一信号灯组控制的进口车道的组合。只有在同一车道组的车辆才进行超车对比,不同车道组的车辆因为通行的信号相位阶段不同,相互之间的超车关系不计入超车统计。

统计某一车道组某一时间段的超车,如7点到8点的超车。算法如下:

1.取7点到8点15分的匹配数据,每辆车都有本车道时间戳与上游路口时间戳,然后根据本车道时间戳从早到晚进行排序。

2.对于每辆车和后面15分钟的车辆进行对比,如果后面车辆的上游时间戳比自己早,则认为是超车,记录被超车辆牌照。

3.如果一辆车的上下游时间戳差值超过15分钟,超过它的车辆不算超车。因为它可能在中间短时停车。

采用绝对性评价指标---路段超车率作为预测对象。

路段超车率是路段进行超车的车辆数占路段所观测车辆数的比率:

步骤s3、数据预处理

对所有数据即超车率进行了归一化处理,见如下的公式:

式中:x表示本发明涉及的超车数据(指超车率),xmin表示输入超车数据中的最小值;xmax表示超车数据中的最大值;x′表示超车数据进行归一化后的数据。

本发明分析的主要超车对象是普通车辆间的超车,因此需要过滤掉一些特殊车辆。特殊车辆包括警车、救护车、军车、外籍车等。通过采用超车与被超车之间的路段行程时间差,并不能完全真实有效的反映车辆的超车情况,需要剔除一些异常数据,以下几种情况可能会产生异常数据:

①车辆在中途行驶过程中,因为某些特殊原因而停车(车辆抛锚,中途载客等)产生高于正常行驶车辆的时间延误;

②车辆行驶途中从未安装检测设备的支路离开检测区间,导致电子警察系统未能匹配到车牌识别数据;

③车辆在路段中二次或多次出行,致使同一车牌数据在电子警察系统中多次出现。

步骤s4、构建深度递归神经网络模型用于超车数据预测

本发明采用的深度递归神经网络是gru(gatedrecurrentunit)神经网络,网络的输入是历史数据的超车数据,网络的输出是未来时刻的超车数据即该问题是一个单变量的时间序列预测问题。深度是使用gru通过记忆单元(memorycell)来更新数据,一个cell由更新门和重置门构成,来控制超车特征信息的流动,使用sigmoid函数使得其输出0和1之间的值,因此产生的超车特征信息可以按照这个概率值在两个门之间流动,具体地,重置门负责组合新输入的超车信息和之前的记忆,更新门负责决定留下多少之前的记忆,即决定了超车数据的网络中间结果以多大的概率输出。具体步骤如下:

ft=sigm(wf[ht-1,xt]+bf)

it=sigm(wi[ht-1,xt]+bi)

其中,i,f是gru网络结构中的参数分别起到了遗忘和更新历史超车数据的作用,历史超车数据特指的是上一个时间段的超车数据,递归网络的一个特点就是不同时刻的网络建立联系,挖掘不同时刻之间的网络关联特性,进而有效的消除无用数据,最大程度保留有用信息。因为原始网络数据中可能存在一些无效数据或者噪声,通过网络训练,可以使得这些参数具有识别有效信息、剔除无用信息的特点,其中网络的训练过程是一个不断通过加权、映射使得参数不断通过目标函数的改变而调整的过程,其中w是在网络中对超车数据的加权参数,b是偏置值。起到了临时控制参数的作用,即是基于当前输入和前一个状态计算,通过网络的损失函数训练得到。

具体地,i负责决定了新的超车数据中间结果(newmemory)的重要性有多大,其值越大,表示越重要,其值的大小由网络训练得到,如果lt约等于0,就不会传递给newmemory。t-1负责决定传递多少ht-1给ht。如果ft为1,将ht-1全部传递给ht。相反,等于0,newmemory直接传递给ht。在从t到t-1的更新时都引入了加法。sigmoid和tanh函数值域分别为[0,1]和[-1,1],它们用于对经过加权之后的超车数据及中间结果进行非线性映射,输出到输出层进行网络训练以更新参数,即网络实际参数通过超车数据加权、映射训练得到。以上所有的参数项均由网络通过目标函数训练、误差反向传播得到,训练得到的参数可以最大程度保留有效信息,使得预测值无限逼近真实值。

本发明的研究数据是苏州工业园区星湖街-现代大道路段的超车率数据,超车率数据如表1所示。选择2017年4月1日-2017年4月20日的路段超车率数据作为训练集,以2017年4月21日-2017年4月29日的路段超车率数据作为模型的测试集,用于验证模型的有效性和实用性,如图6所示。图7显示了任选的两个月的超车数据的散点图,可以看出两个月之间的超车数并没有相关性。神经网络在训练过程中沿着梯度的反方向进行下降,最终得到一组参数,可以使得预测值逼近真实值,归一化可以使得模型在梯度下降寻找最优解的过程变得平缓,更容易收敛到最优解。因此,所有数据进行了归一化处理。

式中:x表示本发明涉及的超车数据(指超车率);xmin表示输入超车数据中的最小值;xmax表示超车数据中的最大值;x′表示超车数据进行归一化后的数据。超车数据是通过电子警察得到的,归一化的作用:1.在梯度下降的训练方式中,用于加速收敛;2.为了消除量纲的影响,如数值太大,网络难以训练。深度递归神经网络输入的是超车率,输出的是超车率,这个两个超车率本质是函数到函数的映射,通过非线性函数sigmoid等映射。所以无论是否归一化都不影响超车率的数值意义和性质。

表1路段43-3超车数据

模型评价指标

为了更好的评估路段超车率预测模型的预测性能,本发明采用均方误差(mean-sqaureerror,mse)、平均绝对值误差(meanabsolutedeviation,mad)两种目标函数。

式中:p(i)为路段超车率的真实值;为路段超车率的预测值;n为预测验证数据集个数。

神经网络模型的训练过程

通过电子警察采集400组数据,300组用于建模,100组进行验证。本发明涉及的gru网络具有200个隐藏层、一个输入层、一个输出层。与传统的递归神经网络相比,每个隐藏层单元均采用gru,每个单元有3个门,输入门表示是否把采样得到的超车数据信息加入,如果为1表示允许加入,如果为0则表示不能被加入,如果落在0到1之间,则仅有部分数据可以通过,通过此方式来过滤掉无效的数据,遗忘门表示是否清除当前保留的超车数据的历史信息,0则表示完全丢弃,1则完全保留,落在0到1之间,则表示只让部分数据保留。输出门表示是否将超车信息输出到下一个隐藏层或者输出层,取0到1的数来衡量输出的超车信息的多少,0表示不输出,1表示完全输出。网络迭代的学习率为0.001。采用adam一阶优化算法替代传统随机梯度下降过程,网络迭代过程见图2所示,为深度神经网络的进化图,其中纵坐标是误差,横坐标是训练次数。

实验结果与分析:

将训练好的网络模型进行如下分析:(1)对三种网络(gru、rnn、bp)分别使用均方误差(mean-sqaureerror,mse)、平均绝对值误差(meanabsolutedeviation,mad)作为目标函数进行网络迭代训练,其中使用平均绝对值误差作为目标函数的泛化能力明显好于均方误差作为目标函数的网络,如图3所示,灰色系统模型在测试集上的效果图。其中,(a)、(b)图分别是gru网络使用mad和mse作为目标函数的训练效果,(c)、(d)图分别是rnn网络使用mad和mse作为目标函数的训练效果,(e)、(f)图分别是bp网络使用mad和mse作为目标函数的训练效果。这是由于部分车辆大范围停车导致的“假超车(假超车为超过停止的车)”现象,导致数据中存在较多噪声,对模型造成扰动较大,导致网络不能学习到潜在的规律,进而导致网络的泛化能力大大下降。如果使用均方误差作为目标函数,会使得噪声的残差被进一步放大,在误差反向传播与梯度下降时,将偏离正确的方向前进,预测值不能向真实值逼近,造成较大误差。而平均绝对值误差作为目标函数,不会使噪声的残差过分放大,一定程度上避免了这一现象的发生。

如表2所示,对于使用绝对值误差作为目标函数的模型中,gru网络性能均好于rnn网络性能,rnn网络性能好于bp网络性能,gru网络的绝对值误差为0.1252、rnn网络的绝对值误差为0.128、bp网络的绝对值误差0.142,其原因为gru作为一种带有联想记忆功能和遗忘机制的深度递归网络在网络进化时发挥着极大的作用,可以使得网络充分学习到有用的信息,消除无用信息的影响。而没有联想记忆功能的bp神经网络,因为没有考虑时间维度上的关系,从而导致误差较大。对于传统rnn网络,虽然有联想记忆功能即考虑了超车数据在时间维度上的关系,但是由于没有遗忘机制,没有办法消除无效超车数据,使得网络难以收敛。

表2网络性能对比

随着城市化进程的不断加快,城市道路中出现的超车情况严重的影响了交通秩序,打破了城市路网中的动态平衡,特别是违规超车带来及极大的安全隐患。由于交通系统是一种高维、复杂的动态系统,对于超车流的预测是一项难题,如何设计适合的模型是交通流预测问题的重中之重。本发明采用深度学习方法,提出了一种基于gru模型对城市道路超车率预测的方法,并与传统rnn网络、传统bp网络等模型进行比较与分析。结果表明gru模型具有更好的泛化能力,可用于城市道路超车率的预测,对于解决交通拥塞、道路拥堵、降低交通事故的发生以及为交警提供辅助决策支持有着重要意义。通过两组目标函数,进行网络训练和验证时发现,深度递归神经网络更能挖掘到超车信息流中有价值得的信息,其“门”的架构可以更好的剔除无用的信息,保留有用的信息。传统的rnn模型虽然有着一定的记忆功能,但不能消除无关信息的影响,bp网络由于网络层数的加深,容易造成梯度消失的现象,因而在城市道路交通流预测中表现不佳,同时在bp网络中,历史信息之间无法融合,进而不能充分挖掘信息。综上,深度递归网络在超车流预测方面有着显著的效果,明显优于其它模型。

尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1