一种基于收费数据的高速公路任意断面的交通流预测方法与流程

文档序号:18832508发布日期:2019-10-09 03:55阅读:424来源:国知局
本发明属于交通流量预测
技术领域
:,特别涉及一种基于收费数据的高速公路任意断面的交通流预测方法。
背景技术
::交通流预测已经成为有效地使用容量有限的道路设施以避免交通拥堵和排队现象,减少污染,节约出行时间,节约能源,促进智能交通系统发展等重要实现手段[1,2]。随着该领域的不断发展,交通流预测的任务也越来越多样,包括短时交通流预测,中长期交通流预测等等,同时对交通流预测的准确性要求也不断提高。随着道路交通数据的积累,如何有效的提取交通流数据并选择合适的预测方法来高精度地预测交通流已经至关重要。在面向高速公路指定断面的交通流预测时,获取高速公路指定断面交通流量最常用的方法之一是人工在公路现场进行车流量记录或从监控视频进行记录[3]。从正在行驶的车辆中获取交通信息是预测整体交通量的另一种方式[4],但很少有驾驶员在高速公路行驶时反馈道路交通状况。车辆检测器(vds)/感应回路检测器、雷达和其他设备通常安装在高速公路上,用于检测交通状况[5-7],以vds为例,可以收集许多信息,如车辆的通过、停留存在、行车速度、车长与型号、车列长度、道路占有率等,通过这些设备也可以获取交通流量。此外,在中国,收费系统完全覆盖了所有运营的高速公路,在收费系统中,既有电子收费(etc),也有人工收费(mtc)。从收费数据中,可以得到每辆车的进站时间、出站时间、进站收费口和出站收费口等数据,利用这些数据可以知道每辆车的行驶时间、行驶距离、总行驶速度以及每辆车的起讫点等信息。因此收费系统提供了一种获取交通流量的可替代方法,但要利用收费数据来估计任意断面上特定点的交通流量,其中一个尚未解决的问题是,收费数据与单个车辆的总体行驶速度挂钩,总体行驶速度不能表示通过车辆在指定点的行驶速度,所以车辆到达指定地点的具体时间仍然未知,指定地点的交通流量也是如此,因此很少有研究建立推导模型,以从封闭的区域收费系统中的收费记录中获取交通流量。张等人[8]提出并证明了当前路段的交通量与其上游收费站的交通量密切相关的假设。吴等人[9]根据收费数据中的有效信息预测了道路状况。大规模交通数据集在改善交通状况或分析旅行方面发挥着重要作用[10,11]。在考虑到大量相关大数据的高速公路情景中,可以基于对其基础相关性的分析来研究收费数据和断面交通流量之间的成功建模。为了解决这个问题,许多研究人员已经调查了起点/目的地(od)对并确定了更多信息。尽管可能不存在精确且完美的演绎模型,但因为车辆经过类似的地理特征,包括各种道路曲率和道路路线,这些车辆可能具有相似的驾驶行为,故提出了实践假设。除了空间信息,时间和天气变化也会影响车辆速度。在这种假设下,可能从随流速度推导出在具有相似行为的单个车辆的不同路段中的共同驾驶行为[12],例如,假设所有车辆在上坡路上轮流时减速。这些潜在的相关性有助于预测指定断面中的行进速度,这是值得进一步研究的问题。在高速公路指定断面的交通流预测方法上,经典的时间序列模型、卡尔曼滤波模型、马尔科夫模型和支持向量机(svm)模型已被用于该领域。在这些模型中,时间序列模型,例如整合移动平均自回归模型(arima),侧重于提取历史数据的时间模式。通过总结相关数据之间的规则,马尔可夫模型可以确定未来时间的道路状态。结合线性状态方程,卡尔曼滤波模型可以获得道路状态的最优估计[13-15]。基于svm方法,苏等人[16]发现分析模型在准确性方面优于预测方法,并且更加有效。这些传统方法中的大多数依赖于引入历史数据的特征来假设未来的交通量。到基于深度学习的深度神经网络(dnn)模型、循环神经网络(rnn)模型再到基于rnn的长短期记忆单元(lstm)模型、门控单元模型(gru)和堆叠式自动编码器(sae)模型,已形成了多种交通流预测手段。其中,深度学习方法作为一组深度非线性拓扑模型,可以代替传统的线性方法以便在现实世界里海量的不规则的交通数据中进行建模,通过提取数据中隐藏的特征,可以提高预测精度。作为一组深度非线性拓扑模型,深度学习方法可以替代经典的线性方法。通过提取隐藏在数据中的特征,成功对现实世界的不规则数据进行建模来提高预测精度[17,18]。例如,孔等人[19]用地铁交通运输数据提取了出行的四个特征来预测出行需求。yi,jung和bae等人[20]使用深度神经网络(dnn)模型以5分钟的间隔预测实时交通量,准确率达到99%,但数据规模很小。循环神经网络(rnn)[21]是广泛用于交通量预测的另一种方法,它可以保存隐藏在数据中的特征,从时间和空间方面预测交通流量。长短期记忆网络(lstm)是基于rnn模型改进的结构,有输入门,输出门和遗忘门[22],这些门和存储单元构成lstm模型,它可以学习输入数据之间的长期依赖关系[23]。门控循环单元(gru)模型是lstm模型的变体,在交通量预测领域被认为比lstm表现更好[24]。所有这些深层结构和多层神经网络在提取数据的内部特征方面都有成功的表现,历史数据的潜在特征和模式被挖掘出来,可以大大提高预测的准确性。深度学习模型的成功应用之一是堆叠自动编码器(sae)模型,该模型具有深层预测结构,并且在交通流预测上有良好的表现[25,26]。在获取交通流量数据时,目前主要采用人工在公路现场进行车流量记录或从监控视频进行记录和从车辆检测器(vds)中提取数据,但是在实际应用中,这些方法也存在很多缺陷与不足之处。首先,人工记录车流量会耗费大量的人力和时间,并且人工统计车流量受到很多因素影响,比如监控视频不清晰、监控设备覆盖不全面、监控设备损坏、人员无法各时段均处于工作状态等,都会导致数据统计遗漏或统计错误,造成数据的缺失和统计准确率下降。其次,其它道路检测设备也存在许多问题。以vds为例,它可以捕捉固定位置的交通流量、行驶速度和占用率,但随着vds设备使用,也会出现一些问题。第一:考虑到高速公路上需要大量的vds设备,这些设备的购买与安装成本很高并且经常维护和定期更新损坏的vds所需的时间和人手不足。第二:vds的探测精度有时不够高,特别是在车流量过于密集时,会导致车流量的统计遗漏率与错误率升高。第三:由于vds被放置在固定位置,以报告这些特定位置的交通状况,而不是任意位置的交通状况,也就是说,交通状况只能通过安装在特定断面位置的vds来捕捉,在没有安装vds和vds损坏的情况下,很难识别其对应位置的交通状况,相应地也会导致无法获取相应位置的交通流量。技术实现要素:本发明的目的在于提供一种基于收费数据的高速公路任意断面的交通流预测方法,以解决上述问题。为实现上述目的,本发明采用以下技术方案:一种基于收费数据的高速公路任意断面的交通流预测方法,包括以下步骤:步骤1,采集数据,得到每辆车在最短路径上的平均行驶速度:从每一个原始的收费数据记录中得到每辆车的进站时间、出站时间、收费站入口和收费站出口信息,根据上述数据得到每辆车在最短路径上的平均行驶速度;步骤2,车辆分类,分类后结合步骤1计算出每个车辆的平均行驶速度,计算出各类车辆在每个路段的随流运动速度与随流运动时间;步骤3,根据每辆车的最短行驶路径,确定车辆通过了哪些路段,并由步骤2得到对应路段的随流运动时间,然后结合每辆车从收费站入口到收费站出口的实际行驶时间,估算出车辆在各路段接近真实情况的行驶时间;步骤4,计算出每辆车从收费站入口到达指定的断面所花费的行驶时间,然后根据对应的行驶时间估算出每辆车到达指定断面位置的确切时间;步骤5,根据步骤4计算出的每辆车到达指定断面的时间,在所需的时间间隔内聚合所有记录来获取指定断面的交通流量;步骤6,基于sae模型来对指定断面位置交通流进行预测。进一步的,步骤1中,根据收费站入口和收费站出口信息,利用dijkstra最短路径算法计算每条记录的最短路径和对应的行驶距离,每辆车对应的行驶时间可由每辆车的出站时间减去进站时间计算得到,那么每辆车在最短路径上的平均行驶速度即可计算出来,该计算公式为:其中t″是车辆j的出站时间,t′是车辆j的入站时间,l(j)是车辆j在最短路径的行驶距离,是车辆j的平均行驶速度。进一步的,步骤2中,车辆的分类方法:每个收费站记录的车辆类型是根据车轴进行分类的,客车和双轴卡车被划分为小型车辆,公共汽车和三、四轴卡车是中型车辆,五轴以上的车辆为大型车辆。进一步的,步骤2中,由步骤1计算出每个车辆的平均行驶速度,再由上述的车辆分类标准计算出各类型车辆在各个路段的随流速度与随流时间,计算公式为:其中是车辆j的平均行驶速度,mk是在第i条路段的收费数据记录的数量,k表示车辆的类型,li是第i条路段的长度,是每辆车在第i个路段的随流速度、随流时间。进一步的,步骤3中,估算出车辆在各路段接近真实情况的行驶时间,计算公式为:其中ti,k是每辆车在第i个路段的估算行驶时间,k表示车辆的类型,t是从每个车辆从收费站入口到收费站出口的行驶时间,n是从每个车辆从收费站入口到收费站出口的的路段数量;基于每月获取的收费数据,每月定时更新变量和ti,k。进一步的,步骤4中,由步骤3可计算出其最短行驶路径上各个路段的行驶时间,然后就可以计算出车辆从收费站入口到达指定的断面所花费的时间,计算公式为:其中δta是从收费站入口到指定断面a的行驶时间,x是从收费站入口到指定断面的路段数,tx是第x个段路段的估计行驶时间,ldis是第x个路段的上游收费站与指定的断面之间的距离,lx是第x个路段的长度;然后估算出每辆车到达指定断面的时间,计算公式为:ta=t′+δta(6)其中ta是单个车辆到达指定断面的时间,t′是每辆车进入收费口的时间。进一步的,步骤5中,时间间隔为5a分钟,a为正整数。与现有技术相比,本发明有以下技术效果:本发明通过提出从大型区域收费数据中提取高速公路任意断面位置历史交通量算法,引入sae模型来对交通流量进行预测,并利用平均绝对误差(mae)来对模型预测结果进行评估,实现了从收费数据来预测高速公路指定断面位置的交通流量预测方法,其具有如下优点,第一:由于不再需要人工在公路现场进行车流量记录或从监控视频进行记录,大大节省了人力与时间。第二:视野不清晰、监控设备覆盖不全、探测设备损坏或探测精度不够高等外在干扰因素大幅减少,数据的完整性大幅度提高。第三:收费数据由计算机自动生成,统计遗漏或统计错误率几乎为零,数据的准确率大幅提高。第四:由于收费系统在全国已开放运营的高速公路上全面建立,所以不需要再安装其他额外的交通流量检测设备,大大节省了各类检测设备安装与维护的人力、财力与时间花销。进一步的,利用所述的从收费数据中获取的指定断面历史交通流数据,通过对相应断面交通流预测验证,确保了算法的正确性。进一步的,通过从收费数据中获取交通流量,不仅能够长期节省资源,包括人力、时间、金钱等,还能够拓展收费数据的应用领域,让收费数据起到物尽其用的效果。进一步的,通过引入随流速度、随流时间作为各路段实际行车速度与行车时间的参考值,大幅度降低了不同路段的不同状况对车辆实际行驶状况的影响。进一步的,通过结合每辆车在各路段的随流时间与每辆车从收费站入口到收费站出口的实际行驶时间,计算出车辆在各路段的行驶时间,确保了计算结果的准确性。进一步的,结合车辆进入收费站的时间与车辆从收费站入口到达指定的断面所花费的行驶时间得到每辆车到达指定断面的时间,确保了估算结果的正确性。进一步的,通过使用对交通流预测适应性较好的sae模型,可以深入提取交通流数据的特征,提高了预测结果的准确率。附图说明图1为vds设备检测交通状况示意图。图2为获取每个路段的行驶时间的过程示意图。图3为自动编码器的原理和结构图。图4为本发明预测指定的断面交通量的过程示意图。图5为从收费数据的描述图。图6为车辆在各路段的随流时间示意图。具体实施方式以下结合附图对本发明进一步说明:请参阅图1至图6,一种基于收费数据的高速公路任意断面的交通流预测方法,包括以下步骤:步骤1,采集数据,得到每辆车在最短路径上的平均行驶速度:从每一个原始的收费数据记录中得到每辆车的进站时间、出站时间、收费站入口和收费站出口信息,根据上述数据得到每辆车在最短路径上的平均行驶速度;步骤2,车辆分类,分类后结合步骤1计算出每个车辆的平均行驶速度,计算出各类车辆在每个路段的随流运动速度与随流运动时间;步骤3,根据每辆车的最短行驶路径,确定车辆通过了哪些路段,并由步骤2得到对应路段的随流运动时间,然后结合每辆车从收费站入口到收费站出口的实际行驶时间,估算出车辆在各路段接近真实情况的行驶时间;步骤4,计算出每辆车从收费站入口到达指定的断面所花费的行驶时间,然后根据对应的行驶时间估算出每辆车到达指定断面位置的确切时间;步骤5,根据步骤4计算出的每辆车到达指定断面的时间,在所需的时间间隔内聚合所有记录来获取指定断面的交通流量;步骤6,基于sae模型来对指定断面位置交通流进行预测。步骤1中,根据收费站入口和收费站出口信息,利用dijkstra最短路径算法计算每条记录的最短路径和对应的行驶距离,每辆车对应的行驶时间可由每辆车的出站时间减去进站时间计算得到,那么每辆车在最短路径上的平均行驶速度即可计算出来,该计算公式为:其中t″是车辆j的出站时间,t′是车辆j的入站时间,l(j)是车辆j在最短路径的行驶距离,是车辆j的平均行驶速度。步骤2中,车辆的分类方法:每个收费站记录的车辆类型是根据车轴进行分类的,客车和双轴卡车被划分为小型车辆,公共汽车和三、四轴卡车是中型车辆,五轴以上的车辆为大型车辆。步骤2中,由步骤1计算出每个车辆的平均行驶速度,再由上述的车辆分类标准计算出各类型车辆在各个路段的随流速度与随流时间,计算公式为:其中是车辆j的平均行驶速度,mk是在第i条路段的收费数据记录的数量,k表示车辆的类型,li是第i条路段的长度,是每辆车在第i个路段的随流速度、随流时间。步骤3中,估算出车辆在各路段接近真实情况的行驶时间,计算公式为:其中ti,k是每辆车在第i个路段的估算行驶时间,k表示车辆的类型,t是从每个车辆从收费站入口到收费站出口的行驶时间,n是从每个车辆从收费站入口到收费站出口的的路段数量;基于每月获取的收费数据,每月定时更新变量和ti,k。步骤4中,由步骤3可计算出其最短行驶路径上各个路段的行驶时间,然后就可以计算出车辆从收费站入口到达指定的断面所花费的时间,计算公式为:其中δta是从收费站入口到指定断面a的行驶时间,x是从收费站入口到指定断面的路段数,tx是第x个段路段的估计行驶时间,ldis是第x个路段的上游收费站与指定的断面之间的距离,lx是第x个路段的长度;然后估算出每辆车到达指定断面的时间,计算公式为:ta=t′+δta(6)其中ta是单个车辆到达指定断面的时间,t′是每辆车进入收费口的时间。步骤5中,时间间隔为5a分钟,a为正整数。基于sae模型的在指定的断面预测交通流量方法,包括,自动编码器,sae模型与数据的精细处理,交通流量预测及绩效指数;单个自动编码器的原理和结构如附图3所示,每个自动编码器具有三层结构,并且需要重建输入层;第一层是输入层,最后一层是重建层,两者都有相同的单元数;隐藏层用于通过输入一组数据{x1(l),x2(l),...,xn(l))}来提取数据特征,其中xi(l)∈rd表示第l层的单元;在自动编码器的非线性处理过程中,编码处理指输入数据的特征可以在隐藏层中获得并表示为a(xi(l)),解码过程是自动编码器将a(xi(l))解码并将其重建为xi(l)'输出,计算公式为:a(x)=f(w1x+b1)(7)x′=g(w2a(x)+b2)(8)其中w1和w2分别是编码矩阵和解码矩阵,它们是每个自动编码器的权重矩阵;b1和b2是编码和解码偏差矢量;f(x)和g(x)是神经网络中使用的激活函数;在本方法中,编码过程和解码过程都采用整流线性单位函数max(0,x);此外,重建误差是评估性能的主要参数,将其定义为模型变量,表示为θ,计算公式为:通常,非线性自编码器的隐含层单元数可能比输入层单元数要多,这就导致自编码器可能会学习恒等函数,或者只是简单地将输入数据复制为输出,从而导致从模型中提取的特征变得无用;我们在编码过程后采用了随机失活(dropout)方法,通过随机删除一个单元,连同它暂时连接的单元也被删除,得到一个更“瘦”的网络,不同的dropout值也会影响模型的功能;sae模型将每个自动编码器作为独立单元使用,并将它们堆叠在一起来创建深层网络,具有深度学习方法的模型通常具有3层以上,层的数量和每层中的节点数量会影响模型的预测结果;sae模型是一种逐层堆叠自动编码器的结构,每一层都是一个自动编码器,用于编码和解码数据;输入层将数据传递给第一个隐藏层,然后隐藏层通过编码操作提取特征并将它们传递给第二个隐藏层,同时从网络中删除重建的输出;第二个及之后的隐藏层执行相同的操作,直到到达最后一个隐藏层;同时,每层都采用贪婪的分层无监督学习算法进行预训练,以优化层的权重;当预训练过程完成时,将最后一个隐藏层的输出作为输入,并通过反向传播(bp)算法对模型的参数进行微调;为了评估sae模型的预测误差并在研究结束时与其他预测模型相比较,常用的性能指标是平均绝对误差(mae),平均相对误差(mre)和均方根误差(rmse)用于评估模型的预测值和实际值之间的误差;由于mae值可以反映预测误差的实际情况,因此本研究选择mae值来评估不同模型的结果;其中xi是实际数据,xi′是预测数据;整体实现过程附如图4所示,首先从指定道路断面周围的大区域范围内的每个收费站收集历史收费记录;通过断面位置的大部分过往车辆都被记录在在周围大型区域的收费数据中;然后使用交通流量模型来估计道路上的交通信息和道路内的交叉路口上的交通量;最后,我们利用基于历史数据的sae模型的优势,以不同的时间间隔来预测指定断面的交通流量。实施例:本发明所描述的统一的基于收费数据预测指定断面的交通流预测方法,如附图4所示,包括五大部分,分别是收费数据的获取、计算车辆到达指定断面的时间、聚合指定断面历史交通流量、基于sae模型的交通流预测、预测结果的评估,各部分具体如下。1、收费数据的获取。截至2018年,陕西省高速公路总里程已达5386公里。本研究中我们收集了中国陕西省所有高速公路收费站的原始收费数据,并选择陕西高速公路网作为一个封闭式区域收费系统。本研究从西安市绕城高速中选择相应路段,如附图5所示,指定的断面是从西高新收费站到长安收费站路段中间位置,断面位置到上游收费站的距离是2公里,收费记录的收集时间是从2018年1月到2018年4月。因为该断面的交通量足够大,满足了研究的基本要求。另外,该断面位于城市的中心位置,交通流量也具有一定的潮汐特征,确保了从收费数据来获取交通流量数据的可靠性。2、计算车辆到达指定断面的时间。从选取的2018年1月到2018年4月的收费记录中,利用从收费数据导出交通流量的算法获得每辆车到达指定断面的时间,如附图6所示,为了说明随流速度与随流时间与每各路段的估计行驶时间的相关性,随机选取了小型,中型和大型三类车辆从绕城高速的三桥收费站到长安收费站的收费数据样本。三类车辆的行车时间是早上7:30到早上8:00,行车路线也包括了西高新收费站到长安收费站路段的指定横截面。如图6(a)所示,整个行进路径上每个路段的长度从2.4千米到7.0千米不等。图6(b)显示了三个样本在整个行进路径上的平均行驶速度,可以看出在实际情况下,使用每个路段的随流速度而不是整体平均行驶速度更加准确。图6(c)显示了每个路段车辆的随流时间,大型车流的行驶时间比其他两种车的行驶时间长,中小型车流的行驶时间相当接近,这反映出这两种类型的车辆在现实世界中的行驶速度可能相似。图6(d)显示了从入口收费站到出口收费站的每个路段的估计行驶时间,我们可以推断出估计的行驶时间与路段的长度正相关。以小型车辆样本为例,最短路段g4-g5的估计时间为89秒,最长路段g2-g3的估计时间为243秒,不考虑交通拥堵等异常情况,结果与实际情况一致。以上的结果表明了以车辆类型与各路段随流速度、随流时间为依据的车辆到达指定断面的时间计算结果的准确性。3、聚合指定断面历史交通流量。根据流量导出算法得到的各类型车辆到达指定断面的时间,将指定断面的交通流量数据聚合起来,即按一定的时间间隔将交通量汇总起来并求和。之后将聚合的交通流量数据整理成数据集的形式,并选择前三个月的交通流量数据作为训练集,第四个月的数据作为测试集。这样既保证将训练集数据与测试集数据分开,又保证了训练集与测试集数据的时间跨度足够长,大大降低了预测结果出现随机误差的概率。4、基于sae模型的交通流预测。在整理好训练集与测试集数据后,我们基于sae模型来进行交通流的预测。但是,如果模型的结构不同,预测精度也会发生变化。为了获得优最优的预测结果,本研究考虑的影响因素如下,第一:使用相同的模型构造,训练集数据聚合的时间间隔不同可能会导致不同的预测结果。因此,我们选择数据聚合的时间间隔分别为5分钟,15分钟,30分钟和60分钟来进行训练与测试。第二:不同的随机失活(dropout)值也可能会产生不同的预测精度。对许多交通流预测网络来说,dropout值为0.5是最佳的。但经过多次实验,本次研究的最佳dropout值为0.2。第三:隐藏层的数量和每层中的单元数目也在一定程度上影响了模型的预测精度。sae模型的不同结构的mre值,mae值和rmse值如附表1所示,每个结构的值是六次实验后获得的平均值。一系列实验表明,2层可以是15分钟间隔内的最佳结构,单元数目为[300,300]。同样对于5分钟间隔,30分钟间隔和60分钟间隔的交通流量预测,最佳的单元数目的分布分别为[300,400,300],[400,400,400],[400,400,400,400]。table1mrevalue,maevalueandrmsevalueofdifferentstructuresofthesaemodel之后按预定参数调整好sae模型,再将训练集数据输入模型中进行训练,训练集数据进行评估,得到预测结果即可。5、预测结果的评估。将sae模型的预测结果与其它深度学习模型预测结果相比较,包括lstm,dnn,gru和rnn模型。经过一系列测试后,我们获得了每个模型预测结果的mae值来评估模型性能,如附表2所示,sae网络在30分钟间隔和60分钟间隔内表现出比某些网络更好的性能,但在5分钟和15分钟间隔内的预测准确度略差于其他模型,但准确度非常接近。随着时间间隔的增加,rnn模型预测结果的准确性与sae模型相比下降迅速,这是由于梯度消失使rnn模型很难进行中长期的交通流预测。但sae模型却可以随着交通流量的不断变化通过编码和解码程序来重建输入的交通流量数据,在长期交通流量预测中表现良好。因此sae模型与其他模型相比实用效果更好。table2performancecomparisonofthemlaeforsae,thednn,thegru,thernnandthelstm本发明通过从大型区域收费数据中提取高速公路任意断面位置历史交通量,并引入sae模型来对交通流量进行预测,研究出了一种低成本的计算模型来取代昂贵的检测设备,既节省了成本,时间和人力,又实现了交通流量的高精度预测。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1