一种基于多元数据的交通流量预测算法的制作方法

文档序号:18730039发布日期:2019-09-21 00:22阅读:452来源:国知局
一种基于多元数据的交通流量预测算法的制作方法

本发明涉及一种交通流量预测算法,具体为一种基于多元数据的交通流量预测算法。



背景技术:

交通流量预测在智能交通系统中占有重要地位,是实现交通诱导的前提。准确实时的短时交通流预测有助于更好的分析路网交通状况,对路网交通规划和交通优化控制有非常重要的作用。随着交通数据采集技术的不断发展,及时获取路网中实时的交通数据已成为可能。

目前,世界各国专家与学者利用各领域的方法,开发出了各种预测模型用于交通流预测,大概可以分成七类模型:基于统计方法的模型、动态交通分配的模型、交通仿真模型、非参数回归模型、神经网络模型、基于混沌理论的模型、综合模型等。对于基于统计方法的模型,会利用历史数据进行预测,并且假设预测的数据与过去的数据具有相同的特性,但大部分模型是基于线性的基础,当交通流变化较大时,预测效果会比较低,对于动态交通分配模型,该模型是通过采集到的交通数据和出行者出行选择的行为来估计时间变换的网络状态,但缺点是,信息获取困难,并且有些模型无法求解并且优化时间较长。对于神经网络模型,神经网络具有识别复杂非线性问题的特性,交通系统复杂很适合此模型,但是缺点是训练过程中需要大量的原始数据,数据不足预测效果较差,并且训练完成的网络推广能力差。

通过上述分析,可以看出任何一个模型都具有其优势和缺点,单个模型都存在其局限性,基于传统的统计理论已经不能满足复杂的交通系统的精度要求,为了提高预测的精度和可靠性,应博采众长,选取适合我国交通流特性的交通流预测综合模型。



技术实现要素:

本发明的目的是为了提供一种基于多元数据的交通流量预测算法,以解决现有技术的上述问题。

本发明的目的是通过以下技术方案来实现的。

本次方法基于路口红外仿真数据、出租车GPS数据、手机信令数据针对低数据量样本对交通流量进行预测,方法需要使用非参数回归与仿真数据。

一种基于多元数据的交通流量预测算法,其步骤为:

(9)在路口放置多个红外线计数器,车辆每通过一次路口,红外计数器加一;

(10)将计数器的值以5取整;

(11)根据zipf定理,对多个计数器数据进行处理,zipf定率提到:一个单词出现的次数与它在频率表里的排名成反比,即少数数量值将出现在多数的数据中(简单的说,多个计数器中的值将出现多次,如130将出现多次)称这些出些频率高的数据为“真”数据,确定数量K(小于计数器数量),在计算器中找出频率最高的K个数作为该路段的有效交通流量基础数据;

(12)对于上述求解K个频率最高的数,利用基数桶与MG算法进行空间与时间的优化,具体描述如流程图与简要说明所示;

(13)根据K个数据值计算均值A作为该路段的交通流量;

(14)由于利用红外计算器精度与现实存在误差ε,ε=|A-y|,y代表真实值,一般的,y≥A,本次方法使用出租车GPS数据与分时租赁的OD等数据作为弥补误差的差值项,出租车的GPS数据等可以得到在样本数据中该类汽车出现在该路段的可能性。例如在出租车样本中,在该路段只出现10次,则出现在该类样本中出现出租车的概率为m为样本数。先得到该地的全部出租车与分时租赁车辆为M1,N1,乘上该路段的出行概率为出现在该路段的车辆数M,N;

(15)样本交通流量样本变更为A+M+N;

(16)利用非参数回归(局部加权回归方式)对该路段交通流量进行预测:确定该时间该路段的交通流量只与前T分钟的历史数据具有相同统计规律(即只利用前T分钟的数据对该时间该路段的交通路段进行预测),预测结果为R1。

本发明与现有技术相比的优势:

(1)本方法比较适合数据样本较小的情况;

(2)对于数据的利用,利用仿真数据与其他多元数据相结合,

在样本较小的情况下具有较大可靠性;

(3)对于神经网络,该方式具有较强的推广性,不仅仅局限在某一数据集。

附图说明

图1为本发明的具体操作流程图;

图2为基数桶数据结构图;

图3为检测器检测结果模型图。

具体实施方式

下面结合具体实施例与附图进一步阐述本发明的技术特点。

如图1所示的一种基于多元数据的交通流量预测算法,其步骤为:在路口放置多个红外线计数器,车辆每通过一次路口,红外计数器加一;将计数器的值以5取整;根据zipf定理,对多个计数器数据进行处理,zipf定率提到:一个单词出现的次数与它在频率表里的排名成反比,即少数数量值将出现在多数的数据中(简单的说,多个计数器中的值将出现多次,如130将出现多次)称这些出些频率高的数据为“真”数据,确定数量K(小于计数器数量),在计算器中找出频率最高的K个数作为该路段的有效交通流量基础数据;对于上述求解K个频率最高的数,利用基数桶与MG算法进行空间与时间的优化,具体描述如流程图与简要说明所示;根据K个数据值计算均值A作为该路段的交通流量;由于利用红外计算器精度与现实存在误差ε,ε=|A-y|,y代表真实值,一般的,y≥A,本次方法使用出租车GPS数据与分时租赁的OD等数据作为弥补误差的差值项,出租车的GPS数据等可以得到在样本数据中该类汽车出现在该路段的可能性。例如在出租车样本中,在该路段只出现10次,则出现在该类样本中出现出租车的概率为m为样本数。先得到该地的全部出租车与分时租赁车辆为M1,N1,乘上该路段的出行概率为出现在该路段的车辆数M,N;样本交通流量样本变更为A+M+N;利用非参数回归(局部加权回归方式)对该路段交通流量进行预测:确定该时间该路段的交通流量只与前T分钟的历史数据具有相同统计规律(即只利用前T分钟的数据对该时间该路段的交通路段进行预测),预测结果为R1。

基数桶与MG算法:道路上存放N个检测器,分别检测到的数据将依次存放至基数桶中。根据Zipf定理,可以确定基数桶结构是有效的。基数是集合论中的一个概念,将相似的数据放入一个基数桶,并保证基数桶中各集合各自保证非递减有序,数据i进入基数桶中只需进入该对应集合,数据i进入基数桶时对数据的最高位进行划分,如:10最的高位是1,则进入1号基数桶,20的最高位是2,则进入2号基数桶,其优势在于与其他数据保持独立性,当有新的数据进入基数桶如40进入基数桶,只需考虑基数4中集合所存在的元素,由于非递减有序特性,利用插入排序对数据进行增加或者更新,具体的基数桶数据结构图如下2所示:

利用红外检测器检测道路流动车流量,并做出如下假设:1、道路是单向的;2、道路没有交叉口;

根据上述假设可以得出:在单向无交叉口的一段连续的道路上的检测器在单位时间内测定的数据值大部分是相同的或是相似连续的(车流量并不能突变)下图3表示在以上假设下检测器检测结果模型图:

当a测出值为5,那么b测出的值应与a的检测值相同或相差车道数m的倍数,且a,b检测值差值不大。根据以上假设推论:如果道路拥有交叉口,那在两条交叉口之间的检测器中的数据大部分是相同的。利用Zipf定理可以得到一个大致的模型,大部分(以90%为例)的道路情况的数据占所有道路情况数据值的10%(10%的数据值分布在不同的路口,有岔路等地),我们可以称这90%的数据是有效数据,剩下10%的数据是无效数据,但这90%的数据中不同的数字只占全部数据的10%,根据以上论述可以得出随机化的合理性和有效性,算法描述如下1所示:

算法1 MG替换算法

实施例:

对数据进行整理,所需数据集样表如下所示,选区K为5,样本例表如下所示:

表1实验数据样表

上述求取平均值为(30+35+45+50+55)/5=43,则一个时间的车流量为43辆,对于非参数回归,只选取T分钟前的数据作为训练样本,这里T取20;

将20组数据传入以下代码进行回归计算,得到结果即可:

以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。

此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1