一种交通流量的预测方法和系统与流程

文档序号:15096917发布日期:2018-08-04 14:47阅读:162来源:国知局

本发明实施例涉及交通管理技术领域,尤其涉及一种交通流量的预测方法和系统。



背景技术:

短时流量预测已有较长的研究历史,主要的预测方法可归纳为四类:基于线性系统理论模型、基于非线性系统理论模型、基于知识发现的智能预测方法以及组合预测模型法。

在现有技术中,基于线性模型的时间序列预测是其中较为成熟的理论,常用的预测模型是差分自回归移动平均模型(Autoregressive Integrated Moving Average,ARIMA),该方法认为未来值是历史值的复杂加权组合。韩超等对模型参数估计方式进行改进,利用带遗忘因子的最小二乘法对模型的参数进行在线递推估计。

然而,发明人在实现本发明的过程中发现至少存在以下问题:

1、可移植性较差;

2、检验过程繁琐。



技术实现要素:

为解决上述技术问题,本发明实施例提供了一种交通流量的预测方法和系统。

根据本发明实施例的一个方面,本发明实施例提供了一种交通流量的预测方法,所述方法包括:

根据从预设态势数据库中依次获取的A时刻至T时刻的当天观测流量信息构建目标序列,其中,T时刻为当前时刻;

从所述态势数据库中获取在前观测流量信息,其中,所述在前观测流量信息为:第n天至当天的每一天的A时刻至T时刻的流量信息;

根据所述在前观测流量信息构建匹配序列矩阵;

根据所述目标序列和所述匹配序列矩阵构建融合距离矩阵;

根据所述融合距离矩阵、预设系数和预设算法确定预测函数。

通过本实施例提供的:根据当天观测流量信息构建目标序列,并获取一定天数的在前观测流量信息构建匹配序列矩阵,根据二者构建融合距离矩阵,根据融合距离矩阵、预设系数和预设算法确定预测函数的技术方案,一方面,避免了现有技术中可移植性较差,且实现过程繁琐的技术弊端;另一方面,实现了高效且精准的对交通流量进行预测的技术效果。

进一步地,所述根据所述标准距离矩阵确定所述标准距离矩阵中除所述最优距离行之外的每一行与所述最优距离行之间的融合欧式距离,具体包括:

根据式9确定所述融合欧式距离,式9:

其中,zi为所述标准距离矩阵中第i行与所述最优距离行之间的融合欧式距离。

进一步地,所述根据所述融合欧式距离构建所述融合距离矩阵,具体包括:

根据式10确定所述融合距离矩阵Fusion_Dis,式10:

进一步地,所述根据所述融合距离矩阵、预设系数和预设算法确定预测函数,具体包括:

根据所述预设系数和所述融合距离矩阵确定预测集矩阵;

根据所述预测集矩阵和所述预设算法确定所述预测函数。

进一步地,所述根据所述预设系数和所述融合距离矩阵确定预测集矩阵,具体包括:

根据式11确定所述预测集矩阵D,式11:

根据式12确定所述预测集矩阵F,式12:

其中,K为所述预设系数,且K<n。

进一步地,所述预设算法为:等权平均算法、距离权重算法、秩次算法中的任意一种。

进一步地,当所述预设算法为所述秩次算法时,则所述根据所述融合距离矩阵和所述秩次算法确定预测函数,具体包括:

根据式13确定所述预测函数,式13:

其中,

其中,ri为所述候选集中第i个候选序列的秩次,Z为秩次指数,且Z为2。

进一步地,K=15,M=5。

进一步地,所述方法还包括:

将接收的N个断面的交通流量数据样本以断面为基准进行划分,得到N个类;

根据层次聚类法对所述N个类进行聚类,得到所述预设态势数据库。

进一步地,所述根据层次聚类法对所述N个类进行聚类,得到所述预设态势数据库,具体包括:

计算所述N个类中每两个类之间的欧式距离,得到多个欧式距离;

根据所述欧式距离和离差平方和法计算每两个类之间的间距,得到多个间距;

在所述多个间距中,选择最小间距对应的两个类;

将所述两个交通流量数据样本合并为一个新的类,直至只有一个类。

根据本发明实施例的另一个方面,本发明实施例提供了一种交通流量的预测系统,所述系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,

所述处理器执行所述程序时实现上述方法。

附图说明

图1为本发明实施例提供的一种交通流量的预测方法的流程示意图;

图2为本发明实施例提供的多种交通态势对比示意图;

图3为本发明实施例提供的余弦距离与欧式距离对比示意图;

图4为本发明实施例提供的M与K取值对预测误差影响的结构示意图;

图5为本发明实施例提供的预设系数K对预测误差的影响示意图;

图6为本发明实施例提供的窗口长度参数M对预测误差的影响示意图;

图7为本发明实施例提供的1月5实际交通流与预测交通流对比图;

图8为本发明实施例提供的1月7实际交通流与预测交通流对比图;

图9为本发明实施例提供的不同服务水平下MAPE分布示意图;

图10为本发明实施例提供的不同服务水平下RMSE分布示意图;

图11为本发明实施例提供的一种交通流量的预测系统的结构示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透切理解本发明。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的方法以及系统的详细说明,以免不必要的细节妨碍本发明的描述。

本发明实施例提供了一种交通流量的预测方法和系统。

根据本发明实施例的一个方面,本发明实施例提供了一种交通流量的预测方法。

请参阅图1,图1为本发明实施例提供的一种交通流量的预测方法的流程示意图。

如图1所示,该方法包括:

S100:根据从预设态势数据库中依次获取的A时刻至T时刻的当天观测流量信息构建目标序列,其中,T时刻为当前时刻;

S200:从态势数据库中获取在前观测流量信息,其中,在前观测流量信息为:第n天至当天的每一天的A时刻至T时刻的流量信息;

S300:根据在前观测流量信息构建匹配序列矩阵;

S400:根据目标序列和匹配序列矩阵构建融合距离矩阵;

S500:根据融合距离矩阵、预设系数和预设算法确定预测函数。

在本实施例中,例如,当需要对8月30(为测量当天日期)18:00-19:00的交通流量进行预测时,则获取14:00-18:00的观测流量,得到当天观测流量,以便根据该当天观测流量构建目标序列。

获取8月20日至8月30日每一天中14:00-18:00的观测流量,得到在前观测流量信息,以便根据该在前观测流量信息构建匹配序列矩阵。

通过本实施例提供的:根据当天观测流量信息构建目标序列,并获取一定天数的在前观测流量信息构建匹配序列矩阵,根据二者构建融合距离矩阵,根据融合距离矩阵、预设系数和预设算法确定预测函数的技术方案,一方面,避免了现有技术中可移植性较差,且实现过程繁琐的技术弊端;另一方面,实现了高效且精准的对交通流量进行预测的技术效果。

在一种可能实现的技术方案中,S100具体包括:

根据式1构建目标序列X(T),式1:

X(T)=[vT,vT-1,vT-2,...,vT-M+1]

其中,vT为当天的T时刻的观测流量值,M为窗口长度参数,且M为T时刻与A时刻的时间差。

可以理解的是,窗口长度参数M决定了目标序列的截取的步长。假设流量记录的时间间隔为5min,预测使用观测前60min的数据进行匹配,则匹配段窗口长度参数M=60min/5min=12。

在一种可能实现的技术方案中,S300具体包括:

根据式2构建匹配序列矩阵C,式2:

其中,为第n天在T时刻时的观测流量值。

在一种可能实现的技术方案中,S400具体包括:

根据目标序列和匹配序列矩阵分别确定目标序列和匹配序列矩阵之间的余弦距离和欧式距离;

根据余弦距离和欧式距离构建融合距离矩阵。

在现有技术中,交通流量机制通常使用经典K邻近算法作为判别相似交通态势的基础算法。

但是,为使预测交通流量的结果更加精准,在本实施例中,采用了新的技术方案。在本实施例中,通过“欧式距离+余弦距离”相结合的技术方案,实现预测交通流量的结果的精准性和可靠性。

其中,根据式3确定余弦距离αn,式3:

根据式4确定欧式距离βn,式4:

请参阅图2和图3,其中,图2为本发明实施例提供的多种交通态势对比示意图,图3为本发明实施例提供的余弦距离与欧式距离对比示意图。

如图2和图3所示,欧式距离只能反应特征向量在空间上的“靠近性”,而忽略了其形状的相似性。如图2所示,以L1为目标,L1与L2在距离上更加靠近,但L1与L3的形状更相似。反应到交通流上则L1与L3的交通态势相似性优于L1与L2,那么在L3的未来时刻值作为L1的预测值更加可靠。

在样本距离计算中,余弦距离常用于判断两个向量在方向上的差异。欧氏距离衡量的是空间各点的绝对距离,跟各个点所在的空间位置坐标直接相关。

如图3所示,dist(A,B)代表A,B两点在空间上的欧氏距离,cosθ为夹角余弦距离。若B点在原方向伸缩至B′,则欧式距离dist(A,B)将减小,但向量间的方向未变余弦距离保持不变。因此提出结合欧氏距离和夹角余弦距离的混合距离作为相似性的度量标准。

在一种可能实现的技术方案中,根据余弦距离和欧式距离构建融合距离矩阵具体包括:

根据余弦距离和欧式距离构建距离矩阵;

根据余弦距离、欧式距离和距离矩阵构建标准距离矩阵;

根据标准距离矩阵构建融合距离矩阵。

其中,根据余弦距离和欧式距离构建距离矩阵,具体包括:

根据余弦距离αn和欧式距离βn确定最优距离行[αn+1,βn+1],其中,αn+1=0,βn+1=1;

根据式5构建距离矩阵Dis,式5:

可以理解的是,αn+1=0,βn+1=1为理想状态,在实际中,可以根据对预测结果的精准度对该赋值进行调整,如,当αn+1=0±1且βn+1=1±1时,则[αn+1,βn+1]即为最优距离行。

在一种可能实现的技术方案中,根据余弦距离、欧式距离和距离矩阵构建标准距离矩阵,具体包括:

根据式6确定余弦距离对应的标准余弦距离α′i,式6:

根据式7确定欧式距离对应的标准欧式距离β′i,式7:

根据式8构建标准距离矩阵Norm_Dis,式8:

其中,为余弦距离αn的均值,为欧式距离βn的均值,Sα为余弦距离αn的标准差,Sβ为欧式距离βn的标准差。

在一种可能实现的技术方案中,根据标准距离矩阵构建融合距离矩阵,具体包括:

根据标准距离矩阵确定标准距离矩阵中除最优距离行之外的每一行与最优距离行之间的融合欧式距离;

根据融合欧式距离构建融合距离矩阵。

其中,根据标准距离矩阵确定标准距离矩阵中除最优距离行之外的每一行与最优距离行之间的融合欧式距离,具体包括:

根据式9确定融合欧式距离,式9:

其中,zi为标准距离矩阵中第i行与最优距离行之间的融合欧式距离。

且,根据融合欧式距离构建融合距离矩阵,具体包括:

根据式10确定融合距离矩阵Fusion_Dis,式10:

在一种可能实现的技术方案中,S500具体包括:

根据预设系数和融合距离矩阵确定预测集矩阵;

根据预测集矩阵和预设算法确定预测函数。

其中,根据预设系数和融合距离矩阵确定预测集矩阵,具体包括:

根据式11确定预测集矩阵D,式11:

根据式12确定预测集矩阵F,式12:

其中,K为预设系数,且K<n。

预设算法为:等权平均算法、距离权重算法、秩次算法中的任意一种。在本实施例中,预设算法采用秩次算法。

当预设算法为秩次算法时,则根据融合距离矩阵和秩次算法确定预测函数,具体包括:

根据式13确定所述预测函数,式13:

其中,

其中,ri为候选集中第i个候选序列的秩次,Z为秩次指数,且Z为2。

关于预设系数K和窗口长度参数M的选取。

通过交叉验证法研究了预设系数K在1-20和窗口长度参数M取值在2-20,380种不同组合对平均绝对百分比误差(Mean Absolute Percent Error,MAPE)的影响。结果表明不同的M与K取值组合对预测误差会交互产生影响。

请参阅图4,图4为本发明实施例提供的M与K取值对预测误差影响的结构示意图。

如图4所示,随着预设系数K增大,预测测误差有递减趋势。随着窗口长度参数M增大,预测误差变化有起有伏。

式中:为i时刻预测值,xi为i时刻真实值。

通过OLS回归分析获取解释变量M、K与响应变量MAPE的关系。

请参阅图5和图6,其中,图5为本发明实施例提供的预设系数K对预测误差的影响示意图,图6为本发明实施例提供的窗口长度参数M对预测误差的影响示意图。

如图5所示,预设系数K在不同取值中,对应不同窗口长度参数M值的预测误差分布,回归曲线显示预设系数K在1-15变化时,MAPE下降迅速,在15取值处达到凹点。

图6反映了窗口长度参数M在不同取值中对应不同预设系数K值的预测误差分布。窗口长度参数M值与预测误差的回归曲线呈现“W”形状,凹点在M取值4-6和17-19附近,考虑参数增加会增加计算时间,则K=15,M=5。

在一种可能实现的技术方案中,该方法还包括:

将接收的N个断面的交通流量数据样本以断面为基准进行划分,得到N个类;

根据层次聚类法对N个类进行聚类,得到预设态势数据库。

其中,根据层次聚类法对N个类进行聚类,得到预设态势数据库,具体包括:

计算N个类中每两个类之间的欧式距离,得到多个欧式距离;

根据欧式距离和离差平方和法计算每两个类之间的间距,得到多个间距;

在多个间距中,选择最小间距对应的两个类;

将两个交通流量数据样本合并为一个新的类,直至只有一个类。

通过本实施例提供的技术方案,避免了现有技术中数据冗余,且导致计算量增大,增加搜索时间的技术弊端,实现了减少冗余数据,提高搜索效率的技术效果。

为使对本发明实施例的技术方案更加透彻的进行理解,并体现本发明实施例产生的技术效果,先结合案例进行具体说明。具体地:

本次预测案例数据源来自视频卡口和RFID检测数据,检测点位共25处,记录时间跨度为2016年1月-2017年1月,数据以5min为时间间隔存储、输出。数据源相关统计指标如表1所示。

表1数据源相关指标统计

Table1 Data source-related metrics

本次实验预测对象为某城市三车道快速路,检测器编号为DECT6。实验中利用2017年1月1日及其之前的数据作为历史数据库,挑选工作日2017年1月5日和非工作日2017年1月7日全日流量进行预测分析。

用历史流量对25处检测断面进行层次聚类,并通过R语言中的Nbclust软件包提供的多指数投票法确定最佳聚类数目。

在本实施例中,检测断面DECT5、DECT6、DECT8被分为同一类,因此将三个相似断面的数据合并作为本次预测的交通态势数据库(即预设态势数据库)。

为更好的评价预测结果,除本文之前提到的MAPE以外还引入MAE、RMSE作为评价指标。平均绝对百分比(Mean Absolute Percent Error,MAPE)计算公式如下:

平均绝对误差(Mean Absolute Error,MAE),公式如下:

均方根误差,(Root Mean Squared Error,RMSE),衡量预测交通量和实际交通量的偏移程度和离散程度,对预测的极大或极小误差反映非常敏感计算公式如下:

式中:为i时刻预测值,xi为i时刻真实值,n为样本总数。

本算法参数选用K=15,M=5,对实验路段1月5日和1月7日交通流量进行预测,实际值与预测值比对分别如图7和图8所示。其中,图7为本发明实施例提供的1月5实际交通流与预测交通流对比图,图8为本发明实施例提供的1月7实际交通流与预测交通流对比图。算法很好的预测了交通流在不同态势下的实际值,即便工作日和非工作日交通流差异较大,算法均能取得良好效果,表明算法有较强的适应性。

使用同一数据库与经典KNN算法和ARIMA算法进行预测结果对比分析,全日预测评价指标对比结果如表2所示。基于共性态势寻觅的预测方法在工作日MAPE较经典KNN算法优1.1%,较ARIMA算法优1.6%。非工作日MAPE较经典KNN优2.3%,较ARIMA算法优4.5%。在MAE和RMSE评价指标中基于共性态势寻觅预测算法同样优于其他算法,表明该模型预测误差的离散程度较优。需要指出的是为体现对比公正性,采用的对比算法选取的参数均为最优。

表2预测误差对比分析

Table2 Comparison of forecast results

算法在不同道路服务水平(Level of Service LOS)下的预测表现可以衡量算法稳定性。将两日的预测结果根据服务水平分类分析,请参阅9和图10,其中,图9为本发明实施例提供的不同服务水平下MAPE分布示意图,图10为本发明实施例提供的不同服务水平下RMSE分布示意图。由图可见共性交通态势寻觅算法在不同道路服务水平下的预测效果均由于另外两种算法,尤其在拥堵状态LOSD和LOSE时预测误差MAPE降至8%以内,预测效果良好。预测RMSE在服务水平为C和D时较大,但均优于其他算法。

由上可知,在交通大数据的环境下提出寻找历史交通态势的方法进行短时流量预测。通过研究提出了利用层次聚类算法构建预测所需的历史交通态势数据库,基于经典KNN模型提出了改进的融合距离算法,并得出了算法中的关键参数的最优解K=15,M=5。以某城市快速路为预测对象,对比了共性交通态势寻觅模型与经典KNN算法和ARIMA算法。从预测结果上看,该算法预测精度优于经典KNN算法和ARIMA模型1-4个百分点,工作日和非工作日MAPE均在10%左右,最优低至9.2%。实验证明本算法精度高、适应性强具有较强的稳定性。

根据本发明实施例的另一个方面,本发明实施例提供了与上述方法相对应的一种交通流量的预测系统。

请参阅图11,图11为本发明实施例提供的一种交通流量的预测系统的结构示意图。

如图11所示,该系统包括:存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,其中,

处理器执行程序时实现上述方法。

读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

在本申请所提供的几个实施例中,应该理解到,所揭露的方法和系统,可以通过其它的方式实现。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

还应理解,在本发明各实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1