一种基于CS-SVR算法的短时道路交通拥堵预测方法与流程

文档序号:17446524发布日期:2019-04-17 05:43阅读:785来源:国知局
一种基于CS-SVR算法的短时道路交通拥堵预测方法与流程

本发明涉及一种道路交通拥堵流量预测方法,涉及一种基于cs-svr算法的针对短时道路交通流量的预测,尤其是针对交通流量、速度的预测,属于道路拥堵预测技术领域。



背景技术:

随着我国国民经济发展,城市化进程加快,越来越多的资源及劳动力涌向城市,促进城市发展同时,交通拥堵问题越来越突出,尤其是一些大城市的交通状况更为严重,交通拥堵现象不仅造成了城市投资成本增加,浪费了大量能源,还会增加环境污染,损害人们身体健康及带来了精神困扰,并会耽误人们很多事情,减少了社会活动效率,造成较大经济损失。因此对交通拥堵进行预测,尤其是预测交通流量有着重大的现实意义。

vapnik等人于1995年首次提出向量机回归模型(svr),是一种基于“小样本”的学习机,主要用于函数逼近。目前,大量的研究表明svr能够处理小样本、高维非线性预测问题,并且在模式识别、参数估计、故障预判领域得到广泛应用,因此将其引入到交通拥堵预测中。

2009年剑桥大学的yang和deb提出了一种新型元启发式搜索算法-布谷鸟搜索(cuckoosearch,cs)算法。其机理是依据布谷鸟种群巢寄生繁衍的策略,通过鸟类特殊的lévy飞行的方式寻找最优孵化的蛋,达到高效寻优目的。因此这种方法非常适用于优化svr参数。

结合上述svr的描述以及在预测方面的工作机理,本发明利用cs算法对svr模型中径向基核函数(rbf)中出现的参数σ以及表达式中存在的惩罚因子c进行参数寻优,为此设计了一种交通拥堵预测流程。



技术实现要素:

本发明提出一种基于cs-svr算法,目的是针对短时道路交通拥堵的预测。包括以下步骤:

步骤s01:收集将要预测的某路段的某时段内的全部交通流量数据。为减少各数据之间特征相关性,提高预测精度,将其归一化,或者使用kpca法进行降维,生成svr训练样本。

步骤s02:初始化改进cs算法相关参数以及svr各参数。包括鸟巢的数量n,预测精度acc,最大迭代iter、搜索的步长α0、鸟蛋识别概率pa,设定pa为0.25。随机选取n个鸟巢初始位置假设每个鸟巢位置可用参数集合(c,g)表示,找出当前最优鸟巢的位置与最优适应度并记t=0。

步骤s03:保留上代最优鸟巢位置利用公式(8)计算lévy飞行步长并更新其他鸟巢位置。通过公式(7)得到新的鸟巢位置,计算它们适应度f。一般来说,适应度的设置遵循某方面指标最小或者最大的特性,本文选择预测精度误差最小作为适应度函数。

步骤s04:将这组新的鸟巢位置与上一组位置进行比较以及替换,得到一组较优的鸟巢位置

步骤s05:通过判断鸟巢主人是否识别出鸟蛋保留或改变鸟巢位置。产生一个服从均匀分布的随机数r作为鸟巢宿主发现外来蛋的概率并与设置好的识别概率定值pa对比,加入随机的r大于pa,则表明布谷鸟蛋已被识别,需要弃巢更新位置,反之保留鸟巢。因此。保留不被发现外来鸟蛋的鸟巢的位置,并且同时根据公式(12)改变发现外来鸟蛋的鸟巢位置pt+1。

步骤s06:将步骤s05中的pt+1与步骤s04中的pt互相比较,用pt+1中较优的解代替pt中较差的解。并判断其最优适应度是否满足设置的预测精度acc。如满足,则停止迭代进入步骤s07;否则需返回步骤s03重新迭代更新。

步骤s07:保留最优鸟巢位置以及对应的(c,g)值作为svr的最优参数,进行交通拥堵流量预测。

步骤s08:判断得出的值是否符合设定精度,如符合输出结果;否则,返回步骤s03。

有益效果:使用本发明方法的预测误差明显小于常用的svm算法,预测精度提高至少2.5倍。

附图说明

图1是本发明的流程图;

图2是对于路段2流量的预测结果;

图3是对于路段14流量的预测结果;

图4是对于路段22流量的预测结果;

图5是对于路段27流量的预测结果。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明。以下所描述的具体实施仅仅用以解释本发明,并不用于限定本发明。

本发明是利用布谷鸟搜索算法进行参数寻优,由svr分类器给出交通拥堵识别结果。

svr模型是支持向量机(supportvectormachine,svm)在回归估计问题中的进一步延伸。其回归本质是通过非线性映射φ(x)具体将低维数据x映射到高维特征空间,并完成线性回归拟合。其模型如下:

利用线性公式:

f(xi)=ωxi+b(1)

对样本s={(xi,yi)|xi∈rn,yi∈r,i=1,2,…,m}中的(xi,yi)进行线性拟合。其中,xi∈rn是具有n个特征的输入指向量;yi∈r是输出指标;f(xi)是回归函数返回的预测值;变量系数ω是该函数的复杂度;b为偏置量,反映了预测函数之间误差度。

当样本不满足拟合函数时,定义ε线性不敏感损失函数为:

并引入两个非负的松弛变量ξi、来对应数据点xi允许偏离的函数间距。之后通过最大化支持向量所组成的两条支持直线或者平面之间的几何间隔,在继续引入惩罚因子c之后,将线性回归拟合问题转化为约束优化问题,即:

式中的惩罚因子c为正则化参数;ε反映了误差量的精度要求。在求解上式中,引入lagrange算子αi、βi与将式(3)构造为一个lagrange方程:

根据kkt最优化条件,分别令并将(4)转化为:

可以解得最优解及b*,其对应的样本即为支持向量,其中k(xi,xj)为核函数。因此所求的回归模型又可以表示为:

本发明选择泛化性更好的径向基核函数(rbf)构造svr分类器。

径向基核函数(rbf):

利用布谷鸟搜索算法寻优目的是找出rbf核函数的σ以及公式(4)中的c。但由于套用了rbf公式,因此在程序编译时可直接设计寻优c和g。

布谷鸟搜索算法(cs)的本质就是使用搜索出来的新的解和更好的解来代替原本较差的解。为模拟布谷鸟搜索的过程,cs算法设定了三个理想状态:

(1)布谷鸟每次只能产一枚蛋,并随机选择鸟巢位置孵化,这代表一种解;

(2)在寻巢过程中,具有最优蛋的鸟巢会被保留并带到下一次迭代;

(3)设定的鸟巢数量是固定的,且布谷鸟蛋会被概率性得发现。如果发现,鸟巢主人会重新筑巢。

通过以上三种假设,cs算法的迭代更新通常可根据莱维(lévy)飞行的方式更新。

lévy飞行是许多动物和昆虫在飞行时所表现出来的一种具含幂律规律的特征。若用表示第i个鸟巢在第k代的鸟巢位置,在引入lévy飞行模式后,此时寻巢路径和位置更新表达式为:

其中的λ为幂次系数;α为步长控制量,步长信息为:

上式α0为常数,一般取值为0.01;xbest代表的是当前的最优解。

l(λ)为服从lévy概率分布的随机搜索路径,这里采用mantegna提出的模拟lévy飞行搜索路径公式:

l(λ)=μ/|v|1/β,0<β≤2(9)

参数β=λ-1,本文取值β=1.5;μ和v需要服从正态分布,则

由于lévy飞行的随机游走特性,局部极值附近会出现新解,因此该飞行的短步长搜索将会更有利于提高搜索解的质量。在某些状况之下,鸟巢宿主会概率性地发现鸟巢中布谷鸟的蛋。若宿主发现布谷鸟蛋的概率为pa,则:

式中xi,xj,xt为随机选择且互不相同的解;h(·)为阶跃函数;r为一个满足(0,1)均匀分布的随机数。在位置更新结束后,如果r>pa,鸟巢位置发生随机改变,否则就不变。

结合上述svr的描述以及在预测方面的工作机理,本文利用cs算法对svr核函数中出现的σ以及表达式中存在的惩罚因子c进行参数寻优。

为提高预测精度,需要对训练样本数据进行预处理,通常先选择kpca法进行降维,再用一化预处理的方式将数据归类到[0,1]区间。

结合图1所示,本文利用cs算法对svr核函数中出现的σ以及表达式中存在的惩罚因子c进行参数寻优,为此设计了一种交通拥堵预测流程,可将其步骤分解为:

步骤s01:收集要预测的某路段的某时段内的全部交通流量数据,包括速度等等。为减少各数据之间特征相关性,提高预测精度,将其归一化。生成svr训练样本。

步骤s02:初始化改进cs算法相关参数以及svr各参数。包括鸟巢的数量n,搜索精度acc,最大迭代iter、搜索的步长α0、鸟蛋识别概率pa,设定pa为0.25。随机选取n个鸟巢初始位置假设每个鸟巢位置可用参数集合(c,g)表示,找出当前最优鸟巢的位置与最优适应度并记t=0。

步骤s03:保留上代最优鸟巢位置利用公式(8)计算lévy飞行步长并更新其他鸟巢位置。通过公式(7)得到新的鸟巢位置,计算它们适应度f。一般来说,适应度的设置遵循某方面指标最小或者最大的特性,本文选择预测精度误差最小作为适应度函数。

步骤s04:将这组新的鸟巢位置与上一组位置进行比较以及替换,得到一组较优的鸟巢位置

步骤s05:通过判断鸟巢主人是否识别出鸟蛋保留或改变鸟巢位置。产生一个服从均匀分布的随机数r作为鸟巢宿主发现外来蛋的概率并与设置好的识别概率定值pa对比,加入随机的r大于pa,则表明布谷鸟蛋已被识别,需要弃巢更新位置,反之保留鸟巢。因此。保留不被发现外来鸟蛋的鸟巢的位置,并且同时根据公式(12)改变发现外来鸟蛋的鸟巢位置pt+1。

步骤s06:将步骤s05中的pt+1与步骤s04中的pt互相比较,用pt+1中较优的解代替pt中较差的解。并判断其最优适应度是否满足设置的搜索精度acc。如满足,则停止迭代进入步骤7;否则需返回步骤3重新迭代更新。

步骤7:保留最优鸟巢位置以及对应的(c,σ)值作为svr的最优参数,建立交通拥堵预测模型。

为检验所提出的基于cs-svr算法在道路交通流预测领域的可行性和有效性,本发明选择某市某新区路网中的第2号快速路段、第14号主干道路段、第22号次干道路段、第27号支路路段作为研究对象。

数据经过kpca法降维之后,部分短时交通流量数据如表1所示:

可知每个路段有18组数据,按其时间顺序定义为1:5:00-5:05;2:5:05-5:10;3:5:10-5:15;4:5:15-5:20;5:5:20-5:25;6:5:25-5:30;7:5:30-5:35;8:5:35-5:40;9:5:40-5:45;10:5:45-5:50;11:5:50-5:55;12:5:55-6:00;13:6:00-6:05;14:6:05-6:10;15:6:10-6:15;16:6:15-6:20;17:6:20-6:25;18:6:25-6:30。

下面在matlab环境下,检验本发明的预测精度,并与其他预测算法进行对比,仿真参数设定如下:

迭代代数m=200;

鸟巢数量n=20;

svr交叉的算子为5;

最鸟蛋识别率为0.25;

预测精度为0.0001。

对于路段2流量的预测结果如图2所示。

对于路段14流量的预测结果如图3所示。

对于路段22流量的预测结果如图4所示。

对于路段27流量的预测结果如图5所示。

目前来说,对短时交通拥堵预测用的比较广的模型是svm。为进一步验证本发明方法优越性,在使用表1同样数据的前提下,选择svm对于交通流量预测的相对误差与本发明cs-svr方法对于交通流量预测的相对误差,对比如表2所示。

通过表2可知,使用本发明方法的预测误差明显小于常用的svm算法,预测精度提高至少2.5倍。因此可以证明本发明的有效性及可行性。

注意,在进行预测时,必须对数据进行归一化处理,否则可能出现预测误差较大的情况。此外,以上所述仅为算法在较佳实施情况下的结果,并不用以限制本发明,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进、变形以及将本发明的方法应用在其他预测对象也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1