一种基于改进SVM算法的交通状态预测方法与流程

文档序号:14715354发布日期:2018-06-16 01:14阅读:153来源:国知局

本发明涉及智能交通系统—城市交通状态预测领域,具体而言涉及一种基于改进SVM算法的交通状态预测方法。



背景技术:

随着社会的快速发展,有限的道路资源与急剧增长的机动车数量之间的供需矛盾变得越来越尖锐,导致交通供求之间难以平衡,这直接造成各城市中的交通拥堵问题日益严峻。道路交通控制与诱导系统是应对城市交通问题的重要方法,短时交通状态预测是实现上述方法的关键问题之一。因此,近几十年来,该领域的研究者已提出多种类型的短时交通流量预测方法,包括:基于小波包和最小二乘SVM的短时交通流组合预测方法、基于多核混合SVM的城市短时交通预测方法、基于SVMR的区域路网多断面交通流的短时预测方法等。

基于改进SVM的方法是近些年来常用的城市道路短时交通状态预测方法之一。大量的实验结果表明,基于改进SVM的方法具有速度快、准确率高、泛化能力强。如:(1)杨兆升,王媛,管青.基于支持向量机方法的短时交通流量预测方法[J].吉林大学学报(工),2006,36(6):881-884;(2)张通,张骏,杨霄.基于混合AGO-SVM的高速公路短时交通量预测研究[J].交通运输系统工程与信息,2011,11(1):157-162;(3)Qian Chen,Wenquan Li,Jinhuan Zhao.The Use of LS-SVM for Short-term Passenger Flow Prediction[J].Transport,2011,26(1):5-10;(4)徐鹏,姜凤茹.基于蚁群优化支持向量机的短时交通流量预测[J].计算机应用与软件,2013,30(3):250-254;(5)Zhang M,Zhen Y,Hui G,et al.Accurate Multisteps Traffic Flow Prediction Based on SVM[J].Mathematical Problems in Engineering,2013,2013(6):91-109;(6)Wang X,An K,Tang L,et al.Short Term Prediction of Freeway Exiting Volume Based on SVM and KNN[J].International Journal of Transportation Science&Technology,2015,4(3):337-352等等。

然而,交通数据的准确性和有效性在很大程度上决定了预测模型的性能。从现场采集的交通数据,因受测量工具和测量环境的影响,采集的交通数据中不可避免的包含异常值,有时甚至含有严重的误差。目前对采集的交通数据仅做如下处理:数据清洗(丢失数据补齐,错误数据判别,冗余数据约简)、数据标准化(总和标准化,标准差标准化,极小极大值标准化,极差标准化)等,易发生弃真或取伪的错误,这直接对生成的预测模型造成影响。



技术实现要素:

本发明提出了一种基于改进SVM算法的交通状态预测方法,可改善现有SVM对异常值敏感问题。

实现本发明的技术解决方案为:一种基于改进SVM算法的交通状态预测方法,具体步骤为:

步骤1、对历史交通数据样本集进行预处理,具体为对交通数据样本集进行归一化处理,并根据道路中各路段的平均速度,对道路交通状态划分等级,每个等级的样本为一类样本,共m类样本;

步骤2、将归一化后的样本数据分割成k个不相交的子样本,从k个不相交的子样本中选取一个子样本作为测试数据集,其它k-1个子样本作为训练数据集;

步骤3、构建改进的SVM模型,用改进的SVM模型在训练数据集上进行模型训练,在训练过程中通过交叉验证的方法获得最优参数c1m和c2m;

步骤4、更新改进的SVM模型的增广向量确定最优增广向量zm,生成最优的改进的SVM预测模型;

步骤5、输入测试数据集至最优的改进的SVM预测模型,获得一组交通状态预测精度;

步骤6、依次从k个不相交的子样本中选取一个子样本作为测试数据集,其它k-1个作为训练数据集,重复步骤3、4,直至所有子样本都作为测试数据集和训练数据集被训练为止,总共得到k组交通状态预测精度,对k组交通状态预测精度求平均值,该平均值为最终的交通状态预测结果。

本发明与现有技术相比,其显著优点为:(1)利用改进的SVM算法可以有效地缓和数据中异常值的影响,增强模型的鲁棒性,并提高其泛化能力。(2)改进的SVM算法可以提高交通状态的预测精度,为城市道路交通的有序、高效通行提供强有力的保障。

下面结合附图对本发明做进一步详细的描述。

附图说明

图1为本发明一种基于改进SVM算法的交通状态预测方法的流程图。

具体实施方式

结合图1所示,一种基于改进SVM算法的交通状态预测方法,具体步骤为:

步骤1、对历史交通数据样本集进行预处理,具体为对交通数据样本集进行归一化处理,并根据道路中各路段的平均速度,对道路交通状态划分等级,每个等级的样本为一类样本,共m类样本;

其中,对交通数据样本进行归一化处理的具体公式为:

di=(xi-min(X))/(max(X)-min(X))

式中,X=(x1,x2,...,xn)∈Rn,表示交通数据样本集,xi(i=1,2,...,n)表示交通数据样本集中的第i个数据样本,min(X)表示交通数据样本集中最小的数据样本,max(X)表示交通数据样本集中最大的数据样本,di表示归一化后的数据样本。

对道路交通状态划分等级的具体方法为,按照城市道路交通规划设计规范,以不高于15分钟为统计间隔,计算道路中各路段的平均速度,并将道路交通状态划分为五级,包括畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵,交通状态等级划分依据为:

步骤2、将归一化后的样本数据分割成5个不相交的子样本,从5个不相交的子样本中选取一个子样本作为测试数据集,其它k-1个子样本作为训练数据集;

步骤3、构建改进的SVM模型,用改进的SVM模型在训练数据集上进行模型训练,在训练过程中通过交叉验证的方法获得最优参数c1m和c2m,其中,构建的改进的SVM模型具体为:

s.t.-(Bmwm+e2mbm)+qm=e2m

其中,||·||1表示L1范数距离,c1m和c2m是惩罚系数,e1m和e2m是相应维度的单位列向量,qm是松弛变量,矩阵Am表示第m类样本,矩阵Bm表示其余的m-1类样本,wm表示第m类样本的权向量,bm表示第m类样本的偏差;

步骤4、更新改进的SVM模型的增广向量确定最优增广向量zm,生成最优的改进的SVM预测模型,具体步骤为:

步骤4.1、设置迭代次数p=0,初始化增广向量根据计算对角矩阵及其中,

步骤4.2、根据对角矩阵及和最优参数c1m及c2m计算增广向量具体计算公式为:

其中,Hm=[Am e1m],Gm=[Bm e2m],I表示单位矩阵;

步骤4.3、根据增广向量更新对角矩阵和具体为:

步骤4.4、计算改进的SVM模型的目标函数值若且p≤30,更新目标函数值并更新迭代次数p=p+1,返回步骤4.2,否则将当前的作为改进的SVM模型最优的增广向量zm,生成最优的改进的SVM预测模型。

步骤5、输入测试数据集至最优的改进的SVM预测模型,获得一组交通状态预测精度;

步骤6、依次从5个不相交的子样本中选取一个子样本作为测试数据集,其它4个作为训练数据集,重复步骤3、4,直至所有子样本都作为测试数据集和训练数据集被训练为止,总共得到5组交通状态预测精度,对5组交通状态预测精度求平均值,该平均值为最终的交通状态预测结果。

下面结合实施例进行更详细的描述。

实施例1

一种基于改进SVM算法的交通状态预测方法,具体步骤为:

步骤1、对历史交通数据样本集进行预处理,具体为对交通数据样本集进行归一化处理,并根据道路中各路段的平均速度,对道路交通状态划分等级,每个等级的样本为一类样本,共m类样本;

其中,对交通数据样本进行归一化处理的具体公式为:

di=(xi-min(X))/(max(X)-min(X))

式中,X=(x1,x2,...,xn)∈Rn,表示交通数据样本集,xi(i=1,2,...,n)表示交通数据样本集中的第i个数据样本,min(X)表示交通数据样本集中最小的数据样本,max(X)表示交通数据样本集中最大的数据样本,di表示归一化后的数据样本。

对道路交通状态划分等级的具体方法为,按照城市道路交通规划设计规范,以不高于15分钟为统计间隔,计算道路中各路段的平均速度,并将道路交通状态划分为五级,包括畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵,交通状态等级划分依据为:

2002年,我国公安部公布了《城市交通管理评价指标体系》,该体系规定交通运行的拥挤程度用城市主干路上机动车的平均速度来描述。按照城市道路交通规划设计规范(GB50220—1995)划分的道路等级,以不高于15分钟为统计间隔,计算道路中各路段的平均速度,并将道路交通状态划分为五级(畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵)。用1到5,五个数字表示,每个数字代表一级交通状态,详情见表1。

表1城市道路交通状态等级划分

其中,V表示平均速度,单位为km/h。

步骤2、将归一化后的样本数据分割成5个不相交的子样本,从5个不相交的子样本中选取一个子样本作为测试数据集,其它4个子样本作为训练数据集;

步骤3、构建改进的SVM模型,用改进的SVM模型在训练数据集上进行模型训练,在训练过程中通过交叉验证的方法获得最优参数c1m和c2m;其中,构建的改进的SVM模型具体为:

s.t.-(Bmwm+e2mbm)+qm=e2m

其中,||·||1表示L1范数距离,||·||2表示L2范数距离,c1m和c2m是惩罚系数,e1m和e2m是相应维度的单位列向量,qm是松弛变量,矩阵Am表示第m类样本,矩阵Bm表示其余的m-1类样本,wm表示第m类样本的权向量,bm表示第m类样本的偏差;

构建改进SVM模型的过程如下:

对于多分类的基于L1范数距离度量的最小二乘孪生有界支持向量机(简称MLSTBSVML1)算法而言,它构建了N(N=1,2,...,m-1)个二分类的基于L1范数距离度量的最小二乘孪生有界支持向量机(简称LSTBSVML1)分类器。其中,第N个LSTBSVML1分类器把第m类视为正类样本,同时把其他m-1类当作负类样本。MLSTBSVML1求解m个线性方程组并生成m个分类平面,每一类对应一个平面。MLSTBSVML1的目标函数构建如下:

s.t.-(Bmwm+e2mbm)+qm=e2m

其中,||·||1表示L1范数距离,||·||2表示L2范数距离,c1m和c2m是惩罚系数,可以克服MLSTBSVML1算法中样本不平衡的问题。e1m和e2m是相应维度的单位列向量,qm是松弛变量,第m类和其余的m-1类样本分别由矩阵Am和Bm组成。本发明中所有向量均为列向量,除非在向量右上角通过T转置成行向量。公式(1)的优化目标是第m类的样本距其相应的平面尽可能的近,同时离它类的平面尽可能的远。重写公式(1)如下

s.t.-(Bmwm+e2mbm)+qm=e2m

其中,D1m=1/|Amwm+e1mbm|,D2m=1/|e2m+Bmwm+e2mbm|。公式(2)中包含了绝对值操作,不易于直接求解,为解决此类问题,本发明设计了一个迭代优化算法,其基本思想是迭代更新目标函数值直到收敛到一个固定值(0.001)。分别求解公式(2)关于wm和bm的偏导数,并令它们的偏导数等于0。

其中,I为相应维度的单位矩阵。联合等式(3)和(4),得到:

变换式(5),得到式(6):

定义zm=(wm bm)T,Hm=[Am e1m],Gm=[Bm e2m],重写等式(6),得到:

其中,D1m=diag(D11,D12,...,D1m),D2m=diag(D21,D22,...,D2m),分别为对角矩阵。通过等式(7)即可获得权向量wm和偏差bm,进一步,得到最优的非平行分类平面如下:

xTwm+bm=0 (8)

一个新的数据点x∈Rn被分配给第m类,需根据其到它的决策函数的垂直距离的大小决定,决策函数如下,

其中,|·|表示绝对值操作。

步骤4、更新改进的SVM模型的增广向量确定最优增广向量zm,生成最优的改进的SVM预测模型,具体步骤为:

步骤4.1、设置迭代次数p=0,初始化增广向量根据计算对角矩阵及其中,

步骤4.2、根据对角矩阵及和最优参数c1m及c2m计算增广向量具体计算公式为:

其中,Hm=[Am e1m],Gm=[Bm e2m],I表示单位矩阵;

步骤4.3、根据增广向量更新对角矩阵和具体为:

步骤4.4、计算改进的SVM模型的目标函数值若且p≤30,更新目标函数值并更新迭代次数p=p+1,返回步骤4.2,否则将当前的作为改进的SVM模型最优的增广向量zm,生成最优的改进的SVM预测模型。

步骤5、输入测试数据集至最优的改进的SVM预测模型,获得一组交通状态预测精度;

步骤6、依次从5个不相交的子样本中选取一个子样本作为测试数据集,其它4个作为训练数据集,重复步骤3、4,直至所有子样本都作为测试数据集和训练数据集被训练为止,总共得到5组交通状态预测精度,对5组交通状态预测精度求平均值,该平均值为最终的交通状态预测结果。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1