一种基于SVM算法对短时交通路况预测的方法与流程

文档序号:11252152阅读:1409来源:国知局

本发明属于智能交通技术领域,具体涉及一种基于svm算法对短时交通路况预测的方法。



背景技术:

道路交通系统是一个众多人参与、实时变化、复杂的非线性系统,具有高度的不确定性,和随机性。这些因素都给交通预测带来了困难,尤其是短时交通预测受随机干扰因素如交通事故、道路施工、突发事件、天气变化等影响更大,不确定性更大规律性更加不明显。交通流具有高度的复杂性、非线性和不确定性,因此以经典的数学方法为基础建立的交通路况预测模型,其预测精度难以很好地满足智能交通系统中实时交通控制诱导的需求。随着交通预测领域研究的深入,各种方法大体可分为两类:一类是以数理统计等传统数学为基础的预测方法;另一类是不追求严格的数学推导,更重视对真实交通现象拟合效果的预测模型。第一类包括时间序列模型,卡尔曼滤波模型,参数回归模型等;第二类则包括非参数回归模型,基于小波理论的方法,神经网络模型等。

西南交通大学计算机与通信工程学院的李存军、杨儒贵、张家树于2003年在计算机应用刊物上发表了论文《基于小波分析的交通流量预测方法》。论文中为了更准确地预测动态变化的交通流量,提出了在小波分析的基础上利用离散卡尔曼滤波进行预测的方法,这种方法可用于动态数据预测的不同领域,如网络流量的预测,经济信息的预测以及其它非线性系统的预测。实验表明,这种方法可以有效地减小数据预测的误差。西南科技大学信息工程学院的申慧、刘知贵、李春菊于2008年在西南科技大学学报上发表了论文《基于bp神经网络的交通流量预测设计》。论文中以交通流量控制为目标,在交通流量特性的研究基础上,建立了基于bp神经网络的交通流量预测模型,并以某三岔口路段为例进行验证,根据相邻两路段的交通流量和天气状况作为输入建模,结果表明预测系统能够比较准确地预测另一路段的交通流量。中国科学院自动化研究所的宫晓燕、汤淑明于2003年在中国公路学报上发表了论文《基于非参数回归的短时交通流量预测与事件检测综合算法》。论文中非参数回归的交通流预测主要根据历史流量数据哭的建立,将实时观察数据通过k近邻搜索算法与历史数据进行匹配,在加权平均得到最终预测结果。该方法无需训练,方便移植,预测误差较小。

现有针对交通预测的方法众多,各有优势和劣势:时间序列模型在大量不间断数据基础上精度较高,但参数估计复杂,参数不能移植,实际应用中会因为数据遗漏问题导致预测精度降低,且依赖大量历史数据,成本很高。卡尔曼滤波法的预测精度随预测时间间隔的变化不大,但每次计算均需调整权值,计算较为复杂,难以用时实时在线预测,输出结果会延迟几个时间段。非参数回归不需要先验知识,只需历史数据,通过寻找历史数据中与当前点相似的近邻,用得到的近邻预测下一时刻结果。该方法使用方便,误差分布情况良好,但在大量历史数据中搜索近邻的复杂度可能会影响预测结果输出的时效性。神经网络凭借其逼近任意非线性函数的能力和所具有的容错、自学习等优势,已被国内外很多学者用于建立交通流量预测模型,并取得了不少研究成果。由于神经网络是一种依赖经验的启发式技术,他的学习过程采用经验风险最小化原则,在小样本情况下,容易出现过拟合现象导致泛化能力低下。同时神经网络算法复杂性受网络结构复杂性和样本复杂性的影响较大。这些不足,使神经网络模型在交通流预测中的应用效果不如期望的那么好,对于非平稳的短时交通流,当输入数据混有噪声时,神经网络预测精度会更差。

故基于以上不同方法的分析,和智能交通系统中的实际应用场景,确定选用基于支持向量机的非线性回归方法来进行短时交通路况预测。而基于支持向量机的非线性回归预测有严格的理论和数学基础,基于结构风险最小化原则,泛化能力优于神经网络等,算法具有全局最优性。该方法的主体思想是根据一些训练样本,寻找一个最优的函数,使得函数对输入x的估计y'与实际输出y之间的期望风险(可以暂时理解为误差)最小化。



技术实现要素:

为了解决上述问题,本发明提供一种基于svm算法对短时交通路况预测的方法,所述方法通过svm的非线性回归进行预测路况值,根据之前邻近时段的路况值去训练svm模型,进而预测下个时段的路况值,并根据路况值转化为拥堵等级完成短时各道路交通拥堵状况的预测;

进一步地,所述方法包括:

s1:选择核函数,确定svm参数,在得到邻近时段的路况值的数据集后,选择高斯核函数作为核函数,所述svm参数包含宽度参数δ、二次规划的优化参数ε和c;

s2:输入邻近时段的路况值数据集作为样本,生成预测函数;

s3:根据预测结果进行评价分析后输出结果;

s4:根据输出结果所代表的的路况信息,进行短时交通路况预测;

进一步地,所述s1中选择核函数,确定svm参数的具体方法如下;

1)假定训练数据集记为t={(xi,yi)}li=1,首先用非线性映射ψ(x)=[ψ1(x),ψ2(x),…,ψn(x)]t把输入数据从原空间映射到n维特征空间,在特征空间中构造逼近函数;

2)在高维空间的线性回归对应着低维空间的非线性回归,定义ε为不敏感损失函数lε(x,y,f)=|y-f(x)|ε=max(0,|y-f(x)|-ε);

3)最小化目标函数

其中,xi∈rn是第i个输入,yi∈r是对应的期望输出;ω=[ω1,ω2,…,ωn]t是线性权值变量,b为偏置;ε和c是两个由使用者决定的自由参数;

4)按下式对测试样本x进行预测,并对应输出,

其中,k为满足mercer条件的核函数,所述核函数包括多项式核函数,sigmoid核函数和高斯径向基核函数;

进一步地,所述s1中采取动态调整svm参数方法,用先验知识确定第一个svm参数,来优化第二个svm参数,在第二个svm参数确定后在优化第一个svm参数,最后再根据不同参数下的评价指标结果各自验证其最优性;

进一步地,所述s2具体为在选定核函数和svm参数后,输入样本,求得lagrange乘子αi(i=1,2,…,l)和偏置b,从而确定预测函数

进一步地,所述s3具体为计算相关预测评价指标,确定预测误差,在正常接受范围内,则将预测的道路路况信息对应为相应的拥堵等级进行输出展示;

进一步地,所述s4具体为:设vi(t)为路段i上t时刻的交通路况值即通过平均速度,vi(t-1)为路段i上t-1时刻的交通路况值;将xi=[vi(t),vi(t-1),…,vi(t-m)]t作为样本t时刻的输入值,vi(t+1)作为样本的输出值yi,svm训练完成后,按预测函数公式对交通路况值进行预测;

本发明的有益效果如下:

1)基于支持向量机的非线性回归预测有严格的理论和数学基础,基于结构风险最小化原则,泛化能力优于神经网络等,算法具有全局最优性,根据一些训练样本,寻找一个最优的函数,数对输入x的估计y'与实际输出y之间的期望风险最小化;

2)采用了动态调整参数的办法去得到svm模型,确定出核函数最优参数,从而达到提高预测精度,减小误差的效果;

3)基于svm的非线性回归进行预测路况值,根据之前邻近时段的路况值去训练svm模型,进而预测下个时段的路况值,并根据路况值转化为拥堵等级完成短时各道路交通拥堵状况的预测。

附图说明

图1为本发明中所述验证集预测结果和真实道路路况值对比图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。

下面结合附图和具体实施例对本发明作进一步说明,但不作为对本发明的限定。下面为本发明的举出最佳实施例:

本发明提供一种基于svm算法对短时交通路况预测的方法,具体基于svm的预测算法步骤如下:

step1,选择核函数,确定svm参数。在得到数据集后,选择高斯核函数作为核函数,包含宽度参数δ、二次规划的优化参数ε、c。由于基于先验知识选择参数,会导致不同数据对先验参数适用程度不同,影响最终整体预测精度。故采取动态调整参数方法,用先验知识确定第一个参数,来优化第二个参数,在第二个参数确定后在优化第一个参数,最后再根据不同参数下的评价指标结果各自验证其最优性。

step2,输入数据集,生成预测函数。在选定核函数和svm参数后,输入样本求得lagrange乘子αi(i=1,2,…,l)和偏置b,从而确定预测函数

step3,根据预测结果进行评价分析后输出结果。计算相关预测评价指标,确定预测误差。在正常接受范围内,则将预测的道路路况信息对应为相应的拥堵等级进行输出展示。

短时交通路况预测过程:

由于交通流随着时间是连续变化的,路段上的当前路况和前几个短时时段的路况有着紧密的关系,据此本文利用路段前几个短时时段的路况信息去预测未来时段的路况。

设vi(t)为路段i上t时刻的交通路况值即通过平均速度,vi(t-1)为路段i上t-1时刻的交通路况值。将xi=[vi(t),vi(t-1),…,vi(t-m)]t作为样本t时刻的输入值,vi(t+1)作为样本的输出值yi。svm训练完成后,可按预测函数公式对交通路况值进行预测。

非线性回归的svm算法原理如下:假定训练数据集记为t={(xi,yi)}li=1,首先用非线性映射ψ(x)=[ψ1(x),ψ2(x),…,ψn(x)]t把输入数据从原空间映射到n维特征空间,在特征空间中构造逼近函数

这样在高维空间的线性回归对应着低维空间的非线性回归,定义ε为不敏感损失函数;

lε(x,y,f)=|y-f(x)|ε=max(0,|y-f(x)|-ε),

需要求解的非线性回归问题就是最小化目标函数

其中,xi∈rn是第i个输入,yi∈r是对应的期望输出;ω=[ω1,ω2,…,ωn]t是线性权值变量,b为偏置;ε和c是两个有用户决定的自由参数。

测试样本x对应的输出按下式进行预测,

其中,k为满足mercer条件的核函数,通常使用的核函数有多项式核函数,sigmoid核函数,高斯径向基核函数。

本发明对一个城市某个四向交叉口其中一条主干道的路况进行预测,测量数据为其中一周的数据,按每15分钟为一个测量间隔,每天24小时连续统计,共12542条准备数据。将当前时刻路况值和之前4个时刻路况值作为模型输入变量xi,其中上述12542条数据中70%作为模型训练样本集,30%作为预测模型的验证样本集。选择了gauss型核函数通常,减小ε或σ2会提高训练精度,但会降低泛化性能;增大c也能提高训练精度。

仿真发现,参数ε、c,以及核宽度σ2对预测结果有较大影响,需要根据训练数据进行具体确定。下图为σ2=0.5,c=10,ε=0.05的道路路况值预测结果。

预测结果评价,均方根误差rmse为7.04,平均绝对误差mae值为5.39,平均绝对百分误差mape为14%。

以上所述的实施例,只是本发明较优选的具体实施方式的一种,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1