一种基于量子粒子群优化策略的车联网交通流量预测方法与流程

文档序号:21041888发布日期:2020-06-09 20:43阅读:305来源:国知局
一种基于量子粒子群优化策略的车联网交通流量预测方法与流程

【技术领域】

本发明属于车联网领域,具体涉及一种基于量子粒子群优化策略的车联网交通流量预测方法。



背景技术:

在智能交通系统(its)中由于车辆的移动性和随机性,都是交通数据流量的随机影响因素,因此交通流量数据经常难以准确预测。为解决its中的交通流量数据预测问题,目前很多学者提出了各种特点各异的预测方法。通常可以将这些方法分为两种类型:传统预测方法和智能预测方法。传统的流量预测方法包括markov,poisson,arma等。但是它们基于线性方法。随着交通规模的迅速发展,交通呈现出复杂,非线性,时变的特点。由于这些特点,传统的线性建模方法已无法精准的表达。因此,传统的预测方法很难获得理想的结果。

利用神经网络技术预测交通流量数据的研究逐渐深入,但考虑到神经网络算法的弊端,很多学者开始选择引入全局优化算法来选择更优秀的参数,以提高网络预测性能。比如引入粒子群算法(pso)对rbf神经网络参数进行优化操作。尽管pso能够提升一定的网络性能,但pso算法也有其弊端,比如收敛速度慢、精度低、群体早熟等问题。由于这些问题,使得该算法无法每次都得到全局最优解,也因此影响pso-rbf的训练速度和诊断精度。



技术实现要素:

本发明的目的是解决psorbf神经网络算法中收敛速度慢、精度低、群体早熟等问题。由于这些问题,使得psorbf神经网络算法无法每次都得到全局最优解,也因此影响神经网络的训练速度和诊断精度等问题。因此提供一种基于量子粒子群优化策略的车联网交通流量预测方法。针对交通流量数据的特点和rbf神经网络预测参数初始值的设置重要性,提出了一种量子粒子群优化策略,将模拟退火遗传算法用于确定量子粒子群的聚类初始中心,并根据量子粒子群优化策略对rbf神经网络参数进行优化。此后利用优化后的神经网络预测交通流量数据。

本发明提供的一种基于量子粒子群优化策略的车联网交通流量预测(mpso-rbf)方法,主要包括如下关键步骤:

第1、交通流量预测数学模型建立,根据影响交通流量数据的几个要素,针对固定某一路段,建立基于该路段当前时刻、过去时段和上游流量状况的关系模型为f(vt,ut,t)=yt,,其中t为当前时刻,vt为所测路段的上游路段l个路口的流量状况,ut为所测路段前d个时间段的流量状况,yt为最终预测的交通数据流量;

第2、使用模拟退火算法(sa)和遗传算法(ga)优化量子粒子群优化策略的初始聚类中心;具体包括:

第2.1、创建初始种群并赋初值,初始化隶属度矩阵u,建立初始聚类中心矩阵v;

第2.2、在全局空间范围内搜索最优解;对每个个体进行遗传算法操作,由此产生的全新个体再经过模拟退火延续至下一代群体;通过反复不断迭代上述过程,直到温度小于设置的温度阈值的终止条件,从而得到最优解,该最优解即为确定的量子粒子群优化策略初始聚类中心;

第3、优化rbf神经网络参数,使用改进和优化后的量子粒子群优化策略,增大粒子位置的随机性,输出最优化的rbf神经网络参数;具体包括:

第3.1、随机创建初始种群,并给各粒子的位置和速度随机赋予初值;

第3.2、计算各个粒子的适应度值,之后比较所有粒子适应度值,取得具有最优适应度的粒子位置;

第3.3、更新粒子的速度和位置;

第3.4、比较当前所有的粒子最优解和上一迭代周期的全局最优解,更新全局最优解。得到的全局最优解即为优化后的rbf神经网络参数。

第4、采用模糊c均值聚类算法(fcm)对径向基函数神经网络(rbf)进行训练,聚类得到的每组子样本都构成神经网络中的一个神经元。具体包括:

第4.1、采用模糊c均值聚类算法(fcm)对rbf神经网络进行训练,计算初始聚类中心c和隶属度矩阵u。将聚类的每组子样本作为rbf神经网络的神经元。选择初始聚类中心c和隶属度矩阵u中的一个变量进行赋值,利用两个变量相互关联性,使得两个变量通过不断的迭代和更新,不断减小目标函数的值,直到系统到达平稳状态,而平稳状态下即为所求的初始聚类中心c和隶属度矩阵u。

第4.2、聚类后所获得的聚类样本组作为rbf神经网络的神经元。

第5、使用实际交通流量数据训练最终优化后的rbf神经网络。最后使用该路段的当前时刻,过去时段和上游流量状况数据运用在训练后的rbf神经网络上,最终获得当前时刻交通流量预测数据。

本发明的优点和积极效果

本发明将遗传模拟退火算法用于优化初始聚类中心,用模糊c均值聚类算法训练rbf网络,并用量子粒子群算法优化神经网络参数,得到了效果更为稳定的交通流量预测算法。mpso-rbf算法具有更好、更稳定的精准度,更好的性能表现,且具有简洁结构简单的特点。

【附图说明】

图1是mpso-rbf方法的流程图;

图2是径向基神经网络结构模型图;

图3是实验测试的长沙市芙蓉区路网图;

图4是长沙市芙蓉区路段9月17日-21日上午10点前交通流量数据;

图5是实验测试的北京四环东路路网图;

图6是北京四环东路路段于11月2日下午15:00-15:30的交通流量数据;

图7是交通数据流量预测算法mse误差比较(长沙);

图8是交通数据流量预测算法rmse误差比较(长沙);

图9是交通数据流量预测算法预测效果比较(长沙);

图10是交通数据流量预测算法mse误差比较(北京);

图11是交通数据流量预测算法rmse误差比较(北京);

图12是交通数据流量预测算法预测效果比较(北京)。

【具体实施方式】

本实施例设计的方法是选择两种不同场景的交通流量数据,从横纵两个方向分别做预测。为清晰显示本发明提出的mpso-rbf算法对于交通流量数据的预测优势,将本发明算法在两种实际场景下与其他两种算法:qpso-rbf和传统rbf进行比较实验。本发明算法性能衡量指标选择均方差mse和均方根误差rmse。其中在附图4和附图7-12中正方形表示qpso-rbf算法,“加号”表示rbf算法,“星号”表示实际数据,“圆圈”表示本发明所提出的mpso-rbf算法。mpso-rbf算法参见附图1,具体实施过程详述如下:

步骤1、建立交通流量预测数学模型:

步骤1.1、建立预测数学模型

根据影响交通流量数据的几个要素,针对固定某一路段,本发明建立基于该路段当前时刻、过去时段和上游流量状况的关系模型,如公式(1)所示。

f(vt,ut,t)=yt(1)

式中,vt=(v1,v2,...,vl)为所测路段的上游路段l个路口的流量状况(括号中vi是第i个路口的流量状况),ut=(ut-1,ut-2,...,ut-d)为所测路段前d个时间段的流量状况(ut-i是当前t时刻前i个时间段),t表示当前时刻。yt为t时刻对应的该路段交通流量状况。由于公式(1)是一个非线性模型,要想得到输入输出之间的关系,需要使用非线性建模对其进行逼近。映射关系通过公式(2)求得映射,并通过该映射关系得到预测的短时交通流量数据值。

γ(vt,ut,t)→f(vt,ut,t)(2)

步骤2、优化量子粒子群优化策略的初始聚类中心:

在优化聚类rbf神经网络中,结合模拟退火算法和遗传算法两种算法的优势,同时劣势互补,将全局和局部的搜索能力同时提高,从而提升搜索效率。

神经网络算法的原理本质是模仿生物的神经细胞工作原理。rbf是一个三层的神经网络结构。三层结构分别是输入层、隐藏层和输出层。前两者之间属于非线性变换,后两者之间属于线性变换。rbf神经网络的原理是将目标函数表示为一些rbf的总和。由于其简单经典的三层网络结构,同时具备快速收敛和局域近似能力,rbf神经网络经常用于解决高阶非线性函数的拟合问题。

rbf神经网络第一层输入层是维度为p、含有n个样本的向量,传输函数为线性函数。第二层隐藏层,每一个隐藏神经元都与每一个输入向量相连,但隐藏神经元之间是相互独立的,传输函数为径向基函数。输入的x1,x2,…,xp为离散点,通过设置基函数,并根据基函数对样点周围的点做插值便可以得到一个平滑函数。径向基神经网络的激活函数可表示为公式(3)。

其中,xp为第p个输入样本,ci为第i个中心点,r为隐藏层神经元个数,σ为基函数的宽度。如果σ较低,那么高斯函数将变的尖锐,这意味着边缘点的权值会很小,就会造成过拟合现象。xp-ci为向量离每一个隐含层中心的距离。一般每个节点都有对应的隐含层中心,xp-ci所表示的距离就是节点矩阵自身相对自身每个点的距离。xp-ci越小,说明与节点的距离越近,该节点对系统输出的影响就越大。

定理1高斯核函数能够将原空间映射到高维空间

证明首先给出高斯核函数的定义公式:

实际上,可以化简为:

通过幂级数展开:

公式(4)、(5)、(6)中表示高斯核函数,表示原始空间中的两个向量,σ为基函数的宽度。根据公式(4)、(5)、(6)的推导过程可以观察到,当输入交通流量样本数据x向量时,x向量会生成类似多项式核展开的形式,也就是说,如果原始向量包含x1,x2两个参数,那么通过映射,就会包含x1*x1,x1*x2,x2*x2三个参数,即通过映射,由二维形式变成了三维形式,也就是说映射到了更高维的空间中。

对于高斯核函数的径向基,方差由公式(7)求解:

其中,cmax为所选取中心点之间的最大距离,h为聚类中心个数。rbf神经网络的输出可根据公式(8)计算得出。

其中,ωij为隐含层与输出层之间的神经元的连接权值,可以通过公式(9)计算得到。

传统的rbf神经网络通常采用聚类算法来训练网络,聚类得到的每组子样本都构成神经网络中的一个神经元。经过合理的神经网络训练后,就可以得到如公式(11)所示的网络中的映射关系。

其中

在经过合理的优化后,得到使rbf神经网络性能更优的参数权值,便可以得到公式(1)、(2)所指的由(vt,ut,t)到yt的映射,通过映射关系便可以对应得到影响交通流量数据的输入与输出之间的关系。

步骤2.1、同时使用模拟退火算法(sa)和遗传算法(ga)优化量子粒子群优化策略初始聚类中心。

算法1模拟退火遗传算法(sa-ga)的算法流程如下:

1、编码方式。针对交通流量数据的特点和数据量,本文采用实数编码。每条染色体由h个聚类中心组成:c=c1,c2,...,ch。对于维度为p的样本,染色体长度为h*m。

2、设置适应度函数。适应度函数是遗传算法在搜索操作中的重要判断依据,进化搜索也是建立在对每一个个体的适应度函数值的判断上,故选择合适的适应度函数直接决定了算法的优良性能。每个个体的目标函数根据公式(21)计算得到,jm越小说明类内离散度和越小,对应个体适应度越高。因此,个体适应度函数设置为:

3、交叉操作。个体间互换基因,通过基因的重组产生具有更高适应度值的新个体。

4、变异操作。以一定的概率对每个基因位上的实数进行变异操作,然后用一个随机数替换发生变异的基因位。

5、个体模拟退火。模拟退火算法中的能量值选用个体适应度值表达,当该值变大时,则选择当前值作为下一个当前解,当该值变小时,则以一定的概率接受当前解。

步骤3、优化rbf神经网络参数

pso算法的经典速度位置公式如公式(13)、公式(14)所示,包含常数学习因子,惯性权重等参数。

其中,w为惯性因子,表示粒子保持的运动惯性;c1为局部学习因子,代表每一个粒子朝该粒子当前最优位置即局部最优位置运动加速项的权重;c2为全局学习因子,代表每一个粒子朝当前全局最优位置运动加速项的权重;r1、r2为(0,1)之间的随机数;v表示粒子速度,q表示粒子位置。

传统的pso算法由于参数设定的限制妨碍了其最优参数的寻找成功率,而且由于粒子的位置变化相对固定,缺少随机性,导致很容易陷入局部最优。

步骤3.1、量子粒子群优化策略

量子粒子群优化(quantumparticleswarmoptimization,qpso)算法针对pso算法的缺陷,不再考虑粒子移动的方向,即粒子位置的更新与该粒子此时之前的运动没有联系,以此使得粒子位置的随机性增大。与pso算法不同,qpso算法引入了新的粒子位置相关名词:mbest表示pbest的平均值,即平均的粒子历史最好位置。量子粒子群算法的粒子更新步骤:

1、计算mbest

其中s表示粒子群的大小,plocal_i表示当前迭代中的第i个plocal。

2、粒子位置更新

pi=φ·plocal_i+(1-φ)pglobal(16)

其中pglobal表示当前全局最优粒子,pi用于第i个粒子位置的更新。在qpso算法不考虑粒子移动历史情况的基础上,本算法修改了粒子位置更新公式。将一个随机参数变为两个随机参数,更好的保证了随机性,降低局部最优风险。

其中,φ1、φ2为(0,1)之间的随机数。适应度函数由公式(18)表示。

其中,ti(x)为rbf神经网络的预测输出值,yi(x)为实际输出值。该适应度函数能够清晰的反应每个粒子的迭代进化效果。粒子位置更新公式为:

其中xi表示第i个粒子的位置,u为(0,1)上的均匀分布数值。取+和-的概率为0.5,当u>0.5时,取+,反之取-。α为qpso中的唯一参数。α根据迭代次数不断更新,可以使得粒子位置更趋于最优,α取值一般小于1。α由公式(20)求得:

式中loopcount为最大迭代次数,curcount为当前迭代次数。

算法2量子粒子群算法步骤如下:

1、随机创建初始种群,并给各粒子的位置和速度随机赋予初值;

2、根据适应度函数计算各个粒子的适应度值,将得到的适应度值和对应的粒子位置记录在该粒子的pbest中,之后比较所有粒子适应度值,将具有最优适应度的粒子位置和对应适应度值记录在gbest中。

3、更新粒子的速度和位置,将每个粒子的当前位置与目前为止的最优位置进行比较,如果优于当前最优位置则更新最优位置信息。

4、比较当前所有的pbest和上一迭代周期的gbest,更新gbest。

5、当迭代次数达到上限或达到阈值限度,则停止搜索操作,将此时系统优化结果输出,若未达到终止条件,则回到量子粒子群算法的操作2继续搜索。

算法2量子粒子群优化策略

经过改进的量子粒子群优化策略,更好的保证了随机性,降低局部最优风险,增加了其最优参数的寻找成功率。

步骤4、采用模糊均值聚类算法(fcm)对rbf神经网络进行训练。

fcm是模糊聚类算法中的一种很经典的算法。传统硬聚类,诸如k-means聚类方法是把个体严格的归到固定对应的某一类中,每个个体都有固定的分类属性且分类间无交集,但实际生活中的数据,包括交通流量数据,无法根据个体特征划分到完全不同的类别当中,所以就需要引入带有隶属度的聚类算法来模糊分类之间的界限,故可以有针对性的对此类数据做聚类划分。

所谓模糊集就是,如果d中的任意一个固定元素x,都有一个数u(x)∈[0,1]与之对应,那么u就是d上的一个模糊集,u(x)称为x对d的隶属度。如果x是d中的任意一个变化元素,那么此时u(x)就是一个函数,称为u的隶属函数。隶属度u(x)越大,表示x从属u的可能性越大,u(x)越小,表示x从属u的可能性越小。因此,x属于u的可能性大小,可以用隶属函数u(x)表示。

基于模糊集、隶属度和隶属度函数的概念,fcm模糊聚类的目标函数如公式(21)所示。

其中,dist(ci,xs)为每个数据点与每个聚类中心的距离,m为加权指数。jm[u,c]即模糊聚类的目标函数就是各个数据点到每个聚类中心的加权平方和。

fcm在计算聚类中心c之外,还会计算隶属度矩阵u,这也是模糊聚类算法与硬聚类算法最大的区别,取(i,u)=maxi(u),即在隶属度的约束条件下,求:

尽管fcm的搜索速度很快,但作为一种局部搜索算法,合理的选择聚类中心初值仍是决定算法性能的关键。因此采用模拟退火遗传算法优化初始聚类中心。

经过上述优化后,可根据公式(23)得到隶属度矩阵u。

聚类中心c的计算如式(24)所示。

步骤5、基于量子粒子群优化策略的交通流量预测

经过结合模拟退火算法和遗传算法的优势,和将两种算法的劣势互补,将全局和局部的搜索能力同时提高,那么搜索效率也就必然随之提升了。使用模拟退火算法(sa)和遗传算法(ga)相对初始聚类中心进行优化,针对交通流量数据的特点有针对性地用模糊c均值聚类算法(fcm)对rbf网络进行训练。

针对传统的pso算法由于参数设定的限制妨碍了其最优参数的寻找成功率,而且由于粒子的位置变化相对固定,缺少随机性,导致很容易陷入局部最优。提出新的量子粒子群优化策略算法(mpso-rbf)。修改了传统量子粒子群算法的粒子位置更新公式。将一个随机参数变为两个随机参数,更好的保证了随机性,降低局部最优风险。结合以上改进的算法,提出更稳定,更准确的量子粒子群优化策略算法。量子粒子群优化策略算法(mpso-rbf)如下:

算法3基于量子粒子群优化策略的交通流量预测算法流程:

1、输入训练数据集和待测数据集,对矩阵做归一化处理。

2、优化初始聚类中心,此处调用算法1。

3、根据公式(7)计算隐藏层的宽度值,根据公式(8)计算隐其输出。

4、训练优化神经网络参数,此处调用算法2。

5、根据公式(10)、(11)计算网络输出。

算法3基于量子粒子群优化策略的交通流量预测算法

inputsamlpedata

initializationm=3,max_iter=20,min_impro=e-6,q=0.8,t0=100,

tend=99.999,sizepop=10,maxgen=100,pc=0.7,pm=0.01,swarmsize=50,particlesample=100,particlesize=m,

epsilon=e-4,loopcount=100

begin

criterionfordata;callingalgorithm1

computedelta,hij//calculatewidthvaluesofhidelayer

andoutputofhidelayer

callingalgorithm2;computey,hj//calculatetheoutput

end

实验测试及性能分析。

本次仿真实验选择两种不同场景的交通流量数据,从横纵两个方向分别做预测。

第一组实验采用长沙市芙蓉区位于嘉雨路与万家丽中路中间的远大一路由东往西方向上的一段,长度约为400米,如图3所示。该组实验数据选取从2013年9月17日开始至2013年9月21日10时为止所产生的交通流量数据。在仿真实验中,我们将数据分为网络训练数据和实验测试数据两部分,网络训练数据用来训练采用本发明算法的神经网络,在测试预测结果时采用实验测试数据对其进行准确度评估。在该组实验中,训练数据采用17日至20日四天中产生的交通流量数据,测试数据采用21日0时至10时所产生的交通流量数据。从图4可以看出该路段于6:00-9:00为早高峰时段,预测此时段交通流量可提前通知相关部门做好交通治理,有效避免高峰期拥堵。

第二组实验数据采用出租车北京四环路某段的交通流量数据,时间为2008年11月2日15时至15时30分,如图5所示。此路段4个车道在30分钟内发生的车流量变化如图6所示。该组实验与第一组实验数据一样分为测试数据和训练数据,此数据采用1车道流量数据。选取1车道15:00-15:25时段的交通流量数据作为训练数据,15:25-15:30时段的交通流量数据作为测试数据。

为清晰显示本发明提出的mpso-rbf算法对于交通流量数据的预测优势,将本发明算法在两种实际场景下与其他两种算法:qpso-rbf和传统rbf进行比较实验。本算法性能衡量指标选择均方差mse和均方根误差rmse。计算公式如公式(25)所示。

本实例的实验测试结果如下:

1.由附图7可以看出,传统rbf神经网络预测的误差普遍高于其他两种算法,在不断测试的过程中,该算法的误差范围浮动也很大,说明其稳定性相对最差。qpso-rbf与本发明提出的mpso-rbf误差趋势大致相同,但偶尔会出现很大的误差。本发明提出的算法误差更加稳定,变化范围更小,表现出更好的预测效果。

2.由附图8可以看出,伴随着试验次数的不断增多,rmse误差会在一定的范围内浮动。传统rbf预测算法的误差大而且波动也大,预测性能较差且十分不稳定。相比之下qpso-rbf算法误差减小,波动范围也减小,但与本发明提出的mpso-rbf算法相比,性能逊色。本发明提出的算法,误差性能最为稳定,而且得到最小误差,说明本发明的优化对算法性能有明显提升。

3.由附图9可以直观反映实际交通流量数据与各算法预测值之间的比较。从图中可以看出,本发明提出的mpso-rbf算法预测值更贴近实际数据值,虽然由于随机性会有少部分偏差,但整体性能都表现最为稳定和准确。

4.由附图10的交通数据流量预测算法mse误差比较可以看出,qpso-rbf的误差波动范围大,且最大误差较平均水平相差较多。而mpso-rbf算法的误差波动范围小,整体性能要高于qpso-rbf算法,说明本发明提出的算法第二组实验数据中的表现也很好。

5.由附图11可知,与mse误差比较一样,本发明提出的算法在rmse误差比较上也表现出更好的性能。不仅稳定度更高,而且误差更小。

6.由附图12可以直观的看出本发明提出的算法预测结果更接近真实数据,波动范围更小。说明本发明提出的算法更适合于交通流量数据的预测。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1