一种单交叉口信号灯时间控制方法及系统与流程

文档序号:12677062阅读:373来源:国知局
一种单交叉口信号灯时间控制方法及系统与流程
本发明涉及一种单交叉口信号灯时间控制方法及系统,属于交通运输控制
技术领域

背景技术
:目前,很多城市深受交通拥堵的困扰,如何构建一个高效率的交通运输系统成为城市建设的头等大事。许多已充分开发的城市几乎不能拓展交通道路,即在空间上已经没有可发展的空间,故交通理论很多方法都从时间上进行了研究,即提出了很多交通信号控制理论算法。文献《Trafficlightcontrolinnon-stationaryenvironmentbasedonmultiagentQ-learning》(下文简称Adboosd的方法)提供了一种单交叉口信号灯时间控制方法,该控制方法将单交叉口的四个来车方向分为24种不同的车辆排队状态,如表1所示,但是,表中24种状态并没有区分l1>l2>l3>l4、l1=l2=l3=l4和l1=l2=l3>l4等情况,而这些情况可能对交通网络造成不同的影响。另外,每种车辆排队状态中不同的排队车辆数也会对交通网络造成不同的影响,例如,若li(i=1,2,3,4)表示第i个车道车辆排队长度,则(l1:4,l2:5,l3:2,l4:3)和(l1:40,l2:50,l3:20,l4:30)同属于l2≥l1≥l4≥l3交通状态,显然这种状态不能选择相同的绿灯时间。表1显然这种方式没有考虑到每种车辆排队状态中不同的排队车辆数也会对交通网络造成不同的影响,导致的信号灯时间段控制与实际交通状况不符合,绿灯时间分配不科学,影响通行效率。技术实现要素:本发明的目的是提供一种单交叉口信号灯时间控制方法,以解决目前信号灯时间控制中没有考虑排队车辆数导致对信号灯控制不科学的问题。同时,本发明还提供了一种单交叉口信号灯时间控制系统。本发明为解决上述技术问题而提供一种单交叉口信号灯时间控制方法,该控制方法的步骤如下:1)按照单交叉口四个来车方向和每种车辆排队状态中不同的排队车辆数将车辆排队状态分为nk种,n为车辆排队长度的种类,k为单交叉口的车道数;2)以交通信号相位个数、每个相位的最小时间、绿灯增加的时间段数和每段时间的长度作为交通行为;3)根据所划分的车辆排队状态和确定的交通行为采用Q学习法进行学习,Q(s,a)←Q(s,a)+α[μ+γmaxa'Q(s',a')-Q(s,a)]s←s′其中α为学习速率,γ为折扣因子,s为目前的交通状态即车辆排队状态,a为某一交通行为,μ为补偿值,s'为下一个状态,a'为下一个交通行为。进一步地,所述的补偿值μ是当前信号周期通过交叉口车辆数与周期结束时交叉口排队的车辆数的差值,当通过交叉口的车辆数大于排队的车辆数时,补偿值为正值;当通过交叉口的车辆数大于排队的车辆数时补偿值为负值。进一步地,交叉口的周期长度δ为:δ=nph×tmin+nex×hex其中nph表示交通信号相位的个数,tmin表示每个相位的最小时间,nex表示绿灯增加的时间段数,hex表示每段时间的长度。进一步地,所述交叉口的周期长度δ可调,周期长度δ通过调整绿灯增加的时间段数nex和每段时间长度hex来实现调整。本发明还提供了一种单交叉口信号灯时间控制系统,该控制系统包括车辆排队状态划分模块、交通行为构建模块和Q学习迭代模块,所述的车辆排队状态划分模块用于按照单交叉口四个来车方向和每种车辆排队状态中不同的排队车辆数将车辆排队状态分为nk种,n为车辆排队长度的种类,k为单交叉口的车道数;所述的交通行为构建模块用于以交通信号相位个数、每个相位的最小时间、绿灯增加的时间段数和每段时间的长度作为交通行为;所述的Q学习迭代模块用于根据所划分的车辆排队状态和确定的交通行为采用Q学习法进行学习,Q(s,a)←Q(s,a)+α[μ+γmaxa'Q(s',a')-Q(s,a)]s←s′其中α为学习速率,γ为折扣因子,s为目前的交通状态即车辆排队状态,a为某一交通行为,μ为补偿值,s'为下一个状态,a'为下一个交通行为。进一步地,所述的补偿值μ是当前信号周期通过交叉口车辆数与周期结束时交叉口排队的车辆数的差值,当通过交叉口的车辆数大于排队的车辆数时,补偿值为正值;当通过交叉口的车辆数大于排队的车辆数时补偿值为负值。进一步地,交叉口的周期长度δ为:δ=nph×tmin+nex×hex其中nph表示交通信号相位的个数,tmin表示每个相位的最小时间,nex表示绿灯增加的时间段数,hex表示每段时间的长度。进一步地,所述交叉口的周期长度δ可调,周期长度δ通过调整绿灯增加的时间段数nex和每段时间长度hex来实现调整。本发明的有益效果是:本发明按照单交叉口四个来车方向和每种车辆排队状态中不同的排队车辆数将车辆排队状态分为nk种,n为车辆排队长度的种类,k为单交叉口的车道数;以交通信号相位个数、每个相位的最小时间、绿灯增加的时间段数和每段时间的长度作为交通行为;根据所划分的车辆排队状态和确定的交通行为采用Q学习法进行学习。本发明通过改变状态空间的定义,将车辆排队状态划分的与交叉口的实际情况更加吻合,使得绿灯时间的分配更加科学。此外,本发明根据某一交通信息的正面和负面影响,对绿灯时间进行补偿,当通过交叉口的车辆数大于排队的车辆数时,补偿值为正值;当通过交叉口的车辆数大于排队的车辆数时补偿值为负值;此外本发明还避免了固定周期的限制,使得单交叉口信号时间的控制更加灵活。附图说明图1是具有四个相位的单交叉口示意图;图2是仿真试验的结果比较图。具体实施方式下面结合附图对本发明的具体实施方式做进一步的说明。本发明一种单交叉口信号灯时间控制方法的实施例本发明针对单交叉口交通拥堵的情况,提出一种单交叉口信号灯时间控制方法,以解决目前信号灯时间控制中没有考虑排队车辆数导致对信号灯控制不科学的问题。1.按照单交叉口四个来车方向和每种车辆排队状态中不同的排队车辆数将车辆排队状态分为nk种,n为车辆排队长度的种类,k为单交叉口的车道数。本实施例中的针对的单交叉口如图1所示,Z1、Z2、Z3和Z4是车辆进入并通过交叉口的区域,A、B、C和D是一个信号周期内的四个相位,将不同的排队长度分为较小,中等和较大三类,若单交叉口有k个车道,则理论上将有3k种不同的车辆排队状态,当k=4时,共有81种状态,远远多于表1中的24种状态,与实际的交通状况更加符合。2.以交通信号相位个数、每个相位的最小时间、绿灯增加的时间段数和每段时间的长度作为交通行为。交通行为包括<nph,tmin,nex,hex>,其中nph表示交通信号相位个数,本实施例中的交通信号相位个数为4,tmin表示每个相位的最小时间,nex表示绿灯增加的时间段数,hex表示每段时间的长度,交叉口的一个周期长度δ为:δ=nph×tmin+nex×hex3.采用Q学习法对信号灯时间进行控制Q学习算法是动态规划的有关理论及动物学习心理学的有力相互结合,以求解具有延迟回报的序贯优化决策问题为目标,该法是根据TD算法对Markov决策过程的行为值函数进行迭代运算,具体的公式如下:Q(s,a)←Q(s,a)+α[μ+γmaxa'Q(s',a')-Q(s,a)]s←s′其中s表示状态,a表示动作,Q(s,a)表示对状态s下动作a得到的总体回报的一个估计,α为学习速率,μ为补偿值,s'为下一个状态,a'为下一个动作。该算法的迭代过程如下:1.对每个s,a初始化表项Q(s,a)为0;2.观察当前状态s;3.一直重复做:选择一个动作a并执行它,该动作为使Q(s,a)最大的a,接收到立即回报r,观察新状态s',对Q(s′,a′)按照下式更新表项:Q(s,a)对于本发明而言,这里的动作a表示一个交通行为,s为目前的交通状态即车辆排队状态,a为某一交通行为,μ为补偿值,s'为下一个交通状态,a'为下一个交通行为。通过上述算法,本发明能够快速、精准的实现对单交叉口信号灯时间的控制。在Q学习迭代过程中,现有方法中的补偿值μ与车辆排队长度成反比,μ归一化后的范围为[0,1],故每次补偿值都为正值,在迭代的过程中,时延将会累计增大。考虑车辆数在整个信号周期中的分布情况,本发明根据到达交叉口的车辆数设置迭代的补偿值μ,该补偿值是当前信号周期通过交叉口车辆数与周期结束时交叉口排队的车辆数的差值,当通过交叉口的车辆数大于排队的车辆数时,补偿值为正值;当通过交叉口的车辆数大于排队的车辆数时补偿值为负值,即交叉口的绿灯时间不足以让一个信号周期的到达车辆通过该交叉口。为了避免固定周期的限制,使得单交叉口信号时间的控制更加灵活,本发明中的交叉口的一个周期长度δ可自主调整,具体地,周期长度δ通过调整绿灯增加的时间段数nex和每段时间长度hex来实现调整。本发明一种单交叉口信号灯时间控制系统的实施例本实施例中的控制系统包括车辆排队状态划分模块、交通行为构建模块和Q学习迭代模块,车辆排队状态划分模块用于按照单交叉口四个来车方向和每种车辆排队状态中不同的排队车辆数将车辆排队状态分为nk种,n为车辆排队长度的种类,k为单交叉口的车道数;交通行为构建模块用于以交通信号相位个数、每个相位的最小时间、绿灯增加的时间段数和每段时间的长度作为交通行为;Q学习迭代模块用于根据所划分的车辆排队状态和确定的交通行为采用Q学习法进行学习,Q(s,a)←Q(s,a)+α[μ+γmaxa'Q(s',a')-Q(s,a)]s←s′其中α为学习速率,γ为折扣因子,s为目前的交通状态即车辆排队状态,a为某一交通行为,μ为补偿值,s'为下一个状态,a'为下一个交通行为。各模块的具体实现手段已在方法的实施例中进行了详细说明,这里不再赘述。为了进一步证明本发明的效果,下面进行仿真实验,本次仿真实验采用ParamicsV6和MATLAB软件进行仿真,仿真条件如表2所示,通过交叉口的车辆总数为4800辆,共计时间为10个小时,每个相位的绿灯时间设定{15,25,35},各相位根据车流量情况选择不同的绿灯时间,设定信号的周期长度是可变的,信号周期长度即为所有相位绿灯时间之和再加8秒,8秒是四个相位的黄灯时间。表2Z1Z2Z3Z4TotalZ1120080002000Z23000200500Z3010002001200Z450006001100Total800220014004004800仿真结果如图2所示,Abdoos的方法和本发明方法累计的平均延误时间分别为48655秒和35235秒,图2中结果表明,本发明比Abdoos的方法的单交叉口通行效率提高了27.6%,具有更好的信号控制效果。本发明使用人工智能学习模式来模拟单交叉口的车辆通行状况,利用实时的车流量信息计算各个路口的绿灯时间,相比之前的单交叉口信号控制算法,本发明中交通状态的划分更加符合实际交通状况,本发明对绿灯方向进入交叉口的车辆和红灯方向排队车辆的平均误差进行了补偿和反馈,从而最小化交叉口信号周期的车辆延误时间,最大程度地增大单交叉口的通行效率。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1