一种基于交通信息物理系统的动态路径引导方法

文档序号:26954016发布日期:2021-10-16 02:58阅读:209来源:国知局
一种基于交通信息物理系统的动态路径引导方法

1.本发明属于信息物理系统领域,涉及一种基于交通信息物理系统的动态路径引导方法。在综合利用实时道路信息(平均通行时间)和车辆信息(所处位置和目的地)的基础上,动态利用路径引导策略,减少道路通行时间、提升道路通行能力、更为充分地利用路网资源。


背景技术:

2.近年来,随着物联网和大数据技术的快速发展,城市交通问题的治理方案不断推陈出新。交通系统中,道路和车辆上的监控和传感设备收集的大量信息,经过实时的处理和分析可用于描述道路和车辆的状态和动态行为,通过在线模型及时决策和规划能充分利用交通系统资源、提高道路通行能力。信息物理系统(cyber

physical systems,cps)可用于管理此类大数据架构。cps集成了感知、计算、通信、控制等技术,实现了信息空间和物理空间中人、机、物、环境、信息等要素的相互映射、适时交互、相互协同,应用范围涵盖了智能电网等能源与资源分配网络、智能汽车与交通网络、医疗护理、环境监测与灾害响应、机器人团体协作、工业自动化等众多领域。
3.可靠、有效的实时交通信息在cps感知、计算、决策、执行过程中的闭环流通,提高了城市交通系统的服务质量,例如其关键服务之一的动态路径引导。动态路径引导,一方面可以考虑通过实时信息对道路中的拥堵迹象进行判断、平衡路网中交通负荷,另一方面可以考虑将dijkstra最短路径方法作用于实时更新的拓扑。
4.目前已有不少基于交通信息物理系统(transportation cps,tcps)在动态路径引导方面的尝试,如利用物联网技术从路段和车辆中采集和聚合实时数据并将短期交通预测与实时路径优化相结合,增强路段与车辆之间的协作;研究由物理交通系统和与其相当的人工交通系统组成的并行智能交通系统,用大量的长期迭代模拟来预测和分析预期的操作结果;考虑道路长度、天气状况、事故等综合成本的最小化,将路网建模为一个不断更新的加权有向图,根据时间表用综合成本最小化策略和最快策略进行引导等。
5.但现有的方法往往只为单一车辆的出行推荐最优路线,未考虑不同车辆采取相同路径后的可能会导致潜在的交通拥堵。在实时全局交通信息已知的情况下,如何以合适的频率对出行个体进行引导,如何权衡全局和个体,或许会是未来城市交通系统面临的挑战。


技术实现要素:

6.本发明提供了一种基于交通信息物理系统的动态路径引导方法。其目的是,在综合利用实时道路信息(平均通行时间)和车辆信息(所处位置和目的地)的基础上,动态利用路径引导策略,减少道路通行时间、提升道路通行能力、更为充分地利用路网资源。
7.本发明的具体技术方案是:
8.一种基于交通信息物理系统的动态路径引导方法,特点是:该方法包括以下具体步骤:
9.步骤1:获取车辆目的地和当前位置,创建或维护q值表,具体包括:获取车辆目的地所在路段编号,查询有无该编号所对应的q值表,若存在则维护q值表,不存在则创建q值表;获取车辆当前位置所在的路段编号作为状态x,将能够驶入的路段作为当前状态的动作空间a,补充q值表中当前位置到目的地范围内路段的动作空间;
10.步骤2:实时获取路段的平均通行时间更新奖赏,具体包括:
11.实时获取动作空间的动作驶入路段的平均通行时间;获取车辆的当前位置和目的地所在路段编号,判断当前位置的动作空间中的动作a驶入的下一个路段是否是目的地所在路段,若是目的地所在路段则足够大的正数更新奖赏(该奖赏取决于实际路网规模,应保证q值为正),否则以动作驶入的路段的平均通行时间作为惩罚:
[0012][0013]
j是动作a驶入的下一路段的编号,i

j表示从路段i驶入路段j,表示采取动作从路段i驶入路段j的奖赏,att是道路平均通行时间:
[0014][0015]
l为当前道路长度,为当前路段i上所有车辆的平均速度,;步骤3:根据奖赏更新q值表
[0016][0017]
t为当前时刻,t+1为下一时刻,x

是在状态x执行动作a后转移的状态,a

是在x

上基于策略π选择的动作,是道路x到道路编号x’的动作的奖赏,α和γ分别为学习率和折扣因子,其中策略π通常采用ε

贪婪:
[0018][0019]
其中,ε为采用随机探索的可能性,取值[0,1];
[0020]
步骤4:选择引导方式和时间间隔,具体包括:
[0021]
1)静态引导:只根据静态路网信息,用最短路径方法生成时间最短路径;
[0022]
2)一次性动态引导:只在车辆进入路网时,根据该时刻的实时交通信息进行一次引导;
[0023]
3)周期性同时引导:按时间间隔τ,对路网中所有车辆同时进行引导;
[0024]
4)周期性各自引导:从车辆各自发车时刻开始,按时间间隔τ进行单独引导;
[0025]
步骤5:依据q值表、最大化值策略引导车辆,具体包括:
[0026]
π(x)=argmax
a

q(x,a

)
[0027]
a

属于当前状态的动作空间;
[0028]
步骤6:通过平均通行时间和平均行驶距离评价网络整体性能,具体包括:
[0029]
获取经过引导的所有车辆从出发位置到目的地的通行时间和行驶距离,求平均。
[0030]
本发明的有益效果:本发明提出了一种基于交通信息物理系统的动态路径引导方法,通过结合实时道路平均行驶时间以及车辆位置和目的地等实时交通信息,考虑一次性
引导、周期性同时引导和周期性各自引导等三种引导方式。对比基于静态拓扑信息的最短通行时间路径引导策略,本发明提出的动态路径引导策略减少了通行时间、提高了道路通行能力、能够更为充分地利用路网资源。
附图说明
[0031]
图1是本发明的交通信息物理系统框架图;
[0032]
图2是本发明的动态路径引导流程图;
[0033]
图3是本发明的具体实施案例中仿真的路网示意图;
[0034]
图4是本发明具体实施例中周期性同时引导和周期性各自引导在不同时间间隔下平均通行时间、平均等待时间和平均行驶距离的示意图;
[0035]
图5是本发明具体实施例中周期性同时引导路网中车数、周期性各自引导路网中车数、周期性同时引导到达车辆平均行驶时间和周期性各自引导到达车辆平均行驶时间随仿真时间的变化趋势示意图;
[0036]
图6是本发明具体实施例中静态引、一次性引导、周期性同时引导和周期性各自引导的总通行时间、等待时间及非等待时间与到达次序的关系示意图。
具体实施方式
[0037]
为了使本发明所要解决的技术问题、技术方案及发明优点更加清楚明白,以下结合附图及实施例,对本发明进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0038]
本发明提供了一种基于交通信息物理系统(图1)的动态路径引导方法。其目的是,在综合利用实时道路信息(平均通行时间)和车辆信息(所处位置和目的地)的基础上,动态利用路径引导策略,减少道路通行时间、提升道路通行能力、更为充分地利用路网资源,缓解静态引导可能的潜在拥堵问题。通过在微观交通仿真器sumo中进行仿真,分析不同方式和引导时间间隔下的平均通行时间和行驶距离等指标,和静态引导方法进行对比,验证动态路径方法的有效性。
[0039]
实施例
[0040]
本实施例的所有结果均是在内存8gb,64位windows10操作系统,sumo 1.6.0实验环境下获得的。仿真中道路网络为一个6
×
3的东西向和南北向路段长分别为200m和100m的矩形网络如图3所示,路口无信号灯、采用默认的南北优先。以最小时间间隔从a1b1到e1f1输入100辆车,采用默认的krauss car

following模型。
[0041]
参阅图2,本实施例具体步骤如下:
[0042]
步骤1:获取车辆目的地和当前位置,创建或维护q值表,具体包括:获取车辆目的地所在路段编号,查询有无该编号所对应的q值表,若存在则维护q值表,不存在则创建q值表;获取车辆当前位置所在的路段编号作为状态x,将能够驶入的路段作为当前状态的动作空间a,补充q值表中当前位置到目的地范围内路段的动作空间;
[0043]
步骤2:实时获取路段的平均通行时间更新奖赏,具体包括:
[0044]
实时获取动作空间的动作驶入路段的平均通行时间;获取车辆的当前位置和目的地所在路段编号,判断当前位置的动作空间中的动作a驶入的下一个路段是否是目的地所
在路段,若是目的地所在路段则足够大的正数更新奖赏(该奖赏取决于实际路网规模,应保证q值为正),否则以动作驶入的路段的平均通行时间作为惩罚:
[0045][0046]
j是动作a驶入的下一路段的编号,i

j表示从路段i驶入路段j,表示采取动作从路段i驶入路段j的奖赏,att是道路平均通行时间:
[0047][0048]
l为当前道路长度,为当前路段i上所有车辆的平均速度,;步骤3:根据奖赏更新q值表
[0049][0050]
t为当前时刻,t+1为下一时刻,x

是在状态x执行动作a后转移的状态,a

是在x

上基于策略π选择的动作,是道路x到道路编号x’的动作的奖赏,α和γ分别为学习率和折扣因子,其中策略π通常采用ε

贪婪:
[0051][0052]
其中,ε为采用随机探索的可能性,取值[0,1];
[0053]
步骤4:选择引导方式和时间间隔,具体包括:
[0054]
1)静态引导:只根据静态路网信息,用最短路径方法生成时间最短路径;
[0055]
2)一次性动态引导:只在车辆进入路网时,根据该时刻的实时交通信息进行一次引导;
[0056]
3)周期性同时引导:按时间间隔τ,对路网中所有车辆同时进行引导;
[0057]
4)周期性各自引导:从车辆各自发车时刻开始,按时间间隔τ进行单独引导;
[0058]
步骤5:依据q值表、最大化值策略引导车辆,具体包括:
[0059]
π(x)=argmax
a

q(x,a

)
[0060]
a

属于当前状态的动作空间;
[0061]
步骤6:通过平均通行时间和平均行驶距离评价网络整体性能,具体包括:
[0062]
获取经过引导的所有车辆从出发位置到目的地的通行时间和行驶距离,求平均。
[0063]
参阅图4,图(a)是周期性同时引导在不同时间间隔下平均通行时间、平均等待时间和平均行驶距离的示意图;图(b)是周期性各自引导在不同时间间隔下平均通行时间、平均等待时间和平均行驶距离的示意图。
[0064]
不同时间间隔τ对动态路径引导的影响。τ越小,引导越频繁;τ越大,车辆上一次引导的保持时间越长。受限于路网大小,τ>30时,在周期性同时引导中会出现尚未对车辆进行引导车辆就已驶入坑洼路段的情况。因此取τ=1,2,3,...,30。注意到,同时引导和各自引导在τ=1时是等价的,因此两子图在τ=1的数值相同。
[0065]
车辆的平均行驶距离反应了整体的博弈的强度。随着τ的增大,引导频率降低,车辆维持上一次引导的时间变长,平均行驶距离整体呈现下降趋势,博弈强度减小。其中,同
时引导的博弈强度随着τ的下降速度更快。考虑到同时引导会使处于相同状态即位于同一条道路上的车辆采取相同动作,当τ较大时,同时引导更容易形成车队。而引导一旦采取了与τ时刻前不同的动作路径,在引导的早期阶段一般都是博弈行为,博弈的结果是路径经过优先级较高的南北向。此时同时引导因为产生车队,在优先级的路口更具有竞争优势,能够较快通行、减少行驶距离;但产生的后果是会有车队整体被更高优先级路口的其他车队较长时间截断,因此即使行驶距离降低较快,但在平均通行时间和等待时间上并无明显优势。各自引导可视为批次的同时引导,因此在频率较大或较小,即τ<13或τ>23时,不同批次的车辆实际上所处的状态在引导早期阶段基本相同,效果和同时引导相近;在τ=15左右时,各自引导呈现出对交通信息更为敏感的特性,平均行驶距离较长、平均等待时间较长,表明其充分利用了路网资源但又受限于路口优先级。
[0066]
参阅图5,图(a)是本发明具体实施例中周期性同时引导路网中车数变化趋势示意图;图(b)是本发明具体实施例中周期性各自引导路网中车数变化趋势示意图;图(c)是周期性同时引导到达车辆平均行驶时间的变化趋势示意图;图(d)是周期性各自引导到达车辆平均行驶时间随仿真时间的变化趋势示意图。
[0067]
动态路径引导都明显优于静态路径引导,能够明显减少路网中车辆数量,降低所有车辆通过路网的用时;到达车辆的平均行驶时间呈上升趋势,意味着车辆在交叉口的等待是影响其通过路网用时的主要因素之一。
[0068]
参阅图6,图(a)、(b)、(c)、(d)分别是本发明的具体实施例中静态引导、一次性引导、周期性同时引导和周期性各自引导的总通行时间、等待时间及非等待时间与到达次序的关系示意图。
[0069]
静态引导的车辆全体经过了坑洼路段,整个过程车流没有停滞,但前60辆车的用时不断增加,说明车队在行驶过程中会受到驾驶员差异的影响。图6(b)(c)(d)中,非等待时间均处于[100,200]区间内,说明当车辆运动时,基本上以较快速度行驶,其通行时间差异主要由等待时间引起。一次性引导中,最后到达的一部分车辆都经历了长时间等待;而周期性引导通过基于实时交通信息的多次引导能缓解这部分潜在的拥堵,这也是周期性引导在平均通行时间上优于一次性引导的原因。另外,如图6(d)所示,各自引导的等待时间呈现多个尖峰中,说明有个别车辆的经历了长时间的等待,成为引导过程中的信息敏感性对出行个体带来的不稳定性的牺牲品。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1