一种枢纽机场摆渡车动态调度方法及系统

文档序号:26141685发布日期:2021-08-03 14:26阅读:278来源:国知局
一种枢纽机场摆渡车动态调度方法及系统

本发明属于交通资源配置领域,具体涉及一种枢纽机场摆渡车动态调度方法及系统。



背景技术:

航空运输市场规模的不断扩大,对民航业而言既是机遇也是挑战。中国民航业务量持续快速、稳定增长,导致远机位频繁使用,远机位在枢纽机场机位布置中的占比极高,如首都机场目前共有机位390个,其中有258个是远机位,占比高达66%。目前机场的摆渡车调度存在着非常严重的问题,主要采用人工调控和管理的方法和手段,人工调度的问题可能会导致车辆实际服务时间的延误,尤其是在航班进出港高峰期以及非正常航班,由调度不佳引发的航班延误问题尤其严重。按照《民用运输机场服务质量》标准,摆渡车需要在航班开始登机或旅客开始下机前5分钟到位,驶离后第二辆摆渡车宜在2分钟内到位。据统计,大概有40%的航班在到达远机位5分钟后未能及时安排摆渡车,由此可见,合理的摆渡车调度和配置资源方法,成为机场资源调度的急需解决的问题。



技术实现要素:

本发明是要解决现有技术中,由于枢纽机场摆渡车调配不合理,而带来的航班延误问题,进而提供了一种枢纽机场摆渡车动态调度方法。

本发明涉及一种枢纽机场摆渡车动态调度方法,包括如下步骤:

步骤一、依据航班计划到达时刻建立规划时间轴内的预调度模型;

步骤二、引入航班到达时间差调节参数,调节摆渡车动态调度策略,以摆渡车在规划时间轴内行驶距离最短,以及摆渡车服务保障容量最大为目标,分别构建目标函数;

步骤三、在由参数感知模型及预调度模型的基础上,利用萤火虫算法对模型进行求解,得到摆渡车动态调度方案。

步骤二中,所述目标函数分别为:

式中,z:摆渡车在规划时间轴内的行驶距离,m;q:摆渡车空闲时间,s;dist(u,v):任意远机位u与v的移动距离,m;λij:摆渡车服务航班i后,服务航班j的可行性;λij=1表示可行,仅当航班j的摆渡开始服务时间ej,晚于航班i的摆渡结束服务时间si加上从航班i摆渡结束到航班j开始摆渡的移动时间t(βi→αj)的时间;t(u→v):任意远机位u与任意远机位v间的移动时间,vmax:摆渡车在机位允许行驶的最大速度;w:航班到达时间差惩罚参数;mij:表示摆渡车服务完航班i,继续保障航班j的空驶时间;当摆渡车服务航班i后,马上服务航班j的时间不超过最长允许等待时间δt,才允许从航班i的摆渡结束位置βi驶向航班j的摆渡开始位置αj,否则要停到默认位置βv,再从βv出发保障航班j。

步骤二中,pi(si)为惩罚函数:si为摆渡车的实际到达机位时间,ai、bi为惩罚系数,若摆渡车在ci前到达指定机位,则摆渡车在此等待,发生机会成本损失;若摆渡车在di之后到达指定机位,则摆渡服务被延误,如式(3)所示:

步骤二中,摆渡车动态调度模型的约束条件如公式(4)—(9)所示:

xi+xj≤1(5)

约束条件式(8)唯一性约束,每个航班必须,且仅能接受一辆摆渡车的服务;式(5)相邻服务的时间间隔限制约束;式(6)是摆渡车只有在空闲时才能被配置给航班,并且满足行驶到任务点的时长小于航班摆渡车到位时刻与车辆空闲开始时刻之间的时长;式(7)计算航班i的摆渡车到位时刻;式(8)为决策变量;式(9)摆渡车服务航班i后,服务航班j的可行性。

本发明还涉及一种采用上述枢纽机场摆渡车动态调度方法的系统。

有益效果

1、机场场面中,摆渡车服务具有时间重合和空间交叉等诸多特点,本发明深入分析和归纳摆渡车服务的特征,使摆渡车调度智能化,将摆渡车调度分类,划分服务。提出了航班到达时间差,航班到达时间差反映了航班状态,为摆渡车调度以及地面服务保障作业提供依据,从强化学习的角度建立航班到达时间差感知模型,有利于地服保障效率提高。

2、本发明根据航班计划实时动态调整调度方案,有利于优化地服保障的效率,减少因调度不及时造成的延误,提高机场场面的运行效率。通过部分重新规划完善调度模型和算法,有利于提升摆渡车动态调度方案的鲁棒性,提高机场场面运行适应异常情况的能力。

附图说明

图1为本发明枢纽机场摆渡车动态调度方法的思路框架图。

具体实施方式

以下结合图1对本实施方式进行说明。

本发明的枢纽机场摆渡车动态调度方法,包括如下步骤:

步骤一、依据航班计划到达时刻建立规划时间轴内的预调度模型;

步骤二、引入航班到达时间差调节参数,调节摆渡车动态调度策略,以摆渡车在规划时间轴内行驶距离最短,以及摆渡车空驶时间最短为目标,分别构建目标函数;

步骤三、在由参数感知模型及预调度模型的基础上,利用萤火虫算法对模型进行求解,得到摆渡车动态调度方案。

在步骤二中,所述目标函数分别为:

式中,z:摆渡车在规划时间轴内的行驶距离,m;q:摆渡车空闲时间,s;dist(u,v):任意远机位u与v的移动距离,m;λij:摆渡车服务航班i后,服务航班j的可行性;λij=1表示可行,仅当航班j的摆渡开始服务时间ej,晚于航班i的摆渡结束服务时间si加上从航班i摆渡结束到航班j开始摆渡的移动时间t(βi→αj)的时间;t(u→v):任意远机位u与任意远机位v间的移动时间,vmax:摆渡车在机位允许行驶的最大速度;w:航班到达时间差惩罚参数;mij:表示摆渡车服务完航班i,继续保障航班j的空驶时间;当摆渡车服务航班i后,马上服务航班j的时间不超过最长允许等待时间δt,才允许从航班i的摆渡结束位置βi驶向航班j的摆渡开始位置αj,否则要停到默认位置βv,再从βv出发保障航班j;

pi(si)为惩罚函数:si为摆渡车的实际到达机位时间,ai、bi为惩罚系数,若摆渡车在ci前到达指定机位,则摆渡车在此等待,发生机会成本损失;若摆渡车在di之后到达指定机位,则摆渡服务被延误,如式(7)所示:

摆渡车动态调度模型的约束条件如式(8)—(13)所示:

xi+xj≤1(9)

约束条件式(8)唯一性约束,每个航班必须,且仅能接受一辆摆渡车的服务;式(9)相邻服务的时间间隔限制约束;式(10)是摆渡车只有在空闲时才能被配置给航班,并且满足行驶到任务点的时长小于航班摆渡车到位时刻与车辆空闲开始时刻之间的时长;式(11)计算航班i的摆渡车到位时刻;式(12)为决策变量;式(13)摆渡车服务航班i后,服务航班j的可行性。

航班到达时间差惩罚参数w的确定

航班到达时间不同,摆渡车调度策略不同,为了避免静态调度问题陷入局部优化,故计算航班到达时间差,将其作为惩罚参数w,通过w值的变化动态调整摆渡车调度策略,不同的w值对应不同的调度策略。当w值为0时,表明忽略航班时间差对调度的影响,采用预调度模型;当w值为1时,表明航班时间差对调度的影响很大,全部重新规划,根据实时信息动态调度。从而实现摆渡车资源的最优分配,从而使得枢纽机场地面服务保障能力最高。

根据航班到达时间差,可以在调度开始时刻依据当前的状态确定调度策略,即确定w的值,通过这样的多步恰当的决策达到期望实现的目标,这种序列多步决策问题可以利用强化学习来解决。强化学习问题包括四个重要组成元素,分别为系统状态、动作集合、状态转移概率函数以及奖励,具体定义方式如下:

(1)系统状态

摆渡车调度系统是一个复杂的动态系统,主要包含摆渡车、航班以及调度中心等要素。完整地描述该系统的状态需要考虑众多因素,其中就包括系统内不断变化的需求信息和摆渡车状态。利用强化学习算法作决策优化时需要尽量避免系统状态特征过于复杂。此外,求解模型的目的是进行分配调度策略,故只选取航班到达时间差作为反映系统状态的指标。

航班到达时间差是指航班计划时刻与航班实际到达时刻的差值的绝对值,由于航班无论早到或是晚到都会对摆渡车调度产生影响,计算绝对值作为时间差。计算公示如下:

te=|tplan-t'|(1)

式中,te:时间差;tplan:航班计划到达时刻;t':航班实际到达时刻。

(2)动作空间

摆渡车在既定的系统中,有四种状态可以选择,即正常处理、改变服务、等待服务、取消服务。结合实际问题,动作空间是指调度模型中的调节参数u的取值集合,u∈【0,1】,这里定义了离散的动作空间a={0,0.25,0.75,1}。

(3)奖励

奖励函数评价每个动作选择的即时奖励,模型最终的优化目标是最大化即时奖励的累计值。综合考虑摆渡车服务成本,定义有效行驶里程比作为即时奖励函数:

式中,do:摆渡车载客行驶里程数;de:从上次航班服务结束到本次航班服务开始摆渡车累计空载里程数,即寻航里程。

该指标能够直观的反映空载所带来的影响,当一段较短的载客里程需要很长的寻航路程时,降低这次服务的奖励。如果摆渡车在某一状态选择空驶、等待或改变动作,有效行驶比为0,则即时奖励为0;选择载客动作,则即时奖励为r。假设在t时段开始时刻,调度中心根据当前的系统状态st执行动作at,累计奖励gt为:

式中,r是折现系数,该系数量化了即时奖励和未来奖励的重要性的差异。当r愈趋近于0时,表明未来时段的奖励对评价t时段开始时刻执行的动作at,好坏的影响程度愈小,基本完全由即时奖励及来决定;相反,当r愈趋近1时,表明未来时段的奖励尺对t时段开始时刻执行的动作at的优劣评定的重要性愈大。本文将r值设为0.8。

(4)状态转移

摆渡车调度系统是一个复杂变化的系统,其状态的转移是随机的,状态空间是连续的,强化学习不可能历遍所有状态,所以无法采用类似于构建矩阵q(st,at)的方式来量化在任意状态st下采取动作at,后可以获得的累积奖励。选用非参数回归中基于高斯核函数的n-w估计的方法来估计q(st,at)。

该方法的基本思想是:设(xi,yi)(i=1,2,…n)为来自总体(x,y)的一个容量为n的样本,对于任意一个点x0,根据样本数据估计在x0点处y0值,通过一个合适的核函数求得各点xi在x0处产生的权值,一般越靠近x0的点权值越大,基于这些权值对yi值进行加权平均,从而得到估计值,其中加权平均的范围和权值的增减速度由带宽控制。

公式如下:

式中,st:t时段初始时刻系统状态;历史数据库中第i个t时段执行动作a的系统状态值;第i个t时段状态为st时执行动作a后观测的累计奖励。

步骤三中,利用萤火虫算法对模型进行求解,得到摆渡车动态调度方案。

选择萤火虫算法解决该问题,萤火虫算法是一种启发式算法,萤火虫的闪光,其主要目的是作为一个信号系统,以吸引其他的萤火虫。其假设为:萤火虫不分性别,这样一个萤火虫将会吸引到所有其他的萤火虫;吸引力与它们的亮度成正比,对于任何两个萤火虫,不那么明亮的萤火虫被吸引,因此移动到更亮的一个,然而,亮度又随着其距离的增加而减少;如果没有比一个给定的萤火虫更亮的萤火虫,它会随机移动。

利用萤火虫算法求解摆渡车动态调度问题时,每一个摆渡车停车点相当于一只萤火虫,摆渡车从一个停车点到一处停车点调度过程相当于萤火虫的移动过程,荧火虫则是每个停车点对应带服务航班的目标函数值,萤火虫的吸引度则是w值。萤火虫的一次移动过程相当于一个可行解,萤火虫的移动过程构成了问题的解空间。最终输出萤火虫编号则为摆渡车的服务地点,行程摆渡车行驶轨迹,依据此生成摆渡车调度方案。求解步骤如下:

step0设置萤火虫数量为m,最大吸引度为β0,光强吸收系数为γ,步长因子为α,最大迭代次数为tmax,算法步骤如下:

step1初始化种群,采用随机排列方法;

step2计算各萤火虫的适应度值,选取种群中适应度值最好的萤火虫,即亮度最强的萤火虫;

step3通过式(5)和(6)和w值计算萤火虫的相对亮度及吸引度,依据编码差异度更新萤火虫位置,然后执行边界检查;

step4对更新位置后的萤火虫个体进行交换和插入操作算子的局部搜索,得到一个临时群,对该种群中的萤火虫进行边界检查;

step5计算临时群中的萤火虫的适应度值,若该群中,存在某一个萤火虫,其适应度优于初始萤火虫个体的适应度值,则用其替代初始萤火虫,否则不变;

step6如果满足终止条件,则算法终止,输出结果;否则,转搜索次数增加1,返回step3。

上述内容仅为本发明的较佳实施例,并非用于限制本发明的实施方案,本领域普通技术人员根据本发明的主要构思和精神,可以十分方便地进行相应的变通或修改,故本发明的保护范围应以权利要求书所要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1