为列车自动驾驶系统生成速度控制命令的方法与流程

文档序号:12661218阅读:153来源:国知局
为列车自动驾驶系统生成速度控制命令的方法与流程

本发明涉及一种城市轨道列车自动控制技术,尤其涉及一种为列车自动驾驶系统生成速度控制命令的方法。



背景技术:

ATO系统(Automatic Train Operation)是一种用于城市轨道列车自动化控制的控制系统,它可以根据控制命令来控制列车沿最优目标曲线运行。

城市轨道列车控制是一种典型的双目标优化问题,即在保证安全性、停车精确性和运行平稳性的条件下,兼顾节能和省时两项指标,具体来说,要实现列车运行中能耗最小,要尽可能多地采用惰行方式,以减小牵引过程中消耗的能量,但惰行距离太长,必然会引起列车运行时间延长,不利于省时。

现有技术在处理前述的双目标优化问题时,比较常见的手段是采用加权求和方法,加权求和的目的是将双目标优化问题转换为单目标优化问题进而求解出最优解,这种处理方式虽然简化了处理难度,但是,由于加权求和的目的完全不同于多目标优化,其总目标函数无法全面反映出被优化对象的真实情况,这就导致其最优解无法体现出双目标间的关联性。从理论上看,双目标优化问题实质上是属于多目标优化的范畴,基于现有的多目标优化理论可知,多目标优化的结果应该是相互独立、相互排斥的一组最优解集,即某一目标性能的优化必然会导致其它目标性能的劣化,因此多目标优化得到的结果应是所有占优解的集合,而非仅有一个最优解,因此,加权求和方法是一种不能反映多目标优化问题实质的一种权宜之计。

纵观现有理论,Pareto原理和粒子群优化算法十分适合用来解决多目标优化问题,针对Pareto原理和粒子群优化算法在ATO系统中的应用问题,本领域技术人员已经进行了一些探索,如,第201510242340.X号中国专利申请公开了一种“城市轨道交通列车ATO速度命令优化方法”,其技术核心是利用NSGA-II方法(非劣排序遗传算法)求解ATO速度命令Pareto解,又如,María Domínguez等提出了采用MOPSO(多目标粒子群优化)方法来解决相关问题(“Multi objective particle swarm optimization algorithm for the design of efficient ATO speed profiles in metro lines”,[J].Engineering Applications of Artificial Intelligence 29(2014):43-53),该方法通过仿真实验证实了在收敛性和多样性方面,多目标粒子群优化方法均优于NSGA-II算法,因此,基于Pareto原理的多目标粒子群优化算法是一种更为优秀的处理方法;在此基础上,发明人经过大量研究后发现,前述的基于Pareto原理的多目标粒子群优化算法的收敛性和多样性仍然可作进一步的改善。



技术实现要素:

针对背景技术中的问题,本发明提出了一种为列车自动驾驶系统生成速度控制命令的方法,所述列车自动驾驶系统能根据速度控制命令对列车的速度进行控制,其创新在于:所涉及的模块包括小种群优化模块、上层优化模块和外部档案模块;所述小种群优化模块中包含有多个小种群;

所述方法包括:

1)设定基础数据和约束参数;所述基础数据包括:线路参数、站点参数、列车参数、ATO系统参数;所述约束参数包括:限速参数、停车位置参数、到站时间参数、列车工况转换原则;

2)按如下方式设定粒子和小种群:为列车设计控制序列;所述控制序列由多个顺次排列的控制阶段组成,每个控制阶段均对应一种列车工况,列车工况切换时控制阶段也随之切换;列车工况切换时,列车在运行线路上所处的位置记为工况转换点(本文所述运行线路是指相邻两个站点之间的行驶线路,对于包含多个站点的全线线路,需按站点排列顺序,对每两个相邻的站点之间的行驶线路分别进行处理);对工况转换点的位置进行调整,即可为控制序列生成多种控制模态,每种控制模态及其对应的多个工况转换点记为一个粒子,粒子的维度即为控制阶段数量与工况转换点数量之和;设粒子数量为x、小种群数量为y,将x个粒子平均分配至y个小种群中;

3)小种群优化模块根据粒子群优化算法,控制各个小种群按公式一对所辖粒子进行粒子速度更新处理,得到各个粒子当前的粒子速度,然后根据粒子速度,小种群按公式三对各个粒子进行粒子位置更新处理,得到各个粒子当前的粒子位置;进入步骤4);

4)满足约束参数条件的粒子位置记为可行解,不满足约束参数条件的粒子位置记为非可行解,若某一小种群所对应的多个粒子位置中存在可行解,则将相应小种群记为可行小种群,若某一小种群所对应的多个粒子位置均为非可行解,则将相应小种群记为非可行小种群;

根据约束参数,对各个小种群的状态进行判断:

若所有小种群均为非可行小种群,则进入步骤5B);若多个小种群中既存在可行小种群又存在非可行小种群,则进入步骤5A);

5A)小种群优化模块将可行解输入外部档案模块,同时,小种群优化模块将每个可行小种群所对应的可行解中的最优者作为精英解输入上层优化模块,同时,小种群优化模块将每个非可行小种群所对应的非可行解中的最优者作为精英解输入上层优化模块;

外部档案模块第一次收到可行解时,若可行解的数量为1,则外部档案模块直接对可行解进行保存,若可行解的数量为2个或2个以上,则外部档案模块对所有可行解进行支配关系识别:对于不存在支配关系的可行解,则全部保留,对于存在支配关系的可行解,只保留支配者,移除受支配者;保留在外部档案模块中的可行解记为Pareto前沿解;后续迭代过程中,外部档案模块对新收到的可行解和Pareto前沿解整体进行支配关系识别:对于不存在支配关系的可行解,则全部保留,对于存在支配关系的可行解,只保留支配者,移除受支配者;

上层优化模块收到多个精英解后,对多个精英解进行优化处理,得到小种群全局最优位置,然后将小种群全局最优位置反馈至所有小种群中,小种群根据小种群全局最优位置对公式二中的相应因子进行更新;

待外部档案模块和上层优化模块的前述动作都完成后,对迭代次数进行判断,若迭代次数达到设定值,则进入步骤6),若迭代次数未达到设定值,则小种群优化模块从外部档案模块中调用Pareto前沿解并从该前沿解中提取出外部全局最优位置,然后将外部全局最优位置反馈至所有小种群中,小种群根据外部全局最优位置对公式二中的相应因子进行更新;然后小种群按公式二对多个小种群中的多个粒子进行粒子速度更新处理,得到各个粒子当前的粒子速度,然后根据粒子速度,小种群按公式三对各个粒子进行粒子位置更新处理,得到各个粒子当前的粒子位置;返回步骤4);

5B)将每个小种群所对应的非可行解中,与约束参数背离程度最小的非可行解作为精英解输入上层优化模块中,上层优化模块收到多个精英解后,对多个精英解进行优化处理,得到种群全局最优位置,然后将种群全局最优位置反馈至所有小种群中,小种群根据种群全局最优位置对公式一中的相应因子进行更新;然后对迭代次数进行判断,若迭代次数达到设定值,则进入步骤6),若迭代次数未达到设定值,则返回步骤3);

6)若外部档案模块中不存在Pareto前沿解,则操作结束;若外部档案模块中存在Pareto前沿解,则从Pareto前沿解中选取一者,然后求解出相应的速度控制命令;

所述公式一为:

其中,w为惯性权重,w为设定值;为相应小种群中第d维度上第i个粒子第k次搜索时的粒子速度,为设定值;为相应小种群中第d维度上第i个粒子第k+1次搜索时的粒子速度;c1和c2均是数值为正的常数,c1和c2均为设定值;和均为[0,1]区间上的随机数,和的具体数值由小种群根据粒子群优化算法随机生成;为相应小种群中第d维度上第i个粒子在第k次搜索时的自身最优位置,为设定值,后续过程中的由各个小种群根据粒子群优化算法自动更新;为第d维度上第k次搜索时的小种群全局最优位置,为设定值;为相应小种群中第d维度上第i个粒子第k次搜索时的位置向量,为设定值;

所述公式二为:

其中,c3是数值为正的常数,c3为设定值,为[0,1]区间上的随机数,的具体数值由小种群根据粒子群优化算法随机生成,为第d维度上第k次搜索时的外部全局最优位置;

所述公式三为:

其中,为相应小种群中第d维度上第i个粒子第k+1次搜索时的位置向量。

本发明的原理是:

PSO算法(也称粒子群算法或粒子群优化算法)是近年来新出现的一种进化算法,相比于过去的爬山法、遗传算法、神经网络算法等方法,PSO算法在解决多目标优化问题时具有多方面的优势,业内已有将PSO算法与Pareto原理结合来处理多目标优化问题的案例,本申请的主旨不是要对PSO算法或Pareto原理本身进行改进,本申请与现有技术的不同点在于:现有技术在应用PSO算法进行单目标优化时,有采用“小种群优化模块+上层优化模块”的双层处理结构;在应用PSO算法进行多目标优化时,未曾见使用“小种群优化模块+上层优化模块+外部档案模块”的三层处理结构的案例。其中,针对多目标优化采用三层处理结构的案例,其外部档案模块对Pareto前沿解的提取、甄选和存储仅是为了在算法处理完成后能累积到多个Pareto前沿解,从而形成Pareto前沿解集,而在本发明中,若某次迭代过程中获得了Pareto前沿解,则在后续迭代过程中,利用公式二将之前获得的Pareto前沿解用于粒子速度更新,这就可以使后续迭代过程既能兼顾到单个小种群的粒子全局最优位置(即小种群全局最优位置)、又能兼顾到所有小种群的粒子全局最优位置(即外部全局最优位置),这就可以使处理过程的收敛性在迭代过程中不断地得到改善,由此得到的处理结果更加趋近于真实情况,最终使得ATO系统能以更优的控制参数来控制列车运行。

关于PSO算法和Pareto原理以及速度控制命令求解等技术内容,它们与本发明的改进点的关联性不大,再加上考虑到这些内容都是现有技术中十分常见的处理手段,故本文对相关内容介绍得较为简略,如有未尽之处,本领域技术人员应参考现有技术来理解本发明。

为了进一步改善本发明的处理效果,发明人还提出了如下的优选方案:所述步骤5A)中,小种群优化模块按如下方式从外部档案模块中调用Pareto前沿解:

若外部档案模块中的Pareto前沿解数量只有1个时,则直接调用该Pareto前沿解;

若外部档案模块中的Pareto前沿解数量大于1且小于4时,则以随机选择方式任选一个Pareto前沿解;

若外部档案模块中的Pareto前沿解数量大于或等于4时,则按如下方式处理:

1]在运行时长和能耗大小中任选一者作为参考标准,参考标准的最大值和最小值所对应的两个Pareto前沿解分别记为两个边界解,其余Pareto前沿解记为非边界解;

2]按获取时间顺序,用1至n的整数将多个非边界解连续编号,然后根据Pareto原理,计算出各个非边界解的拥挤距离值,然后按下式计算出各个非边界解所对应的选取概率pi

其中,di为第i个非边界解的拥挤距离值,n为非边界解的数量;

3]根据各个非边界解所对应的选取概率pi,采用轮盘赌选择方法,从多个非边界解中抽选出一者作为备用解,然后以随机选择方式,从两个边界解和备用解三者中任选一个作为外部全局最优位置。

前述改进方案的原理是:在具体处理时,外部档案模块中存在的Pareto前沿解数量有可能会逐步增加(也可能不变,但不会减少),若以运行时长和能耗大小分别作为横轴和纵轴建立坐标系,从Pareto前沿解在坐标系上的分布来看,Pareto前沿解有可能在坐标系上的某些区域分布得较为集中,而在坐标系的另一些区域上,Pareto前沿解又可能分布得较稀;当Pareto前沿解数量小于4时,Pareto前沿解在坐标系上的分布位置并无太大的技术意义,没有必要选取特定的Pareto前沿解,因此,前述改进方案中,对于Pareto前沿解数量小于4的情况,直接采用随机选择方式来进行选取;当Pareto前沿解数量大于或等于4时,Pareto前沿解在坐标系上的分布位置就会出现较为明显的趋势化(即在某些区域集中、在某些区域稀疏),此时,若仍采用随机选择方式从所有Pareto前沿解中任意选取,就有可能使后续得到的Pareto前沿解继续在坐标系上的密集区域分布,这就不利于得到覆盖面较宽的Pareto前沿解集,于是前述改进方案中采用计算选取概率的方式来对选取操作进行优化,其中,涉及到的拥挤距离值为Pareto原理中的常见参数,拥挤距离值小,意味着某一Pareto前沿解与周围的Pareto前沿解较为密集,反之则较稀疏,而从选取概率的计算公式中可以看出,拥挤距离值与选取概率成反比,采用这种方式计算来计算选取概率,在后续的轮盘赌选择方法中,可以使拥挤距离值较大的Pareto前沿解更容易被选中,这就可以使后续处理过程更容易得到分布在较为稀疏区域上的Pareto前沿解,从而提高最终得到的Pareto前沿解集的多样性。

本发明的有益技术效果是:提出了一种为ATO系统生成速度控制命令的方法,该方法可以在迭代过程中,不断地改善算法的收敛性,使处理结果更加趋近于真实情况,并最终得到更优的速度控制命令参数。

附图说明

图1、本发明的原理示意图;

图2、Pareto前沿解拥挤距离值示意图;

图3、采用现有方法得到的Pareto前沿解在时间-能耗坐标系上的分布示意图;

图4、采用本发明方法得到的Pareto前沿解在时间-能耗坐标系上的分布示意图;

图5、图3和图4叠放后得到的对比图。

具体实施方式

一种为列车自动驾驶系统生成速度控制命令的方法,所述列车自动驾驶系统能根据速度控制命令对列车的速度进行控制,其创新在于:所涉及的模块包括小种群优化模块、上层优化模块和外部档案模块;所述小种群优化模块中包含有多个小种群;

所述方法包括:

1)设定基础数据和约束参数;所述基础数据包括:线路参数、站点参数、列车参数、ATO系统参数;所述约束参数包括:限速参数、停车位置参数、到站时间参数、列车工况转换原则;

2)按如下方式设定粒子和小种群:为列车设计控制序列;所述控制序列由多个顺次排列的控制阶段组成,每个控制阶段均对应一种列车工况,列车工况切换时控制阶段也随之切换;列车工况切换时,列车在运行线路上所处的位置记为工况转换点;对工况转换点的位置进行调整,即可为控制序列生成多种控制模态,每种控制模态及其对应的多个工况转换点记为一个粒子,粒子的维度即为控制阶段数量与工况转换点数量之和;设粒子数量为x、小种群数量为y,将x个粒子平均分配至y个小种群中;

3)小种群优化模块根据粒子群优化算法,控制各个小种群按公式一对所辖粒子进行粒子速度更新处理,得到各个粒子当前的粒子速度,然后根据粒子速度,小种群按公式三对各个粒子进行粒子位置更新处理,得到各个粒子当前的粒子位置;进入步骤4);

4)满足约束参数条件的粒子位置记为可行解,不满足约束参数条件的粒子位置记为非可行解,若某一小种群所对应的多个粒子位置中存在可行解,则将相应小种群记为可行小种群,若某一小种群所对应的多个粒子位置均为非可行解,则将相应小种群记为非可行小种群;

根据约束参数,对各个小种群的状态进行判断:

若所有小种群均为非可行小种群,则进入步骤5B);若多个小种群中既存在可行小种群又存在非可行小种群,则进入步骤5A);

5A)小种群优化模块将可行解输入外部档案模块,同时,小种群优化模块将每个可行小种群所对应的可行解中的最优者作为精英解输入上层优化模块,同时,小种群优化模块将每个非可行小种群所对应的非可行解中的最优者作为精英解输入上层优化模块;

外部档案模块第一次收到可行解时,若可行解的数量为1,则外部档案模块直接对可行解进行保存,若可行解的数量为2个或2个以上,则外部档案模块对所有可行解进行支配关系识别:对于不存在支配关系的可行解,则全部保留,对于存在支配关系的可行解,只保留支配者,移除受支配者;保留在外部档案模块中的可行解记为Pareto前沿解;后续迭代过程中,外部档案模块对新收到的可行解和Pareto前沿解整体进行支配关系识别:对于不存在支配关系的可行解,则全部保留,对于存在支配关系的可行解,只保留支配者,移除受支配者;

上层优化模块收到多个精英解后,对多个精英解进行优化处理,得到小种群全局最优位置,然后将小种群全局最优位置反馈至所有小种群中,小种群根据小种群全局最优位置对公式二中的相应因子进行更新;

待外部档案模块和上层优化模块的前述动作都完成后,对迭代次数进行判断,若迭代次数达到设定值,则进入步骤6),若迭代次数未达到设定值,则小种群优化模块从外部档案模块中调用Pareto前沿解并从该前沿解中提取出外部全局最优位置,然后将外部全局最优位置反馈至所有小种群中,小种群根据外部全局最优位置对公式二中的相应因子进行更新;然后小种群按公式二对多个小种群中的多个粒子进行粒子速度更新处理,得到各个粒子当前的粒子速度,然后根据粒子速度,小种群按公式三对各个粒子进行粒子位置更新处理,得到各个粒子当前的粒子位置;返回步骤4);

5B)将每个小种群所对应的非可行解中,与约束参数背离程度最小的非可行解作为精英解输入上层优化模块中,上层优化模块收到多个精英解后,对多个精英解进行优化处理,得到种群全局最优位置,然后将种群全局最优位置反馈至所有小种群中,小种群根据种群全局最优位置对公式一中的相应因子进行更新;然后对迭代次数进行判断,若迭代次数达到设定值,则进入步骤6),若迭代次数未达到设定值,则返回步骤3);

6)若外部档案模块中不存在Pareto前沿解,则操作结束;若外部档案模块中存在Pareto前沿解,则从Pareto前沿解中选取一者,然后求解出相应的速度控制命令;

所述公式一为:

其中,w为惯性权重,w为设定值;为相应小种群中第d维度上第i个粒子第k次搜索时的粒子速度,为设定值;为相应小种群中第d维度上第i个粒子第k+1次搜索时的粒子速度;c1和c2均是数值为正的常数,c1和c2均为设定值;和均为[0,1]区间上的随机数,和的具体数值由小种群根据粒子群优化算法随机生成;为相应小种群中第d维度上第i个粒子在第k次搜索时的自身最优位置,为设定值,后续过程中的由各个小种群根据粒子群优化算法自动更新;为第d维度上第k次搜索时的小种群全局最优位置,为设定值;为相应小种群中第d维度上第i个粒子第k次搜索时的位置向量,为设定值;

所述公式二为:

其中,c3是数值为正的常数,c3为设定值,为[0,1]区间上的随机数,的具体数值由小种群根据粒子群优化算法随机生成,为第d维度上第k次搜索时的外部全局最优位置;

所述公式三为:

其中,为相应小种群中第d维度上第i个粒子第k+1次搜索时的位置向量。

进一步地,所述步骤5A)中,小种群优化模块按如下方式从外部档案模块中调用Pareto前沿解:

若外部档案模块中的Pareto前沿解数量只有1个时,则直接调用该Pareto前沿解;

若外部档案模块中的Pareto前沿解数量大于1且小于4时,则以随机选择方式任选一个Pareto前沿解;

若外部档案模块中的Pareto前沿解数量大于或等于4时,则按如下方式处理:

1)在运行时长和能耗大小中任选一者作为参考标准,参考标准的最大值和最小值所对应的两个Pareto前沿解分别记为两个边界解,其余Pareto前沿解记为非边界解;

2)按获取时间顺序,用1至n的整数将多个非边界解连续编号,然后根据Pareto原理,计算出各个非边界解的拥挤距离值,然后按下式计算出各个非边界解所对应的选取概率pi

其中,di为第i个非边界解的拥挤距离值,n为非边界解的数量;

3)根据各个非边界解所对应的选取概率pi,采用轮盘赌选择方法,从多个非边界解中抽选出一者作为备用解,然后以随机选择方式,从两个边界解和备用解三者中任选一个作为外部全局最优位置。

参见图2,图中以能耗E为纵轴、运行时长t为横轴建立坐标系,图中的大黑点即为多个Pareto前沿解,第i个非边界解的拥挤距离值即是图中虚线所围四边形的长、宽之和。

参见图3、图4、图5,在相同线路和相同迭代次数条件下,分别采用现有的多目标粒子群优化算法和本发明进行处理,图3即为通过现有方法得到的Pareto前沿解在时间-能耗坐标系上的分布示意图,图4即为通过本发明方法得到的Pareto前沿解在时间-能耗坐标系上的分布示意图,图5即为将图3和图4叠放后的对比图。从图5中可见,由本发明方法得到的Pareto前沿解更靠近坐标轴的内侧,说明本发明的收敛性更好,此外,由本发明方法得到的Pareto前沿解向坐标系的左侧区域延伸得较宽,数量也较多且分布得更加均匀,说明由本发明方案获得的Pareto前沿解的覆盖面和分布均匀性都更好。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1