一种轨道机车节能操纵实时优化控制策略库构建方法与流程

文档序号：12667037阅读：151来源：国知局

本申请涉及一种轨道机车控制技术，尤其涉及一种轨道机车节能操纵实时优化控制策略库构建方法。

背景技术：

轨道机车节能操纵是为了能够在一定的牵引机车、车辆、线路等硬件环境和既定的运行图、列车编组计划等运营管理状况下，来改进机车的操纵方法以实现列车的节能运行。轨道机车在运行过程中会受到坡度、限速、隧道、弯道等多个外部约束条件，机车的节能操纵往往也会有多个需要优化的目标，如油耗、到站时间、运行平稳性等，这些外界因素和自身因素的干扰，使得轨道机车的操纵驾驶有很大的复杂性和不确定性，所以机车的节能操纵实时优化控制是一个多目标、多约束、高非线性的复杂操纵序列优化问题。

在解决这类复杂操纵序列优化问题中常见的有三类方法：数值搜索、解析求解、启发式操纵规则设计。数值搜索：通过数值搜索算法对操纵序列进行寻优搜索从而得到优化的档位操纵序列，常见的算法有遗传算法、群搜索算法、动态规划等，这种方式耗时长，且短时间内无法收敛到最优结果，不适合在线控制系统优化。解析求解：基于领域知识对操纵控制过程中不同状况下的关键转换点根据解析公式求解来得到最终的优化操纵序列，这种方式主要缺陷是转换点的解析公式推导过程复杂，较难处理多约束条件。启发式策略设计：考虑诸多复杂因素，人工通过现有领域的一些操作规范等启发式的进行机车控制策略库设计，然后通过不同的路况信息和机车信息进行策略匹配，来自动控制机车运行，该种方式过多的引入人工的分析与设计，极大的降低了策略设计的效率，同时由于人思考范围有限，无法覆盖所有可能的情况，这势必会导致部分优化解遗漏。以上三种方法中，启发式优化策略设计由于有人工经验的参与可以考虑到诸多复杂的因素，通过人工设计操作优化规则，可控性、可靠性较强，在工程领域应用很多。针对于启发式优化策略设计，由于优化策略库的设计对最终的机车的节能效果起到了至关重要的作用，而且机车节能控制往往是需要由很多策略组织起来形成策略库，共同协调来完成优化控制，本专利针对启发式策略设计中存在的策略设计和维护效率低下、策略覆盖率低等问题提出一种轨道机车节能操纵实时优化控制策略库构建方法。

技术实现要素：

本发明的目的是提供一种通过数据挖掘和机器学习相结合的方法来实现轨道机车节能操纵实时优化策略库的构建，最终的优化策略在控制机车运行过程中表现为具有时间属性的离散档位序列集合，机车按照这些优化操纵档位行驶。

本发明的技术方案是一种轨道机车节能操纵实时优化控制策略库构建方法，具体包括以下步骤：

步骤1、数据的收集与预处理，得到标准的数据集，为后续的步骤准备数据的输入，此步骤分为数据的收集、数据的预处理两个步骤。数据的收集是从机车上相关的监控记录设备上获取机车运行的线路数据、机车参数数据和机车操纵日志数据的原始数据；数据的预处理是针对从记录仪器上获取的原始数据进行数据的预处理操作，数据预处理阶段分别对机车运行的线路数据和机车操纵日志数据进行了预处理操作；最终得到预处理后的标准的线路数据和所有机车操纵日志数据中子操作序列集合，并以一种结构化的表征形式存储在文本文件中；

步骤2、利用数据挖掘算法结合上步骤1中的数据预处理结果对机车操纵日志数据进行大规模的搜索与挖掘，挖掘出机车在运行过程中频繁的运行趋势及档位操作序列，从而得到不同坡段类型下的频繁子操作序列集合，最终将子操作序列集合处理为一种结构化的表征形式，并存储在文本文件中；

步骤3、以上步骤2中得到的不同坡段类型下的频繁子操作序列集合作为基础的策略库，然后基于此基础策略库，使用基于知识发现的机器学习算法进行优化策略的学习生成，这个阶段加入包括区段限速、时刻表、运行平稳规范在内的约束条件进行策略学习过程中的规则的调整与新规则的添加，同时运行测试用例调整更新策略库，最终得到可以作为机车优化驾驶操作策略的优化策略库，并将最终得到的优化策略库处理为一种结构化的表征形式，存储在文本文件中；

步骤4、根据步骤3得到的优化策略库，根据机车的状态参数，进行策略的搜索匹配与策略的执行，通过策略的优化运算执行策略，最终生成整条线路的优化操纵序列。

本发明的有益效果在于：该方法提高了策略设计与生成的效率，并可以进行更加节油的驾驶模式的学习。通过序列模式挖掘算法对油耗较低的机车操纵日志数据进行了数据挖掘操作，挖掘出不同坡段类型不同坡长下的子操作序列；对于优化策略库的构建，将数据挖掘出的策略子操作序列集合作为初始策略库，再结合机车驾驶牵引规范进行原始规则设计，并针对区段限速、时刻表、运行平稳性等约束条件进行策略库的调整。整个规则的设计过程中运用了RDR方法，运行大量测试用例，通过错误驱动原理来对策略子操作树进行构建及规则维护，最终保证了策略的健壮性、优化效果和整体的运行效率。

附图说明

图1是一种轨道机车节能操纵实时优化策略库构建方法流程图；

图2是线路数据预处理流程图；

图3是机车操纵日志数据预处理示意图；

图4是策略子操作表征形式示意图；

图5是RDR知识获取流程图；

图6是RDR知识库结构示意图；

图7是基于RDR的策略生成流程图；

图8是优化策略的匹配与执行过程。

具体实施方式

以下结合附图1-8对本发明的技术方案进行详细说明。

如图1所示，该实施例提供了一种轨道机车节能操纵实时优化控制策略库构建方法，具体包括以下步骤：

步骤1.1、从机车上相关的记录设备上获取线路数据、机车参数数据、机车操纵日志数据等原始数据

一般现代轨道机车在运行中都会有相关的设备记录机车的整个运行过程中的状态。如列车监控装置(简称LKJ)、列车控制和管理系统(简称TCMS)等，LKJ装置中主要记录线路、时刻表、运行调度等日志数据，从中可以获得线路的基本信息和机车运行公里标、速度等；TCMS装置中主要记录了机车运行的操纵日志数据，从中可以获得机车运行的档位。该实施例中所提出的数据收集，主要是指从LKJ、TCMS等装置或系统中得到相关的日志数据。该实施例提出的策略库构建方法主要是为了解决轨道机车的节能操纵，为了达到节能的目的，我们在数据的收集过程中会选取较为节油的机车操纵日志数据，这里节油的评估指标为油耗，评估的数据来自于TCMS记录或铁路局统计的油耗，根据线路信息和机车信息的不同，选取相同机车信息相同线路下油耗最小的若干条数据记录作为我们数据挖掘和机器学习的原始样本数据，原始样本数据包括线路数据、机车参数数据、机车操纵日志数据等。

步骤1.2、将步骤1.1中得到的原始数据进行数据预处理操作，这一步骤包括线路的数据预处理和机车操纵日志数据的预处理操作，最终得到处理后标准的数据集。

首先进行线路数据的预处理操作，如图2所示，线路的数据预处理主要由加算坡度计算，线路分段，短分段合并组成：

a.加算坡段过程是线路信息中的坡度、线路曲线、隧道三种线路信息叠加所产生的坡度该实施例中所处理的线路。由于机车运行在轨道上会有多种外界因素影响机车的运行，单独去考虑每一种外界因素，不利于我们处理分析问题，所以加算坡段过程就是将最重要的三种环境因素(坡度、线路曲线、隧道)进行加算，最终得到一个能代表线路每一段环境因素叠加后的坡段类型的实值。

b.线路分段是根据所在线路加算坡度的不同，对线路进行分类，并经过一些相同坡段合并处理之后得到具有坡段类型标识的分段数据。线路分段的原因在于机车在不同类型的坡度情况下，其驾驶的档位操纵规律不同，在相同近似的坡度范围内，其驾驶档位操纵规律基本一致，因此可以对具有相同或相近的道路坡段情况进行数据挖掘分析和机器学习策略生成，并充分利用不同的道路坡段情况对机车的影响，来提高策略的节能效果，针对以上特点，将一条距离较长的完整线路根据坡度情况拆分为不同坡段类型的集合，并针对不同的坡段类型单独进行驾驶策略的设计很有必要。根据加算坡度的范围，我们得到不同的6种坡段类型，如表1所示：

表1坡段分类表

c.短分段合并过程，在线路分段的过程中，除了考虑线路本身的坡度之外，还需要考虑每种坡段类型的长度，对于一些坡段长度较短的坡段类型，由于其对机车的影响较小，需要进行一些合并操作(首先合并连续的一些短段，然后合并相同的坡段类型)。

预处理完线路数据，就需要进行机车操纵日志数据的预处理。对于完整的机车运行速度曲线来说，其可以拆分为若干个有序的坡段组合，每个坡段中又可以根据曲线速度的变化情况拆分为若干个有序的子操作组合，如图4所示，图中以机车在某个坡段的运行曲线为例，根据机车的速度变化情况将该坡段的操纵策略分为加速操作、匀速操作、减速操作三种类型子操作。这里匀速操作定义为两种情况：一种为机车一直保持某种速度运行一段时间，另一种情况为机车在某范围内围绕着某一速度上下起伏。这两种情况我们都认为是匀速操作。对于图4中的坡段策略来说，其子操作序列为加速、减速、匀速、加速。

对于每种类型的坡段来说，在相同坡长情况下，机车的运行趋势是一致的，其子操作序列也基本一致，不同的坡长情况下，其子操作序列有一定的差别。根据这一特点，我们可以从机车操纵日志数据中挖掘出每种坡段类型下不同的坡长的频繁的运行趋势序列及档位操作序列，并将其用于机车节能操作策略库构建的机器学习过程。

为了能够更准确的从机车操纵日志数据中挖掘出不同坡段类型不同坡长下的频繁序列，需要结合线路分段步骤中的线路分段信息来对机车操纵日志数据进行预处理操作，整个预处理的过程如图3所示，共分为以下5个步骤：

a.将LKJ中的数据根据时间同TCMS数据进行映射(数据合并操作)，同时处理公里标不匹配的情况，使得最终的机车操纵日志数据包含连续公里标、机车速度和档位。(由于在TCMS数据中没有记录机车的公里标，且机车在行驶过程中会出现公里标(列车相对位置)不匹配的情况，所以需要进行数据合并)

b.将机车运行曲线中连续相同的速度进行合并。(由于在机车操纵日志中记录的是机车每秒的运行速度，而机车在运行过程中速度变化一般为若干秒变换一次，因此在提取的数据中会出现相同的速度连续出现很多次的情况，这会对后续的档位操作序列的提取出现干扰，因此需要将该连续的速度进行合并，并记录速度所运行的时间)

c.根据已有的线路分段信息，我们以分段为单位进行机车子操作的数据集构建，针对某种坡段类型，遍历这个坡段中的速度，找到速度的变化规律，并记录相应的档位信息。

d.对每条线路机车操纵日志数据每个分段中子操作进行坡长划分。位于同一坡段类型中，不同的坡长驾驶操纵序列也不同，对于短的坡长，会尽可能考虑前后坡段类型的情况，而减弱当前坡段类型的影响，对于较长的坡长，则当前坡度情况对策略的影响较大。综合考虑，我们将坡长分为短坡、中等坡长、长坡三种类型，其具体范围如表2所示。

表2坡长分类表

e.以坡段类型为单位，将所有线路机车操纵日志数据中同一坡段类型同一坡长下的子操作数据进行合并，最终得到所有机车操纵日志数据中所包含的子操作序列集合，作为后续序列模式挖掘的数据输入。

通过以上5个机车操纵日志数据预处理步骤，机车操纵日志被处理为以坡段为单位的子操作序列集合，这些数据将作为后续步骤2数据挖掘的输入。

将机车操纵日志数据进行预处理之后，得到的是每个坡段类型下的不同坡长范围的子操作序列。这些子操作序列是有时间性质的离散序列，对于每种坡段类型的子操作数据挖掘我们采用序列挖掘算法实现。该实施例中采用GSP算法来进行坡段类型子操作序列的挖掘。 GSP(Generalized Sequential Pattern)算法是AprioriAll算法的扩展算法，由于其属于Apriori算法的一类，因此其整个算法过程也包括排序、频繁项集、转换、序列四个阶段。在算法执行过程中GSP采用逐层搜索的迭代方式，并引入了分类层次、时间约束、滑动时间窗等技术，对候选项集的选择给与约束，使其候选项集的数目相比于AprioriAll有了大幅度的减少。同时在存储方面，GSP采用了哈希树作为候选项集的存储结构，使得扫描候选项集的数量大幅度减少，计数的速度有了很大的提升。

本技术方案中中GSP算法的输入为所有坡段类型的子操作序列，核心过程包含了连接步骤和剪枝步骤(本算法并不是要保护的点，不具体展开说明)最终得到的结果如表3所示，其中最后一列对应的子操作序列为挖掘出的最大频繁子操作序列。该子操作序列将作为基础策略库为后续机器学习步骤提供基础输入。

表3不同坡段类型不同坡长下子操作序列结果表

根据步骤2中数据挖掘得到的不同坡段类型下的频繁子操作序列集合，并将这些子操作序列集合作为我们的基础策略库，然后采用机器学习的方法来构建优化策略库，我们采用的机器学习方法为涟波下降规则(Ripple Down Rules，RDR)。

RDR规则常被应用于领域知识的获取和大型知识体系的构建。传统的基于知识的系统很少考虑到系统的维护，其往往希望通过经验丰富的领域专家、知识开发工程师等在大量的前期域分析中，通过他们的大脑去捕获知识来构建完整的模型。这种方式对专家的依赖性太高且知识模型在构建完之后不易于维护和扩展。RDR是一种典型的思维模式的转变，它通过领域专家与现实外部可能发生的情况交互，增量迭代的进行知识的获取和维护。外部情况(用例)在知识获取环节中占据了关键的角色，对新知识的获取起到了推动和促进的作用。当外部情况在知识库中出现错误匹配或者无法匹配的情况，则根据外部情况往知识库中添加新的规则，以此方式来不断使知识库完善，RDR知识获取流程如图5所示。

对于整体流程来说，初始状态构建一个空的知识系统，通过运行用例来进行知识库规则的匹配，若匹配到的结论未得到结果检查的认可，则针对用例的特点，提取出能够用于构建新的例外规则的属性-值对，并分配新的结论组合成一条新的规则存放到知识库中。整个RDR知识库是以二叉树的形式存在，树中的每个节点存储一个规则结论。当通过条件匹配到某个规则所对应的结论不是该用例的结论时，则针对当前节点添加新的条件和结论，作为其的例外规则，具体示例模型如图6所示。

本技术方案中基于RDR的规则学习部分：将步骤2中得到的不同坡段类型的频繁子操作序列集合作为RDR规则学习的基础策略库，并根据RDR方法的错误驱动原理，加入机车运行过程中的区段限速、时刻表、运行平稳规范等约束条件，运行大量用例，对优化策略进行调优与扩充。基于RDR的策略生成是生成策略的关键步骤，本技术方案中采用基于RDR的优化策略学习的流程图如图7所示。主要包含三大核心过程：

原始策略的设计，主要是根据步骤2中数据挖掘得到的不同坡段类型下的频繁子操作序列集合作为原始策略库。

基于多约束的策略调整(包括基于区段限速、基于时刻表、基于机车行驶平稳性的规则调整等过程)，基于区段限速、时刻表、运行平稳性规范等约束条件分别匹配限速调整规则、时间偏差调整规则、平稳性调整规则，这三者是顺序分步执行的，共同作为策略检查的标准。

策略的更新(包括运行测试用例、定位规则失败条件、添加新规则等过程)。规则的更新，通过构建大量测试用例对优化策略进行测试，若出现规则优化失败或者优化操纵档位不符合检查规范，则进行策略定位，对造成问题的策略添加新的判断，从而对策略进行扩展与完善使其稳定性提高。

优化策略的匹配与执行是生成优化操纵序列的最后步骤，整个流程如图8所示，该步骤中，输入为机车的状态参数，主要包括坡段类型、坡长、车重等，这些状态参数将作为策略匹配的依据。优化策略的匹配根据读入的参数从优化策略库进行遍历搜索，输出匹配的优化策略。当匹配到具体的优化策略后，将执行这个优化策略从而生成当前策略下的优化操纵序列。最终整条线路的优化操纵档位序列由具有时间顺序的每个策略生成的优化操纵档位序列拼接而成。

虽然上面结合本发明的优选实施例对本发明的原理进行了详细的描述，本领域技术人员应该理解，上述实施例仅仅是对本发明的示意性实现方式的解释，并非对本发明包含范围的限定。实施例中的细节并不构成对本发明范围的限制，在不背离本发明的精神和范围的情况下，任何基于本发明技术方案的等效变换、简单替换等显而易见的改变，均落在本发明保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨英;刘炎;黄晋;赵曦滨;李增坤;顾明;孙家广
技术所有人：清华大学;中车信息技术有限公司;中车大连机车研究所有限公司
我是此专利的发明人

上一篇：一种二级火星灰尘捕集器的制作方法与工艺
上一篇：一种空气净化杀菌装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。