一种基于遗传算法的地铁发车策略方法及系统与流程

文档序号:26803325发布日期:2021-09-29 02:13阅读:207来源:国知局
一种基于遗传算法的地铁发车策略方法及系统与流程

1.本发明涉及地铁调控领域,尤其涉及一种基于遗传算法的地铁发车策略方法及系统。


背景技术:

2.地铁作为大城市公共交通的重要组成部分,每一天地铁客流都在随着人们生活和工作需要的变化而变化,工作日和休息日的出行规律存在着明显的差异。而且地铁客流具有动态性和时变性的特点,则要求根据实际情况调整发车密度。
3.目前地铁的发车时间和发车间隔都是固定的,只有在高峰期或者休息日有些许的调整。而所谓的高峰期也都是由地铁站的工作人员根据实时的客流来判断的,具有主观性和滞后性,给乘客在高峰期或者休息日乘车带来不好的体验感。解决的有效办法是提前预测客流量,调整发车密度。而传统的方法只是统计所有乘客的进站和出站信息来进行预测,没有对乘客的完整的行程进行预测,因此需要根据地铁运行环境按一种新的方式进行发车密度预测。


技术实现要素:

4.本发明的目的是针对现有流程的缺陷,提供一种基于遗传算法的地铁发车策略方法及系统,所述方法及系统基于遗传算法,将每一时间点的发车决策作为遗传算法的基因,将固定时间段内所有时间点的发车决策集合作为发车决策个体,将不同时间段或相同时间段的不同基因发车决策个体组合生成发车决策种群进行基因的随机组合繁衍,生成发车决策的子代,根据环境奖励值的计算来获取最优的发车决策个体。
5.一种基于遗传算法的地铁发车策略方法及系统,所采用的技术方案如下:本发明提供一种基于遗传算法的地铁发车策略方法及系统,所述方法及系统的环境数据包括地铁线路信息,地铁线上乘客信息和地铁站候车乘客信息,这三部分共同构成了整个系统的地铁的环境状态,从而可以同时考虑整个地铁环境的客流量或者分别考虑地铁线上和地铁站的局部客流量,并结合遗传算法,可以使得子代的发车决策更加符合总体客流量和局部客流量的调度要求,从而避免局部客流量的快速增加而地铁发车策略仍然基于整体客流量来判断的情况发生,提高乘客的满意度并降低整体的运营成本;本发明提供一种基于遗传算法的地铁发车策略方法及系统,所述方法及系统从地铁环境状态中获取乘客进站站点和目标站点信息,判断乘客到目标站点是可以直达还是需要换乘,针对不同类型的乘客设置不同的矩阵参数,从而可以综合考虑总体流量和局部流量进而来设计地铁的调度方案;本发明提供一种基于遗传算法的地铁发车策略方法及系统,所述方法及系统通过环境奖励值作为子代遗传适应性依据,选取大部分环境奖励值高的子代组建子代发车决策种群,并选取小部分环境奖励值低的子代加入到子代发车决策种群中,作为繁衍出可能的“基因突变”子代,其中“基因突变”的子代可能会有更好的遗传适应性,也可能存在较差的
遗传适应性,通过选择函数将遗传适应性较差的剔除;进一步的,获取地铁线路信息,地铁线上乘客信息和地铁车站候车乘客信息,建立地铁环境状态矩阵和乘客候车环境状态矩阵;进一步的,建立地铁发车决策,根据所述地铁环境状态矩阵获取每一时间点的发车决策所对应的环境奖励值;进一步的,将每一时间点发车决策编码为遗传算法的发车基因,并建立包括多个遗传算法发车基因的发车决策个体,并建立包括多个发车决策个体的发车决策种群;进一步的,随机选取发车决策种群中一个发车决策个体作为发车决策母体,将剩余的发车决策个体作为发车决策父体,所述发车决策母体遍历所有发车决策父体进行发车决策父体和发车决策母体基因对应位置随机组合繁衍,生成子代发车决策个体;进一步的,计算每一子代发车决策个体对应的环境奖励值,通过选择函数选取高于设定环境奖励阈值对应的发车决策个体进行基因随机组合繁衍,获取发车决策种群中环境奖励值最高的发车决策个体作为最终的发车决策个体。
6.优选的,根据所述环境奖励并通过所述选择函数计算每一子代发车决策个体的选择概率,所述选择概率的计算方法为:每一子代发车决策个体环境奖励值/子代发车决策种群中所有子代发车决策个体环境奖励值之和,并保留部分低于所述环境奖励阈值的子代发车决策个体进行基因随机组合繁衍。
7.优选的,当所述发车决策母体和所有发车决策父体繁衍后,生成子代发车决策种群,在子代发车决策种群中随机选取一个个体作为新的发车决策母体和子代发车决策种群中剩余的所有新的发车决策父体进行基因随机组合繁衍,生成下一子代发车决策种群,在繁衍多代种群后,计算每一代种群中每一个体的环境奖励值,并将环境奖励值最高的个体作为最终发车决策。
8.优选的,所述环境奖励值的计算方法为:(在地铁车上的乘客数/地铁环境总乘客数)

运行的地铁班车数目

每位乘客平均等待时间,环境奖励值越高个体遗传适应性越高。
9.优选的,设置相邻的两列地铁列车间最小距离阈值,若在地铁运行过程中相邻两地铁列车之间的距离小于所述最小距离阈值,则判定当前地铁环境状态死亡,禁止地铁列车发车,直到两辆地铁列车之间的距离大于最小距离阈值后重新获取当前地铁环境状态矩阵后发车。
10.优选的,所述每一时刻地铁环境状态矩阵的更新方法:根据乘客信息的进站站点、进站时间和出站站点,确定在当前地铁站候车的乘客到地铁线路上其他站点的乘客数量,当某一时刻地铁列车到站时,地铁站中候车的乘客部分或者全部上车,并在地铁车站候车乘客信息中将已经上车的乘客信息去除,同时在地铁线上的乘客信息中添加相应的数据,生成新的地铁环境状态矩阵。
11.优选的,若在候车的乘客中有需要在换乘站点换乘的,则在地铁班列车到达换乘点后,换乘乘客下车,并将地铁线上的乘客信息去除,同时将下车的乘客以当前换乘站点为起始站点,以下一个换乘站点或者终点站为目的站点将入到当前地铁站点候车的乘客信息中,生成新的地铁环境状态矩阵。
12.优选的,通过lstm+cnn神经网络建立地铁客流量预测模型, 将当前时刻所有站点的地铁环境状态矩阵作为输入,输入到模型中预测下一时间点的客流量。
附图说明
13.图1显示的是本发明一种基于遗传算法的地铁发车策略方法及系统流程示意图。
14.图2显示的是本发明遗传算法流程示意图。
15.图3显示的是本发明在不可换乘站点地铁环境状态矩阵中的处理示意图。
16.图4显示的是本发明在可换乘站点地铁环境状态矩阵中的处理示意图。
具体实施方式
17.以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。
18.可以理解的是,术语“一”应理解为“至少一”或“一个或多个”,即在一个实施例中,一个元件的数量可以为一个,而在另外的实施例中,该元件的数量可以为多个,术语“一”不能理解为对数量的限制。
19.请结合图1

图4,本发明公开了一种基于遗传算法的地铁发车策略方法及系统,所述方法及系统是基于遗传算法来实现地铁发车的优化调度,其中通过获取每个乘客的乘车信息、地铁站乘客候车信息和地铁线上乘客信息建立地铁环境状态矩阵,根据所述地铁环境状态矩阵计算每一时刻发车决策对应的环境奖励值,同时综合考虑局部和总体客流量并结合遗传算法使地铁的发车策略可以兼顾地铁发车成本和乘客乘车体验。
20.具体的,乘客通过刷卡进站则可以获取乘客的进站数据,乘客的进站数据包括刷卡发生时间、地铁线路id、地铁站id、进出站状态和用户身份id,在地铁官网可以获取所有地铁线路信息和每条线路每个站点数据。获取地铁列车状态,所述列车状态分为存活和死亡,其中存活状态即为列车在运行之中,死亡状态为列车在起始站点未发车或已经到达终点站点。获取地铁列车的最大载客量,运行中列车的载客量不能超过列车允许的最大载客量。
21.获取到所有乘客的乘车信息后,初始化地铁环境状态矩阵,地铁环境状态矩阵分为地铁站候车乘客状态矩阵和地铁线上乘客状态矩阵,所述地铁环境状态矩阵为二维矩阵,横列表示乘客乘车的进站站点,纵列表示乘客出站的目标站点,矩阵中的数据则表示从进站站点到目标站点的乘客数量。上述地铁环境状态矩阵包含了当前时刻所有地铁站点的乘客候车数据和所有在运行中的地铁线上乘客数据。
22.具体的,当有乘客刷卡进站的时,则在地铁站候车乘客状态矩阵上添加相应的乘客乘车数据;当乘客上车之后,将乘客数据在地铁站候车乘客状态矩阵去除,同时在地铁线上乘客状态矩阵添加乘客数据。若乘客为直达乘客,则在乘客到达目的站点后,将乘客数据在地铁线上乘客状态矩阵去除;若乘客为换乘乘客,则在到达换乘站点后乘客下车,去除乘客在地铁线上乘客状态矩阵的数据,同时以当前换乘站点为起始站点,将乘客数据加入到地铁站候车乘客状态矩阵中去。相比于传统方案只能对客流量从乘客入站到出站的监控,通过本发明可以弥补对换乘乘客流量的监控缺失,从而提高实际的地铁调度效果。需要说明的是,在本发明中,乘客在站点停留或乘客坐过站的情况将不作考虑。
23.在地铁环境状态矩阵设置完成之后,本发明进一步结合神经网络来对地铁客流量
进行预测,根据预测结果来调整地铁发车策略。具体的:获取每一时刻的地铁环境状态矩阵,在本发明中以每分钟作为时间间隔,将时间信息与地铁环境状态矩阵相结合,构建时间客流量矩阵表示为:(t,x
m,n
),其中t表示时间节点,x
m,n
表示在t时刻从m站到n站的乘客数量矩阵,每个时刻t都有其独立的乘客数量矩阵。对此本发明将每一时刻的客流量矩阵x
m,n
作为输入,通过设置滑窗的大小在所述乘客数量矩阵中采集数据作为训练集,在lstm+cnn神经网络中训练。滑窗大小的设置应该小于或等于由乘客流量矩阵x
m,n
的横纵列值构成的窗口。本发明通过计算神经网络的损失函数与调整神经网络的权值相结合来获取最终的预测模型。考虑到一个神经网络包含有多个神经元,因此可以通过设置每个神经元的输出权值从而调整整个神经网络的输出。
24.本发明所述的地铁发车决策模块中,所述的部分用于判断在当前时刻下列车是否应该发车,将每天列车固定最早的发车时间作为初始化发车的时间,在之后的时刻,将根据地铁环境状态矩阵与神经网络训练的结果作为是否发车的判断标准。具体的,首先判断列车在某时刻的存活状态,1代表存活可以执行发车操作,0代表死亡则不允许发车,因此在某一时刻的发车决策可表示为(t,vs),t表示时间点,vs表示发车决策矩阵。
25.值得一提的是,本发明采用的遗传算法构建发车决策个体,通过个体繁衍的遗传适应性计算并筛选出遗传适应性更高的子代作为用于繁衍的种群,从而基本保障每一子代的遗传繁衍相比父代具有更好的遗传适应性。具体的:构建遗传算法的编码基因,其中设置n个时间点,获取每一个时间点地铁环境中所有线路的发车动作,将发车行为记为1,不发车记为0,因此当前时间点8条线路的发车决策可以表示为:vt=(1,1,0,0,1,1,0,1),t表示当前时间点,上述编码的发车决策中的数值相当于基因中的碱基,需要在繁衍过程中进行互换,单个时间点的发车决策相当于是染色体。进一步计算一天内所有时间点对应的发车决策作为遗传算法中的发车决策个体。需要说明的是,通过改变发车决策个体中的基因,从而生成不同的发车决策个体,基因的改变方式包括:随机替换基因中的碱基对:即将部分发车决策中的0和1互换;或增减染色体数:即增加同一时间点不同的发车决策,或不同时间点的发车决策数。在完成多个发车决策个体的组建后,生成包含多个发车决策个体的发车决策种群,在本发明其中一个较佳实施例中,假设从早上6点到晚上24点每一分钟都具有一个发车决策,发车行为具有1080个时间点的发车决策,本发明通过建立初始种群个体,其中所述种群包括所有可能的基因,并且每个初始化个体的自身的基因相同,举例来说:上述8条线路发车时存在28=256种可能,即存在256条不同染色体,本发明通过对个体的设置,使得每个个体中的染色体是相同的,比如第一个个体所有的染色体都为:v1=(0,0,0,0,0,0,0,0),表示所有时间点都不发车,第二个个体的所有基因都为:v2=(1,0,0,0,0,0,0,0),表示只有1号线在间隔固定时间点都发车,直到设置256个不同的个体,从而保证种群中存在所有的基因,从而使得繁衍的效果和速度更好。
26.在建立所述256个发车决策个体初始种群后,随机将所述初始种群中的一个个体作为发车决策母体,所述发车决策母体遍历所述初始种群中剩余的255个发车决策个体,其中剩余的255个发车决策个体作为发车决策父体和所述发车决策母体进行基因对应位置的随机组合繁衍,其中基因随机交换繁衍的方式包括但不仅限于:碱基对选择互换(0,1互换)、染色体局部选择互换(发车决策部分互换)、染色体全体选择互换(发车决策整体互换),其中上述互换的是父体和母体对应基因位置的随机组合,也就是说,控制对应碱基位
置进行自由组合,相当于模拟人体遗传繁衍功能。在完成基因随机交换繁衍后生成子代发车决策个体。其中由于每个发车决策父体和发车决策母体都进行一次基因随机交换繁衍,从而一个发车决策母体可以繁衍出255个子代发车决策个体。在本发明另一个较佳实施例中,将所有发车决策的个体都作为发车决策母体均和剩余的发车决策个体进行繁衍,从而可以生成多个不同的子代发车决策个体。 值得一提的是,本发明通过计算每一发车决策个体的环境奖励值作为发车决策个体的遗传适应性,特别是子代的发车决策个体。其中所述环境奖励值的计算方式包括:获取当前发车决策个体中每一发车决策所对应的地铁环境状态矩阵,其中所述地铁环境状态矩阵包含换乘站的乘客数据,因此在记录乘客上下车时,可以同时获取乘客的等待时间,以及乘客在地铁车厢中的时间。也就是说,根据所述地铁环境状态矩阵可以获得对应地铁车厢内的乘客数,并获取车站上乘客的等待时间,进一步计算环境奖励值,其中所述环境奖励值=(在地铁车上的乘客数/地铁环境总乘客数)

运行的地铁班车数目

每位乘客平均等待时间。所述环境奖励值作为发车决策遗传适应性的参数,当所述环境奖励值越大,则遗传适应性更强,更符合发车要求。
27.本发明进一步设置环境奖励阈值,并计算所有发车决策个体中所有发车决策的环境奖励值之和,作为发车决策个体环境奖励值,在本发明其中一个较佳实施例中,计算所述发车决策个体的环境奖励值是否大于所述环境奖励阈值,若是则加入到发车决策个体种群中。上述方法较适用于子代的发车决策个体中,从而使得子代的发车决策种群整体上具有更好的遗传适应性。在本实施例的其他较佳实施例方式中,采用概率函数计算所述发车决策个体在整个族群中的发车概率,其中发车概率包含了所述环境奖励值。具体方法如下:计算种群中每一发车决策个体的环境奖励值,并计算该种群中所有发车决策个体的环境奖励值之和作为该种群的环境奖励值,其中发车概率可以是每一发车决策个体的环境奖励值在对应种群中的比值。 将比值最大的发车决策个体作为最终发车操作行为。
28.值得一提的是,在执行遗传算法获取子代的发车决策个体后,建立子代的发车决策种群,可进一步随机选取子代的发车决策种群中的一个发车决策个体作为新的发车决策母体,并将对应子代的发车决策种群中剩余的发车决策个体作为新的发车决策父体进行基因随机交换繁衍,生成第二次繁衍的第二子代发车决策个体,并根据所述环境奖励阈值建立第二子代发车决策种群。按照上述繁衍方式进行多次繁衍后,获取最高的环境奖励值的发车决策个体作为最终的发车决策执行依据。
29.由于遗传算法需要考虑“基因突变”的可能性,因此在本发明另一个较佳实施例中,需要在已接建立的发车决策初始化种群,或子代发车决策种群中加入部分环境奖励值在所述环境奖励阈值之下的发车决策个体,从而在执行基因随机组合繁衍过程中会发生更好的“基因突变”型的子代发车决策个体,当然,也可能会发生更差的“基因突变”型的子代发车决策个体,由于存在所述环境奖励阈值的约束,以及选择函数的约束,因此子代发车决策个体的选择和繁衍基本是正向繁衍的。
30.特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(cpu)执行时,执行本技术的方法中限定的上述功
能。需要说明的是,本技术上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线段、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线段的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线段、电线段、光缆、rf等等,或者上述的任意合适的组合。
31.附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
32.本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1