一种基于多所博弈的融通型牵引供电系统能量管理方法

文档序号：37906631发布日期：2024-05-09 21:54阅读：13来源：国知局

本发明涉及电气化铁路，具体涉及一种基于多所博弈的融通型牵引供电系统能量管理方法。

背景技术：

1、电气化铁路作为关乎国民经济发展的重要交通运输方式，具有运量大、速度快、成本低等优势。牵引供电系统作为驱动电力机车的唯一能量来源，其能量消耗高、冲击功率大等问题逐渐显现。因此，如何降低牵引能耗，实现能量的高效利用对于铁路运行及社会发展具有重要的现实意义。传统牵引供电系统由于电分相的存在，导致能量只能在一个供电臂内进行流动；同时，由于未装配储能装置，导致多余电力机车再生制动能量无法被消纳，从而造成浪费。针对以上问题，功率融通型牵引供电系统在电分相及分区所处增设功率融通装置，并在牵引变电所的功率融通装置的直流母线上接入储能系统。然而，功率融通装置及储能系统的加入使得新型牵引供电的用电方式发生了变化，能量管理系统如何高效协调多个牵引变电所的功率融通装置及储能系统成为了新的问题。

2、目前，针对融通型牵引供电系统的能量管理方法研究尚处起步阶段。在能量管理范围方面，目前主流能量管理方法主要聚焦于单个变电所层面的运行，缺乏相邻牵引变电所的功率支援，并未充分利用融通型牵引供电系统的跨时空调配能量的能力；在能量管理原理方面，目前方法以规则类方式主导，例如：城市轨道交通领域普遍以牵引网网压为判据，根据网压来控制储能系统的充放电电流；在交流牵引供电领域以电力机车功率为判据，通过设定功率阈值来控制系统充放电。然而，固定的充放电曲线会造成系统运行的灵活性不足，同时，由于铁路运行图的变化，牵引供电系统每日的运行状态并不相同，导致规则类方式灵活性不足，且需要针对单一牵引变电所进行适配，不具备迁移能力。因此，对于融通型牵引供电系统，急需建立协同自适应的能量管理方法。

3、根据公开专利信息显示，当前对于功率融通型牵引供电系统的能量管理方法研究尚处于起步阶段。专利《一种电气化铁路储能式牵引供电系统及其控制方法》(公开号：cn110829435a)提出了一种应用于单相交流牵引供电系统，可以实现再生制动能量高效利用和系统容量优化配置的方案，但该方法灵活性不足，没有自适应控制效果；专利《储能装置放电阈值的确定方法、装置、终端及存储介质》(公开号：cn111628514a)提出了一种电气化铁道储能系统放电阈值确定方法，但无法实现多个牵引变电所的协同供能，只能实现对单一系统的控制，且自适应效果有限；专利《一种基于强化学习的电气化铁路储能系统能量管理方法》(公开号：cn116316755b)提出了一种基于强化学习的能量管理方法，自适应效果较好，但仍然缺乏多个能量管理系统的交互机制。

技术实现思路

1、为克服现有技术的缺陷，本发明提出一种基于多所博弈的融通型牵引供电系统能量管理方法，该方法建立了多变电所协同工作过程的能量管理数学模型，基于该数学模型与已建立的马尔科夫决策模型，可将融通型牵引供电系统划分为独立运行工况与协同运行工况，并由强化学习算法进行决策，实现在多变电所独立运行方式下以及协同运行方式下的自适应充放电。

2、本发明的目的可以通过以下技术方案来实现：

3、一种基于多所博弈的融通型牵引供电系统能量管理方法，基于电气化铁路能量管理过程的马尔科夫决策模型以及多变电所协同工作过程的能量管理数学模型，通过判断电力机车的实时功率需求，动态调节融通型牵引供电系统的运行方式，实现多变电所在独立运行方式以及协同运行方式下的自适应能量交换；

4、所述能量管理方法包括以下步骤：

5、s1：马尔可夫决策模型中载入离散训练得到的动作-状态价值矩阵；

6、s2：建立基于多变电所协同工作过程的能量管理数学模型；

7、s3：读取二次设备数据并载入马尔可夫决策模型以及能量管理数学模型；

8、s4：基于能量管理数学模型，获取各牵引供电系统的状态变量优化值，根据独立运行工况的判别条件以及协同运行工况的判别条件，判断所述融通型牵引系统的运行工况；

9、s5：若判断为独立运行工况时，则执行基于强化学习算法得到的动作-状态价值函数矩阵进行决策，控制储能系统进行功率交换并更新系统参数，以独立完成功率分配和储能充放电任务；

10、s6：若判断为协同运行工况时，则执行基于多所博弈算法进行功率博弈至纳什均衡，根据博弈结果控制储能系统进行功率交换并更新系统参数，以实现多变电所之间的能量管理和功率分配；

11、s7：更新系统参数，执行功率交换，循环步骤s4至s6，直到系统接收到停止指令后结束运行。

12、所述能量管理方法用于动态调节多个牵引变电所在独立运行和协同运行工况下与电力机车之间的能量交换过程，使得融通型牵引供电系统能够灵活地切换运行模式，根据实时功率需求和系统状态，有效地进行能量管理，以提高能源利用效率和保障电力供应的稳定性。

13、进一步的，所述基于多变电所协同工作过程的能量管理数学模型包括能量管理目标以及能量管理约束；

14、所述能量管理目标包括储能系统能量吸收效率最大化、储能系统能量回馈效率最大化以及平均牵引功率最小化；

15、所述储能系统能量吸收效率最大化可表示如式(1)：

16、

17、式(1)中，eab％为储能系统能量吸收效率，x为牵引变电所总数，y为供电臂总数，m为采样时间窗总数，n为每个采样时间窗的数据点总数，x为牵引变电所序号，y为供电臂序号，i为时间窗序号，j为采样点序号，ηce为储能系统充电效率，为第x个牵引变电所储能系统的电压，为第x个牵引变电所储能系统的充电电流，为第x个牵引变电所的空闲状态补能功率，为第y个供电臂下的电力机车再生制动功率和；

18、所述储能系统能量回馈效率最大化可表示如式(2)：

19、

20、式(2)中，etr％为储能系统能量回馈效率，ηde为储能系统放电效率，为第x个牵引变电所储能系统的放电电流，为第y个供电臂下的电力机车牵引功率和；

21、所述平均牵引功率最小化可表示如式(3)：

22、

23、式(3)中，pave为平均牵引功率，δt为采样时间间隔。

24、进一步的，所述能量管理约束包括多牵引变电所功率平衡约束、电力机车能量平衡约束、储能系统能量平衡约束、储能系统功率爬坡约束、储能系统最大放电功率约束、储能系统最大充电功率约束以及储能系统荷电状态约束；

25、所述多牵引变电所功率平衡约束描述如式(4)：

26、

27、式(4)中，为第x个牵引变电所与该所连接的外部电力系统的交换功率，为第y个供电臂下的电力机车功率和；

28、所述电力机车能量平衡约束描述如式(5)：

29、

30、所述储能系统能量平衡约束描述如式(6)：

31、

32、式(6)中，为第x个牵引变电所的储能系统交换功率；

33、所述储能系统功率爬坡约束描述如式(7)：

34、

35、式(7)中，t与t+1为两个相邻的采样时间点，为单位时间内储能系统所允许的最大交换能量；

36、所述储能系统最大放电功率约束描述如式(8)：

37、

38、式(8)中，为储能系统最大放电功率；

39、所述储能系统最大充电功率约束描述如式(9)：

40、

41、式(9)中，为储能系统最大充电功率；

42、所述储能系统荷电状态约束描述如式(10)：

43、

44、式(10)中，socx(t)为第x个牵引变电所的储能系统的荷电状态数值，和分别为储能系统最小荷电状态数值与最大荷电状态数值。

45、能量管理系统在运行时满足能量管理约束条件，同时根据能量管理目标，提升储能系统能量吸收效率以及储能系统能量回馈效率，降低平均牵引功率。

46、进一步的，利用q-learning强化学习算法来求解所述基于电气化铁路能量管理过程的马尔科夫决策模型，获取当前状态下的最优动作，对动作-状态价值矩阵进行迭代更新。

47、进一步的，所述独立运行工况的判别条件如式(11)：

48、

49、式(11)中，yx为第x个牵引变电所的供电臂总数。

50、独立运行工况下，供电臂下电力机车的功率和可以被单个储能系统完全供给/吸收，各牵引变电所的能量不通过分区所功率融通装置进行交换，电力机车能量由该机车所处的供电臂的牵引变电所及其储能设备进行供给，；

51、独立运行工况下，能量管理系统基于强化学习算法直接进行决策，输出满足约束条件的储能系统指导功率，控制系统根据储能系统指导功率控制dc/dc变换器的运行，从而实现能量管理系统对融通型牵引供电系统的控制。

52、进一步的，所述协同运行工况的判别条件如式(12)：

53、

54、式(12)中，x1和x2为两个相邻的牵引变电所序号，和分别为与x1和x2直接连接的供电臂总数，和分别为x1和x2牵引变电所的储能系统的最大充电功率，和分别为x1和x2牵引变电所的储能系统的最大放电功率。

55、协同运行工况下，供电臂下电力机车的功率和无法被单个储能系统完全供给/吸收，牵引变电所的能量通过分区所功率融通装置进行交换，电力机车能量由该机车所处的供电臂的牵引变电所及最近的相邻牵引变电所共同承担；

56、协同运行工况下，能量管理系统会基于多所博弈算法进行决策，博弈算法的输出结果用于动作-状态价值函数矩阵的更新。

57、进一步的，所述多所博弈算法包括建立多所博弈算法模型以及对所述多所博弈算法模型进行求解，建立多所博弈算法模型具体包括以下步骤：

58、s81：确定各牵引变电所的能量管理系统作为博弈参与者，建立其相互间的博弈关系，并定义每个参与者的可能动作集合及相应的奖励函数；

59、s82：构建一个纳什均衡模型，该模型反映了在牵引供电系统中，各相邻牵引变电所的能量管理系统通过协同决策实现纳什均衡；其中每个牵引变电所的策略旨在最大化其奖励数值，而当系统达到纳什均衡状态时，任何一个能量管理系统无法通过单独改变策略来提高自己的奖励；

60、s83：以序号x的牵引变电所为参考点，建立包括所有牵引变电所在内的策略奖励数值矩阵，并计算在策略组合下每个变电所的奖励数值，确定每个变电所的最优策略和相应的奖励数值；

61、s84：以整个牵引供电系统的最大化预期回报为目标，形成全局最优的纳什均衡方程，结合各个变电所的策略概率分布函数与奖励函数，构建全局奖励期望模型；该奖励期望综合考虑所有牵引变电所能量管理系统的预期回报，以引导各变电所达到全局最优的能量分配；对于任一个牵引变电所能量管理系统，考虑其在全局最优条件下达成与其他所有牵引变电所的能量管理系统的纳什均衡，通过迭代博弈过程，调整其能量分配策略以最大化全局奖励期望。

62、s85：修改纳什均衡方程以适应全局最优条件，对最大动作-状态价值函数矩阵数值进行替换修正，通过迭代更新动作-状态价值函数矩阵，每个牵引变电所在纳什均衡及全局最优条件下修正各自的策略，确保在全局视角下达到预期的最优能量管理效果。

63、进一步的，基于多所博弈算法模型的功率博弈至纳什均衡的求解步骤包括：

64、s91：在牵引变电所之间建立主从博弈关系，其中直接连接牵引负荷的牵引变电所作为主系统，相邻支援变电所作为从系统，主系统根据动作的概率分布进行抽样来确定初始决策；

65、s92：主系统的初始决策信息通过通信线路传递给从系统，从系统依据主系统的决策，根据自身的动作-状态价值函数数值更新决策，旨在提升相应的奖励值；

66、s93：主从系统反复执行各自的决策过程，每次迭代都基于对方的最新策略进行调整，直到博弈过程达到预定的纳什均衡次数，从而形成稳定的策略组合；

67、s94：利用纳什均衡判据检验当前策略组合是否为纳什均衡的唯一解，若符合纳什均衡方程，则认定博弈决策为稳定，否则继续博弈过程；

68、s95：在存在多组可行的动作对的情况下，各能量管理系统的决策动作将交替重复，根据设定的期望标准，选择全局最优解，保证能量管理系统在达到博弈均衡的同时，实现整体的最佳功率分配；

69、s96：完成博弈后，根据最终的纳什均衡决策结果，控制储能系统执行功率交换，并更新系统参数，确保多变电所之间实现有效的能量管理和功率分配。

70、与现有技术相比，本发明具有以下技术效果：

71、(1)本发明可以实现多个牵引变电所的协同供电，有利于消纳更多再生制动能量，提升了能量的利用效率。

72、(2)本发明能够实现多个储能系统动态自适应充电及放电，并实时对充放电策略进行调整，能够更好的利用再生制动能量，发挥削峰填谷的作用。

73、(3)本发明可以实现相邻牵引变电所的自适应能量支援，通过博弈的方法动态调节支援功率的大小，具有较好的灵活性。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高仕斌,罗嘉明,韦晓广,雷杰宇,刘帝洋,张敬凯,富嘉兴
技术所有人：西南交通大学
我是此专利的发明人

上一篇：一种石英晶体谐振器的加工装置及方法与流程
上一篇：一种捋穗式机械-负压气流耦合苜蓿种子采收机

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。