本发明属于电力系统调度领域,具体涉及一种基于数据驱动并计及风险的电力系统风险调度方法及系统。
背景技术:
1、可再生能源(res)的大规模整合和交通、供热部门的电气化是能源行业的发展方向。然而,这一转型带来了电力系统运行中的一系列技术和经济挑战。特别是,可再生能源的高间歇性和有限可控性,以及电力和热负荷的增加,都加剧了电力系统的运行复杂性和风险。在这一环境下,电力系统面临的紧迫问题之一是如何管理和最小化约束违反和安全运行极限风险,尤其是输电过载问题。此外,高比例的可再生能源并网引入了新的挑战,包括供需波动性、电网频率和电压控制,以及电力质量问题。这些因素共同增加了n-1风险管理的复杂性:可再生能源的波动性可能会放大单一故障的影响,导致系统行为更难以预测和控制;高比例的可再生能源并网要求电网具有更高的灵活性,以适应供能波动,从而增加了在n-1情况下维护系统稳定性的挑战;这种复杂性通常需要更先进的控制系统和数据分析,例如利用深度学习算法进行更准确的需求预测和资源调度。
技术实现思路
1、本发明要解决的技术问题:针对现有技术的上述问题,提供一种基于数据驱动并计及风险的电力系统风险调度方法及系统,本发明旨在将风险评估嵌入到电力系统的调度过程中形成计及风险的应急调度技术,以面向高比例的可再生能源并网场景下实现更准确的需求预测和资源调度。
2、为了解决上述技术问题,本发明采用的技术方案为:
3、一种基于数据驱动并计及风险的电力系统风险调度方法,包括:
4、步骤s1,确定电力系统的物理要素及其突发事件;
5、步骤s2,基于电力系统的物理要素及其突发事件,确定电力系统面临的n-1风险所对应的突发事件,对n-1风险量化评估建立各个突发事件的最优减载问题及其约束条件;
6、步骤s3,结合各个突发事件的最优减载问题及其约束条件,定义风险调度模型的状态空间、动作空间、奖励函数;
7、步骤s4,结合风险调度模型的状态空间、动作空间、奖励函数搭建马尔可夫决策过程,并利用递归确定性策略梯度算法r-ddpg结合神经网络训练出风险调度模型。
8、可选地,步骤s1中确定的电力系统的物理要素包括:母线、常规电厂cpp、可再生能源发电厂res、无功补偿器rpc和负荷,所述常规电厂cpp、可再生能源发电厂res、无功补偿器rpc、负荷分别与总线相连构成电力系统的物理拓扑结构。
9、可选地,步骤s1中的突发事件是指对应的物理要素对电力系统的稳定性或安全性构成潜在威胁的突发性的事件。
10、可选地,步骤s2中结合电力系统的物理要素及其突发事件确定电力系统面临的n-1风险所对应的突发事件时,确定电力系统面临的n-1风险所对应的突发事件是指引起电力系统中各个物理要素中的发电机、变压器、输电线路故障的突发事件。
11、可选地,步骤s2中突发事件的最优减载问题的函数表达式为:
12、,,
13、上式中,min表示最小化, m为母线集合,表示与减载动作相关的线性成本,表示因减载操作的负荷量而损失的经济利益,为突发事件下t时刻母线n上有功负载减少;步骤s2中突发事件的最优减载问题的约束条件包括:
14、,
15、,
16、,
17、,
18、,
19、,
20、,
21、,
22、,
23、,
24、,
25、,
26、,
27、,
28、,
29、,
30、上式中,为突发事件下母线n上承诺常规电厂cpp的子集,为突发事件下t时刻第g个常规电厂cpp的再调度有功功率,为突发事件下t时刻第g个可再生能源发电厂res的有功功率,为t时刻的母线n的有功需求,为突发事件下连接到母线n的母线集合,为突发事件下t时刻母线n和母线m之间的支路上的有功潮流;为突发事件下t时刻第g个常规电厂cpp的再调度无功功率,为突发事件下母线n上的无功补偿器rpc的集合,为突发事件下t时刻第c个无功补偿器rpc的无功功率,为突发事件下t时刻母线n上的无功负载减少,为t时刻的母线n的有无功需求,为突发事件下t时刻母线n和母线m之间的支路上的无功潮流;和分别为突发事件下t时刻母线n和母线m的电压,和分别为母线n和母线m之间的电导和电纳,为突发事件下t时刻母线n和母线m之间的电压相角差,和分别为突发事件下t时刻母线n和母线m的电压相角,为突发事件下t时刻第g个常规电厂cpp的最大和最小有功功率限值,为突发事件下t时刻第g个常规电厂cpp的最大无功功率限值和最小稳定发电的限值,为日前承诺的常规电厂cpp的集合,为突发事件下t时刻第g个常规电厂cpp的有功功率,和分别为第g个常规电厂cpp的上升和下降极限,为突发事件下承诺常规电厂cpp的子集,为突发事件下t时刻第g个可再生能源发电厂res的预测有功功率,为可再生能源发电厂res的集合,和分别为突发事件下t时刻第c个无功补偿器rpc的最大和最小无功功率限值,为无功补偿器rpc的集合,和分别为最大和最小电压量值限制,和分别为最大和最小电压角限制,为突发事件下t时刻母线n和母线m之间的支路上的视在在线潮流,为连接到母线n的母线集合,为母线n和母线m之间的支路的热极限。
31、可选地,步骤s3中定义的风险调度模型的状态空间的函数表达式为:
32、,
33、上式中, s为状态空间,和为t时刻系统需求的有功功率和无功功率,为t时刻第g个常规电厂cpp的最大和最小有功功率限值,和分别为t时刻第c个无功补偿器rpc的最大和最小无功功率限值,和分别为t时刻常规电厂cpp和无功补偿器rpc的电压值,为t-1时刻的调度动作,且有:
34、,
35、上式中,为t-1时刻的第g个常规电厂cpp的调度动作,为t-1时刻第g个电压的调度动作,为t-1时刻第g个可再生能源发电厂res的调度动作,为t-1时刻第c个无功补偿器rpc的调度动作;
36、步骤s3中定义的风险调度模型的动作空间的函数表达式为:
37、,
38、上式中, a为动作空间,为第g个常规电厂cpp的调度动作,为第g个电压的调度动动作,为第g个可再生能源发电厂res的调度动作,为第c个无功补偿器rpc的调度动作,且各个调度动作的输出值的取值范围为[−1,+1],且风险调度模型根据动作空间的调度动作的输出值进一步控制输出如下物理量,包括t时刻第g个常规电厂cpp的有功功率和电压值,t时刻第g个可再生能源发电厂res的有功功率以及无功补偿器rpc的无功功率,函数表达式如下:
39、,
40、,
41、,
42、,
43、,
44、,
45、上式中,和分别为常规电厂cpp的最大和最小有功功率限值,为t时刻的第g个常规电厂cpp的调度动作,为t时刻第g个电压的调度动作,和分别为t时刻第g个可再生能源发电厂res的预测有功功率最大值和最小值,和分别为t时刻第c个无功补偿器rpc的最大和最小无功功率限值,为t时刻第g个可再生能源发电厂res的调度动作,为t时刻第c个无功补偿器rpc的调度动作;
46、步骤s3中定义的风险调度模型的奖励函数的函数表达式为:
47、,
48、上式中,为t时刻的预期收益,为t时刻电力系统运行成本,为t时刻风险成本,为惩罚成本,且有:
49、,
50、,
51、,
52、,
53、,
54、上式中,为常规电厂cpp的发电成本,为可再生能源发电厂res的发电成本,、和分别表示常规电厂cpp的二次成本系数、一次成本系数和常数成本系数,为可再生能源发电厂res的发电成本系数;为正标量,用于归一化运行和减载成本,取值为日前所有承诺的常规电厂cpp和可再生能源发电厂res机组在其最大功率限制下运行时的运行成本;为数据驱动风险评估模型产生的风险成本;为视在在线潮流违规的支路集合;为母线n的电压幅值的单位惩罚值,为第 l条视在在线潮流违规的支路的单位惩罚值,且有:
55、,
56、,
57、上式中,为母线n的电压幅值,为第 l条视在在线潮流违规的支路的视在在线潮流,为第 l条视在在线潮流违规的支路的视在在线潮流上限值。
58、可选地,步骤s4中利用递归确定性策略梯度算法r-ddpg结合神经网络训练出风险调度模型时,采用的神经网络为递归神经网络rnn。
59、可选地,步骤s4中利用递归确定性策略梯度算法r-ddpg结合神经网络训练出风险调度模型包括:
60、步骤1,采用递归神经网络rnn构建的演员网络、目标演员网络、评论家网络以及目标评论家网络,演员网络和目标演员网络用于将状态空间s中的当前状态和递归神经网络rnn的隐藏状态作为输入预测在动作空间 a中要采取的行动,评论家网络和目标评论家网络用于将状态空间s中的当前状态,行动和递归神经网络rnn的隐藏状态作为输入预测在当前状态采取行动的预期收益;
61、步骤2,用随机权重初始化演员网络和评论家网络;使用演员网络相同的权重初始化目标演员网络,使用评论家网络相同的权重初始化目标评论家网络,初始化用于存储过去经验的数据结构的重放缓冲器;
62、步骤3,将环境重置为状态空间s中的初始状态,并将演员网络、目标演员网络的初始的隐藏状态初始化为零或其他预设起始值,将评论家网络和目标评论家网络的初始的隐藏状态初始化为零或其他预设起始值;
63、步骤4,在预设的情节集合中遍历选择当前情节,其中~为0~ l时刻的状态,~为0~ l时刻的动作,~为0~ l时刻的预期收益,并对当前情节下的每一个当前时刻t执行以下步骤:
64、1)根据t时刻的当前状态和演员网络的隐藏状态,利用演员网络选择t时刻的动作:
65、,
66、上式中,为演员网络根据t时刻的当前状态和演员网络的隐藏状态得到的行动,为探索噪音;
67、2)在环境中执行t时刻的动作,利用评论家网络计算t时刻的预期收益并过渡到下一个状态;
68、3)将t时刻的当前状态、动作、t时刻的预期收益、下一个状态、演员网络的隐藏状态、以及评论家网络的隐藏状态构成的元组存储到重放缓冲区中中;
69、4)从重放缓冲区中随机抽取大小为的小批次样本;
70、5)通过下式所示的最小化损失函数来更新评论家网络;
71、,
72、上式中,表示从小批次样本中抽取的样本的数学期望值,分别为样本中的当前状态、动作、预期收益、下一个状态、演员网络的隐藏状态和评论家网络的隐藏状态;表示评论家网络根据样本中的当前状态、动作、评论家网络的隐藏状态得到的结果,为目标评论家网络根据样本中的当前状态、动作和目标评论家网络的隐藏状态得到的结果,动作为目标演员网络根据样本中的当前状态、目标演员网络的隐藏状态得到的结果,样本中的预期收益,为权重参数;
73、6)通过对进行梯度上升来更新演员网络:
74、
75、上式中,为期望奖励函数,为样本的数学期望值,为评论家网络针对样本中的当前状态、演员网络根据当前状态和样本中的演员网络的隐藏状态预测的行动、样本中的评论家网络的隐藏状态所产生的预期收益;
76、7)根据下式更新目标演员网络以及目标评论家网络:
77、,
78、,
79、上式中,为软更新率;
80、8)采用演员网络的隐藏状态更新演员网络的隐藏状态,评论家网络的隐藏状态更新评论家网络的隐藏状态;
81、9)将t时刻加1,判断t时刻是否等于预设阈值,若不等于预设阈值,则跳转步骤1)继续当前情节的处理,否则,结束并退出当前情节的处理。
82、此外,本发明还提供一种基于数据驱动并计及风险的电力系统风险调度系统,包括相互连接的微处理器和存储器,所述微处理器被编程或配置以执行所述基于数据驱动并计及风险的电力系统风险调度方法。
83、此外,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序用于被微处理器编程或配置以执行所述基于数据驱动并计及风险的电力系统风险调度方法。
84、和现有技术相比,本发明主要具有下述优点:本发明提出了一种深度强化学习的电力系统风险调度方法:将风险评估嵌入到电力系统的调度过程中,形成一个计及风险的应急调度方法,其目标是评估和最小化n-1突发事件的后果,通过定义一个综合意外事件后果和发生概率的风险指数来进行量化评估,将最优减载问题用作量化突发事件经济后果的手段,利用深度强化学习方法进行风险调度,面向高比例的可再生能源并网场景能够实现更准确的需求预测和资源调度。