一种基于强化学习的电网运行方式自动调整方法

文档序号：31052561发布日期：2022-08-06 08:18阅读：来源：国知局

技术特征：
1.一种基于强化学习的电网运行方式自动调整方法，其特征在于，所述包括以下步骤：确定下一时刻火电机组有功功率总调整量；若每一组火电机组的动作空间处于出力调整区间，则按照最优机组调控顺序，将有功功率总调整量分摊到各个火电机组上；若每一组火电机组的动作空间低于火电机组动作空间的下限或高于火电机组动作空间的上限，则在开关机操作后，按照最优机组调控顺序，将有功功率总调整量分摊到各个火电机组上；在完成分摊后，根据线路过载或临界重载进行潮流调整量重新分配，并进行机端电压调整；所述最优机组调控顺序通过强化学习模型获取。2.根据权利要求1所述的方法，其特征在于，所述潮流调整量重新分配包括下述步骤：识别线路负载率关键机组；若关键机组为新能源机组，当负载率大于第一设定阈值时，降低所述新能源机组出力至第一设定值；当负载率大于1小于等于第一设定阈值时，若连续降低的次数达到设定次数时仍然过载，则降低所述新能源机组出力至第二设定值；若关键机组为火电机组，则降低火电机组出力至该机组出力下限。3.根据权利要求2所述的方法，其特征在于，所述关键机组通过有功功率线路负载率灵敏度矩阵确定，包括：提取有功功率线路负载率灵敏度矩阵所在行向量；筛选机组所在节点对应分量；将绝对值最大的分量所对应的节点挂载机组确定为关键机组；所述有功功率-线路负载率灵敏度矩阵为m
×
n阶矩阵，m为电力系统支路数，n为电力系统节点数。4.根据权利要求1所述的方法，其特征在于：所述最优机组调控顺序通过将基础机组调控顺序输入强化学习模型获得；所述基础机组调控顺序通过对有功功率-线路负载率灵敏度矩阵进行列向量求和后排序获得；所述有功功率-线路负载率灵敏度矩阵为m
×
n阶矩阵，m为电力支路数，n为电力节点数。5.根据权利要求3或4所述的方法，其特征在于：所述有功功率线路负载率灵敏度矩阵基于所有机组完全开机且网架中无断线的历史运行数据提取。6.根据权利要求1所述的方法，其特征在于：所述强化学习模型将机组调控顺序作为智能体的状态，将顺序中的两个位置作为智能体的动作，并将综合评估指标作为奖励；所述综合评估指标的影响因素包括新能源相对消纳量、线路越限情况、机组出力约束、节点电压约束、运行经济成本。7.根据权利要求6所述的方法，其特征在于，所述奖励通过下式计算：
式中：r为奖励；r
i
为分奖励取值；当i＝1时，式中：renewable
t+1，j
为第j组新能源机组出力在t+1时刻的出力；为第j组新能源机组出力在t+1时刻的出力上限；re为新能源机组个数；当i≠1时，式中，a表示约束；当i为2时，约束为线路电流；当i为3时，约束为机组出力；当i为4时，约束为节点电压；当i为5时，约束为运行经济成本；下标max和min分别表示对应约束的上下限。8.根据权利要求1所述的方法，其特征在于，所述下一时刻火电机组有功功率总调整量通过下式确定：δthermal＝thermal
t+1-thermal
t
式中：thermal
t
为当前时刻t火电出力，thermal
t+1
为下一时刻火电出力；thermal
t+1
通过下式计算：式中：l为负荷总个数，l为负荷个数变量，re为新能源机组个数，j为新能源机组个数变量；为t+1时刻总负荷；renewable
t+1，j
为第j组新能源机组出力在t+1时刻的出力；balance
t+1
为t+1时刻平衡机出力；loss
t+1
为下一时刻的网络损耗功率，通过下式计算：loss
t+1
＝loss
t
·
lfactor其中lfactor为网络损耗估计系数，通过下式计算：9.根据权利要求1所述的方法，其特征在于，所述开关机操作包括：当负荷波动导致火电需调整量超出火电机组的爬坡约束上界时，按照线路负载率的灵敏度由小到大，对火电机组进行开机操作；开机火电的台数所提供的功率，能够补偿火电需调整量超出爬坡约束上界部分；当负荷波动导致火电需调整量低于火电机组的爬坡约束下界时，按照线路负载率的灵敏度由大到小，对火电机组进行关机操作；关机火电的台数所减小的功率，能够抵消火电需调整量低于火电机组的爬坡约束下界；当所有运行发电机的实际处理与最大处理的比值超过第二设定阈值时，按照线路负载率的灵敏度由小到大的顺序开机，使所述比值小于第二设定阈值；当所有运行发电机的实际处理与最大处理的比值低于第三设定阈值时，按照线路负载率的灵敏度由大到小的顺序关机，使所述比值大于第三设定阈值。
10.根据权利要求1所述的方法，其特征在于，所述机端电压调整包括：将发电机组的电压记作u
k
，将无功记作q
k
，其中k表示发电机组标识；若q
k
≥100，则将u
k
用u
k-0.01后的值更新；若60≤q
k
＜100，则将u
k
用u
k-0.004后的值更新；若-90＜q
k
＜60，则u
k
不变；若-180＜q
k
≤-90，则u
k
用u
k
+0.0015后的值更新；若q
k
≤-180，则u
k
用u
k
+0.01后的值更新。

技术总结
本发明涉及一种基于强化学习的电网运行方式自动调整方法，包括确定下一时刻火电机组有功功率总调整量；若每组火电机组的动作空间处于出力调整区间，按照最优机组调控顺序，将有功功率总调整量分摊到各个火电机组上；若每组火电机组的动作空间低于火电机组动作空间的下限或高于火电机组动作空间的上限，在开关机操作后，按照最优机组调控顺序，将有功功率总调整量分摊到各个火电机组上；在完成分摊后，根据线路过载或临界重载进行潮流调整量重新分配，进行机端电压调整；最优机组调控顺序通过强化学习模型获取。该方法能实现电网运行方式自动调整，保障电网安全稳定运行，实现新能源最大消纳。通过强化学习模型，提升获取最优机组调控顺序的效率。优机组调控顺序的效率。优机组调控顺序的效率。

技术研发人员：丁涛李明乐田智勤李帅高逸兴
受保护的技术使用者：西安交通大学
技术研发日：2022.04.24
技术公布日：2022/8/5

完整全部详细技术资料下载

当前第2页1 2