一种电网无功电压分布式控制方法及系统与流程

文档序号：22580783发布日期：2020-10-20 17:01阅读：来源：国知局

技术特征：

1.一种电网无功电压分布式控制方法，其特征在于，包括：

步骤1：根据被控电网整体无功电压控制目标与优化模型，制定各被控区域无功电压控制目标，并建立无功电压优化模型；

步骤2：结合优化模型与电网的实际配置情况，构建基于马尔科夫游戏的多智能体交互训练框架；

步骤3：初始化各神经网络及相关控制过程变量并下发到各控制区域；

步骤4：各区域本地控制器根据接收的策略神经网络并行执行控制步骤；

步骤5：各区域本地控制器并行执行上传样本步骤，上传量测样本到云服务器；

步骤6：云服务器并行学习各个控制器策略并下发更新后的策略到各区域控制器；

步骤7：重复执行步骤4、5、6。

2.根据权利要求1所述的电网无功电压分布式控制方法，其特征在于，所述步骤1包括：

步骤1-1：建立被控电网整体无功电压控制目标与优化模型：

其中，为电网全部节点的集合，vj为节点j的电压幅值；pj为节点j的有功功率输出；qgj为节点j的dg无功功率输出；qcj为节点j的svc无功功率输出；vj,分别为节点j的电压下限与上限；qcj,分别为节点j的svc无功功率输出的下限与上限；sgj,pgj分别为节点j的dg装机容量与有功功率输出；

步骤1-2：拆分上述无功电压控制目标与优化模型，形成各被控区域无功电压控制目标与优化模型：

其中，为第i个区域的全部节点集合，为第i个区域的网络输出功率。

3.根据权利要求2所述的电网无功电压分布式控制方法，其特征在于，所述步骤2包括：

步骤2-1：对应各区域系统量测，构建各区域观测变量oi,t：

其中pi,qi为第i个区域各节点有功、无功功率注入组成的向量；vi为第i个区域各节点电压组成的向量；pi^e,为第i个区域的网络输出有功功率和网络输出无功功率；t为控制过程的离散时间变量；

步骤2-2：对应各区域无功电压优化目标，构建各区域统一回馈变量rt：

pj为节点j的有功功率输出，为区域i的网络输出有功功率；

步骤2-3：对应各区域无功电压优化约束，构建各区域约束回馈变量

其中[x]+＝max(0,x)；βi为第i个区域的协作系数，vj(t)为t时刻节点j的电压，表示电压上限，v为电压上限；

步骤2-4：对应可控灵活性资源无功功率，构建各区域动作变量ai,t：

ai,t＝(qgi,qci)t(0.6)

其中，qgi,qci分别为第i个区域的dg及svc无功功率输出向量。

4.根据权利要求3所述的电网无功电压分布式控制方法，其特征在于，所述步骤3包括：

步骤3-1：初始化各神经网络及相关控制过程变量并下发到各控制区域；

步骤3-2：初始化各区域拉格朗日乘子λi，为一标量；

步骤3-3：通过通讯网络，下发初始策略神经网络与到区域i的控制器；

步骤3-4：初始化离散时间变量t＝0，两步之间的实际时间间隔为δt；

步骤3-5：初始化策略更新周期tu，用于每隔tuδt时间执行一次策略更新；

步骤3-6：初始化样本上传周期ts与样本上传比例m∈[1,ts]，用于每隔tsδt各控制器进行一次样本上传，上传前一个上传周期中的m个样本；

步骤3-7：初始化云服务器经验库各控制器本地缓存经验库

5.根据权利要求4所述的电网无功电压分布式控制方法，其特征在于，所述步骤3-1包括：

步骤3-1-1：定义神经网络为一个输入(oi,t,ai,t)输出单个标量值的神经网络；激活函数为relu函数；记的网络参数为φi，对应的冻结参数为并随机初始化φi与

步骤3-1-2：定义神经网络为一个输入(oi,t,ai,t)输出单个标量值的神经网络；激活函数为relu函数；记的网络参数记为对应的冻结参数为随机初始化与

步骤3-1-3：定义与为两个输入oi,t输出与动作ai,t形状相同向量的神经网络，与分别具有独立的输出层，同时共享相同的神经网络输入层与隐含层；激活函数为relu函数；记与的全部网络参数为θi，随机初始化θi。

6.根据权利要求5所述的电网无功电压分布式控制方法，其特征在于，所述步骤4包括：

步骤4-1：从区域电网的量测装置获得量测信号，形成对应的观测变量oi,t；

步骤4-2：根据本地的策略神经网络与生成本时刻对应动作ai,t：

步骤4-3：控制器将ai,t下发至本地被控灵活性资源，如dg节点和svc节点；

步骤4-4：将(oi,t,ai,t)储存到中。

7.根据权利要求6所述的电网无功电压分布式控制方法，其特征在于，所述步骤5包括：

步骤5-1：将中前m+1个样本上传至云服务器的经验库di中；

步骤5-2：清空

步骤5-3：在云服务器上对本轮上传数据的前m组计算rt与

步骤5-4：如发生通讯故障，导致某区域样本未能上传，可直接忽略本次采样上传。

8.根据权利要求7所述的电网无功电压分布式控制方法，其特征在于，所述步骤6包括：

步骤6-1：从经验库di中抽取一组经验数量为b；

步骤6-2：计算参数φi的损失函数：

其中x＝(o1,...,on)为全部区域观测值；x'为x对应的下一时刻观测值；a1,...,an分别为区域1到区域n的动作向量；表示在中求取；yi为：

其中γ为折合系数；αi为区域i的熵最大化因子；为取到的概率值；为：

⊙表示按位相乘，o′i为区域i下一时刻的观测值；

步骤6-3：更新参数φi：

其中ρi为学习步长，表示是对变量φi求梯度；

步骤6-4：计算参数的损失函数；

其中为：

步骤6-5：更新参数

步骤6-6：计算拉格朗日函数：

其中为电压越线程度约束限值；为：

步骤6-7：更新参数θi：

步骤6-8：更新参数λi：

步骤6-9：更新冻结参数和

其中η为冻结系数；

步骤6-10：下发更新后的策略神经网络与到区域i。

9.根据权利要求1-8中任一项所述的电网无功电压分布式控制方法，其特征在于，

所述步骤4、步骤5、步骤6并行执行。

10.一种电网无功电压分布式控制系统，其特征在于，包括：

模型构建模块，用于根据被控电网整体无功电压控制目标与优化模型，制定各被控区域无功电压控制目标，并建立无功电压优化模型；

训练框架构建模块，用于结合优化模型与电网的实际配置情况，构建基于马尔科夫游戏的多智能体交互训练框架；

初始化模块，用于初始化各神经网络及相关控制过程变量并下发到各控制区域；

控制器模块，用于设置在各区域本地，根据接收的策略神经网络并行执行控制步骤；

样本上传模块，用于设置在各区域本地，并行执行上传样本步骤，上传量测样本到云服务器；

策略学习模块，用于设置在云服务器上，并行学习各个控制器策略并下发更新后的策略到各区域控制器；

其中，所述控制器模块、样本上传模块、策略学习模块用于被重复调用执行。

技术总结
本发明提供一种电网无功电压分布式控制方法，包括：根据被控电网整体无功电压控制目标与优化模型，制定各被控区域无功电压控制目标，并建立无功电压优化模型；结合优化模型与电网的实际配置情况，构建基于马尔科夫游戏的多智能体交互训练框架；初始化各神经网络及相关控制过程变量并下发到各控制区域；各区域本地控制器根据接收的策略神经网络并行执行控制步骤；各区域本地控制器并行执行上传样本步骤，上传量测样本到云服务器；云服务器并行学习各个控制器策略并下发更新后的策略到各区域控制器。本发明实现了无功电压灵活控制和模型不完备场景下的最优控制。

技术研发人员：吴文传;刘昊天;孙宏斌;王彬;郭庆来
受保护的技术使用者：清华大学
技术研发日：2020.06.23
技术公布日：2020.10.20

完整全部详细技术资料下载

当前第2页1 2