1.一种城市配电网重构运行两阶段强化学习方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种城市配电网重构运行两阶段强化学习方法,其特征在于,所述城市配电网动态重构运行数学模型目标函数为:
3.根据权利要求2所述的一种城市配电网重构运行两阶段强化学习方法,其特征在于,所述城市配电网动态重构运行数学模型的约束条件包括潮流约束、安全运行约束、重构约束、光伏出力约束以及失负荷约束,所述潮流约束的计算公式为:
4.根据权利要求1所述的一种城市配电网重构运行两阶段强化学习方法,其特征在于,所述开关贡献度量化方法包括以下步骤:
5.根据权利要求1所述的一种城市配电网重构运行两阶段强化学习方法,其特征在于,所述weighted qmix多智能体深度强化学习模型的计算方法为:
6.根据权利要求5所述的一种城市配电网重构运行两阶段强化学习方法,其特征在于,还包括多智能体交互模型,所述多智能体交互模型包括观测空间、状态空间、动作空间、奖励函数以及状态转移概率,所述观测空间表示每一个智能体能够从环境中观测到的状态值,时刻智能体的观测空间定义为:
7.一种基于权利要求1-6中任一项所述的城市配电网重构运行两阶段强化学习方法的学习系统,其特征在于,包括: