一种城市配电网重构运行两阶段强化学习方法及系统

文档序号：37436298发布日期：2024-03-25 19:34阅读：来源：国知局

技术特征：

1.一种城市配电网重构运行两阶段强化学习方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种城市配电网重构运行两阶段强化学习方法，其特征在于，所述城市配电网动态重构运行数学模型目标函数为：

3.根据权利要求2所述的一种城市配电网重构运行两阶段强化学习方法，其特征在于，所述城市配电网动态重构运行数学模型的约束条件包括潮流约束、安全运行约束、重构约束、光伏出力约束以及失负荷约束，所述潮流约束的计算公式为：

4.根据权利要求1所述的一种城市配电网重构运行两阶段强化学习方法，其特征在于，所述开关贡献度量化方法包括以下步骤：

5.根据权利要求1所述的一种城市配电网重构运行两阶段强化学习方法，其特征在于，所述weighted qmix多智能体深度强化学习模型的计算方法为：

6.根据权利要求5所述的一种城市配电网重构运行两阶段强化学习方法，其特征在于，还包括多智能体交互模型，所述多智能体交互模型包括观测空间、状态空间、动作空间、奖励函数以及状态转移概率，所述观测空间表示每一个智能体能够从环境中观测到的状态值，时刻智能体的观测空间定义为：

7.一种基于权利要求1-6中任一项所述的城市配电网重构运行两阶段强化学习方法的学习系统，其特征在于，包括：

技术总结
本发明涉及一种城市配电网重构运行两阶段强化学习方法及系统，包括如下步骤：构建城市配电网动态重构运行数学模型；提出开关贡献度的概念以及开关贡献度量化方法，根据光伏消纳和供电能力对贡献度进行量化，再由贡献度值对开关进行筛选，从而实现开关动作空间的大幅度降维；提出一种基于动作权重的Weighted QMIX多智能体深度强化学习算法，可深化智能体对开关贡献度的感知，在此基础上提出一种两阶段强化学习框架，将筛选后所得开关根据贡献度的差异分为两组，随之强化学习训练过程分为两阶段，以避免因权重分配失衡而导致智能体学习困难的问题；充分训练本发明所提多智能体深度强化学习模型，获得城市配电网动态重构运行最优策略。

技术研发人员：高红均,雷成,姜思远,梁宇,聂金峰,潘旭东,王仁俊,刘友波,刘俊勇
受保护的技术使用者：四川大学
技术研发日：
技术公布日：2024/3/24

完整全部详细技术资料下载

当前第2页1 2