一种基于LightGBM-LSTM的配电网拓扑识别方法和装置

文档序号:37721803发布日期:2024-04-23 11:58阅读:11来源:国知局
一种基于LightGBM-LSTM的配电网拓扑识别方法和装置

本发明属于中压有源配电网,特别是涉及一种基于lightgbm-lstm的配电网拓扑识别方法和装置。


背景技术:

1、配电网的拓扑结构信息是工程师针对配电系统进行实时运行决策和控制决策的基础性信息。当需要对配电网进行潮流分析、状态估计、故障检测、故障恢复、负载平衡、需求响应、可再生能源的合理并网规划时,配电网拓扑识别技术发挥着不可替代的作用。如果无法可靠提供准确的网络拓扑结构信息,许多电网优化运行、控制方案无法实现预期效果,甚至可能导致电网转入更劣的运行状态。因此,有必要进行快速、准确识别配电网拓扑结构的方法研究。

2、配电网拓扑识别方法主要分为两大类:一类是全面搜索重建整个网络的拓扑,另一类是估计发生变化的开关位置和状态,进而确定网络的完整拓扑。状态估计和图论学习属于全面搜索构建完整网络拓扑的方法。基于状态估计的配电网拓扑识别方法具有高准确性和实时性,适用于各种电网规模,但需要复杂的数学模型、高质量数据和大量测量数据。基于图论学习的方法具有自适应性和能够处理复杂电网结构,但需要大量标记数据和计算资源,复杂模型有时难以解释。此外,还有依靠数据驱动,如统计学习、数学规划、拟合、聚类等实现拓扑识别的方法。此类方法均基于相关性分析理论进行节点连接关系判断,要求节点注入电流、负荷间彼此独立。然而,随着越来越多的分布式电源并入配电网,系统潮流情况变得更加复杂,节点注入电流、负荷可能存在复杂的相关关系。

3、由于配电网的潮流变量中蕴含着有关拓扑结构的丰富信息,通过机器学习等方法充分挖掘其中的信息,实现配电网的拓扑识别已成为可能。然而普通的机器学习方法可能存在以下缺点:通常需要大规模的历史数据(样本数量和特征数量两方面)来保证估计的准确性,而实际配电网中的测量数据类型有限;需要平衡数据充足性,以减轻计算负担、避免过度拟合。此外,配电网中数据采集设备的采样周期和采样数据类型各有不同,如微相量测量单元(μpmu)能够以10至20毫秒的频率采集相量(包括电压和电流的幅值和相位角)、频率、相位角差等数据;监控与数据采集系统(scada)能够以2至5秒的频率采集电压、电流、功率等数据;高级计量架构(ami)能够以15至30分钟的频率采集用电量数据。因此,现场采集测量数据存在采样频率不一致的问题,无法直接用于机器学习模型的训练。


技术实现思路

1、为了解决背景技术中存在的问题,本发明提供一种基于lightgbm-lstm的配电网拓扑识别方法和装置,实现测量变量之间复杂关系的建模,从而融合多类型数据更准确地辨识配电网拓扑,对不同采样频率的数据进行时序同步,选择最少、最有效的特征变量进行配电网拓扑识别,减少算法计算负担。

2、为了达到上述技术目的,本发明的一方面提供一种基于lightgbm-lstm的配电网拓扑识别方法,包括:

3、s1:获取配电自动化主站的遥测数据和遥信数据,对所述遥测数据进行数据清洗,对清洗后的遥测数据进行时序同步;

4、s2:从遥信数据中提取开关状态数据中的有效标志、刷新标志和遥信状态值标志,并利用独热编码的方式对提取的遥信数据进行编码,再将编码之后的遥信数据进行时序同步得到遥信特征;

5、s3:利用lightgbm算法对时序同步后的遥测数据进行特征筛选;

6、s4:将遥信特征和筛选的遥测特征输入基于lstm的配电网拓扑识别模型,预测配电网中所有开关的开关状态;

7、s5:根据配电网中所有开关的开关状态绘制配电网的拓扑连接示意图。

8、优选地,所述配电自动化主站的遥测数据包括:节点电压、节点有功/无功功率、线路电流、线路有功/无功功率;

9、所述配电自动化主站的遥信数据具体指开关状态数据,其包括:有效标志、刷新标志、取代标志、封锁标志、遥信状态值标志。

10、优选地,所述将编码之后的遥信数据进行时序同步包括:将低频采样源获取的遥信数据和高频采样源获取的遥信数据进行时序同步;设高频采样源获取的遥信数据表示为低频采样源获取的遥信数据表示为其中,tl=rth;则时序同步后低频采样源获取的遥信数据表示为其中,a表示大于等于0的整数,b表示大于等于1小于等于r之间的整数,th表示高频采样源的采样时间间隔,tl表示低频采样源的采样时间间隔。

11、优选地,所述对清洗后的遥测数据进行时序同步包括:

12、将低频采样源获取的遥测数据和高频采样源获取的遥测数据进行时序同步;设高频采样源获取的遥测数据表示为低频采样源获取的遥测数据表示为其中,tl=rth;则时序同步后低频采样源获取的遥测数据表示为:

13、

14、

15、其中,a表示大于等于0的整数,b表示大于等于1小于等于r之间的整数,th表示高频采样源的采样时间间隔,tl表示低频采样源的采样时间间隔。

16、优选地,所述利用lightgbm算法对时序同步后的遥测数据进行特征筛选包括:将时序同步后的遥测数据作为样本的输入特征,样本的标签为配电自动化主站中nl个开关的二进制状态值;lightgbm模型设置参数如下:叶子数量num_leaves=a,提升树数量num_trees=b,问题类型为二分类objective=’binary’;迭代结束后遍历整个lightgbm模型,得到某个遥测特征作为分裂特征的所有节点的信息增益总和作为该遥测特征对于配电网拓扑辨识的重要度,按配电网拓扑辨识的重要度从大到小排序,选择前nf=c%×nyc的遥测特征作为筛选后的遥测特征,nl表示配电网中所有开关的二进制状态值。

17、优选地,所述基于lstm的配电网拓扑识别模型包括:依次串联的输入层、第一lstm层、第一dropou layer层、第二lstm层、第二dropou layer层、全连接层、softmax层、输出层。

18、本发明的另一方面提供一种基于lightgbm-lstm的配电网拓扑识别装置,所述装置应用于所述的一种基于lightgbm-lstm的配电网拓扑识别方法,包括:

19、数据获取单元,用于获取配电自动化主站的遥测数据和遥信数据;

20、第一数据预处理单元,对所述遥测数据进行数据清洗,对清洗后的遥测数据进行时序同步;

21、第二数据预处理单元,用于从遥信数据中提取开关状态数据中的有效标志、刷新标志和遥信状态值标志,并利用独热编码的方式对提取的遥信数据进行编码,再将编码之后的遥信数据进行时序同步得到遥信特征;

22、特征筛选单元,用于利用lightgbm算法对时序同步后的遥测数据进行特征筛选;

23、拓扑识别单元,用于将遥信特征和筛选的遥测特征输入基于lstm的配电网拓扑识别模型,预测配电网中所有开关的开关状态;

24、拓扑生成单元,用于根据配电网中所有开关的开关状态绘制配电网的拓扑连接示意图。

25、本发明的再一方面提供一种电子设备,所述电子设备包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行所述的一种基于lightgbm-lstm的配电网拓扑识别方法。

26、本发明至少具有以下有益效果

27、本发明借助机器学习算法挖掘配电网各个测量变量之间复杂的数学关系和物理关系,直接避免了人工进行配电网潮流数学建模的复杂过程;本发明考虑的遥测数据不仅有电压数据、节点注入功率,还考虑了支路电流和支路功率,能更好地还原复杂的配电网潮流关系,提高机器学习模型的可解释性;本发明针对不同遥测数据采样频率不一致的问题,基于线性外推方法构造伪测量,实现了全部遥测数据的时序同步;本发明引入lightgbm算法进行遥测数据的特征筛选,减少了冗余的遥测特征变量,保留最有效的遥测特征变量,大幅度减轻了模型计算负担;本发明考虑了工程实际中大部分遥信数据可观的现实情况,将遥信开关数据纳为机器学习模型的输入变量,再综合最少、最有效的遥测数据判断无直接监测的、无效的开关状态,提高了配电网拓扑识别的准确度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1