本发明属于电力系统暂态稳定评估领域,具体涉及一种基于电网特征排列重要性的暂态稳定评估方法及系统。
背景技术:
1、现代电力系统设备元件日趋复杂多样导致系统非线性日益增强,作为电力系统暂态稳定分析传统方法的时域仿真法过于耗时。近年来,数据驱动方法凭借其学习能力强、计算速度快、能挖掘数据潜在有用信息等特点,受到国内外学者的广泛关注,已经被用于电力系统暂态稳定分析。基于机器学习的电力系统暂态稳定性分析认为系统中各变量,包括状态变量x和代数变量y,与系统的暂态稳定性s之间存在函数关系f,即:
2、s=f(x,y)
3、可以通过学习机拟合这个复杂的函数关系,学习机按照一定的学习方法建模,通过对历史数据的训练得到。对于暂态稳定性预测而言,系统的稳定性只有稳定和不稳定两种状态,因此学习机是一个二分类器。
4、电力系统中可供选择的安全稳定相关的变量有:发电机的功角、转速、机械功率或其发出的有功和无功功率、负荷有功和无功功率、母线电压、线路的传输功率与关键断面功率大小等,如何优化选取与电网暂态安全性强相关性的关键特征,并研究数据驱动的暂态电压安全、功角稳定和频率稳定的多维度安全稳定评估方法,是一个亟待解决的问题。
技术实现思路
1、本发明的目的在于提供一种基于电网特征排列重要性的暂态稳定评估方法及系统,以克服现有数据驱动暂态稳定评估方法中特征选择问题,本发明首先建立一个基础学习模型,通过打乱特征顺序,使用打乱后的特征数据来预测计算正确率,通过多次乱打特征再求均值和方差,最终得到特征的排列重要性,选择排列靠前的特征作为输入重新训练模型从而提升模型表现。
2、为达到上述目的,本发明采用如下技术方案:
3、基于电网特征排列重要性的暂态稳定评估方法,包括:
4、获取系统运行状态和故障条件下的实时样本数据;
5、将实时样本数据输入预先建立的暂态稳定评估模型,得到暂态稳定评估结果;
6、其中,所述暂态稳定评估模型的建立方法,包括:
7、获取不同系统运行状态和故障条件下的历史样本数据;
8、基于所述历史样本数据构建特征集,采用特征集训练学习模型;
9、循环改变特征集中的变量排列并计算变量的重要性,直至达到预设循环次数,依据计算结果重构特征集;
10、以重构的特征集作为输入重新训练以上得到的学习模型,得到暂态稳定评估模型。
11、进一步地,所述获取不同系统运行状态和故障条件下的历史样本数据,具体为:利用时域仿真软件模拟电力系统在不同潮流水平下、不同线路不同位置发生故障的条件下的运行状况,得到历史样本数据;
12、所述时域仿真软件包括psasp或psd-bpa;
13、所述故障包括三相短路或两相短路。
14、进一步地,所述特征集包括故障前、发生故障时、故障后的系统特征,所述系统特征包括发电机的电磁功率、端电压、功角及母线电压。
15、进一步地,所述采用特征集训练学习模型,具体为:基于特征集以及系统稳定或失稳的标签训练学习模型;
16、故障前、发生故障时、故障后共n个时间点的系统特征作为输入特征,通过暂态稳定指数itsi标记标签,计算公式为:
17、
18、其中,δδmax为任意2台发电机之间的最大功角之差,当itsi<0时系统不稳定,反之稳定;
19、基于标签和输入特征构建训练集,训练学习模型,拟合特征和标签之间的关系。
20、进一步地,所述循环改变特征集中的变量排列并计算变量的重要性,直至达到预设循环次数,依据计算结果重构特征集,具体为:
21、将特征集随机划分为训练集和验证集;
22、利用训练集训练学习模型,利用验证集进行预测;
23、在验证集上对单个特征随机打乱,使用训练好的学习模型,重新在验证集上做预测,并评价模型;计算两次验证集上模型评价的差异,得到该特征的重要性指标;
24、依据计算结果选择排名靠前的若干特征重构特征集。
25、进一步地,所述将实时样本数据输入预先建立的暂态稳定评估模型,得到暂态稳定评估结果后,计算评价指标,所述评价指标包括准确率、精确率、召回率及f1分数;
26、所述准确率计算表达式为:
27、
28、其中,t表示真,预测对;f表示假,预测错;p表示阳性,预测为真;n表示阴性,预测为假;
29、所述精确率计算表达式为:
30、
31、所述召回率计算表达式为:
32、
33、所述f1分数计算表达式为:
34、
35、基于电网特征排列重要性的暂态稳定评估系统,包括:
36、实时样本数据获取模块:用于获取系统运行状态和故障条件下的实时样本数据;
37、评估模块:用于将实时样本数据输入预先建立的暂态稳定评估模型,得到暂态稳定评估结果;
38、其中,所述暂态稳定评估模型通过模型建立模块建立,所述模型建立模块包括:
39、历史样本数据获取模块:用于获取不同系统运行状态和故障条件下的历史样本数据;
40、一次训练模块:用于基于所述历史样本数据构建特征集,采用特征集训练学习模型;
41、重构模块:用于循环改变特征集中的变量排列并计算变量的重要性,直至达到预设循环次数,依据计算结果重构特征集;
42、二次训练模块:用于以重构的特征集作为输入重新训练以上得到的学习模型,得到暂态稳定评估模型。
43、进一步地,所述历史样本数据获取模块中,利用时域仿真软件模拟电力系统在不同潮流水平下、不同线路不同位置发生故障的条件下的运行状况,得到历史样本数据;
44、所述时域仿真软件包括psasp或psd-bpa;
45、所述故障包括三相短路或两相短路;
46、所述一次训练模块中,特征集包括故障前、发生故障时、故障后的系统特征,所述系统特征包括发电机的电磁功率、端电压、功角及母线电压;
47、所述采用特征集训练学习模型,具体为:基于特征集以及系统稳定或失稳的标签训练学习模型;
48、故障前、发生故障时、故障后共n个时间点的系统特征作为输入特征,通过暂态稳定指数itsi标记标签,计算公式为:
49、
50、其中,δδmax为任意2台发电机之间的最大功角之差,当itsi<0时系统不稳定,反之稳定;
51、基于标签和输入特征构建训练集,训练学习模型,拟合特征和标签之间的关系。
52、进一步地,所述重构模块中,循环改变特征集中的变量排列并计算变量的重要性,直至达到预设循环次数,依据计算结果重构特征集,具体为:
53、将特征集随机划分为训练集和验证集;
54、利用训练集训练学习模型,利用验证集进行预测;
55、在验证集上对单个特征随机打乱,使用训练好的学习模型,重新在验证集上做预测,并评价模型;计算两次验证集上模型评价的差异,得到该特征的重要性指标;
56、依据计算结果选择排名靠前的若干特征重构特征集。
57、进一步地,所述评估模块中,将实时样本数据输入预先建立的暂态稳定评估模型,得到暂态稳定评估结果后,计算评价指标,所述评价指标包括准确率、精确率、召回率及f1分数;
58、所述准确率计算表达式为:
59、
60、其中,t表示真,预测对;f表示假,预测错;p表示阳性,预测为真;n表示阴性,预测为假;
61、所述精确率计算表达式为:
62、
63、所述召回率计算表达式为:
64、
65、所述f1分数计算表达式为:
66、
67、与现有技术相比,本发明具有以下有益的技术效果:
68、本发明方法首先建立一个基础学习模型,通过打乱特征顺序,使用打乱后的特征数据来预测计算正确率,通过多次乱打特征再求均值和方差,最终得到特征的排列重要性,选择排列靠前的特征作为输入重新训练模型从而提升模型表现,因此本发明可以在任何模型上使用,不只是在基于决策树的模型,在线性回归,神经网络,任何模型上都可以使用。不存在对连续型变量或高基数类别型变量的偏好,体现了变量的泛化能力,当数据发生偏移时会特别有价值,相较于循环的增加或剔除变量,不需要对模型重新训练,极大地降低了成本。进一步地,所选特征作为输入能够提升模型预测精度和泛化性。