一种基于错分代价分类学习的电网暂态电压稳定评估方法

文档序号:9418120阅读:385来源:国知局
一种基于错分代价分类学习的电网暂态电压稳定评估方法
【技术领域】
[0001] 本发明涉及一种基于错分代价分类学习的电网暂态电压稳定评估方法,属于电力 系统稳定分析评估领域。
【背景技术】
[0002] 目前电网中正广泛普及和应用的同步相量测量技术可为基于大数据的电力系统 稳定分析和监测提供可靠的同步数据源。大数据方法在知识挖掘和探索上的优势可为人 们更好地解决电网暂态电压稳定评估的传统难题提供新的思路。但已有的方法大多从单 一时间断面进行特征变量的提取,难以直接用于电气量变化剧烈的电网暂态电压稳定评估 中。实际上,关乎系统失稳规律的各电气量的关键变化趋势和特征可能蕴藏于某一小段时 间内。若以故障后一段时间内PMU量测得到的动态时间序列来构建学习样本,从动态时序 数据中提取特征变量,将能实现更为准确的特征捕获和更加可靠的分类评估。
[0003] 在已有的基于数据挖掘的电网暂态电压评估方法中,并未考虑到暂态电压稳定分 类学习的特殊性:将失稳错分为稳定(漏判)和将稳定错分为失稳(误判)的代价截然不 同,前者往往容易引起不可逆转的电压崩溃甚至停电事故,造成巨大的经济损失,而后者通 常可利用校正控制措施及时进行补救,所造成的损失要小很多。在同等错分几率下,系统运 行人员宁愿将样本划分为失稳类别,以避免不可挽回的严重后果。
[0004] 综上,若从电网中各节点电气量的动态时间序列中进行特征属性的提取,然后考 虑错分代价问题,利用错分代价向学习样本引入权重系数,采用融入样本权重系数的决策 树进行分类学习,将能提高以数据挖掘为基础的电网暂态电压稳定评估的实用价值,进一 步增强在线监测和评估的可靠性。

【发明内容】

[0005] 本发明的目的是提出一种基于错分代价分类学习的电网暂态电压稳定评估方法, 从时间序列中提取出与电网稳定状态密切相关的关键子序列作为特征属性,利用融入错分 代价分类学习的决策树算法来构建电网暂态电压稳定的评估模型,从而对电网暂态电压稳 定状况进行可靠的在线监测和评估。
[0006] 本发明提出的基于错分代价分类学习的电网暂态电压稳定评估方法,方法包括以 下步骤:
[0007] (1)从电网的调度运行记录中采集电网的典型运行方式集、典型故障集和节点集, 根据所述电网的典型运行方式集、典型故障集和节点集,采用计算机时域仿真方法对电网 中各节点在各种运行方式下的各种故障进行N次时域仿真,分别记录每次时域仿真过程中 所述节点在故障发生后At时间内电压、电流、有功功率、无功功率随时间的变化曲线,四 种变化曲线均形成长度为m的时间序列,依次记为U、I、P、Q,其中At= (m-l)XAT,ΔΤ 为仿真时间间隔,m为所记录的变化曲线的数据点数,并记录每次时域仿真过程中电网的状 态Z,将电网处于稳定状态记为Z = 1,电网处于失稳状态记为Z = -1,将一次时域仿真过程 中记录的数据集合成一个样本,进行N次时域仿真后共得到N个样本,N个样本形成一个初 始样本集,计算初始样本集对电网状态Z的信息熵E1= -(N 1;/N) Iog2(N1M -(N2/N) Iog2(N2/ N),其中N1为所有N个样本中电网状态为Z = 1的样本总数,N 2为所有N个样本中电网状 态为Z = -1的样本总数,NfN2= N ;
[0008] (2)从上述步骤⑴的初始样本集中获取所有N个样本的U、I、P、Q时间序列,并 获取相应的电网状态Z的记录,分别从U、I、P、Q时间序列中提取出与电网状态Z的类别关 系最密切的关键子序列,以此作为初始样本集中的特征属性,具体过程如下:
[0009] (2-1)从上述步骤⑴的初始样本集中获取所有N个样本的U、I、P、Q时间序列, 并获取相应的电网状态Z的记录;
[0010] (2-2)设定一个长度为1的矩形窗,其中3 < I < m,通过矩形窗滑动方式从步骤 (2-1)的N个样本中的第i个样本的U、I、P、Q时间序列中获取长度为1的子序列集;
[0011] (2-3)从步骤(2-2)的子序列集中任意选取第j个子序列,采用欧几里得距离定 义形式,分别计算第j个子序列与初始样本集中所有N个样本对应时间序列的距离,计算 得到的N个距离的数值构成距离数据集,将距离数据集中的距离数值按从小到大的顺序 排列为0={(1 1,(12,*",(^},在[(11,(1」区间内任意选取距离分裂点8口 1<=((11<+(4+1)/2,1^ = 1,2, 3,…,N-I,将距离数值大于SPk的样本总数N sl和距离数值小于等于SP ,的样本分别集 成为两个样本子集SJP S 2,统计S1中电网状态为Z = 1的样本总数Nsll和电网状态为Z = -1 的样本总数Nsl2,统计S2中电网状态为Z = 1的样本总数N s21和电网状态为Z = -1的样本 总数Ns22,并分别统计S1中的样本总数Nsl= (Ns11+Ns12)和32中的样本总数Ns2= (Ns21+Ns22), 计算距离分裂点spk分裂距离数据集后得到的期望信息E 2:
[0012]
[0013] (2-4)遍历步骤(2-3)中的所有(N-I)个距离分裂点,依次计算各距离分裂点分裂 距离数据集后得到的期望信息,从中找出期望信息的最大值,记为E 2niax,根据步骤(1)中初 始数据集对电网状态Z的信息熵E1,计算步骤(2-3)中第j个子序列对电网状态Z的信息 增侃 IG = E1-E2max;
[0014] (2-5)遍历第i个样本中所有长度为1的子序列,重复上述步骤(2-3),得到所有 长度为1的子序列的信息增益,从中选出信息增益最大的子序列,作为候选关键子序列;
[0015] (2-6)遍历初始样本集中所有N个样本,重复上述步骤(2-2)~(2-4),得到所有 N个样本的候选关键子序列,从所有N个样本的候选关键子序列中选出信息增益最大的候 选关键子序列,作为与电网状态Z的类别关系最密切的关键子序列,以关系最密切的关键 子序列作为初始样本集中的特征属性,将步骤(2-3)中计算得到的所述关键子序列与所有 N个样本对应时间序列的距离作为特征属性值;
[0016] (3)设定电网暂态电压稳定评估中,将电网状态Z = 1错分为电网状态Z = -1的 代价为C1,将电网状态Z = -1错分为电网状态Z = 1的代价为C2,根据步骤(1)的初始样 本集中的各样本的电网状态Z依次为各样本确定权重系数w,引入方法如下:对Z进行判 断,若Z = 1,则对应的样本确定权重系数w = N · (V (N1 · CJN2 · C2),若Z = -1,则对应的 样本确定权重系数w = N · C2/ (N1 · CAN2 · C2);
[0017] (4)构成一个数据挖掘训练集,将上述步骤(2-5)得到的特征属性和特征属性值 作为数据挖掘训练集的输入数据,将步骤(1)得到的各样本中电网状态Z作为数据挖掘训 练集的输出数据,以决策树算法对数据挖掘训练集进行分类学习,以步骤(3)的各样本权 重系数作为分类学习过程中的样本权重,得到一个决策树模型,以交叉验证方式判断决策 树模型的分类准确率P ra和召回度Re。,若97%且Re。彡98%,则决策树模型分类性能 满足要求,进行步骤(5),若P ra< 97 %且R e。彡98 %,或者P 97 %且R ee< 98 %,或者P < 97%且Re。多98%,以决策树算法重新对数据挖掘训练集进行分类学习,直到得到的决策 树模型的分类准确率满足97%且Re。彡98%,进行步骤(5);
[0018] (5)当所述电网遭遇短期大扰动时,电网中各节点的同步相量测量单元实时采集 该节点在At时间内的电压、电流、有功功率、无功功率的实时量测数据,分别形成U'、I'、 P'、Q'时间序列,计算步骤(4)的各特征属性与U'、I'、P'、Q'时间序列的距离,将得到的距 离输入到步骤(4)的决策树模型中,由决策树模型输出电网状态Z',作为电网暂态电压稳 定的实时评估结果。
[0019] 本发明提出的基于错分代价分类学习的电网暂态电压稳定评估方法,其优点是, 本发明方法从电网中各节点电压、电流、有功功率、无功功率动态时间序列中全面地提取关 键子序列作为电网暂态电压稳定评估的特征属性,利用错分代价向稳定/失稳样本引入权 重系数,采用融入样本权重系数的决策树算法对电网调度运行数据中潜藏的规律进行探 索,适当提高分类学习过程中对失稳样本的偏倚,可在综合实施可靠的分类和评估的同时, 尽可能减少评估模型发生漏判的可能性,在实际运行中为电网的在线监测和稳定控制提供 可靠指导,避免由于失稳事故的漏判所造成的不必要的负荷停电和经济损失。
【附图说明】
[0020] 图1为本发明方法涉及的电网单线结构示意图。
[0021] 图2为本发明方法中基于错分代价分类学习得到的决策树模型。
【具体实施方式】
[0022] 本发明提出的基于错分代价分类学习的电网暂态电压稳定评估方法,包括以下步 骤:
[0023] (1)本发明评估方法中涉及的电网单线结构示意图如图1所示,图1所示为本发明 的一个实施例,针对图中的中部电网,从电网的调度运行记录中采集电网的典型运行方式 集、典型故障集和节点集,根据所述电网的典型运行方式集、典型故障集和节点集,采用计 算机时域仿真方法对电网中各节点在各种运行方式下的各种故障进行N次时域仿真,分别 记录每次时域仿真过程中所述节点在故障发生后△ t时间内电压、电流、有功功率、无功功 率随时间的变化曲线,这四种变化曲线均形成长度为m的时间序列,依次记为U、I、P、Q,其 中Δ t = (m - I) X Δ T = 2. 5秒,Δ T = 0. 01秒,为仿真时间间隔,m = 250为所记录的变 化曲线的数据点数,并记录每次时域仿真过程中电网的状态Z,将电网处于稳定状态记为Z =1,电网处于失稳状态记为Z = -1,将一次时域仿真过程中记录的数据集合成一个样本, 进行N次时域仿真后共得到N个样本,N个样本形成一个初始样本集,计算初始样本集对电 网状态Z的信息熵E 1 = - (N,) Iog2 (VN) - (N2/N) Iog2 (N2/N),其中N1为所有N个样本中电 网状态为Z = 1的样本总数,N2为所有N个样本中电网状态为Z = -1的样本总数,N JN2 = N;
[0024] (2)从上述步骤⑴的初始样本集中获取所有N个样本的U、I、P、Q时间序列,并 获取相应的电网状态Z的记录,分别从U、I、P、Q时间序列中提取出与电网状态Z的类别关 系最密切的关键子序列,以此作为初始样本集中的特征属性,具体过程如下:
[0025] (2-1)从上述步骤⑴的初始样本集中获取所有N个样本的U、I、P、Q时间序列, 并获取相应的电网状态Z的记录;
[0026] (2-2)设定一个长度为1的矩形窗,其中3 < I < m,通过矩形窗滑动方式从步骤 (2-1)的N个样本中的第i个样本的U、I、P、Q时间序列中获取长度为1的子序列集;
[0027] (2-3)从步骤(2-
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1