本发明涉及电力系统暂态稳定分析领域,具体涉及一种电力系统暂态稳定结果的特征提取和聚类分析方法。
背景技术:
瞬态稳定仿真工具是电力系统安全可靠运行的关键。在现实生活庞大的电力系统中,瞬态稳定性研究经常产生大量的数据,对监测控制电力系统提供了重要的依据,但同时由于彻底分析的效率非常低,对电力系统规划人员分析整个系统响应和识别系统中可能存在的“异常”情况提出了重大挑战。因此开发从瞬态稳定数据中自动提取此类信息方法具有非常重要的意义。将聚类技术应用于暂态稳定数据,例如电压和频率响应信号,解决了上述需求。通过提取常见特征,识别具有不常见特征的异常值。与此同时鉴于更好更直观的观察暂态稳定结果,可将地理信息注入到结果的显示中,使暂态结果更加清晰化。
但是在实际的电力应用中,对电力系统暂态稳定结果特征提取和聚类的方法中也存在许多不足:①传统的特征提取方法对于有些异常值还是不能够完全识别或者识别不够准确,存在潜在的危险;②采用的聚类方法对于聚类簇数目以及初始聚类中心的确定都是随机的,存在很大的误差和偶然性,使得聚类的效果经常存在不理想状况;③简单的特征提取方案结果不够信息明朗化,将暂态稳定数据结合地理信息进行分析也存在需要完善的地方,如随着级数的增加,数据密集,传统的条形图无法区分准确的识别信号。暂态稳定结果特征提取和聚类分析对系统运行有很重要的作用,改进算法和优化方案是暂态研究领域的一个重点。
技术实现要素:
本发明的目的是为了解决现有对电力系统暂态稳定结果特征提取和聚类的方法存在的归一化程度较低,不同参量间联系不紧密,网络收敛较慢的技术问题。
发明的目的是这样实现的:
一种电力系统暂态稳定结果的特征提取和聚类分析方法,包括以下步骤:
步骤1对暂态稳定的特征数据进行归一化的预处理,以对数据进行聚类;
步骤2将预处理的数据利用改进的聚类算法进行特征提取和异常点判断;
步骤3对聚类效果进行有效性评价;
步骤4将从瞬态稳定中提取的数据特征结合地理位置信息进行分析。
在步骤1中,归一化的特征数据预处理采用联合归一化方法,先后对列向量、行向量以最值法对其进行归一化处理;
在步骤2中,所述特征提取包括数据降维和高质量聚类两个步骤;
在步骤3中,通过轮廓系数对特征提取的聚类效果进行评价;
在步骤4中,在经典弹力模型图布局的基础上引入力导引模型,对图中节点地理位置进行调整。
在步骤2中,具体包括以下步骤:
步骤2-1:对k-means聚类算法运用统计学的线性回归和残差分析进行改进,根据标准化残差落点范围求取异常值从而得到聚类中心,且通过逆映射求得集群数目k,得到聚类数和聚类中心自确定的k均值算法即cancsk-means算法;
步骤2-1:高质量聚类通过对由cancsk-means算法得到的新聚类采用限定类之间直径来重新聚类。
在步骤2-1中:在处理cancsk-means算法时步骤如下:
(1)输入待聚类的数据集s={x1,x2,...,xn};
(2)将数据集s采用联合归一化方法进行标准化预处理,得到标准化的数据集
(3)根据局部密度公式
(4)令ρ*=1/ρ,运用线性函数
(5)计算每一个σi的残差
(6)在处理后的标准化残差中,筛选出残差绝对值大于3的数据。则这些点所对应的
(7)以得到的数据对象为初始聚类中心ci,对
(8)输出聚类结果
在步骤2-1的步骤(7)中:再对
1)根据自动确定的聚类中心作为初始聚类中心;
2)利用公式
3)找到每个样本点到聚类中心ci的最小距离,并将样本点归类到对应的集群
4)再次计算同一类新的聚类中心
(5)重复以上步骤(2)至步骤(4),直到所有的集群中心点不再发生变化或者达到最大运行次数。
在步骤2-2中:高质量聚类算法步骤如下:
(1)从k个集群的聚类中心列表中选择一个聚类中心ci*;
(2)确定集群中每个节点与该聚类中心的欧式距离,如果距离小于预先指定的质量阈值距离,则将这两个节点聚集在一起;
(3)将依次选择该集群中的节点执行上步步骤(2),直到遍历该集群中的所有节点得到新的集群,重新计算集群数据平均值得到新的聚类中心c'i;
(4)选择第二个候选聚类集群,重复步骤上述步骤(2)、步骤(3),直到k个集群都重新归类计算得到新的聚类中心和集群,而集群个数不变。
在步骤3中,对于样本xi的轮廓系数sil定义为:
在步骤4中,对图中节点地理位置进行调整,步骤如下:
(1)给所有的点一个初始的随机位置;
(2)首先计算节点之间相互排斥力,然后计算图中有边连接的节点相互吸引力,最后综合吸引力和排斥力,通过力的作用调整布局中节点的位置;
(3)重复上步步骤,直到网络区域平衡,或者迭代达到一定的次数。
在步骤4的步骤(2)中,采用fr算法进行处理,具体的采用以下步骤:
1)计算网络平衡距离;
2)计算节点之间的几何距离;
3)获得相邻节点之间的吸引力函数;
4)获得相邻节点之间的排斥力函数。
采用上述技术方案,能带来以下技术效果:
(1)相对于传统数据预处理方法存在的归一化程度较低,不同参量间联系不紧密,网络收敛较慢等问题,本发明采用的联合归一化方法可以将不同数据特征之间紧密的更加联系,抗干扰性能好;
(2)本发明对k-means聚类算法运用统计学的线性回归和残差分析进行改进,得到集群簇数目和初始中心点自动确定的cancsk-means聚类算法,避免了由于随机性和偶然性引起的数据聚类效果弱化问题。
(3)本发明针对数据显示问题,提出将地理信息注入到暂态数据中,借助力导向改进区域节点布局,使电力系统数据监测更加形象化,有效解决了传统条形图不能提供地理信息的短板。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1是本发明整体流程图;
图2是本发明特征提取模型图;
图3是本发明k-means聚类算法流程图;
图4是本发明实例ieee-118节点系统图;
图5是本发明距离阈值选取与分类簇数目关系图;
图6是本发明发电机终端电压信号结合地理位置信息分类表。
具体实施方式
一种电力系统暂态稳定结果的特征提取和聚类分析方法,如图1所示,包括以下步骤:
步骤1:对暂态稳定的特征数据进行归一化的预处理,以便对数据进行聚类。归一化的特征数据预处理采用联合归一化方法,先后对列向量、行向量以最值法对其进行归一化处理。使得系统数据之间联系的更加紧密,对于系统扰动有更好的适应性。
数据集s={x1,x2,...xn}是包含n个样本对象的集合,且s中的每一个样本对象xij={xi1,xi2,...,xiτ}(i=1,2,...,n,j=1,2,...,τ)含有τ个维度,其中xij代表样本对象xi的第j维属性的值,即可构成一个(τ×n)的样本矩阵。先后对列向量、行向量以最值法进行归一化处理有:
(1)列向量归一化:
式中:i=0,1,...,n-1,j=0,1,...,τ-1,xij、
(2)行向量归一化:
式中:j=0,1,...,τ-1,
步骤2:将预处理的数据利用改进的聚类算法进行特征提取和异常点判断,特征提取包括数据降维和高质量聚类两个步骤,如图2所示分别为:
步骤2-1:对k-means聚类算法运用统计学的线性回归和残差分析进行改进,根据标准化残差落点范围求取异常值从而得到聚类中心,且通过逆映射求得集群数目k,得到聚类数和聚类中心自确定的k均值算法即cancsk-means算法。
步骤2-2:高质量聚类通过对由cancsk-means算法得到的新聚类采用限定类之间直径来重新聚类。
其中,在步骤2-1中,cancsk-means算法的步骤如下,如图2步骤2-1:
(1)输入待聚类的数据集s={x1,x2,...,xn};
(2)将数据集s采用联合归一化方法进行标准化预处理,得到标准化的数据集
(3)根据局部密度公式
(4)令ρ*=1/ρ,运用线性函数
(5)计算每一个σi的残差
(6)在处理后的标准化残差中,筛选出残差绝对值大于3的数据。则这些点所对应的
(7)以步骤(6)中得到的数据对象为初始聚类中心ci,对
(8)输出聚类结果
k-means聚类是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。其中步骤2-1的步骤(7)如图3所示,操作步骤如下:
1)根据自动确定的聚类中心作为初始聚类中心;
2)利用公式
3)找到每个样本点到聚类中心ci的最小距离,并将样本点归类到对应的集群
4)再次计算同一类新的聚类中心
5)重复步骤(2)至步骤(4),直到所有的集群中心点不再发生变化或者达到最大运行次数。
而在步骤2-2中,高质量聚类算法步骤如下,如图2中步骤2-2:
(1)从k个集群的聚类中心列表中选择一个聚类中心ci*;
(2)确定集群中每个节点与该聚类中心的欧式距离,如果距离小于预先指定的质量阈值距离,则将这两个节点聚集在一起;
(3)将依次选择该集群中的节点执行步骤(2),直到遍历该集群中的所有节点得到新的集群,重新计算集群数据平均值得到新的聚类中心c'i;
(4)选择第二个候选聚类集群,重复步骤(2)、步骤(3),直到k个集群都重新归类计算得到新的聚类中心和集群,而集群个数不变。
在步骤3中:对聚类效果进行有效性评价;特征提取的聚类效果可通过轮廓系数进行评价,对于样本xi的轮廓系数sil定义为:
式中:ri表示每个聚类中样本个数,a(xi)表示样本xi到聚类中剩余样本的平均距离,b(xi)表示样本xi到其他聚类中样本的平均距离最小值。
对于整个数据集,则可以通过平均轮廓指标来评价聚类结果有效性,表示如下:
式中:n表示数据集样本大小,且
在步骤4中:将从瞬态稳定中提取的数据特征结合地理位置信息进行分析,而暂态数据量大、集群密集,聚类分析需考虑重叠部分的影响。因此在经典弹力模型图布局的基础上引入力导引模型,对图中节点地理位置进行调整,步骤如下:
(1)给所有的点一个初始的随机位置;
(2)首先计算节点之间相互排斥力,然后计算图中有边连接的节点相互吸引力,最后综合吸引力和排斥力,通过力的作用调整布局中节点的位置;
(3)重复步骤(2),直到网络区域平衡(全部结点作用力较小),或者迭代达到一定的次数。
在步骤4的步骤(2)中,采用fr算法(力引导布局算法,通过两点间的吸引力和排斥力不断迭代达到布局稳定)调节节点位置。在一个高度为w,宽度为h的显示区域,fr基本定义如下:
对一个高度为w,宽度为h的显示区域,任意节点n有两个布局参量,节点的位置pos和所受合力产生的位置偏移量。
1)平衡距离:
式中:|n|是图中节点个数,dp也称为最理想距离。
2)u和v两节点之间的几何距离:
式中:u.posx,u.posy是节点u的位置信息;v.posx,v.posy是节点v的位置信息。
3)相邻节点u和v之间吸引力函数:
fa(u,x)=(dist(u,v))2/dp(7)
4)相邻节点u和v之间排斥力函数:
fr(u,v)=dp2/dist(u,v)(8)
如图4所示,采用ieee-118节点系统,19台发电机都被建模为经典发电机模型,同步发电机被建模为戴维宁电压源以回放已知的电压信号。1秒时,在节点23和节点25之间模拟了一个三相故障,并通过在1.12秒处打开线路进行清除,由此触发系统发生扰动,记录终端标幺值电压。而通过对此暂态稳定数据按照步骤1过程进行预处理,从而为下步的特征提取作准备。紧接着按照发明的步骤2、步骤3对数据处理。
如图5所示,显示了系统聚类簇数目与所选阈值直径的敏感关系。特征提取分析所用的聚类簇数量是与所选的阈值直径有关的,当系统自动确定系统聚类数目之后,可以看出当距离阈值取的越小,得到的簇分类数越多,而当系统所选距离阈值大到一定程度时系统分类簇甚至能统一为一个。所以选取合适的阈值直径至关重要。此次实例中选取阈值直径为0.03,对系统终端电压信号进行特征分析。
图6中的表为利用高质量聚类对发电机终端电压信号结合地理位置信息进行分离和分组情况,总共得到的6个簇聚类:第一个集群为基于电压响应的发电机,共有13台(图4单线图上的黑点);第二个集群包含2个发电机(图4单线图上的5号点);剩下的四个集群各自由一个发生器组成(图4显示的是1、2、3、4号点),其中第4集群是连接到发生故障的25节点。实际系统中,每一个聚类簇都有对应的位置信息,当获取位置信息之后可以按照步骤4的流程对提取的电压信息进行进一步结合即可得到方便易观察的暂态信息情况。