一种配网故障选线大数据降维方法和装置与流程

文档序号:14909869发布日期:2018-07-10 23:06阅读:186来源:国知局

本发明涉及电网故障选线技术领域,具体涉及一种基于故障特征提取和最大信息系数理论的配网故障选线大数据降维方法和装置。



背景技术:

电网是国民经济的支柱,经济的发展离不开电网的发展,一旦发生大面积停电事故将产生不可估量的损失。配电网是直接为用户输送电能的网络,配电网的正常运行对社会发展有着重大意义,配网接地故障选线一直是个难题。

当前,国内外中压配电网中性点广泛采用小电流接地方式,以避免发生单相接地故障时跳闸造成供电中断。对于小电流接地故障,由于故障电流微弱、电弧不稳定和随机因素影响等原因,接地故障选线比较困难。传统的各种选线方法只考虑一种或几种故障特征变量,得到的选线结果准确度较低,不能满足配电网故障选线的要求。

随着智能电网的发展,大量智能监测装置被应用于配电网方方面面,由此产生了大量的不同类型的数据。其中包括配电网内部实时监测装置产生的各种电气量数据,也包括配电网外部的各种数据如天气、交通和地理信息等非电气量数据。

为了利用多种数据全面分析故障线路,提高小电流接地系统故障选线准确率,需要运用大数据技术对以上大量的数据来进行分析处理。现采用大数据故障选线方法,需要建立神经网络模型,将大量数据作为输入,故障线路作为输出,进行数据挖掘,模型训练。由于利用了多种故障特征信息,此方法可以有效地提高小电流接地系统故障选线准确率,对提高配网自动化水平有重要意义。

综上所述,现有技术中由于数据维度太高,而且往往存在着噪声,进行数据挖掘时会造成结果精度不够、数据挖掘时间过长的问题,尚缺乏有效的解决方案。



技术实现要素:

为了克服上述现有技术的不足,本发明提供了一种配网故障选线大数据降维方法和装置,降低了使用大数据方法进行配网故障选线时的大数据维度,大大减小了大数据处理难度。

本发明所采用的技术方案是:

一种配网故障选线大数据降维方法,包括以下步骤:

步骤一:获取配网故障选线大数据,提取故障特征变量;

步骤二:分析步骤一中所提取的故障特征变量与线路故障结果之间的关联程度,计算各故障特征变量与线路故障结果之间的MIC值;

步骤三:比较各故障特征变量与线路故障结果之间的MIC值与设定的MIC阈值的大小,筛选故障特征变量。

进一步的,所述配网故障选线大数据包括电流及电压数据、零序电压及电流数据、稳态电气数据、暂态电气数据、远端遥测数据以及故障录波数据。

进一步的,所述步骤一中,获取配网故障选线大数据的具体方法为:

搭建仿真模型,模拟不同线路、不同位置、不同类型故障,产生多组故障录波数据;

通过故障录波器记录各条线路的故障录波数据;

获取各条线路的故障录波数据作为配网故障选线大数据。

进一步的,所述故障特征变量包括故障类型、故障后各相电压降落值、故障后零序电流幅值与相角、各出线零序电流的小波包能量、零序电流五次谐波幅值与方向、故障后首半波幅值与极性、故障后能量函数、暂态零模特征电流幅值与极性和FTU安装处零序电流幅值与相角。

进一步的,所述步骤一中,提取故障特征变量的具体方法为:

选择一条故障线路,用不同数字代表不同类型故障结果;

利用配网故障选线大数据中故障前后电压有效值计算故障前后各相电压降落值;

从配网故障选线大数据中提取故障后零序电流幅值与相角、暂态零模特征电流幅值与极性以及FTU装设处的零序电流幅值与相角;

根据配网故障选线大数据,利用dB15基函数、三层分解和第四尺度能量函数计算各出线零序电流的小波包能量;

根据配网故障选线大数据,计算故障后能量函数,提取零序电流五次谐波分量和故障后首半波的幅值与极性。

进一步的,所述步骤二中,分析步骤一中所提取的故障特征变量与线路故障结果之间的关联程度,计算各故障特征变量与线路故障结果之间的MIC值的具体方法为:

基于各个故障特征变量和线路故障结果构建二维数据集;

根据最大信息系数MIC计算公式,分别计算所有二维数据集的MIC值,即所有故障特征变量与线路故障结果之间的MIC值。

进一步的,最大信息系数MIC计算公式为:

MIC(D)=maxxy<B(n)M(D)xy=maxxy<B(n)I(D,x,y)·log-1(min(x,y))

其中,D为二维数据集,I(D,x,y)=max(I(D│G)),G代表二维数据集D的一种划分,D│G代表二维数据集D在网格G中的分布,I(D,x,y)表示基于二维数据集D的互信息;B(n)取数据总量的0.6或者0.55次方,是个经验值;x为故障特征变量;y为线路故障结果。

进一步的,所述步骤三中,比较各故障特征变量与线路故障结果之间的MIC值与设定的MIC阈值的大小,筛选故障特征变量的具体方法为:

比较各故障特征变量与线路故障结果之间的MIC值与设定的MIC阈值的大小;

若故障特征变量和线路故障结果之间的MIC值大于或等于设定的MIC阈值,则表明故障特征变量和线路故障结果之间关联程度大,保留该故障特征变量;

若故障特征变量和线路故障结果之间的MIC值小于设定的MIC阈值,则表明故障特征变量和线路故障结果之间关联程度小,剔除该故障特征变量。

一种实现上述的配网故障选线大数据降维方法的装置,包括:

故障录波数据模拟模块,用于模拟产生各条线路的故障录波数据;

配网故障选线大数据获取模块,用于从故障录波数据模拟模块获取各条线路的故障录波数据,将各条线路的故障录波数据即作为配网故障选线电气量大数据;

故障特征变量提取模块,用于对配网故障选线大数据进行故障特征变量提取;

最大信息系数分析模块,用于分析所提取的故障特征变量与线路故障结果之间关联程度,计算故障特征变量与线路故障结果之间的MIC值;

故障特征变量筛选模块,用于根据故障特征变量与线路故障结果之间的MIC值,保留关联程度大的故障特征变量,剔除关联程度小的故障特征变量。

进一步的,所述故障录波数据模拟模块包括具有多条出线的小电流接地系统,所述小电流接地系统的每个出线处装设有馈线终端设备,通过馈线终端设备设置参数;所述小电流接地系统的每条出线上设置有多个故障位置,故障位置上安装有故障录波器,通过故障录波器记录各条线路故障时的故障录波数据。

与现有技术相比,本发明的有益效果是:

(1)本发明从配网故障选线大数据提取出对故障选线有重要意义的故障特征数据,进行初步的配网故障选线大数据降维,对故障特征变量和线路是否故障之间的关联程度进行最大信息系数算法分析,得出各种故障特征变量和线路是否故障之间的MIC值,保留关联程度较大的故障特征,剔除关联程度较小的故障特征,进行进一步大数据降维,有效地降低了使用大数据方法进行配网故障选线时的大数据维度,大大减小了大数据处理难度;

(2)本发明基于故障选线饭方法,提取有用的故障特征变量,有效的进行了配网故障选线大数据初步降维;

(3)本发明采用先进的关联性最大信息系数分析算法,准确全面的研究了各种故障特征变量与线路故障的关联程度,以此为依据进行有效的大数据进一步降维;

(4)本发明对配网故障选线原始大数据进行筛选处理,保留有用数据,剔除无关数据,从而提高了大数据故障选线精度和运算速度。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。

图1是本发明实施例公开的配网故障选线大数据降维方法流程图;

图2是本发明实施例公开的仿真模型简化图;

图3是本发明实施例公开的基于配网故障选线大数据的选线方法流程图;

具体实施方式

应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

正如背景技术所介绍的,现有技术中由于数据维度太高,而且往往存在着噪声,进行数据挖掘时会造成结果精度不够、数据挖掘时间过长的问题,本申请提出了一种配网故障选线大数据降维方法和装置,包括故障特征变量提取和关联性分析两部分,可以大大提高大数据选线模型精度与运算速度。

如图1所示,本实施例提供了一种配网故障选线大数据降维方法,包括以下步骤:

步骤101:获取配网故障选线大数据,对配网故障选线大数据进行故障特征提取,得到故障特征变量。根据选线方法经验,提取出对故障选线有重要意义的故障特征数据,进行初步的配网故障选线大数据降维;

步骤102:对在步骤101所提取出的故障特征变量和线路是否故障结果之间的关联程度进行最大信息系数(Maximal Information Coefficient,MIC)算法分析,得出各种故障特征数据和线路是否故障之间的MIC值,保留关联程度较大的故障特征,剔除关联程度较小的故障特征,进行进一步大数据降维。

所述配网故障选线大数据包括配电网内部实时监测装置产生的各种电气量数据和非电气量数据,大部分数据都是从电力系统内部系统获得的,如电流、电压数据,零序电压、电流数据,稳态电气数据,暂态电气数据,远端遥测数据以及故障录波数据。对于这些数据,为了保证电力系统信息安全,需要安装正向隔离装置。

在步骤101中,故障特征提取是指从原始数据中提取出具有重要物理意义或统计意义的特征变量,可以对维数较高的原始数据进行有效降维。由于原始数据尤其是电气数据维度太高,数据量太大,并且含有一些无用的信息,所以有必要进行特征提取,提取出有用的故障特征变量进行分析。

故障特征提取有多种方法,为保证提取数据的有效性,一般根据选线方法确定要提取的特征数据。在故障选线中,使用不同数字代表不同类型故障结果,利用故障前后电压有效值计算各相电压降落,利用dB15基函数、三层分解和第四尺度能量函数来计算各出线零序电流的小波包能量,记录各处零序电流幅值和相角,计算能量函数,提取零序电流五次谐波分量和故障后首半波的幅值与极性;根据故障录波数据,提取暂态零模特征电流幅值与极性(设置中性点不接地系统采样频率为0~2kHz,设置消弧线圈接地系统采样频率为200Hz~2000kHz),提取FTU装设处的零序电流幅值与相角。将以上变量作为故障特征变量,可以有效地降维。

在步骤二中,最大信息系数MIC是一种有效的分析大量数据之间关联程度的衡量指标,是基于互信息技术提出的一种算法,可信度极高。MIC可以有效挖掘出两个数据项间的关系强弱,这为进一步的数据挖掘提供了基础。

MIC具有通用性与公平性。其中,通用性是指它不仅适用于函数相关性也适用于非函数相关性,既适用于线性相关性也适用于非线性相关性;公平性是指两个不同的函数关系受到相同的噪音干扰时它们的MIC值仍保持一致,也即噪音对MIC造成的影响与变量之间的函数关系无关。

在样本数量足够大时,MIC的公平性和通用性可以保证它能捕捉各种各样复杂隐藏的关联,而不限定于特定的函数形式,被称为21世纪的相关性。运用MIC进行准确全面的故障特征数据与线路故障之间的关联程度分析,进一步剔除无用数据进行降维,可以有效提高大数据模型选线精度与运算速度。

最大信息系数(MIC)原理如下:

对于某个数据变量,衡量随机变量中所含有的信息量,定义如下:

其中pi代表事件i的发生概率,两个随机变量之间的互信息为:

I(X,Y)=H(X)+H(Y)-H(X,Y)

对一个有限的有序二维数据集D:(x,y),最大信息系数(MIC)计算方法如下:

MIC(D)=maxxy<B(n)M(D)xy=maxxy<B(n)I(D,x,y)·log-1(min(x,y))

其中I(D,x,y)=max(I(D│G)),G代表有限数据集D的一种划分,D│G代表数据集D在网格G中的分布,I(D,x,y)表示基于数据集D的互信息。B(n)取数据总量的0.6或者0.55次方,是个经验值;x,y为两个向量,D为数据集。

在MATLAB中导入故障特征提取结果,包括各相电压降落值,故障后零序电流幅值与相角、各出线零序电流的小波包能量、零序电流五次谐波幅值与方向、故障后首半波幅值与极性、故障后能量函数、暂态零模特征电流幅值与极性和FTU安装处零序电流幅值与相角。将各个故障特征变量作为一个行向量,线路是否故障结果作为另一个行向量,构成二维数据集;

使用最大信息系数(MIC)原理的原理算法,逐个计算所有故障特征变量与线路故障结果之间的MIC值,得到每两个向量的MIC值。

比较各故障特征变量与线路故障结果之间的MIC值与设定的MIC阈值的大小。由MIC原理可知两变量之间的MIC的值介于0到1之间,越接近1则表示关联程度越大,越接近0则表示关联程度越小。由于本方法涉及多种变量,结合实际情况,将MIC=0.1作为划分关联程度的阈值,是一个经验值。

若故障特征变量和线路故障结果之间的MIC值大于或等于设定的MIC阈值,则表明故障特征变量和线路故障结果之间关联程度较大,保留该故障特征变量;若故障特征变量和线路故障结果之间的MIC值小于设定的MIC阈值,则表明故障特征变量和线路故障结果之间关联程度较小,剔除该故障特征变量;实现进行进一步大数据降维。

本申请的另一种典型实施方式,提供了一种实现上述的配网故障选线大数据降维方法的装置,该装置包括:

故障录波数据模拟模块,用于模拟产生各条线路的故障录波数据;

配网故障选线大数据获取模块,用于从故障录波数据模拟模块获取各条线路的故障录波数据,将各条线路的故障录波数据即作为配网故障选线电气量大数据;

故障特征变量提取模块,用于对配网故障选线大数据进行故障特征变量提取;

最大信息系数分析模块,用于对所提取的故障特征变量与线路故障结果进行最大信息系数分析,得到故障特征变量与线路故障结果之间的MIC值;

故障特征变量筛选模块,用于根据故障特征变量与线路故障结果之间的MIC值,保留关联程度大的故障特征变量,剔除关联程度小的故障特征变量。

在本实施例中,所述故障录波数据模拟模块包括具有多条出线的小电流接地系统,所述小电流接地系统的每个出线处装设有馈线终端设备,通过馈线终端设备设置参数;所述小电流接地系统的每条出线上设置有多个故障位置,故障位置上安装有故障录波器,通过故障录波器记录各条线路故障时的故障录波数据。

下面结合一个具体的实施方式对本发明的技术方案进行详细说明。

实施例一

本实施例提出的一种配网故障选线大数据降维方法,包括以下步骤:

步骤一,获取配网故障选线大数据,对配网故障选线大数据进行故障特征提取。根据选线方法经验,采用合理方法,提取出对故障选线有重要意义的故障特征数据,进行初步大数据降维;

步骤二,对步骤一提取出的故障特征数据变量和线路是否故障结果之间的关联程度进行最大信息系数(MIC)算法分析,得出各种故障特征数据和线路是否故障之间的MIC值,保留关联程度较大的故障特征,剔除关联程度较小的故障特征,进行进一步大数据降维。

所述步骤一,配网故障选线大数据包括配电网内部实时监测装置产生的各种电气量数据和非电气量数据,包括电流、电压数据,零序电压、电流数据,稳态电气数据,暂态电气数据,远端遥测数据以及故障录波数据。大部分数据都是从电力系统内部系统获得的,对于这些数据,为了保证电力系统信息安全,需要安装正向隔离装置。

采用仿真模型来模拟配网故障选线大数据中的电气数据。使用电力系统暂态计算机辅助设计(Power Systems Computer Aided Design,PSCAD)软件来搭建仿真模型,模型为具有五条出线的小电流接地系统,每个出线处装设有馈线终端设备(Feeder Terminal Unit,FTU)。设置线路、负载、电源、变压器参数。消弧线圈参数为6.0H,线路正序参数为:正序电阻R1=1.7E-4Ω/m,正序电感XL1=3.8E-4Ω/m,正序电容XC1=32.84MΩ/m;线路零序参数为:零序电阻R0=2.3E-4Ω/m,零序电感XL0=1.72E-3Ω/m,零序电容XC0=53.08MΩ/m。每条出线设置五个故障位置,装设故障录波器,记录各条线路故障时的电压、电流故障录波数据。模型简化图如图2所示。

设置中性点不接地、经消弧线圈接地两种接地系统;设置故障类型分别为A相故障接地AG、B相故障接地BG、C相故障接地CG三种情况;设置故障角分别为0度、45度、90度;设置故障电阻分别为0Ω、10Ω、50Ω;设置模型循环运行,共产生1350组故障信息。

如图3所示,对仿真电气数据进行故障特征提取。仿真时每条线路产生了225组故障数据,对故障录波数据进行处理,采用合理方法,提取有用的特征数据。提取出以下14种故障特征数据:故障类型,故障后各相电压降落,故障后零序电流幅值与相角,各出线零序电流的小波包能量,零序电流五次谐波幅值与方向,故障后首半波幅值与极性,故障后能量函数,暂态零模特征电流(Special Frequency Band,SFB)幅值与极性,FTU安装处零序电流幅值与相角。根据每一条出线获得故障特征变量,并归一化。从原始电气数据提取出以上重要故障特征,有效的进行了数据降维。

所述步骤二中,运用MIC进行准确全面的故障特征数据变量与线路是否故障结果之间的关联程度分析,进一步剔除无用数据进行降维,可以有效提高大数据模型选线精度与运算速度。

利用MIC算法来研究故障特征数据变量与线路发生故障的关联程度。将各个故障特征数据作为一个向量,线路故障结果作为另一个向量,使用矩阵实验室(Matrix Laboratory,MATLAB)软件计算两向量的MIC值,求取5条线路的平均值,结果如下所示:

表1各故障特征变量与线路发生故障的MIC值

由以上结果可以看出,在两种接地系统中,零序电流幅值和相角、小波包能量、首半波幅值、暂态零模特征电流幅值与极性以及FTU幅值均为与线路故障相关性较大的故障特征变量,这一结果与传统选线方法的优缺点是一致的。其中在不接地系统中,小波包能量、首半波幅值以及暂态零模特征电流幅值与极性是最为重要的变量;而在经消弧线圈接地系统中,首半波幅值和FTU极性是更为重要的变量。在两种接地系统中,故障类型和首半波极性均为与线路故障相关性较小的故障特征变量,可以在数据处理时将其剔除,进行进一步的降维,这样仅剩下了12种故障特征变量,即故障后各相电压降落,故障后零序电流幅值与相角,各出线零序电流的小波包能量,零序电流五次谐波幅值与方向,故障后首半波幅值,故障后能量函数,暂态零模特征电流SFB幅值与极性,FTU安装处零序电流幅值与相角,大数据维度得到了进一步降低。

建立大数据模型进行验证该降维方法的有效性。使用数据挖掘平台统计产品与服务解决方案建模器(Statistical Product and Service Solutions Modeler,SPSS Modeler)来搭建大数据选线模型。将各种故障特征向量作为输入数据,故障线路作为输出数据,建立神经网络,设置神经网络参数,并对神经网络进行训练。

为验证本发明提出的方法的确可以有效的进行数据降维,提高故障选线准确度与运算速度,加入几样无关的故障特征变量以加入干扰:零序电流三次、七次谐波电流幅值与极性,用第1、2、3、5尺度能量函数来计算各出线零序电流的小波包能量。加上原来的14种故障特征变量,一共有22种故障特征变量,与经过本文方法降维后的12种故障特征变量分别作为神经网络的输入,使用径向基函数作为核心函数,建立神经网络模型,验证模型准确度与运算速度。

结果表明故障特征变量从22种减少到12种,大数据模型准确率从95.6%上升至99.6%,运算时间从561ms下降至425ms,隐藏层神经元数量由5下降至2,证明此本发明提出的方法确实可以有效地提高有效提高大数据模型选线精度与运算速度。从结果可以看出经过本发明提出的方法降维后,故障特征变量数量明显减少,建立大数据神经网络模型时网络结构更加简单,构建与运算速度加快,并且准确度得到了进一步提高。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1