一种基于多分类支持向量机变压器故障诊断的方法与流程

文档序号:18602132发布日期:2019-09-03 22:47阅读:153来源:国知局
一种基于多分类支持向量机变压器故障诊断的方法与流程

本发明属于变压器故障诊断的技术领域,具体涉及一种基于多分类支持向量机变压器故障诊断的方法。



背景技术:

近年来,随着国家电网大力发展特高压技术和智能电网,中国的电力技术水平和电力网络规模已然成为全球电力网络的排头兵。在整个电网结构中,变压器作为连接不同电压等级的电力枢纽设备,内部结构缜密、运行工况复杂,也就决定了它的成本较高,较易引发系统故障电力系统的安全与稳定很大程度上与变压器的运行状态密不可分,变压器一旦发生故障,就会存在引发供电区域大面积停电的危险,这将对整个经济社会的发展产生较为严重的影响。因此,掌握变压器运行工况,确保变压器稳定运行,对电力系统发展具有十分实际的意义。

目前的变压器故障诊断的方法算法复杂且实测准确率较低。



技术实现要素:

本发明所要解决的技术问题在于提供一种基于多分类支持向量机变压器故障诊断的方法,实测正确率高。

为实现上述目的,本发明的技术方案包括其包括以下步骤,

一、建立用于变压器故障诊断的支持向量机分类模型;

(1)状态提取:搜集为若干组数量的现有明确结论的样本数据作为dga原始数据,所述每组样本数据为变压器油中五种气体含量及其对应的变压器故障类型;

对dga原始数据分为训练集和测试集;

(2)数据归一化:对上述dga原始数据进行归一化处理;

(3)利用网格搜索法寻找支持向量机最优核函数及核参数:将归一化处理后训练集中的气体含量作为支持向量机的输入,以相对应的变压器状态作为相应的输出,首先设定核函数和参数中c∈[-5,5],g∈[-4,4],然后设定c的步长和g的步长,在遍历c,g范围的同时,对于每个不同的c,g组合,用网络搜索法的交叉验证算法确定该参数下准确率最高的组值作为c,g最优参数;采用得到的最优参数建立支持向量机分类模型;

(4)用步骤(2)中归一化处理后的测试集的样本数据带入步骤(3)得到的支持向量机分类模型,将气体含量作为支持向量机分类模型的输入,以变压器状态作为相应的输出,得到支持向量机分类模型的结果,然后和测试集的样本数据结果进行比对,准确率达70%以上说明步骤(3)的支持向量机分类模型建立成功,否则重新进行步骤(3)建立支持向量机分类模型;

二、对未知故障的变压器进行故障诊断

从待诊断的未知故障的变压器中脱离出h2、ch4、c2h6、c2h4和c2h2五种气体并记录其含量,带入上述建立好的支持向量机分类模型中,得到相应的故障类型。

进一步地,第一步的步骤(2)中,归一化处理的公式为

式(1)中:xi为原始的气体含量,单位μl/l;xmax为同一样本5种气体含量最大值,单位μl/l;xmin为同一样本5种气体含量最小值,单位μl/l;x′i为归一化后的数据。

进一步地,第一步的步骤(3)中,c的步长为0.5,g的步长为0.5。

进一步地,第一步的步骤(1)中,气体含量来源于h2、ch4、c2h6、c2h4和c2h25种气体,其对应的变压器状态为高温过热、高能放电、低能放电、局部放电和中低温过热五种故障信息。

进一步地,第一步的步骤(3)中,核函数为高斯径向基核函数,数学表达式为:k(x,xi)=exp(-γ|u-v|2);c表示惩罚因子,g用来设置核函数中的γ参数。进一步地,第一步的步骤(1)中,所述训练集和测试集的样本数据比例为10:3。

进一步地,第一步的步骤(1)中,搜集现有明确结论的10组以上的样本数据。

进一步地,第一步的步骤(1)中,搜集现有明确结论的100组以上的样本数据。

本发明积极效果如下:

本发明用多分类支持向量机,挖掘数据中的规律。通过将已有的变压器故障数据分为训练集和测试集,用训练集的数据找出规律,测试集来验证规律是否正确,以分类正确率来衡量找出的规律是否正确,然后建立支持向量机变压器故障诊断模型,本发明建模的过程为以变压器油中5种主要特征气体作为支持向量机的输入,以5种变压器状态作为相应的输出,选用径向基核,使用网格搜索法得到优化参数,充分发挥了支持向量机具有较高泛化能力的优势。对于未知故障的变压器诊断时,将5中特征气体的含量带入建立的支持向量机变压器故障诊断模型,然后得出故障类型结论。

本发明基于支持向量机变压器故障诊断模型对于提早发现变压器内部可能存在的缺陷或性能劣化起到了不容替代的作用,能够为设备检修提供初期判断,减少了重大事故的发生率,降低了设备的维护数量和维修费用,为真正实现输变电设备状态检修提供了有力的技术手段。

附图说明

图1本发明第一步的流程图;

图2是实施例中第一步步骤(3)中寻求最优参数的结果图;

图3是实施例测试集的测试结果示意图。

具体实施方式

下面结合附图对本发明方案进行进一步说明和解释。

支持向量机是一种广泛应用于统计分类以及回归分析中的监督式学习方法。

支持向量机理论基础

1、svm理论基础

支持向量机是在统计学习的基础上发展起来的一种新的机器学习方法。其基本思想是,在线性的情况下,在原空间寻找两类样本的最优分类超平面,在非线性的情况下,首先选择一个非线性变换,将n维输入、一维输出的样本向量(xi,yi)从原空间映射到高维空间f(其中xi∈rn为输入向量,yi∈[-1,1]为输出类别,i=1,2,3……l,l为训练样本数),再在高维特征空间建立优化超平面:

式中:w为权重;b为偏差。

因此,原样本空间的两分类问题就可以表示为

考虑到有些样本也许不能被式(2)分开,引入非负的松弛变量ξi,以便在确定最优分类面时折中考虑最大分类间隔和最小错分样本,用常数c(惩罚系数)控制对错分样本的惩罚程度,故构造最优超平面的问题被转化为如下的优化问题:

引入lagrange乘子αi,将原问题转换为简单的对偶问题,即

根据kuhn-tucker条件,优化系数αi必须满足:

因此,只有一小部分αi不为0,它们对应的训练样本即为支持向量.求解上述问题,得到最优分类函数:

式中,k(x,xi)=φt(x)φ(xi)为核函数;m为支持向量的数目。

2、支持向量机多分类模型

支持向量机是针对二值分类问题提出的,并且成功地应用子解函数回归及一类分类问题。虽然支持向量机在解决二值分类问题时获得了巨大的成功,但实际应用中的大量多值分类问题也进一步要求如何将支持向量机推广到多分类问题上,目前有以下几种的方法:“一对一”、“一对多”、决策导向无环图、k类svm方法等。最常用的是一对一、一对多。

(1)一对多法。其基本思想是把某一种类别的样本当作一个类别,剩余其他类别的样本当作另一个类别,这样就变成了一个两分类问题。然后,在剩余的样本中重复上面的步骤。这种方法箱要构造k个svm模型,其中,k是待分类的个数。这种方案的缺点是训练样本数目大,训练困难。

(2)一对一方法。其做法是在多值分类中,每次只考虑两类样本,即对每两类样本设计一个svm模型,因此,总共需要设计个svm模型.这种做法需要构造多个二值分类器,并且测试时需要对每两类都进行比较,导致算法计算复杂度很高。

其包括以下步骤,

一、建立用于变压器故障诊断的支持向量机分类模型;

(1)状态提取:从网上、数据库或日常测试数据积累等途径搜集为若干组数量的样本数据作为dga原始数据,所述样本数据为现有具有明确结论的数据,该样本数据中的信息为所述每组样本数据为变压器油中五种气体含量及其对应的变压器故障类型;五种气体含量为已知含量,故障类型为该含量对应的故障类型,该故障类型是已知且正确的故障类型。优选地,样本数据为10组以上,数量越多,建立的支持向量机变压器故障诊断模型诊断结构正确率越高,所以更优地,样本数据为100组以上。

对dga原始数据按照一定比例分为训练集和测试集,一般来说,训练集内的样本数据数量多于测试集内的样本数据。

气体含量的单位为μl/l,即单个组分气体体积占变压器总气体体积中的体积比。

第一步的步骤(1)中,气体含量来源于h2、ch4、c2h6、c2h4和c2h25种气体,其对应的变压器状态为高温过热、高能放电、低能放电、局部放电和中低温过热五种故障信息。每组样本数据中有5种气体的含量,单位为μl/l,还有其对应的故障信息。

(2)数据归一化:对上述dga原始数据进行归一化处理,训练集和测试集内的样本数据都进行归一化处理;归一化处理的公式为

式(1)中:xi为原始的气体含量,单位μl/l;xmax为同一样本5种气体含量最大值,单位μl/l;xmin为同一样本5种气体含量最小值,单位μl/l;x′i为归一化后的数据。数据归一化的目的为降低各种气体之间由于量值差异造成的影响。该步骤的作用是将所有的数据归算到[0,1]之间。充分利用每组数据信息,避免过大的数据掩盖较小数据的作用。

(3)利用网格搜索法寻找支持向量机最优核函数及核参数:

对训练集中的样本进行训练,将归一化处理后训练集中的气体含量作为支持向量机的输入,以相对应的变压器状态作为相应的输出,首先设定核函数和参数中c∈[-5,5],g∈[-4,4],然后设定c的步长和g的步长,在遍历c,g范围的同时,对于每个不同的c,g组合,用网络搜索法的交叉验证算法确定该参数下准确率最高的组值作为c,g最优参数;

采用得到的最优参数建立支持向量机分类模型;向量机分类模型的关键是核参数的确定,核参数确定了,用libsvm工具箱直接就可以建立分类模型。向量机分类性能的好坏很大程度依赖于核函数与核参数的选取。目前核参数常用的寻优方法有网格搜索法、遗传算法和粒子群优化算法。本发明提出了一种支持向量机核参数的确定方法—网格搜索法。

网格搜索法:在支持向量机核参数确定中,网格搜索法以其简单、高效得到了广泛的应用。网格搜索法首先确定各个参数的取值范围,然后对每个参数取值范围按照一定规律插值,得出若干组参数组合,对每个网格点采用一定算法进行计算.本文采用交叉验证算法,基本思想是:把n个数据样本随机地分成k个互不相交的子集,即k折s1,s2,…,sk,每个折的大小大致相等;进行k次训练与测试。第i次训练与测试的做法是选择si为测试集,其余作为训练集。首先根据训练集求出决策函数后,然后对测试集si进行测试。一共需要重复k次这样的过程。测试结果错误率最低的那组参数便是是最优参数。

(4)用步骤(2)中归一化处理后的测试集的样本数据带入步骤(3)得到的支持向量机分类模型,将气体含量作为支持向量机分类模型的输入,以变压器状态作为相应的输出,得到支持向量机分类模型的结果,然后和测试集的样本数据结果进行比对,准确率达70%以上说明步骤(3)的支持向量机分类模型建立成功,否则重新进行步骤(3)建立支持向量机分类模型。本步骤通过将已知故障类型的样本带入步骤(3)中建立的模型中,得到模型的诊断结果,然后将模型的诊断结果和已知故障类型比对,计算准确率。准确率的计算为比对一致的样本数量除以样本总数量然后乘以100%。

二、对未知故障的变压器进行故障诊断

建立好支持向量机分类模型后就可以用来对未知故障的变压器进行诊断,从待诊断的未知故障的变压器中脱离出h2、ch4、c2h6、c2h4和c2h2五种气体并记录其含量,带入上述建立好的支持向量机分类模型中,得到相应的故障类型。

优选地,第一步的步骤(3)中,核函数为高斯径向基核函数,数学表达式为:k(x,xi)=exp(-γ|u-v|2);c表示惩罚因子,g用来设置核函数中的γ参数。

优选地,第一步的步骤(1)中,所述训练集和测试集的样本数据比例为10:3。

优选地,第一步的步骤(3)中,c的步长为0.5,g的步长为0.5。

实施例

一、建立用于变压器故障诊断的支持向量机分类模型;

(1)状态提取:

搜集为130组样本数据作为dga原始数据。所述样本数据为现有具有明确结论的数据,该样本数据中的信息为所述每组样本数据为变压器油中五种气体含量及其对应的变压器故障类型;五种气体含量为已知含量,故障类型为该含量对应的故障类型,该故障类型是已知且正确的故障类型。

对dga原始数据按照10:3的比例分为训练集和测试集。

气体含量的单位为μl/l,即单个组分气体体积占变压器总气体体积中的体积比。

第一步的步骤(1)中,气体含量来源于h2、ch4、c2h6、c2h4和c2h25种气体,其对应的变压器状态为高温过热、高能放电、低能放电、局部放电和中低温过热五种故障信息。每组样本数据中有5种气体的含量,单位为μl/l,还有其对应的故障信息。测试集样本数据信息如表1所示,每组测试集样本数据中包含了表1中前5列信息。

(2)数据归一化:对上述dga原始数据进行归一化处理,训练集和测试集内的样本数据都进行归一化处理;归一化处理的公式为

式(1)中:xi为原始的气体含量,单位μl/l;xmax为同一样本5种气体含量最大值,单位μl/l;xmin为同一样本5种气体含量最小值,单位μl/l;x′i为归一化后的数据。数据归一化的目的为降低各种气体之间由于量值差异造成的影响。该步骤的作用是将所有的数据归算到[0,1]之间。充分利用每组数据信息,避免过大的数据掩盖较小数据的作用。

(3)利用网格搜索法寻找支持向量机最优核函数及核参数:

对训练集中的样本进行训练,将归一化处理后训练集中的气体含量作为支持向量机的输入,以相对应的变压器状态作为相应的输出,首先设定核函数和参数中c∈[-5,5],g∈[-4,4],然后设定c的步长和g的步长,在遍历c,g范围的同时,对于每个不同的c,g组合,用网络搜索法的交叉验证算法确定该参数下准确率最高的组值作为c,g最优参数;得到的结果见图2。采用得到的最优参数建立支持向量机分类模型;向量机分类模型的关键是核参数的确定,核参数确定了,用libsvm工具箱直接就可以建立分类模型。

本发明中,核函数为高斯径向基核函数,数学表达式为:k(x,xi)=exp(-γ|u-v|2);c表示惩罚因子,g用来设置核函数中的γ参数。

惩罚参数c和参数g的选择,对于svm诊断的准确率影响很大,c值过大或过小,都会使系统的泛化能力变差。svm最佳参数选择目前还没有十分好的方法,本发明通过用网络搜索法的交叉验证算法确定该参数下准确率最高的组值作为c,g最优参数,准确率高。本实施例第一步的步骤(3)中,c的步长为0.5,g的步长为0.5。

支持向量机的难点在于核函数及核参数的确定。所给的数据不同,核函数及核参数也不同。核函数本发明用高斯径向基函数,其对应的核参数就是c,g。这两个参数确定了,模型理论上就确定了。c,g参数的确定是使用网格搜索法确定的,使用网格搜索法确定c,g参数是现有技术。本实施例c=16,g=0.7,交叉验证准确率为60%。

本实施例图2中显示了网格搜索法的过程,即参数寻优的过程。

(4)用步骤(2)中归一化处理后的测试集的样本数据对训练后的测试集的样本数据进行验证,本步骤的作用是用新数据来验证建立模型的好坏。具体为:用步骤(2)中归一化处理后的测试集的样本数据带入步骤(3)得到的支持向量机分类模型,将气体含量作为支持向量机分类模型的输入,以变压器状态作为相应的输出,得到支持向量机分类模型的结果,然后和测试集的样本数据结果进行比对,准确率达70%以上说明步骤(3)的支持向量机分类模型建立成功,否则重新进行步骤(3)建立支持向量机分类模型。

本步骤通过将已知故障类型的样本带入步骤(3)中建立的模型中,得到模型的诊断结果,诊断结果见表1最后一列内容,然后将模型的诊断结果和已知故障类型比对,计算准确率,也就是表1最后一列分类结果和倒数第二列实际故障进行比对,其中编号9、12、19、20、22这5项用本发明模型分类得到的故障类型和实际故障不一致。准确率的计算为比对一致的样本数量除以样本总数量然后乘以100%。本实施例中,准确率为(30-5)/30=0.8333,0.8333*100%=83.33%,说明本实施例的支持向量机分类模型准确率为83.33%,满足使用要求,建立的支持向量机分类模型可用。

图3为本发明实施例测试集的测试结果示意图。圆圈带点图例的意思是测试集分类结果与原故障类型相同,也就是代表分类正确。

二、对未知故障的变压器进行故障诊断

电力变压器内部发生故障时会出现过热现象的,变压器油由于受热会分解出表征相应故障类型的特征气体。故障类型不同,特征气体含量不同。根据gb-t7252-2001准则,特征气体种类为h2、ch4、c2h6、c2h4和c2h2。通过油气分离技术,从电力变压器油中脱离出上述气体并记录其含量。

建立好支持向量机分类模型后就可以用来对未知故障的变压器进行诊断,从待诊断的未知故障的变压器中脱离出h2、ch4、c2h6、c2h4和c2h2五种气体并记录其含量,带入上述建立好的支持向量机分类模型中,得到相应的故障类型,结果见图3所示。

表130组测试集样本数据信息

本发明用多分类支持向量机,挖掘数据中的规律。通过将已有的变压器故障数据分为训练集和测试集,用训练集的数据找出规律,测试集来验证规律是否正确,以分类正确率来衡量找出的规律是否正确,然后建立支持向量机变压器故障诊断模型,本发明建模的过程为以变压器油中5种主要特征气体作为支持向量机的输入,以5种变压器状态作为相应的输出,选用径向基核,使用网格搜索法得到优化参数,充分发挥了支持向量机具有较高泛化能力的优势。。对于未知故障的变压器诊断时,将5中特征气体的含量带入建立的支持向量机变压器故障诊断模型,然后得出故障类型结论。

本发明基于支持向量机变压器故障诊断模型对于提早发现变压器内部可能存在的缺陷或性能劣化起到了不容替代的作用,能够为设备检修提供初期判断,减少了重大事故的发生率,降低了设备的维护数量和维修费用,为真正实现输变电设备状态检修提供了有力的技术手段。

本文方法能够在较大范围内准确地找到相应的优化参数,并能有效地进行变压器的故障诊断。实测样本正确率高达83.3%。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1