基于遗传算法优化装袋算法的电力变压器故障诊断方法

文档序号:10697808阅读:422来源:国知局
基于遗传算法优化装袋算法的电力变压器故障诊断方法
【专利摘要】本发明公开了一种基于遗传算法优化装袋算法的电力变压器故障诊断方法,具体按照以下步骤实施:步骤1,对利用DGA技术获得的五种变压器油中溶解气体进行数据预处理,并构建输入样本集,步骤2,利用训练样本集D’对Bagging?CART算法进行训练,得到一系列CART基分类器,同时对待分类样本进行分类,步骤3,采用遗传算法对得到的全部E个CART基分类器进行选择,由于全部CART基分类器中存在相似甚至相同,以及分类性能不好的基分类器,采用遗传算法选择出部分性能优越,差异性大的基分类器,步骤4,得到待分类样本的最终分类结果,即变压器故障类别。本发明的方法能以此来对变压器故障状态进行更为精确有效的判定。
【专利说明】
基于遗传算法优化装袋算法的电力变压器故障诊断方法
技术领域
[0001] 本发明属于变压器在线监测与故障诊断技术领域,具体设及一种基于遗传算法优 化装袋算法的电力变压器故障诊断方法。
【背景技术】
[0002] 电力系统是一个复杂且联系紧密的系统,各个环节相互依存,互相影响。油浸式大 型变压器是目前电力系统应用最为广泛的变压器,是重要的枢纽设备,在变电和配电环节 扮演着重要角色,承担着转换电压等级、变换交流电能的作用。但由于变压器内部构造十分 复杂,在运行过程中,内部故障、外部因素 W及老化等都会造成绝缘油裂解乃至材质劣化, 造成变压器擁痕,给电网运行造成严重后果。油浸式变压器在运行时,绝缘油纸会裂解产生 各种气体,运些气体和变压器状态有着相当紧密的联系。油中溶解气体分析(Dissolved Gas Analysis,简称DGA)技术因其科学合理性成为充油设备最常用的监测方法,该技术可 为变压器故障诊断提供了数据基础。在该技术的基础上,衍生出一系列故障诊断方法。目 前,传统变压器故障诊断方法存在编码不全,编码区间划分过于硬性,应用时需要丰富的工 作经验等缺陷。而单一智能故障诊断方法存在初始参数设定困难,泛化能力较差等问题,审U 约了故障诊断准确率的提升。因此,对电力变压器进行深入的故障诊断研究,对指导变压器 的运行维护和状态检修具有重要的理论和实际意义。

【发明内容】

[0003] 本发明的目的是提供一种基于遗传算法优化装袋算法的电力变压器故障诊断方 法,W此来对变压器故障状态进行更为精确有效的判定。
[0004] 本发明所采用的技术方案是,
[0005] 基于遗传算法优化装袋算法的电力变压器故障诊断方法,具体按照W下步骤实 施:
[0006] 步骤1,对利用DGA技术获得的五种变压器油中溶解气体进行数据预处理,并构建 输入样本集,
[0007] 步骤2,利用训练样本集D'对Bagging-CART算法进行训练,得到一系列CART基分类 器,同时对待分类样本进行分类,
[000引步骤3,采用遗传算法对步骤2中的到的全部E个CART基分类器进行选择,由于全部 CART基分类器中存在相似甚至相同,W及分类性能不好的基分类器,采用遗传算法选择出 部分性能优越,差异性大的基分类器,
[0009] 步骤4,得到待分类样本的最终分类结果,即变压器故障类别。
[0010] 本发明的特征还在于:
[0011] 步骤1具体按照W下步骤实施:
[0012] 步骤1.1,将氨气、甲烧、乙烧、乙締、乙烘运五种典型特征气体的原始含量作为属 性数据,分别记为41、42、43、44、45,心~45都是由多个属性值组成的向量,假设采集了4次数 据,贝ljAi= {an ,日21,,aii,,aki},A2= (ai2,日22,,ai2,,ak2},A3= (ai3 ,日23,,ai3,, 曰k3 } , A4 二{曰14 ,日24 ,...,化4 ,...,曰k4 } , A己二{曰]_己,a化,...,曰i己,...,曰kS },
[001 ;3 ]设Xi = {ail, ai2, ai3, ai4,ai日访其中第i个样本中的属性集,
[0014] 则相对应的变压器故障类型记为yi,yieY=化,Υ2,···,Υη},
[001引那么原始样本集为D={(xi,yl) ,(X2,y2),...,(Xi,yi),...,(Xk,yk)},其中(Xi,yi)代 表一个样本.
[0016]步骤1.2,对原始属性数据XI按式(1)进行最小最大规范化处理,将原始属性值映 射到[(U]区间,
[001 7] dnew二(dor-cUin)/(cUax-cUin) (1)
[0018]其中,cU是原始数据,dmin是原始数据中的最小值,cUx是原始数据中的最大值,dnew 为归一化后的数据,经归一化后的属性集为Bi = {bil,bi2,bi3,bi4,bi5};
[0019] 步骤1.3,对归一化后的属性数据Xi'进行维规约处理,使Cii = bi2/bii,Ci2 = bi4/ bi3,Ci3 = bi日/bi4使原始数据由5维降至3维,Ci = kii,Ci2,Ci3 }为经步骤1 .巧P步骤1.2两步数 据预处理后的属性集。
[0020] 贝ij算法的新样本集知)' = {(Ci,yi),(C2,y2),...,(Ci,yi),...,(Ck,yk)};
[0021] 步骤1.4,将新的样本集D '作为算法的训练样本集,X = {ai,日2,日3,日4,日日}为经过步 骤1.2和步骤1.3处理后的待分类样本。
[0022] 步骤2具体按照W下步骤实施:
[0023] 步骤2.1,Bagging算法参数初始化,Bagging算法只有一个参数需要事先设定,即 迭代次数。设迭代次数为E化为正整数),初始化迭代次数t = l;
[0024] 步骤2.2,由D '经重采样技术得到第t次迭代所需的训练样本集dt; t表示第t次迭 代;
[0025] 步骤2.3,采用dt构建一个CART基分类器h(t),具体步骤如下:
[00%]步骤2.4,判断迭代次数t是否小于E,
[0027] 若*祐,则t = t+1,重复步骤2.2和步骤2.3;
[002引若。E,则停止迭代,得至化个CART基分类器{Ii,12,…,It,…,Ie}。
[0029] 步骤2.5,采用E个CART基分类器对待分类样本X = {ai,日2,日3,日4,日日}进行分类。
[0030] 步骤2.3具体按照W下步骤实施,
[0031 ]步骤2.3.1,设训练样本集dt包含m个类别,即m个变压器的状态类型,则Gini指数 的计算式为:
[0032]
(2)
[0033] 其中,表示节点N处属于类别j(jem)的样本数占总样本数的比重;
[0034] 步骤2.3.2,Gini指数需要考虑Ai~As每个属性的二元划分,假定某个属性A的二元 划分将dt划分成dtL和dtR,则此次在节点N处W某属性A划分样本集dt的Gini指数改变量为:
[0035]
C3)
[0036] 其中,N是分裂节点;|dtL|/d康示节点N中左分支样本数占总数的比例,|dtR|/d康 示节点N中右分支样本数占总数的比例;G(化)和G(Nr)分别表示分裂后左右分支节点的Gini 指数。
[0037] 步骤2.3.3,对Ai~As每个属性,考虑所有可能的二元划分,均按式(2)和式(3)计算 Gini指数改变量,选择Gini指数改变量最小的属性Af (f = 1,2,3,4,5)作为节点N的分裂属 性,产生最小Gini指数改变量的子集作为分裂子集。按照此规则,W训练样本集dt作为根节 点,由上至下不断分裂,在满足下述条件之一时停止建树:①所有叶节点中的样本数为1;② 所有叶节点中的样本属于同一类。至此,整棵分类回归树生长完成,得到一个CART基分类 器。
[0038] 步骤2.5具体按照W下步骤实施:
[0039] 步骤2.5.1,在待分类样本X中的五个属性ai~as中寻找和分类回归树的根节点属 性相同的属性;
[0040] 步骤2.5.2,按照已经生成的分类回归树中的规则,寻找该属性处同根节点相同的 属性值,判断待分类样本属于左右哪一分支子集,寻找到下一子节点,进而继续进行属性匹 配;
[0041] 步骤2.5.3,通过CART分类回归树自顶向下,逐层查找,得出最终的变压器故障诊 断结果即得出故障类别;
[0042] 步骤2.5.4,重复进行步骤2.5.1至步骤2.5.3,得到对应于待分类样本的E个故障 类别,设运E个故障类别表示为F=化,f2,…,托}。
[0043] 步骤3具体按照W下步骤实施,
[0044] 步骤3.1,设置遗传算法编码长度为固定值E,设定群体规模GpDp_size,交叉概率 Gcross_rate ? 变异概率Gmutate_rate,终止代数S ;
[0045] 步骤3.2,使用二进制编码方式全部基分类器进行编码,每个基分类器相当于等位 基因,对应编码值0或者1,基因值为1表示该基分类器被选中,基因值为0表示基分类器未被 选中,不同的二进制基因编码串表示不同的个体,共有r = 2E个体组成群体Q={qi,q2,···, Qi,...,屯}
[0046] 步骤3.3,对个体qi进行适应度评价。由于需要选择出一种基分类器组合使最终的 强分类器泛化性能最优,因此,可W将最终的强分类器的十折交叉验证准确度作为适应度 评价函数,
[0047] 步骤3.4,对群体Q进行选择操作。采用轮盘赌算子进行选择运算,使适应性强的个 体W-个较高的概率为下一代贡献1个或多个后代。但是由于运种选择具有随机性,在选择 的过程中可能会丢失比较好的个体,所W同时使用精英机制,将前代最优个体直接选到下 一代中;
[0048] 步骤3.5,对群体Q进行交叉操作。采用交叉算子产生新个体。本文采用单点交叉算 子将上述通过选择运算得到的个体W随机方式配对,然后随机选择交叉位置,已配对的染 色体互相交换交叉位置W后二进制基因串(包括交叉位置)。交叉运算是产生新个体的主要 方法;
[0049] 步骤3.6,对群体Q进行变异操作。利用变异算子产生新个体。本文采用单点变异算 子,随机选择变异个体,再随机选择变异位置,对该位置的二进制数字进行变异,也就是1变 成0,0变成1。变异运算是产生新个体的辅助方法;
[0050] 步骤3.7,循环进行步骤3.3至步骤3.6,直到达到预设的终止迭代数S;
[0051 ]步骤3.8,对群体Q中所有个体的适应度值进行排序,选择适应度值最大的个体作 为最优个体qbest,即就是最佳基分类器组合。
[0052] 步骤3.3具体实施步骤如下:
[0053] 步骤3.3.1,将训练集D'平均分成10份,每一份都包含所有变压器故障类别,运10 份样本集分别为D'i,D'2,…,D'lo;
[0054] 步骤3.3.2,把D ' 1,D ' 2,…,D ' 9作为适应度评价阶段的训练样本集Dtr = {D ' 1,D ' 2,…,D ' 9 },剩下的一份D ' 10作为适应度评价阶段的验证样本集Dval = D ' 10 ;
[0055] 步骤3.3.3, WDtr代替步骤2中的D'执行步骤2中的(1)~(4),得到适应度评价阶段 Ega=E个CART基分类器{: Ji,J2,…,Jt,…,化};
[0化6] 步骤3.3.4,在Ega个基分类器中选择出编码为1的CART基分类器对验证样本集Dval 进行分类,并对分类结果进行多数投票集成,最终的变压器故障诊断结果为:
[0057]
(4)
[005引其中1( ·)是一个指标函数,当括号内为真,则I为1,反之为0;h(t)为第t个基分类 器的分类结果;
[0059] 步骤3.3.5,再把D'9作为适应度评价阶段的验证样本集Dval = D'9,剩下的九份作为 适应度评价阶段的训练样本集Dvai = D'i〇,再次执行步骤3.3.3至步骤3.3.4,循环10次,每份 样本集轮流作为验证集。其实就是把D ' 1到D ' 9轮流执行一次步骤3.3.3和3.3.4;
[0060] 步骤3.3.6,对当前个体qi进行适应度评价,W最终的强分类器的十折交叉验证准 确度作为适应度评价函数,定义如下:
[0061 ]
(5)
[0062] 其中,e为交叉验证时每份数据集所包含的样本数,出神日5^分别为第j份样本集中 第i个验证样本的集成预测故障类别和实际变压器故障类别。f表示个体qi的值。
[0063] 步骤4具体为:
[0064] 根据最优个体qbest的编码,选出和编码值1相对应的部分CART基分类器进行集成, 得到最终的强分类器并对待分类样本进行故障类别判断。根据选出的最优个体qbest的二进 制编码串,选择出编码为1的CART基分类器,对应步骤2中的2.5.4的待分类样本分类结果F = {fl,f2,…,托},将选择出的基分类器的对应分类结果G={G(l),G(2),…,G(z-l),G(z)} eF进行最终的集成,集成方式仍采用式(3)所示的多数投票方式,得到待分类样本的最终 分类结果,即变压器故障类别。
[0065] 本发明的有益效果是:本发明的方法考虑到变压器故障诊断的实质是多分类问 题,W油中溶解气体分析(Dissolved Gas Analysis,简称DGA)技术为基础,由于单一分类 回归树(Classification and Regression Trees,简称CART)算法的故障诊断准确度不高, 将CART算法作为基分类器,采用装袋(Bagging)算法对CART算法进行集成,从而提高单一 CART算法的准确度。但是考虑到在集成过程中会产生相似甚至相同的基分类器,降低了基 分类器之间的差异性,影响最终强分类器的泛化能力,故进一步采用遗传算法(Genetic Algorithm,简称GA)作为一种全局寻优算法,从全部基分类器中选择出最优的部分基分类 器进行集成,即选择性集成,w此提高变压器的故障诊断准确度。
【附图说明】
[0066] 图1是本发明基于遗传算法优化装袋算法的电力变压器故障诊断方法的整体流程 图;
[0067] 图2是本发明的基于遗传算法优化装袋算法的电力变压器故障诊断方法中 Bagging-CART算法流程图;
[0068] 图3是本发明的基于遗传算法优化装袋算法的电力变压器故障诊断方法中使用的 CART基分类器模型示意图。
【具体实施方式】
[0069] 下面结合附图和【具体实施方式】对本发明进行详细说明。
[0070] 本发明基于遗传算法优化装袋算法的电力变压器故障诊断方法,W油中溶解气体 分析(Dissolved Gas AnalysiS,简称DGA)技术获得的五种油中溶解气体:氨气化2)、甲烧 (CH4 )、乙烧(C2H6 )、乙締(C2H4)、乙烘(C2H2)作为方法的输入属性,将分类回归树 (Classification and Regression Trees,简称CART)算法作为基分类器,采用装袋 (Bagging)算法对CART算法进行集成,得到装袋分类回归树组合(Bagging-CART)算法,再采 用遗传算法(Genetic Algorithm,简称GA)对Bagging-CART算法进行优化,GA优化Bagging- CART算法变压器故障诊断模型如附图1,具体按照W下步骤实施:
[0071] 步骤1,对利用DGA技术获得的五种变压器油中溶解气体进行数据预处理,并构建 输入样本集,具体步骤如下:
[00巧步骤1.1,将氨气化)、甲烧(邸4)、乙烧(C2此)、乙締侣出)、乙烘(C2出)运五种典型 特征气体的原始含量作为属性数据,分别记为41、42、43、44、45,41~45都是由多个属性值组 成的向量,假设采集了k次数据,则Ai = {曰11,曰21,…,ail,…,aki},A2 = {曰12,曰22,…,ai2,…, 曰 k2 } 'As二{曰13,日23,...,曰曰 k3 } ,A4 二{曰14,日24,...,曰曰 k*} ,As= {曰化,曰化,曰:?5,..., 祉已},
[007;3]设Xi= {曰。沖2沖3,曰14,曰巧}为其中第:[个样本中的属性集,
[0074] 则相对应的变压器故障类型记为yi,yieY=化,Υ2,···,Υη},
[007引那么原始样本集为D= {(xi,yi),(X2,y2),…,(xi,yi),…,(xk,yk)},其中(xi,yi)代 表一个样本.
[0076] 步骤1.2,对原始属性数据XI按式(1)进行最小最大规范化处理,将原始属性值映 射到[(U]区间,
[0077] dnew二(dor-cUin)/(cUax-cUin) (1)
[0078] 其中,CU是原始数据,cUin是原始数据中的最小值,cUx是原始数据中的最大值,dnew 为归一化后的数据,经归一化后的属性集为Bi = {bil,bi2,bi3,bi4,bi5};
[0079] 步骤1.3,对归一化后的属性数据Xi'进行维规约处理,使Cii = bi2/bii,Ci2 = bi4/ bi3,Ci3 = bi日/bi4使原始数据由5维降至3维,Ci = kii,Ci2,Ci3 }为经步骤1 .巧P步骤1.2两步数 据预处理后的属性集。
[0080] 贝ij算法的新样本集为D' = {(Ci,yi),(C2,y2),···,(Ci,yi),…,(Ck,yk)};
[0081 ]步骤1.4,将新的样本集D '作为算法的训练样本集,X = {ai,日2,日3,日4,日日}为经过步 骤1.2和步骤1.3处理后的待分类样本。
[0082]步骤2,利用训练样本集D'对Bagging-CART算法进行训练,得到一系列CART基分类 器,同时对待分类样本进行分类,方法的流程图如附图2所示,具体实施步骤如下:
[0083]步骤2.1,Bagging算法参数初始化,Bagging算法只有一个参数需要事先设定,即 迭代次数。设迭代次数为E化为正整数),初始化迭代次数t = l;
[0084] 步骤2.2,由D '经重采样技术得到第t次迭代所需的训练样本集dt; t表示第t次迭 代;
[0085] 步骤2.3,采用dt构建一个CART基分类器h(t),具体步骤如下:
[0086] 步骤2.3.1,设训练样本集dt包含m个类别,即m个变压器的状态类型,则Gini指数 的计算式为:
[0087]
(2)
[008引其中嘶表示节点N处属于类别j(jem)的样本数占总样本数的比重;
[0089] 步骤2.3.2,Gini指数需要考虑Ai~As每个属性的二元划分,假定某个属性A的二元 划分将dt划分成dtL和dtR,则此次在节点N处W某属性A划分样本集dt的Gini指数改变量为:
[0090]
(3)
[0091] 其中,N是分裂节点;|dtL|/d康示节点N中左分支样本数占总数的比例,|dtR|/d康 示节点N中右分支样本数占总数的比例;G(化)和G(Nr)分别表示分裂后左右分支节点的Gini 指数。
[0092] 步骤2.3.3,对Ai~As每个属性,考虑所有可能的二元划分,均按式(2)和式(3)计算 Gini指数改变量,选择Gini指数改变量最小的属性Af(f= 1,2,3,4,5)作为节点N的分裂属 性,产生最小Gini指数改变量的子集作为分裂子集。按照此规则,W训练样本集dt作为根节 点,由上至下不断分裂,在满足下述条件之一时停止建树:①所有叶节点中的样本数为1;② 所有叶节点中的样本属于同一类。至此,整棵分类回归树生长完成,得到一个CART基分类 器,CART基分类器模型如附图3所示;
[0093] 步骤2.4,判断迭代次数t是否小于E,
[0094] 若*祐,则t = t+1,重复步骤2.2和步骤2.3;
[009引若。E,则停止迭代,得至化个CART基分类器{Ii,12,…,It,…,Ie}。
[0096] 步骤2.5,采用E个CART基分类器对待分类样本X = {ai,日2,日3,日4,日日}进行分类,具体 按照W下步骤实施:
[0097] 步骤2.5.1,在待分类样本X中的五个属性ai~as中寻找和分类回归树的根节点属 性相同的属性;
[0098] 步骤2.5.2,按照已经生成的分类回归树中的规则,寻找该属性处同根节点相同的 属性值,判断待分类样本属于左右哪一分支子集,寻找到下一子节点,进而继续进行属性匹 配;
[0099] 步骤2.5.3,通过CART分类回归树自顶向下,逐层查找,得出最终的变压器故障诊 断结果即得出故障类别;
[0100] 步骤2.5.4,重复进行步骤2.5.1至步骤2.5.3,得到对应于待分类样本的E个故障 类别,设运E个故障类别表示为F=化,f2,…,托};
[0101] 步骤3,采用遗传算法对步骤2.4中的到的全部E个CART基分类器进行选择,由于全 部CART基分类器中存在相似甚至相同,W及分类性能不好的基分类器,采用遗传算法选择 出部分性能优越,差异性大的基分类器,具体步骤如下:
[0102] 步骤3.1,设置遗传算法编码长度为固定值E,设定群体规模GpDp_size,交叉概率 Gcross_rate ? 变异概率Gmutate_rate,终止代数S ;
[0103] 步骤3.2,使用二进制编码方式全部基分类器进行编码,每个基分类器相当于等位 基因,对应编码值0或者1,基因值为1表示该基分类器被选中,基因值为0表示基分类器未被 选中,不同的二进制基因编码串表示不同的个体,共有r = 2E个体组成群体Q={qi,q2,···, Qi,...,屯}
[0104] 步骤3.3,对个体qi进行适应度评价。由于需要选择出一种基分类器组合使最终的 强分类器泛化性能最优,因此,可W将最终的强分类器的十折交叉验证准确度作为适应度 评价函数,具体实施步骤如下:
[0105] 步骤3.3.1,将训练集D'平均分成10份,每一份都包含所有变压器故障类别,运10 份样本集分别为D'i,D'2,…,D'lo;
[0106] 步骤3.3.2,把D ' 1,D ' 2,…,D ' 9作为适应度评价阶段的训练样本集Dtr = {D ' 1,D ' 2,…,D ' 9 },剩下的一份D ' 10作为适应度评价阶段的验证样本集Dval = D ' 10 ;
[0107] 步骤3.3.3, WDtr代替步骤2中的D'执行步骤2中的(1)~(4),得到适应度评价阶段 Ega=E个CART基分类器{: Ji,J2,…,Jt,…,化};
[0108] 步骤3.3.4,在Ega个基分类器中选择出编码为1的CART基分类器对验证样本集Dval 进行分类,并对分类结果进行多数投票集成,最终的变压器故障诊断结果为:
[0109]
(4)
[0110] 其中1( ·)是一个指标函数,当括号内为真,则I为1,反之为0;h(t)为第t个基分类 器的分类结果。
[0111] 步骤3.3.5,再把D'9作为适应度评价阶段的验证样本集Dval = D'9,剩下的九份作为 适应度评价阶段的训练样本集Dval = D ' 10,再次执行步骤3.3.3至步骤3.3.4,
[0112] 循环10次,每份样本集轮流作为验证集。其实就是把D'l到D'9轮流执行一次步骤 3.3.3和3.3.4
[0113] 步骤3.3.6,对当前个体qi进行适应度评价,W最终的强分类器的十折交叉验证准 确度作为适应度评价函数,定义如下:
[0114]
巧)
[0115]其中,e为交叉验证时每份数据集所包含的样本数,出j和5^分别为第j份样本集中 第i个验证样本的集成预测故障类别和实际变压器故障类别。f表示个体qi的值。
[0116]步骤3.4,对群体Q进行选择操作。采用轮盘赌算子进行选择运算,使适应性强的个 体W-个较高的概率为下一代贡献1个或多个后代。但是由于运种选择具有随机性,在选择 的过程中可能会丢失比较好的个体,所w同时使用精英机制,将前代最优个体直接选到下 一代中。
[0117] 步骤3.5,对群体Q进行交叉操作。采用交叉算子产生新个体。本文采用单点交叉算 子将上述通过选择运算得到的个体W随机方式配对,然后随机选择交叉位置,已配对的染 色体互相交换交叉位置W后二进制基因串(包括交叉位置)。交叉运算是产生新个体的主要 方法。
[0118] 步骤3.6,对群体Q进行变异操作。利用变异算子产生新个体。本文采用单点变异算 子,随机选择变异个体,再随机选择变异位置,对该位置的二进制数字进行变异,也就是1变 成0,0变成1。变异运算是产生新个体的辅助方法。
[0119] 步骤3.7,循环进行步骤3.3至步骤3.6,直到达到预设的终止迭代数S。
[0120] 步骤3.8,对群体Q中所有个体的适应度值进行排序,选择适应度值最大的个体作 为最优个体qbest,即就是最佳基分类器组合,
[0121] 步骤4,根据最优个体qbest的编码,选出和编码值1相对应的部分CART基分类器进 行集成,得到最终的强分类器并对待分类样本进行故障类别判断。根据选出的最优个体 qbest的二进制编码串,选择出编码为1的CART基分类器,对应步骤2.5.4中的待分类样本分 类结果F={fl,f2,…,fE},将选择出的基分类器的对应分类结果G={Gα),G(2),…,G(z- l),G(z)}eF进行最终的集成,集成方式仍采用式(3)所示的多数投票方式,得到待分类样 本的最终分类结果,即变压器故障类别。
[0122] 本发明的有益效果是:
[0123] 针对油浸式电力变压器故障样本数据为连续性数值数据的特点,采用CART算法作 为基分类器,无需对原始数据进行离散化,可很好地处理连续属性数据。
[0124] 利用Bagging算法可W构造出高精度的强分类器,其对基分类器的要求低,只需基 分类器的分类准确率略大于50%,通过集成分类准确率低的单一算法,解决了强分类算法 难W获得的问题,实现应用都相对简单,为工程变压器故障诊断提供了一种新的思路。
[0125] 对于Bagging-CART算法中存在的不足,进一步采用遗传算法对Bagging-CART全集 成算法作选择性集成优化,建立变压器故障诊断模型。该方法直接对编码进行操作,无需解 码过程,所制定的适应度函数易于理解,可W更好的完成变压器故障诊断任务。
【主权项】
1. 基于遗传算法优化装袋算法的电力变压器故障诊断方法,其特征在于,具体按照以 下步骤实施: 步骤1,对利用DGA技术获得的五种变压器油中溶解气体进行数据预处理,并构建输入 样本集, 步骤2,利用训练样本集D '对Bagging-CART算法进行训练,得到一系列CART基分类器, 同时对待分类样本进行分类, 步骤3,采用遗传算法对步骤2中的到的全部E个CART基分类器进行选择,由于全部CART 基分类器中存在相似甚至相同,以及分类性能不好的基分类器,采用遗传算法选择出部分 性能优越,差异性大的基分类器, 步骤4,得到待分类样本的最终分类结果,即变压器故障类别。2. 根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其 特征在于,所述的步骤1具体按照以下步骤实施: 步骤1.1,将氢气、甲烷、乙烷、乙烯、乙炔这五种典型特征气体的原始含量作为属性数 据,分别记为^、如、知^4、心,^~&都是由多个属性值组成的向量,假设采集了1^欠数据,则 Ai = {an,a2i,…,aii,…,aki},A2 = {ai2,a22,…,ai2,…,ak2},A3 = {ai3,a23,…,ai3,…,ak3},A4 ={ai4, a24, · · ·, ai4, , ak4}, As = {ais, a25, · · ·, ai5, , ak5}, 设Xi = {an,ai2,ai3,ai4,ai5}为其中第i个样本中的属性集, 贝1J相对应的变压器故障类型记为· ·,Υη}, 那么原始样本集为D={(xi,yi),(X2,y2),…,(xi,yi),…,(xk,yk)},其中(xi,yi)代表一 个样本; 步骤1.2,对原始属性数据^按式(1)进行最小最大规范化处理,将原始属性值映射到 [〇,1]区间, dnew-( dor-dmin )/( dmax-dmin ) ( 1 ) 其中,cU是原始数据,d_是原始数据中的最小值,dmax是原始数据中的最大值,cUw为归 一化后的数据,经归一化后的属性集为Bi = {bil,bi2,bi3,bi4,bi5}; 步骤1.3,对归一化后的属性数据Xi '进行维规约处理,使Cil = bi2/bil,Ci2 = bi4/bi3,Ci3 = bl5/bl4使原始数据由5维降至3维,(:1={(311,(: 12,(313}为经步骤1.1和步骤1.2两步数据预处 理后的属性集; 贝1J算法的新样本集为D' = {(Ci,yi),(C2,y2),…,(Ci,yi),…,(Ck,yk)}; 步骤1.4,将新的样本集D '作为算法的训练样本集,X = {ai,a2,a3,ε?4,as}为经过步骤1.2 和步骤1.3处理后的待分类样本。3. 根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其 特征在于,所述的步骤2具体按照以下步骤实施: 步骤2.1,Bagging算法参数初始化,Bagging算法只有一个参数需要事先设定,即迭代 次数,设迭代次数为E(E为正整数),初始化迭代次数t = 1; 步骤2.2,由D '经重采样技术得到第t次迭代所需的训练样本集dt; t表示第t次迭代; 步骤2.3,采用dt构建一个CART基分类器h(t),具体步骤如下: 步骤2.4,判断迭代次数t是否小于E, 若t〈E,则t = t+Ι,重复步骤2.2和步骤2.3; 若t彡E,则停止迭代,得到E个CART基分类器{h,I2,…,It,…,IE}; 步骤2.5,采用E个CART基分类器对待分类样本X = {m,a2,a3,iu,a5}进行分类。4. 根据权利要求3所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其 特征在于,所述的步骤2.3具体按照以下步骤实施,步骤2.3.1,设训练样本集dt包含m个类别,即m个变压器的状态类型,则Gini指数的计算 式为: (2) 其中,w表示节点N处属于类别j(jem)的样本数占总样本数的比重; 步骤2.3.2,Gini指数需要考虑Αι~As每个属性的二元划分,假定某个属性A的二元划分 将dt划分成ck和dtR,则此次在节点N处以某属性A划分样本集dt的Gini指数改变量为:(3) 其中,N是分裂节点;| dtL |/dt表示节点N中左分支样本数占总数的比例,| dtR |/dt表示节 点N中右分支样本数占总数的比例;G(Nl)和G(Nr)分别表示分裂后左右分支节点的Gini指 数; 步骤2.3.3,对心~六5每个属性,考虑所有可能的二元划分,均按式(2)和式(3)计算Gin i 指数改变量,选择Gini指数改变量最小的属性Af (f=l,2,3,4,5)作为节点N的分裂属性,产 生最小Gini指数改变量的子集作为分裂子集,按照此规则,以训练样本集d t作为根节点,由 上至下不断分裂,在满足下述条件之一时停止建树:①所有叶节点中的样本数为1;②所有 叶节点中的样本属于同一类,至此,整棵分类回归树生长完成,得到一个CART基分类器。5. 根据权利要求3所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其 特征在于,所述的步骤2.5具体按照以下步骤实施: 步骤2.5.1,在待分类样本X中的五个属性ai~a5中寻找和分类回归树的根节点属性相 同的属性; 步骤2.5.2,按照已经生成的分类回归树中的规则,寻找该属性处同根节点相同的属性 值,判断待分类样本属于左右哪一分支子集,寻找到下一子节点,进而继续进行属性匹配; 步骤2.5.3,通过CART分类回归树自顶向下,逐层查找,得出最终的变压器故障诊断结 果即得出故障类别; 步骤2.5.4,重复进行步骤2.5.1至步骤2.5.3,得到对应于待分类样本的E个故障类别, 设这E个故障类别表示为F = {f i,f 2,…,ft}。6. 根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其 特征在于,所述的步骤3具体按照以下步骤实施, 步骤3.1,设置遗传算法编码长度为固定值E,设定群体规模GPC1P_S1Z(3,交叉概率 Gcross_rate ? 变异概率G mutate_rate ? 终止代数s; 步骤3.2,使用二进制编码方式全部基分类器进行编码,每个基分类器相当于等位基 因,对应编码值0或者1,基因值为1表示该基分类器被选中,基因值为0表示基分类器未被选 中,不同的二进制基因编码串表示不同的个体,共有r = 2E个体组成群体Q={qi,q2,···, qi,··· ,qr}; 步骤3.3,对个体^进行适应度评价,由于需要选择出一种基分类器组合使最终的强分 类器泛化性能最优,因此,可以将最终的强分类器的十折交叉验证准确度作为适应度评价 函数; 步骤3.4,对群体Q进行选择操作,采用轮盘赌算子进行选择运算,使适应性强的个体以 一个较高的概率为下一代贡献1个或多个后代,但是由于这种选择具有随机性,在选择的过 程中可能会丢失比较好的个体,所以同时使用精英机制,将前代最优个体直接选到下一代 中; 步骤3.5,对群体Q进行交叉操作,采用交叉算子产生新个体,本文采用单点交叉算子将 上述通过选择运算得到的个体以随机方式配对,然后随机选择交叉位置,已配对的染色体 互相交换交叉位置以后二进制基因串(包括交叉位置),交叉运算是产生新个体的主要方 法; 步骤3.6,对群体Q进行变异操作,利用变异算子产生新个体,本文采用单点变异算子, 随机选择变异个体,再随机选择变异位置,对该位置的二进制数字进行变异,也就是1变成 〇,〇变成1,变异运算是产生新个体的辅助方法; 步骤3.7,循环进行步骤3.3至步骤3.6,直到达到预设的终止迭代数S; 步骤3.8,对群体Q中所有个体的适应度值进行排序,选择适应度值最大的个体作为最 优个体qbest,即就是最佳基分类器组合。7.根据权利要求6所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其 特征在于,所述的步骤3.3具体实施步骤如下: 步骤3.3.1,将训练集D'平均分成10份,每一份都包含所有变压器故障类别,这10份样 本集分别为D'^D'2,…,D'10; 步骤3.3.2,把D ' i,D ' 2,…,D ' 9作为适应度评价阶段的训练样本集Dtr '9},剩下的一份D'1Q作为适应度评价阶段的验证样本集Dval = D'10; 步骤3.3.3,以Dtr代替步骤2中的D'执行步骤2中的(1)~(4),得到适应度评价阶段Eca= E个CART基分类器{Ji,J2,…,Jt,…,Je }; 步骤3.3.4,在Ega个基分类器中选择出编码为1的CART基分类器对验证样本集Dval进行 分类,并对分类结果进行多数投票集成,最终的变压器故障诊断结果为: ιΕ. II = argmax^/(/7(r) = j·) (4) ye¥ i=i 其中I( ·)是一个指标函数,当括号内为真,则I为1,反之为〇;h(t)为第t个基分类器的 分类结果; 步骤3.3.5,再把1)'9作为适应度评价阶段的验证样本集1)^ = 1)'9,剩下的九份作为适应 度评价阶段的训练样本集Dval = D'1Q,再次执行步骤3.3.3至步骤3.3.4,循环10次,每份样本 集轮流作为验证集,其实就是把D ' ^IjD ' 9轮流执行一次步骤3.3.3和3.3.4; 步骤3.3.6,对当前个体^进行适应度评价,以最终的强分类器的十折交叉验证准确度 作为适应度评价函数,定义如下:及-I1,分".=·、'" 馬?〇:,其他 (5) 其中,e为交叉验证时每份数据集所包含的样本数,Hij和yij分别为第j份样本集中第i个 验证样本的集成预测故障类别和实际变压器故障类别,f表示个体9:的值。8.根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其 特征在于,所述的步骤4具体为: 根据最优个体qbest的编码,选出和编码值1相对应的部分CART基分类器进行集成,得到 最终的强分类器并对待分类样本进行故障类别判断,根据选出的最优个体qbest的二进制编 码串,选择出编码为1的CART基分类器,对应步骤2中的2.5.4的待分类样本分类结果F = {&彳2,…,fE},将选择出的基分类器的对应分类结果G= {G(l),G(2),…,G(z-l),G(z)} eF 进行最终的集成,集成方式仍采用式(3)所示的多数投票方式,得到待分类样本的最终分类 结果,即变压器故障类别。
【文档编号】G06K9/62GK106067066SQ201610378057
【公开日】2016年11月2日
【申请日】2016年5月31日 公开号201610378057.4, CN 106067066 A, CN 106067066A, CN 201610378057, CN-A-106067066, CN106067066 A, CN106067066A, CN201610378057, CN201610378057.4
【发明人】黄新波, 李文君子, 魏雪倩, 徐冠华, 王玉鑫, 吴孟魁
【申请人】西安工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1