基于无监督机器学习的变压器油温异常识别方法与流程

文档序号:15047892发布日期:2018-07-27 23:07阅读:367来源:国知局
本发明涉及变压器顶层油温异常识别方法,属于电网设备状态监测与风险预警
技术领域

背景技术
:在对此方法的研究和实践过程中,本发明的发明人发现:变压器是电力系统能源传递的核心组件,价格昂贵,技术复杂,而变压器的油温和变压器的使用寿命是密切相关的,油温过高会严重缩短变压器使用寿命。在变压器负载运行过程中,必须保证其油温在相应的温度区间。根据变压器的工作状况和环境温度等特征,分析当前油温在工作状况下是否异常。参考工况属性特征如表1所示。一方面可以保证变压器在安全可靠的前提下,充分利用其负载能力;另一方面可以及时发现变压器过热故障。表1油温异常工况常见属性特征举例表特征名特征描述特征名特征描述yg_yc_g主变高压侧有功遥测dlz_yc_g主变高压侧电流值遥测yg_yc_d主变低压侧有功遥测dlz_yc_d主变低压侧电流值遥测yg_yc_z主变中压侧有功遥测dlz_yc_z主变中压侧电流值遥测wg_yc_g主变高压侧无功遥测dlfza_yc_g主变高压侧a相电流副值wg_yc_d主变低压侧无功遥测dlfza_yc_d主变低压侧a相电流副值wg_yc_z主变中压侧无功遥测dlfza_yc_z主变中压侧a相电流副值glys_yc_g主变高压侧功率因数遥测rzwda_yc主变a相绕组温度glys_yc_d主变低压侧功率因数遥测yw1a_yc主变a相油温1glys_yc_z主变中压侧功率因数遥测hjwd环境温度目前,变压器油温的计算、预测和异常分析,主要采用了基于变压器修正热路模型技术、基于变压器油色谱判别技术和基于顶层油温异常探测技术三大类技术路线,往往存在、设备成本高、通用性差,精度不高、实时性不强等弱点,且不能适应大数据时代国家电网的发展需求。k-means算法是一种基于样本间相似性度量的间接聚类方法,属于非监督学习方法。此算法以k为参数,把n个对象分为k个簇,以使簇内具有较高的相似度,而且簇间的相似度较低。k-means算法具有以下优点:(1)算法能根据较少的已知聚类样本的类别对树进行剪枝确定部分样本的分类;(2)为克服少量样本聚类的不准确性,该算法本身具有优化迭代功能,在已经求得的聚类上再次进行迭代修正剪枝确定部分样本的聚类,优化了无监督学习样本分类不合理的地方;(3)聚类时间复杂度低。决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的决策规则,然后使用决策规则对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。决策树算法具有以下优点:(1)决策树易于理解和实现,人们在通过解释后都有能力去理解决策树所表达的意义。(2)在相对短的时间内能够对大型数据源做出可行且效果良好的结果。(3)可以处理不相关特征数据(4)效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度。技术实现要素:本发明的目的:提供一种基于无监督机器学习的变压器油温异常识别方法。本方法有效缓解现有的变压器异常状态的识别方法往往存在、设备成本高、通用性差,精度不高、实时性不强等难题。适应大数据时代国家电网的发展需求。本发明的方案:首先利用无监督机器学习k-means算法对变压器的工作状况训练数据集进行聚类,得到变压器设备不同工况类簇的划分然后,统计聚类获得的每一类样本数据中的各类油温对象在本类簇中的条件概率。当条件概率小于给定阈值时,该簇中对象标注为异常油温,反之标注为正常。对标注后的训练数据集实施决策树算法,提取决策规则。应用测试数据集对提取的决策规则进行测试,如果油温异常判定的准确率低于指定要求,则调整判定油温异常的条件概率阈值,重新标注数据,并实施决策规则提取算法,重新测试。直至提取的决策规则在测试数据集上,油温异常判定的准确率大于等于指定要求。本发明的具体步骤如下:1)输入训练样本数据集x={x1,x2,lxm}。每个对象xi∈x的油温,以指定的温度数值nc0为间隔进行油温离散化标注。例如0c0→nc0区间标注为温度t0,nc0→(2n)c0区间标注为温度t1,以此类推,即油温离散化后的标识集合为t={t0,t1,...ti}。2)根据除油温以外工况特征向量,对数据集x实施k-means聚类算法,获得k个类簇集合u。其中第j个类簇记为uj,其中0<j≤k;3)统计聚类获得的每一类簇中,各同类油温对象在本类簇中的条件概率p。例如第j个类簇uj中第j种温度类型ti的对象集占簇uj所有对象的条件概率记为p(i|j),其中4)将每个聚类中的每个温度分类的条件概率p(i|j)与异常判定阈值α进行比较。如果p≥α的油温样本定义为正常样本posx,如果p<α则标识为异常样本negx。5)将标注后的油温训练集数据集x={x1,x2,lxm}输入决策树算法进行训练,得到决策树模型,并提取油温异常识别决策规则。6)应用专家已经标注油温异常的测试数据集xtest对提取的油温异常识别决策规则进行测试。并且统计识别准确率r。7)设定识别准确率预期目标γ,如果识别准确率r<γ,则令α=α+λ,其中λ为一常数,并且返回步骤4)。如果r≥γ,则输出步骤5)获得的决策规则作为油温异常分离器匹配规则。本发明的优点是:本发明技术方案能够根据变压器工况数据进行变压器设备顶层油温异常识别规则,不需要另外购置油温异常识别光电设备。为电网运维管控人员提供了一种有效的变压器油温异常判定方法。附图说明图1为基于无监督机器学习的变压器油温异常识别方法流程图。具体实施方式为使本发明的发明目的、技术方案和优势更加清楚,下面将对本发明的实施方式做出进一步的描述。1)训练数据集x={x1,x2,lxm}中油温分布区间为(-37c0,150c0),每个对象记录的油温按照每10c0间隔进行油温离散化处理,例如-37c0→-30c0作为取值t0,-30c0→-20c0作为取值t1,以此类推得到温度区间集合t={t0,t1,...,t18}。2)根据除油温以外工况特征向量,对数据集x实施k-means聚类算法,获得k个类簇。其中第j个类簇记为uj,其中0<j≤k;聚类过程如下:2.1)随机选取k个聚类质心点为u1,u2,l,uk∈x。重复下面过程直到收敛;2.2)对于每一个样例xi∈x,计算xi与k个质心点向量的欧式距离dist,uj为第j个质心,1≤j≤k,dist计算公式如下:dist(xi,uj)=||xi-uj||2其中,与xi距离最小的质心点uj所属类别j为xi的类别,记作ci,计算公式如下:2.3)对于每一个类j,重新计算j类的质心,计算公式如下:其中3)统计聚类获得的每一类簇中,各同类油温对象在本类簇中的条件概率p。例如第j个类簇uj中第i种温度类型ti的对象集占簇uj所有对象的条件概率记为p(i|j),其中4)将每个聚类中的每个温度分类的条件概率p与阈值α=0.01进行比较。如果p≥α的油温样本定义为正常样本posx,如果p<α则标识为异常样本negx。5)将标注后的油温训练集数据集x={x1,x2,lxm}输入决策树算法进行训练,得到决策树模型,并提取油温异常识别决策规则。其中决策树训练过程如下:5.1)将x作为决策树根节点,循环下列过程直至所有节点无需再分裂;5.2)设d为用类别对x进行的划分,则d的熵表示为:其中pi表示第i个类别在xtrain中出现的概率,可以用属于此类别元素的数量除以训练元组元素总数量作为估计。5.3)将训练元组d按属性a进行划分,则a对d划分的期望信息为其中v为属性a的可能取值,v∈v表示属性a的某一取值,dv表示d中取值为v的样本,而信息增益即为两者的差值:gain(a)=inf(d)-infa(d)5.4)选择增益最大的属性进行分裂。6)应用专家已经标注油温异常的测试数据集xtest,其中异常样本集合为对提取的油温异常识别决策规则进行测试。并且统计异常识别准确率r,计算公式如下7)设定异常识别准确率预期目标γ=90%,如果异常识别准确率r<γ,则令α=α+λ,其中λ=0.01为一常数,并且返回步骤4)。如果步骤r≥γ,则输出步骤5)获得的决策规则作为油温异常分离器匹配规则。综上所述,本发明提供了一种基于无监督机器学习算法的变压器油温异常识别方法。该方法通过k-means聚类对变压器设备工作状态进行建模分析,以各同类油温对象在本类簇中的条件概率作为当前油温在相应工作状态下是否异常的分析指标。同时通过异常识别准确率反馈来不断自适应学习异常判定阈值,提高模型的可靠性和稳定性的同时简化了异常识别决策规则的复杂性。某主变设备a项油温异常识别实验结果如表2所示。(通过与pms中报告的异常比对,最后计算异常标注准确率为93.82%。而采用变压器油色谱异常探测的油温预警方法同类实验对象仅有86%的异常识别准确率。因此本算法在识别效果上明显优于传统的油色谱异常探测方法。表2异常识别阈值与异常识别准确率结果表总之,以上所述仅为本发明的一个应用实例,而并非对实施方式的限定。由本发明所引伸出的明显变化和修饰皆处于本发明的涵盖范围之中。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1