一种基于聚类分析和云模型的智能电表故障分类方法

文档序号:10510766阅读:273来源:国知局
一种基于聚类分析和云模型的智能电表故障分类方法
【专利摘要】本发明涉及一种基于聚类分析和云模型的智能电表故障分类方法,包括以下步骤:1)获取历史智能电表故障数据样本点,并采用K?means算法将历史智能电表故障数据样本点分为K个故障大类以及每个大类对应的中心值;2)将每个大类对应的中心值作为样本均值,每个故障大类包含的智能电表故障数据样本点作为数据点,生成对应的K级电能表故障云模型;3)采用逆向正态云发生器对电能表故障云模型进行计算,获取电能表故障云模型的定性云特征;4)根据定性云特征将K个故障大类下分为多个故障小类。与现有技术相比,本发明具有定性分析、分类细致等优点。
【专利说明】
一种基于聚类分析和云模型的智能电表故障分类方法
技术领域
[0001] 本发明涉及智能电表故障分类方法,尤其是涉及一种基于聚类分析和云模型的智 能电表故障分类方法。
【背景技术】
[0002] 计算机和网络技术的迅猛发展,使得信息获取和分析手段日益先进,数据挖掘己 成为企业、机构研究数据规律的重要工具,数据挖掘平台主要分为存储计算平台和数据挖 掘算法,针对现有智能电能表数据特点,现在的智能电能表故障数据数量庞杂繁多,还没有 一种定性分析的方法能够将其按故障类型分开,现急需一种由定量向定性的故障分析分类 方法。

【发明内容】

[0003] 本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种定性分析、分类 细致的基于聚类分析和云模型的智能电表故障分类方法。
[0004] 本发明的目的可以通过以下技术方案来实现:
[0005] -种基于聚类分析和云模型的智能电表故障分类方法,包括以下步骤:
[0006] 1)获取历史智能电表故障数据样本点,并采用K-means算法将历史智能电表故障 数据样本点分为K个故障大类以及每个大类对应的中心值;
[0007] 2)将每个大类对应的中心值作为样本均值,每个故障大类包含的智能电表故障数 据样本点作为数据点,生成对应的K级电能表故障云模型;
[0008] 3)采用逆向正态云发生器对电能表故障云模型进行计算,获取电能表故障云模型 的定性云特征;
[0009] 4)根据定性云特征将K个故障大类下分为多个故障小类。
[0010]所述的步骤1)具体包括以下步骤:
[0011] 11)选择K个历史智能电表故障数据样本点作为初始故障大类的聚类中心;
[0012] 12)对剩余的历史智能电表故障数据样本点,根据其与各个聚类中心的距离,将其 归纳入距离最近的故障大类;
[0013] 13)计算每个故障大类的样本均值,并计算标准测度函数,BP:
[0016] 式中,πη为第i个簇的电能表故障数据样本均值,U为第i个簇的电能表故障数据样 本点集合,心为第i个簇的电能表故障数据样本总数,E为标准测度函数,τ为电能表故障数 据样本点;
[0017] 14)以每个故障大类的样本均值代替初始聚类中心,重复步骤12)~14),直到标准 测度函数收敛。
[0018] 所述的步骤3)中,将电能表故障云模型的样本均值X、一阶样本绝对中心矩T和样 本方差S2分别作为逆向正态云发生器输入值,即期望值Ex、熵En和超熵He。
[0019] 所述的样本均值X、一阶样本绝对中心矩T和样本方差S2的计算式为:
[0023]其中,η为故障大类包含的数据点的数量,Xl为第i个数据点的值。
[0024]所述的期望值Ex、熵En和超熵He的计算式为:
[0025] Ex-^X
[0028] 6.根据权利要求1所述的一种基于聚类分析和云模型的智能电表故障分类方法, 其特征在于,所述的步骤4)中,K个故障大类包括错接线、用电异常、窃电、电池失效和设备 故障。
[0029] 7.根据权利要求6所述的一种基于聚类分析和云模型的智能电表故障分类方法, 其特征在于,所述的步骤4中)K个故障大类下的故障小类分类为:



[0034] 与现有技术相比,本发明具有以下优点:
[0035] -、定性分析:本发明首先采用K-means聚类算法将庞杂的故障数据粗分为5个大 类,在根据逆向正态云发生器分别对每个故障大类进行定量向定性的转换,最终将故障数 据分多个故障小类,分类准确。
[0036] 二、分类细致:本发明将故障数据分为5个大类、96个小类,分类精细,便于对将来 的电能表故障判定和故障划分。
【附图说明】
[0037] 图1为一维正态云模型分布图。
[0038]图2为正向云发生器原理示意图。
[0039]图3为逆向云发生器原理示意图。
[0040] 图4为智能电能表评估指标体系。
[0041] 图5为指标频数分布图。
【具体实施方式】
[0042] 下面结合附图和具体实施例对本发明进行详细说明。
[0043] 实施例
[0044] K-means算法是一种应用最广泛的聚类算法。该算法以标准测度函数最小为分类 原则,把N个电能表故障数据样本点分为K个簇。其聚类结果使得同簇的电能表故障数据样 本点具有较高的相似性,而各簇间的电能表故障数据样本点相似程度较低。K-means算法的 具体分类步骤如下:
[0045] (1)任意选择K个电能表故障数据样本点作为初始聚类中心;
[0046] (2)对剩余的每个电能表故障数据样本点,根据其与各个簇中心的距离,将它赋予 最近的族;
[0047] (3)计算每个簇的样本均值,并计算标准测度函数,BP:
[0049]式中,nu为第i个簇的电能表故障数据样本均值;Ci为第i个簇的电能表故障数据 样本点集合;Ni为第i个簇的电能表故障数据样本总数;E为标准测度函数;τ为电能表故障 数据样本点。
[0050] (4)以每个簇的样本均值代替初始聚类中心,重复步骤(2)~步骤(4),直到标准测 度函数收敛。本文的具体应用是:把电能表故障数据分类指标和分类数Κ输入到K-means算 法中,得到电能表故障数据分类指标的K个分群,每个分类指标对应一种电能表故障,从而 得到电能表故障数据的分类结果。
[0051] 传统的电能表故障分析方法,往往会以最严重故障为评价标准,不能反映实际电 能表故障数据中所包含随机、模糊信息及其之间关联性。此外,部分电能表故障判别是基于 经验数据获得的,若利用不准确的经验数据给出一个确切值作为电能表故障计算结果,显 然是不合理的。因此,需要引入合理的数据分析方法,结合随机性、模糊性等不确定性理论, 对电能表故障数据进行定性和定量分析。
[0052]本项目采用在概率论和模糊数学理论两者的基础上产生的云理论来对电能表故 障数据中的不确定性信息进行挖掘分析。云理论由我国李德毅院士建立起来的将不确定的 定性概念与定量数据相互转换的数据分析方法。云理论反映了概念和知识不确定性的两个 方面,即模糊性和随机性,并能将两者结合起来,建立定性和定量之间的对应映射关系。
[0053] 设U是定量的论域空间,其中,T为论域空间的定性概念,如果元素x(x^X)对 T概念的隶属度CT(x)在[0,1]上有个趋于稳定的数值,则从定性概念到论域在[0,1]的映射 分布成为云。即
[0054] Ct(x):U^[0,1]
[0055] Va*g U : (\)
[0056] 基于该映射关系,结合正态分布理论可以得到云模型。正态分布是一种很常见的 分布,它广泛适用于自然现象、社会现象。根据中心极限定理,如果每个决定因素所产生的 影响都很微小的,没有哪一种因素可以起到压倒性的作用,那么这个随机变量可以近乎正 态特性。实际上在工程应用中,很多参数模型都简单地处理为正态分布特性来研究,因为它 具有普遍性和适用性。如图1所示,云模型就是基于这种分布的基础上产生的,是最基本的 云模型分布。
[0057] 期望Ex:是概念在论域中的中心值,即最能代表这个定性概念的值。
[0058]熵En:衡量模糊性和随机性的指标量,模糊性反映了在定性概念在纵向坐标上隶 属度的不确定,随机性反映了定性概念在横坐标上被接受的范围大小。熵值越大,定性概念 就越宏观,不确定性的量度就越难。
[0059]超熵He:是熵的熵,它反映了云滴的离散程度,与正态分布相比较,该参数的建立 是为了表征偏离正态分布的程度大小。超熵的值越大,表示它与正态分布的区别越大,云滴 就越离散,隶属度的随机性也越大。
[0060] 云发生器:
[0061] 云发生器是将定性概念与定量数值之间相互转换的算法。按照云的产生机理和方 向,有正向云发生器和逆向云发生器。正向云是最基本的云算法,由云的数字特征产生云 滴,即实现从语言表达的定性信息到定量数据的范围和分布规律的转换过程。如图2所示, 正向云是在给定的云参数下,产生一个服从正态云分布的点即云滴Drop( Xl,yi)。
[0062] 正向正态云发生器的具体算法如下:
[0063] 输入量:定性概念A的三个云参数Ex,En,He和云滴总数M;
[0064] 输出量:M个云滴和每个云滴对概念A的确定度。
[0065] Stepl:生成一个服从(Ex,En)为方差的正态分布随机数X;
[0066] Step2:生成一个服从(Ex,He)为方差的正态分布的随机数En' ;
[0067] Step3:若X为概念A的一次具体的量化值;
[0068] Step4:令y为X对概念的确定度,计算y = exp{-(x_Ex)2/2(En')};
[0069] Step5:设点(x,y)是一个云滴;
[0070] Step6:重复以上步骤直到产生要求数目的Μ个云滴。
[007?]如果是给定符合某一种正态云分布规律的云滴样本(xi,yi),转换为恰当的定性 语言值(Ex,En,He)的过程,即从定量值到定性概念的转换,这与上述正向云发生器的输入 和输出正好相反,称为逆向云发生器,如图3所示。本项目采用的逆向正态云发生器是在无 确定信息基础上建立的,其具体算法如下:
[0072]输入:Μ个云滴的定量值xi;
[0073] 输出:定性概念的期望值Ex,熵En,超熵He。
[0074] Stepl:由X计算数据组的样本均值
一阶样本绝对中心矩
[0075] Step2:由上步可得到期望及二f ;
[0077] Step4:由stepl中的样本方差和step3中的熵可
[0078] 对于采集终端和电能表生成的事件,按以下规则筛选:
[0079] (1)同1条事件重复上报,事件内容包括时间均完全相同,只按第1条进行主站智能 诊断,其余事件不参与主站智能诊断。
[0080] (2)同1类事件重复上报,事件名称相同但内容不同,由期间分析判断为误报的,k 天内不再参与主站智能诊断(k建议值为15,建议设置范围5~60)。
[0081] (3)剔除内容不符合通信协议格式要求的事件,包括数据乱码及应填数据为空的 情况。
[0082] (4)剔除内容明显有误的事件,包括事件时间早于设备安装时间及事件时间晚于 当前时间k天后的情况(k建议值为5,建议设置范围2~30)。
[0083] (5)对于应成对出现的事件,若事件不成对则通过曲线数据和终端心跳、登录报文 等数据进行辅助判断,例如可按照终端心跳和登录报文辅助判断停电区间,按照曲线数据 辅助判断越限区间。
[0084] 对于采集终端和电能表的数据,按以下规则筛选:
[0085] (1)正/反向有功总功率乘倍率的数值大于用户合同容量的k倍(k建议值为50,建 议设置范围2~50),属于异常数据。
[0086] (2)日冻结正/反向电能示值计算得到的电量,大于用户日最大用电量(合同容量 X24h)的k倍(k建议值为50,建议设置范围2~50),属于异常数据。
[0087] (3)月冻结正/反向电能示值计算得到的电量,大于用户月最大用电量(合同容量 X 24h X 30天)的k倍(k建议值为50,建议设置范围2~50),属于异常数据。
[0088] (4)日/月冻结最大需量乘倍率的数值大于用户合同容量的k倍(k建议值为50,建 议设置范围2~50),属于异常数据。
[0089] (5)总加组电能量曲线计算得到的时段电量,大于用户时段最大用电量(合同容量 X时段长度)的k倍(k建议值为50,建议设置范围2~50),属于异常数据。
[0090] (6)二次侧电压值大于二次侧额定电压值的k倍(k建议值为2,建议设置范围2~ 10),属于异常数据。
[0091 ] (7)二次侧电流值乘倍率大于电流互感器一次侧额定电流值的k倍(k建议值为2, 建议设置范围2~10),属于异常数据。
[0092] 根据上述筛选规则,可以将电能表异常数据分为:电量异常诊断、电压电流异常诊 断、异常用电诊断、负荷异常诊断、时钟异常诊断、接线异常诊断、费控异常诊断共计7类29 个智能诊断分析模型(具体诊断模型见附录一)。
[0093] 电量异常诊断(R1):电能表示值不平(R11)、电能表飞走(R12)、电能表倒走(R13)、 电能表停走(R14)、电能表费率设置异常(R15)。
[0094] 电压电流异常诊断(R2):电压断相(R21)、电压越限(R22)、电压不平衡(R23)、高供 高计B相异常(R24)、电流失流(R25)、电流不平衡(R26)。
[0095] 异常用电诊断(R3):电能表开盖(R31)、计量门开闭(R32)、恒定磁场干扰(R33)、电 量差动异常(R34)、功率差动异常(R35)、停电事件异常(R36)。
[0096]负荷异常诊断(R4):需量超容(R41)、负荷超容(R42)、电流过流(R43)、负荷持续超 下限(R44)、功率因数异常(R45)。
[0097] 时钟异常诊断(R5):终端时钟异常(R51)、电能表时钟异常(R52)。
[0098]接线异常诊断(R6):反向电量异常(R61)、相序异常(R62)、潮流反向(R63)。
[0099] 费控异常诊断(R7):费控下发异常(R71)、剩余金额异常(R72)。
[0100] 由于现场出现的故障数据,可能是由电能表本身故障引起,或者由于外部原因(窃 电、电网异常等)引起,因此需对故障数据进行挖掘分析,从而帮助工作人员有针对性的解 决问题。
[0101]本项目以上海地区2015年10月至12月主站采集到的电能表异常事件记录为数据 源(取500个电能表的异常事件),对其进行分析。取K值为7,每个事件数据值为1或者0(1表 示事件发生,0表示事件未发生),建立智能电能表评估指标体系,如图4所示。
[0102] 为更好地体现各指标在评估体系中的重要程度和内在关系,需引入指标权重。常 用的权重确定方法有专家打分法、特征向量法、层次分析法等等。本项目通过层次分析法确 定评估体系中各指标的权值,每个权值是通过统计历年数据设置的,如表1所示。
[0103] 表1评估指标权重值
[0105] 基于收集的500组数据,计算出指标值R(精确至0.05),根据电能表在不同数值区 域的数量,画出指标频数分布图,如图5所示。
[0106] 基于云变换算法处理各事件的频数分布曲线,利用云变换算法提取样本数据的云 概念分布,其原理表不为
[0108] 式中,f(x)代表频数分布函数,ai代表幅度系数,Ci(Exi,Eni,Hei)代表云变换后的某 云概念,K是变换后云概念的数量(即聚类空间数),ε表示变换的误差阀值。云变换计算步骤 如下:
[0109] (1)找到给空间故障数据中i事件(如电能表飞走)的频数分布中所有的峰值点,各 峰值点横坐标值X j作为云概念的期望Exj (j = 1,2…η)。
[0110] (2)分别计算拟合原频率分布函数f(x)的各个云概念(期望为Exj)的熵E nj,并将求 解出的所有云概念Cj的概率密度期望函数
[0112]基于无确定度的逆向云算法对各云概念的超熵计算。经过云变换后,相邻的2个云 概念间相距过近,甚至会存在某个云概念被另一个云概念包括在内,由此产生的概念重复 及多余会给后续样本数据的所属概念划分造成困难和混乱,因此需对上述步骤得到的云概 念进行合并跃升,使每个云概念更加独立和清晰。
[0113] 根据对电能表的认知及IEC60599:2007的技术标准,并考虑到云之间的幅度系数 影响,将云变换得到的相近云概念进行合并。
[0114] 各云概念数字特征(Ex,En,He)如下所示:C1 (0.0860,0· 0781,0· 0039)、C2 (0·1741,0·0611,0·0045)、C3(0.3532,0·0475,0·0024)、C4(0.5867,0·0632,0·0051)、C5 (0.7911,0.0685,0.0063)。每个云都有一个定性的概念,根据电能表实际运行情况本项目 将各个云分别定义为:错接线、用电异常、疑似窃电、电池失效和设备故障。为直观表示,将 电能表故障数据诊断模型归纳为以下5类个96诊断模型,具体见表2。 [0115]表2电能表故障数据聚类模型



【主权项】
1. 一种基于聚类分析和云模型的智能电表故障分类方法,其特征在于,包括以下步骤: 1) 获取历史智能电表故障数据样本点,并采用κ-means算法将历史智能电表故障数据 样本点分为K个故障大类以及每个大类对应的中心值; 2) 将每个大类对应的中心值作为样本均值,每个故障大类包含的智能电表故障数据样 本点作为数据点,生成对应的K级电能表故障云模型; 3) 采用逆向正态云发生器对电能表故障云模型进行计算,获取电能表故障云模型的定 性云特征; 4) 根据定性云特征将K个故障大类下分为多个故障小类。2. 根据权利要求1所述的一种基于聚类分析和云模型的智能电表故障分类方法,其特 征在于,所述的步骤1)具体包括以下步骤: 11) 选择K个历史智能电表故障数据样本点作为初始故障大类的聚类中心; 12) 对剩余的历史智能电表故障数据样本点,根据其与各个聚类中心的距离,将其归纳 入距离最近的故障大类; 13) 计算每个故障大类的样本均值,并计算标准测度函数,BP:- .1 -i'CVi. 式中,nu为第i个簇的电能表故障数据样本均值,Ci为第i个簇的电能表故障数据样本点 集合,化为第i个簇的电能表故障数据样本总数,E为标准测度函数,τ为电能表故障数据样 本点; 14) 以每个故障大类的样本均值代替初始聚类中心,重复步骤12)~14),直到标准测度 函数收敛。3. 根据权利要求1所述的一种基于聚类分析和云模型的智能电表故障分类方法,其特 征在于,所述的步骤3)中,将电能表故障云模型的样本均值7、一阶样本绝对中心矩Τ和样 本方差S 2分别作为逆向正态云发生器输入值,即期望值Ex、熵Εη和超熵He。4. 根据权利要求3所述的一种基于聚类分析和云模型的智能电表故障分类方法,其特 征在于,所述的样本均值T、一阶样本绝对中心矩T和样本方差S 2的计算式为:其中,η为故障大类包含的数据点的数量,Xl为第i个数据点的值。5. 根据权利要求4所述的一种基于聚类分析和云模型的智能电表故障分类方法,其特 征在于,所述的期望值Ex、熵Εη和超熵He的计算式为:6. 根据权利要求1所述的一种基于聚类分析和云模型的智能电表故障分类方法,其特 征在于,所述的步骤4)中,K个故障大类包括错接线、用电异常、窃电、电池失效和设备故障。7. 根据权利要求6所述的一种基于聚类分析和云模型的智能电表故障分类方法,其特 征在于,所述的步骤4中)K个故障大类下的故障小类分类为:
【文档编号】G01R35/04GK105866725SQ201610246635
【公开日】2016年8月17日
【申请日】2016年4月20日
【发明人】江剑峰, 朱彬若, 张垠, 朱铮, 王新刚, 顾臻, 翁素婷, 陈金涛, 盛青
【申请人】国网上海市电力公司, 华东电力试验研究院有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1