一种电能表非健康度预测方法与流程

文档序号:12365957阅读:767来源:国知局
本发明涉及一种电能表非健康度预测方法,属于电能表计量和数据挖掘
技术领域

背景技术
:国网安徽省电力公司拥有2500万只电能表,绝大部分电能表属于IV、V类电能表,总计25,363,693只(约占98%)。III类电能表约占安徽公司运行电能表的101,852(1.5%),余下的I、II类电能表占比不到0.5%。目前是根据DL/T448-2000《电能计量装置技术管理规程》要求将电能表分为I、II、III、IV、V五个等级,I、II、III类电能表开展现场随机抽查,对抽查的电能表进行校验,及按规定的时间进行定期轮换。而IV、V类不开展现场校验,只采用定期轮换方式进行管理。然而,IV、V类电能表由于运行环境比较差,目前无法分析和判断电能表的运行状况,只能通过用户申请校验、现场故障投诉和定期轮换来管理这些表。这样就会存在部分电能表未到期就已出现质量问题,还有部分电能表质量较好,因为到期更换而造成浪费,及发生计量故障的电能表引起用户投诉率高等一系列问题。技术实现要素:由于DL/T448-2000《电能计量装置技术管理规程》和国家电网公司下发的《电能表现场状态检验方案》是针对单个电能表进行实验室检定和分析,与电能表真实运行状况差异比较大,同时对占98%的2500万只IV、V类电能表不进行现场抽检,只按时间进行轮换。针对上述规定存在的不足,本发明目的是提供一种电能表非健康度预测方法,以厂商和批次为分析对象,通过建立电能表健康度评价模型,应用大数据技术实现对安徽省电力公司2500多万只电能表进行整体运行状态分析。为了实现上述目的,本发明是通过如下的技术方案来实现:本发明的一种电能表非健康度预测方法,具体包括以下几个步骤:(1)以厂商和批次为对象,分析所属电能表的多维度指标,并利用主成分分析法从原始变量中导出与健康值相关性最大的前N个主变量,其中,N为正整数;(2)利用统计平均数法对步骤(1)得出的主变量进行加权打分;(3)通过非健康值的计算公式将步骤(2)中的加权打分结果降成一个维度的非健康值;(4)通过min-max标准化对非健康值进行线性变换,使结果值映射到[0-1]之间,最终用散点图展现出各批次电能表的非健康值分布;(5)通过多元线性回归算法对电能表未来的非健康值进行预测。步骤(1)中,所述多维度指标包括故障率、报废率、待报废率、折旧率、检测合格率和现场抽检率。步骤(1)中,所述主成分分析法的计算步骤如下:(1-1)原始变量的标准化采集p维随机向量x=(x1,x2,...,xp)T中n个样本xi=(xi1,xi2,...,xip)T,i=1,2,…,n,n>p,构造样本阵,对样本阵元进行如下标准化变换:i=1,2,3…n;j=1,2,…p;其中,得标准化阵Z;(1-2)对标准化阵Z求相关系数矩阵R=[rij]pxp=ZTZn-1]]>其中,i=1,2,3…p,j=1,2,…p;(1-3)解样本相关矩阵R的特征方程|R-λIp|=0得p个特征根,确定主变量,其中,λ表示特征值,lp表示单位矩阵;按确定m,m指所有维度中的第m个维度值,使信息的利用率达85%以上,对每个λj,j=1,2,...,m,解方程组Rb=λjb得单位特征向量bj0,λj表示第j个特征值,Rb表示矩阵的解,b表示特征向量;(1-4)将标准化后的指标变量转换为主变量:Uij=ziTbj0,j=1,2,...mUij表示第ij个主变量,Zi表示第i个主成分;(1-5)对m个主变量进行综合评价对m个主变量进行加权求和,即得最终评价值,权数为每个主变量的方差贡献率。步骤(2)中,所述统计平均数法具体的步骤如下:(2-1)确定行业专家进行初评:将待定的主变量交给各位专家,并请专家在不受外界干扰的前提下独立的给出各项指标的权数值;(2-2)回收专家意见:将各位专家的数据收回,并分别计算电能表整体运行状态各项指标的加权打分的均值和标准差。步骤(3)中,所述非健康值的计算公式如下:其中,w为故障种类,Ai为故障率,Fi为故障率权值,其中,故障包括电能表倒走、电能表反向潜动、电能表电池欠压、电能表总与各费率之和不一致;G2为待报废率,K2为待报废率权值;G3为报废率,K3为报废率权值;G4为折旧率,K4为折旧率权值;G5为检测合格率,K5为检测合格率权值。步骤(4)中,线性变换的函数如下:x=x-minmax-min]]>其中,x为样本中的数据,max为样本数据的最大值,min为样本数据的最小值。步骤(5)中,所述多元线性回归算法如下:y=b0+b1x1+b2x2+……bkxk+ey,其中,x1、x2……xk为自变量,b0为常数项,ey是随机误差,b1,b2,……bk为回归系数,b1为x2,x3……xk固定时,x1每增加一个单位对y的效应,即x1对y的偏回归系数;同理b2为x1,x3……xk固定时,x2每增加一个单位对y的效应,即x2对y的偏回归系数。本发明以厂商和批次为核心,从故障率、报废率、待报废率和折旧率等维度指标对电能表的健康度进行分析评价,分析电能表健康度的变化趋势,不仅可以获知每个批次电能表的现状,发现电能表家族问题,还能了解到哪些批次存在问题,确定电能表故障的严重性。并通过预测电能表健康度值变化趋势,为电能表状态检修、备品备件等工作提供辅助决策依据。附图说明图1为本发明的电能表非健康度预测方法工作流程图。具体实施方式为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。国家电网公司营销部下发的《电能表现场状态检验方案》不适用国网安徽省电力公司现状,安徽省电力公司通过引入大数据分析与数据挖掘方式,设计电能表健康度评价模型,对电能表的运行状态进行分析与评价。参见图1,其具体实现步骤如下:本发明是基于大数据统计分析电能表的非健康值,利用机器学的线性回归算法对电能表未来的非健康值进行预测分析,其具体实现步骤如下:S1:选取所有批次电能表的一个月数据进行降维处理,数据降维基本原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间,从而获得一个关于原数据集紧密的低维表示。利用主成分分析法从原始变量中导出少数几个主变量,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。主成分分析法的计算步骤如下:1、原始指标数据的标准化采集p维随机向量x=(x1,x2,...,xp)T)n个样品xi=(xi1,xi2,...,xip)T,i=1,2,…,n,n>p,构造样本阵,对样本阵元进行如下标准化变换:i=1,2,3…n;j=1,2,…p其中得标准化阵Z。2、对标准化阵Z求相关系数矩阵R=[rij]pxp=ZTZn-1]]>其中,i,j=1,2,…p。3、解样本相关矩阵R的特征方程|R-λIp|=0得p个特征根,确定主变量按确定m值,使信息的利用率达85%以上,对每个λj,j=1,2,...,m,解方程组Rb=λjb得单位特征向量bj0。4、将标准化后的指标变量转换为主变量Uij=ziTbj0,j=1,2,...mU1称为第一主变量,U2称为第二主变量,…,Up称为第p主变量。5、对m个主变量进行综合评价对m个主变量进行加权求和,即得最终评价值,权数为每个主变量的方差贡献率。S2:由第一步得出模型的主要变量后,利用统计平均数法,对主要的几个变量进行加权打分,再通过非健康值的计算公式降成一个维度,非健康值计算出来后需要min-max标准化,最终用散点图展现出各批次电能表的非健康值分布。1、统计平均数法(Statisticalaveragemethod)是根据所选择的各位专家对各项评价指标所赋予的相对重要性系数分别求其算术平均值,计算出的平均数作为各项指标的权重。其基本步骤是:第一步,确定行业专家进行初评。将待定的电能表运行状态、报废费和折旧率权数的指标提交给各位专家,并请专家在不受外界干扰的前提下独立的给出各项指标的权数值;第二步,回收专家意见。将各位专家的数据收回,并计算电能表整体运行状态涉及的各项指标的权数均值和标准差;第三步,分别计算电能表整体运行状态各项指标权重的平均数。2、建立非健康度分析模型如下:(Gi、Ai:变量,Ki、Fi:该变量对应的权重)A1:故障率,Fi:故障率权值;(故障包括电表倒走,电能表反向潜动、电能表电池欠压、电能表总与各费率之和不一致等)G2:待报废率,K2:待报废率权值;G3:报废率,K3:报废率权值;G4:折旧率,K4:折旧率权值;G5:检测合格率,K5:检测合格率权值。3、min-max标准化(Min-MaxNormalization)通过min-max标准化对原始数据的线性变换,使结果值映射到[0-1]之间。转换函数如下:x=x-minmax-min]]>其中max为样本数据的最大值,min为样本数据的最小值。S3:通过多元线性回归分析预测算法对非健康值进行预测,多元线性回归步骤如下:1、模型的建立y=b0+b1x1+b2x2+….bkxk,其中,b0为常数项,是随机误差,l,…为回归系数,b1为x2,x3固定时,x1每增加一个单位对y的效应,即x1对y的偏回归系数;同理b2为x1,xk固定时,x2每增加一个单位对y的效应,即,x2对y的偏回归系数,等等。2、多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和(Σe2)为最小的前提下,用最小二乘法求解参数。以二线性回归模型为例,求解回归参数的标准方程组为Σy=nb0+b1Σx1+b2Σx2Σx1y=b0Σx1+b1Σx12+b2Σx1x2Σx2y=b0Σx2+b1Σx1x2+b2Σx22]]>解此方程可求得b0,b1,b2的数值。亦可用下列矩阵法求得b==(x′x)-1(x′y)3、多元线性回归算法的检验多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验与评价,以决定模型是否可以应用。4.1拟合程度的测定。与一元线性回归中可决系数r2相对应,多元线性回归中也有多重可决系数r2,它是在因变量的总变化中,由回归方程解释的变动(回归平方和)所占的比重,R2越大,回归方各对样本数据点拟合的程度越强,所有自变量与因变量的关系越密切。计算公式为:R2=Σ(y^-y‾)2Σ(y-y‾)2=1-Σ(y-y^)2Σ(y-y‾)2]]>其中,Σ(y-y^)2=Σy2-(b0Σy+b1Σx1y+b2Σx2y+...+bkΣxky]]>Σ(y-y‾)2=Σy2-1n(Σy)2]]>4.2估计标准误差估计标准误差,即因变量y的实际值与回归方程求出的估计值之间的标准误差,估计标准误差越小,回归方程拟合程度越程。Sy=Σ(y-y^)2n-k-1]]>vk=Syy]]>其中,k为多元线性回归方程中的自变量的个数。4.3回归方程的显著性检验回归方程的显著性检验,即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否密切。能常采用F检验,F统计量的计算公式为:F=ΣΣ(y^-y‾)2/kΣ(y-y^)2/(n-k-1)=R2/k(1-R2)/(n-k-1)]]>根据给定的显著水平a,自由度(k,n-k-1)查F分布表,得到相应的临界值Fa,若F>Fa,则回归方程具有显著意义,回归效果显著;F<Fa,则回归方程无显著意义,回归效果不显著。4.4回归系数的显著性检验在一元线性回归中,回归系数显著性检验(t检验)与回归方程的显著性检验(F检验)是等价的,但在多元线性回归中,这个等价不成立。t检验是分别检验回归模型中各个回归系数是否具有显著性,以便使模型中只保留那些对因变量有显著影响的因素。检验时先计算统计量ti;然后根据给定的显著水平a,自由度n-k-1查t分布表,得临界值ta或ta/2,t>t-a或ta/2,则回归系数bi与0有显著关异,反之,则与0无显著差异。统计量t的计算公式为:ti=bisyCij=bisbi]]>其中,Cij是多元线性回归方程中求解回归系数矩阵的逆矩阵(x'x)-1的主对角线上的第j个元素。对二元线性回归而言,可用下列公式计算:C11=S22S11S22-S122]]>C22=S11S11S22-S122]]>其中,S11=Σ(x1-x1‾)2=Σx12-1n(Σx1)2]]>S22=Σ(x2-x2‾)2=Σx22-1n(Σx2)2]]>S12=Σ(x1-x1‾)(x2-x2‾)=s21]]>Σx1x2-1n(Σx1(Σx2)]]>4.5多重共线性判别若某个回归系数的t检验通不过,可能是这个系数相对应的自变量对因变量的影响不显著所致,此时,应从回归模型中剔除这个自变量,重新建立更为简单的回归模型或更换自变量。也可能是自变量之间有共线性所致,此时应设法降低共线性的影响。多重共线性是指在多元线性回归方程中,自变量之间有较强的线性关系,这种关系若超过了因变量与自变量的线性关系,则回归模型的稳定性受到破坏,回归系数估计不准确。需要指出的是,在多元回归模型中,多重共线性的难以避免的,只要多重共线性不太严重就行了。判别多元线性回归方程是否存在严惩的多重共线性,可分别计算每两个自变量之间的可决系数r2,若r2>R2或接近于R2,则应设法降低多重线性的影响。亦可计算自变量间的相关系数矩阵的特征值的条件数k=λ1/λp(λ1为最大特征值,λp为最小特征值),k<100,则不存在多重点共线性;若100≤k≤1000,则自变量间存在较强的多重共线性,若k>1000,则自变量间存在严重的多重共线性。降低多重共线性的办法主要是转换自变量的取值,如变绝对数为相对数或平均数,或者更换其他的自变量。以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1