一种电能表失效率的评估方法及装置与流程

文档序号:17698476发布日期:2019-05-17 21:55阅读:205来源:国知局
一种电能表失效率的评估方法及装置与流程

本申请涉及可靠性数据评估领域,具体涉及一种电能表失效率的评估方法,同时涉及一种电能表失效率的评估装置。



背景技术:

电能表作为智能电网终端中最重要计量仪器之一,其可靠性能不仅仅关系到电能计量的准确性,更关系到民众的切身利益。实际运行中的电能表失效数据更能反映电能表的真实可靠性,为发挥智能电网采集的各类数据作用,实现对投入运营中电能表的可靠性分析,补充检验标准下缺失的实际应用结果,对实际运行条件下的电能表进行失效率评估具有十分重要的意义。电能表失效率评估主要包括:失效率预测与可靠度计算。

现有的设备可靠性分析方法有:

故障树(faulttree,ft)分析法,作为一种最重要的可靠性分析方法,已经用于仪器故障诊断长达40年,其灵活性高,可依据不同仪器结构进行可靠性分析,但进行ft分析时,复杂系统中部分故障因素易被遗漏,从而影响分析准确性。

神经网络(neuralnetworks,nn)算法,其优势在于能从原始失效数据中提取数据特征,并对样本数据进行充分的拟合与预估。但仍然存在诸多局限:nn无法给出设备故障、可靠性的置信区间;nn在对小样本数据进行分析时容易导致欠拟合。

贝叶斯网络(bayesiannetwork,bn),贝叶斯模型常用于数据融合与精确的预测。相比于一般方法,贝叶斯模型适用于对不同地区的信息融合与参数概率估计。特别地,多层贝叶斯提供了融合不同种类的信息得途径,克服了单层贝叶斯的局限性。近年来,贝叶斯备受重视,如已经授权的中国专利201710886532.3公开了“一种求解结构失效概率函数的贝叶斯再抽样方法”,该方法克服了失效概率函数求解的多次可靠性分析,并通过贝叶斯的一次抽样与再抽样技术,推断求解失效概率函数,减少计算代价,提高了结构失效概率函数求解的效率。但贝叶斯在对实际的融合过程中依然存在模型不确定的特点,难以实现最优化模型的分析。

以上分析可知,现有的数据融合可靠性方法存在分析结果不完善,小样本下易欠拟合等问题,难以同时兼顾准确性与全面性。



技术实现要素:

本申请提供一种电能表失效率的评估方法,解决了现有的数据融合可靠性方法存在分析结果不完善,模型不确定,小样本下易欠拟合等问题,难以同时兼顾准确性与全面性。

本申请提供的一种电能表失效率的评估方法,其特征在于,包括:

获取电能表的失效数据,采用标准差离群值法,对所述电能表的失效数据的噪声点进行清理;

根据失效数据特性与模型复杂度,选取对应的b样条基函数阶数;根据电能表故障数据的分布选择对应的似然函数,将b样条函数嵌入贝叶斯模型中,建立层次贝叶斯b样条模型;将清理噪声点后的有效数据进行规一化处理后,作为层次贝叶斯b样条模型的输入数据,对所述模型进行训练;

根据电能表的失效数据,通过所述层次贝叶斯b样条模型预估所述电能表的失效率。

优选的,所述获取电能表的失效数据,采用标准差离群值法,对所述电能表的失效数据的噪声点进行清理:

设置每次测量的失效数据标准偏差σ为

式中,l为每次测量失效数据的长度,ui,i+2为三次测量失效数据的平均值,yi,i+2表示第i次到i+2次所有的测量失效数据;

设定长度为3的窗对失效数据进行计算,窗由i,i+1,i+2三年数据组成,即每次对连续三次测量数据同时进行标准偏差计算;

计算得到每个数据的标准偏差σ后,选取2倍于均值ui,i+2的阈值作为噪声判断标准,使用三次测量失效数据均值代替高于标准差的失效数据。

优选的,所述根据失效数据特性与模型复杂度,选取对应的b样条基函数阶数,包括:

将多项式的次数p与非递减的节点序列t1,…,tq,阶数为0的b样条包含一组分段的常函数

式中,bi,0表示阶数为0时的i次项b样条。高阶b样条基函数定义为

bi,k(x)=wi,kbi,k-1(x)+(1-wi+1,k)bi+1,k-1(x)

其中,

式中,wi,k为样条基函数的系数,值域为(0,1),当给定数据点x时,定义的b样条基函数表明b样条基函数bi,k(x)是bi,p-1(x)和bi+1,p-1(x)的线性组合;

为让阶数为p的b样条包含所有的节点,可将节点序列[t1,tq)扩展为

扩展节点:

将样条基函数的系数的递归公式定义于扩展节点公式的扩展节点上;

为达到失效数据拟合效果,防止高阶过拟合,通常取p=3,即三次b样条。此时三次b样条的曲线段方程可表示为

上式中,αs,j表示在位于s区域的j个b样条系数。

优选的,所述根据电能表故障数据的分布选择对应的似然函数,包括:

根据电能表的故障数据,选择威布尔函数作为似然函数,对分布进行描述,具体的步骤为,定义两参数的威布尔概率密度函数为

pw(ys,t=m)=βρ(m)ρ-1exp(-βmρ)

上式中,ρ>0为威布尔分布的形状参数,β>0的威布尔尺度参数,m>0为故障率。

优选的,所述将b样条函数嵌入贝叶斯模型中,建立层次贝叶斯b样条模型,包括:

为描述电能表故障率,结合三次b样条的曲线段方程,尺度参数β用log函数形式可表示为

式中,log函数保证了β取值范围为正值,εx,s为log函数模型的误差项,s依据区域数目而定;

针对电能表失效率随时间变化的这一模型,通过可取模型b样条系数αs,j服从高斯随机游走先验分布,即

αs,j~n(αs,j-1,σα)

式中,σα为高斯分布方差,为实现平稳的拟合,可将上式改进为

式中,τs为b样条系数αs,j的平滑因子;

将两参数的威布尔概率密度函数中的误差项εx,s相互独立且服从具有零均值的高斯分布

εx,s~n(0,σε2)

式中,σε为误差项的方差,且σε无任何先验信息,故可取σε为正值域的均匀分布σε~uniform(0.01,3)。

优选的,所述将清理噪声点后的失效数据进行规一化处理,包括:

使用的规一化公式为

对清理噪声点后的失效数据进行规一化处理,其中,ys,t*为位于s地区,年限为t时的电能表故障率大小,ys,t为经过归一化处理后的失效数据。

优选的,在对所述模型进行训练的步骤之后,还包括对所述模型的准确性进行验证,具体的,包括:

根据贝叶斯原理,模型参数先验分布通过观测数据来更新,此时模型的联合后验分布表达式可表示为

式中,y为电能表故障率观测数据,l(y|αs,j,εx,s)为模型似然函数,p(y)为边缘密度函数;

将模型的联合后验分布表达式中的参数可通过积分来确定每个参数的后验分布。

优选的,所述根据电能表的失效数据,通过所述层次贝叶斯b样条模型预估所述电能表的失效率,包括:

使用已知的信息与参数后验分布,设在s区域新的观测数据zs,有

p(zs|y)=∫f(zs|θ)p(θ|y)dθ

式中,p(θ|y)为上式的联合后验分布,θ代表参数αs,j-1,τs,εx,s,α1,s,f(zs|θ)为已知参数θ时的似然函数。

优选的,还包括;

对于基于威布尔的层次贝叶斯b样条电能表失效率模型,在计算出模型所有参数的后验分布后,电能表随时间变化的可靠度为

式中,0<=r(t|y)<=1,第二个指数项代表电能表故障率曲线,可靠度的置信区间可通过对应的后验样本分析得出。

优选的,所述电能表随时间变化的可靠度,是评佑电能表可靠性的主要指标,用于评价在指定时间内完成功能的能力。

本申请同时提供一种电能表失效率的评估装置,其特征在于,包括:

数据获取单元,用于获取电能表的失效数据,采用标准差离群值法,对所述电能表的失效数据的噪声点进行清理;

模型建立单元,用于根据失效数据特性与模型复杂度,选取对应的b样条基函数阶数;根据电能表故障数据的分布选择对应的似然函数,将b样条函数嵌入贝叶斯模型中,建立层次贝叶斯b样条模型;将清理噪声点后的有效数据进行规一化处理后,作为层次贝叶斯b样条模型的输入数据,对所述模型进行训练;

预估单元,用于根据电能表的失效数据,通过所述层次贝叶斯b样条模型预估所述电能表的失效率。

本申请提供的一种电能表失效率的评估方法,通过将b样条基函数与多层贝叶斯相结合,形成的层次贝叶斯b样条算法对电能表失效信息进行拟合,预估出电能表的失效率和可靠度的概率分布,具备融合多区域的失效数据特点,特别适用于小样本数据分析,提高了电能表失效率的准确率。

附图说明

图1是本申请实施例提供的一种电能表失效率的评估方法示意图;

图2是本申请实施例涉及的基于层次贝叶斯b样条的电能失效率评估流程图;

图3是本申请涉及的层次贝叶斯b样条模型,采用一阶自回归先验时层次贝叶斯b样条模型与二次线性贝叶斯模型对电能表失效率训练结果对比图;

图4是本申请层次贝叶斯b样条模型对电能表可靠度结果分析图;

图5是本申请实施例提供的一种电能表失效率的评估装置示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。

请参看图1,图1是本申请实施例提供的一种电能表失效率的评估方法,下面结合图1对本申请提供的方法进行详细说明。

步骤s101,获取电能表的失效数据,采用标准差离群值法,对所述电能表的失效数据的噪声点进行清理。

获取不同地区近几年的电能表的失效数据,然后采用标准差离群值法,对所述电能表的失效数据的噪声点进行清理,减小信息损失。

采用标准差离群值法,对所述电能表的失效数据的噪声点进行清理的具体实现步骤为;

设置每次测量的失效数据标准偏差σ为

式中,l为每次测量失效数据的长度,ui,i+2为三次测量失效数据的平均值,yi,i+2表示第i次到i+2次所有的测量失效数据;

考虑到样本数据不连续性,为避免去除有效数据,并考虑到失效样本数据的不连续性,设定长度为3的窗对失效数据进行计算,窗由i,i+1,i+2三年数据组成,即每次对连续三次测量数据同时进行标准偏差计算;

计算得到每个数据的标准偏差σ后,选取2倍于均值ui,i+2的阈值作为噪声判断标准,使用三次测量失效数据均值代替高于标准差的失效数据。

步骤s102,根据失效数据特性与模型复杂度,选取对应的b样条基函数阶数;根据电能表故障数据的分布选择对应的似然函数,将b样条函数嵌入贝叶斯模型中,建立层次贝叶斯b样条模型;将清理噪声点后的有效数据进行规一化处理后,作为层次贝叶斯b样条模型的输入数据,对所述模型进行训练。

任何给定阶次的样条函数均可表示为b样条基函数的线性组合形式,即免除了多层贝叶斯建模过程中对线性函数选取的难点。b样条函数可由两个参数唯一确定:多项式的次数p与非递减的节点序列t1,…,tq。阶数为0的b样条包含一组分段的常函数

式中,bi,0表示阶数为0时的i次项b样条。高阶b样条基函数定义为

bi,k(x)=wi,kbi,k-1(x)+(1-wi+1,k)bi+1,k-1(x)(3)

其中,

样条基函数表明b样条基函数bi,k(x)是bi,p-1(x)和bi+1,p-1(x)的线性组合;

为让阶数为p的b样条包含所有的节点,可将节点序列[t1,tq)扩展为

扩展节点:

将样条基函数的系数的递归公式定义于扩展节点公式的扩展节点上;若不定义扩展序列,b样条函数将无法很好拟合节点序列[t1,tq]的边缘位置。

为达到失效数据拟合效果,防止高阶过拟合,通常取p=3,即三次b样条。此时三次b样条的曲线段方程可表示为

上式中,αs,j表示在位于s区域的j个b样条系数。

层次贝叶斯b样条属于非参数模型,摆脱了广义线性贝叶斯模型对回归表达式的依赖。为将三次b样条充分与贝叶斯相结合,建立层次贝叶斯b样条模型的还包括对似然函数的选择。

电能表等电子测量仪器的失效率数据有多种似然函数作为选择,在电能表的实际运行过程中,当电能表任何一个最弱的环节出现故障时,系统即发生故障,此时的故障数据比较适合用威布尔分布进行描述。所以根据电能表的故障数据,选择威布尔函数作为似然函数,对分布进行描述,具体的步骤为,定义两参数的威布尔概率密度函数为

pw(ys,t=m)=βρ(m)ρ-1exp(-βmρ)(7)

上式中,ρ>0为威布尔分布的形状参数,β>0的威布尔尺度参数,m>0为故障率。威布尔形状参数α的改变通常意味着电能表的故障机理改变,因此认为尺度参数β发生改变而形状参数ρ保持恒定。

为描述电能表故障率,结合三次b样条的曲线段方程,尺度参数β用log函数形式可表示为

式中,log函数保证了β取值范围为正值,εx,s为log函数模型的误差项,s依据区域数目而定;

参数先验分布应反映参数值的不确定性程度,与此同时也需保证求解模型时的收敛性。对无历史信息的参数可取无信息均匀分布,但均匀分布在时间模型中无法有效的拟合实际数据,且容易造成收敛时间过长。

针对电能表失效率随时间变化的这一模型,通过可取模型b样条系数αs,j服从高斯随机游走先验分布,即

αs,j~n(αs,j-1,σα)(9)

式中,σα为高斯分布方差,高斯随机游走先验分布能充分跟随故障数据变化,也容易造成模型对三个地区故障数据的过拟合,因此,为实现平稳的拟合,可将上式改进为

式中,τs为b样条系数αs,j的平滑因子;

将两参数的威布尔概率密度函数中的误差项εx,s相互独立且服从具有零均值的高斯分布

εx,s~n(0,σε2)(11)

式中,σε为误差项的方差,且σε无任何先验信息,故可取σε为正值域的均匀分布σε~uniform(0.01,3)。

在建立层次贝叶斯b样条模型后,需要对模型进行训练,就需要使用训练数据,那么就将清理噪声点后的有效数据进行规一化处理后,作为层次贝叶斯b样条模型的输入数据,对所述模型进行训练,使用的规一化公式为

对清理噪声点后的失效数据进行规一化处理,其中,ys,t*为位于s地区,年限为t时的电能表故障率大小,ys,t为经过归一化处理后的失效数据。

数据规一化后,将原始数据分为两部分,将t-1年的数据作为模型训练数据,第t年数据作为模型验证数据。

然后就使用t-1年的数据作为模型训练数据对层次贝叶斯b样条模型进行训练。

接下来就是对层次贝叶斯b样条模型的准确性进行验证,使用第t年失效数据与模型预测结果对比,验证模型准确性,具体实施方法为:

依据贝叶斯原理,模型参数先验分布通过观测数据来更新,此时模型的联合后验分布可表示为

式中,y为电能表故障率观测数据,l(y|αs,j,εx,s)为模型似然函数,对应于式(7);p(y)为边缘密度函数。表达式(13)中的参数可通过积分来确定每个参数的后验分布,以估计αs,j-1为例

p(αs,j-1|y)=∫∫∫p(αs,j-1,τs,α1,s,εx,s|y)dτsdα1,sdεx,s(14)

求得参数后验分布后,层次贝叶斯b样条模型参数αs,j-1均值可从(14)推导得出

e(αs,j-1|y)=∫p(αs,j-1|y)dαs,j-1(15)

为验证模型的准确性,求取用于测试的第t年数据与层次贝叶斯b样条预测的第t年数据均方根误差。

信息准则是一种评价模型在相同观测值与相似结构下好坏的方法,widelyapplicableinformationcriterion(waic)是一种不需多重高斯后验且相比偏差信息准则更准确的准则方法,相比常用的aic、bic可提供更多的模型信息。waic可表示为

式中,p*(ys,t)为贝叶斯预测分布,v(logp(ys,t|θ))代表log似然函数的方差,式(16)的第一项为贝叶斯训练损失,第二项为模型有效参数个数。

计算出waic之后,可在多个相似的贝叶斯模型中通过贝叶斯平均计算出各个模型的权重大小

式中,dwaic为每个模型与最低waic值模型之间的差值,权重之和为1。通常,更小的waic值与更大的权值wr表明模型对原始数据有更好的拟合效果。

步骤s103,根据电能表的失效数据,通过所述层次贝叶斯b样条模型预估所述电能表的失效率。

使用已知的信息与参数后验分布,设在s区域新的观测数据zs,有

p(zs|y)=∫f(zs|θ)p(θ|y)dθ(18)

式中,p(θ|y)为上式的联合后验分布,θ代表参数αs,j-1,τs,εx,s,α1,s,f(zs|θ)为已知参数θ时的似然函数。

可靠度是评估电能表可靠性的主要指标,用于评价在指定时间内完成功能的能力。

对于基于威布尔的层次贝叶斯b样条电能表失效率模型,在计算出模型所有参数的后验分布后,电能表随时间变化的可靠度为

式中,0<=r(t|y)<=1,第二个指数项代表电能表故障率曲线,可靠度的置信区间可通过对应的后验样本分析得出。

下面再结合附图2、3、4对本发明提供的实施例进行详细说明。

本发明提出一种基于层次贝叶斯b样条的电能失效率评估方法,实施例采用三个典型省份的电能表失效数据,对省份选取依据主要参考:温度、湿度、海拔等环境条件的差异。采集的电能表失效数据为y,对应年限时间为t,本实施例中时间t为7,每年度进行两次数据收集。本实施例包括以下步骤:

步骤一,结合图2,对采集的电能表失效数据y进行噪声点检测,预防因噪声点造成的模型拟合失准。具体依据标准差离群值法,计算出每个样本点的标准差:

式中,l为每次测量失效数据的长度,ui,i+2为三次测量失效数据的平均值,yi,i+2表示第i次到i+2次所有的测量失效数据,n为数据总数。待得出标准差后,对标准差大小进行判定,当标准差大于2倍的数据均值时,采用三次测量数据均值代替噪声点,减小噪声对失效数据影响。

步骤二,对步骤一的数据进行归一化处理

式中,ys,t*为位于s地区,式中s取3,年限为t时的电能表故障率大小,ys,t为经过归一化处理后失效数据。将前6年的归一化数据作模型训练数据集,最后1年作为模型验证数据集。

步骤三,建立层次贝叶斯b样条模型,参照图2,建立层次贝叶斯b样条模型需分为三个子步骤:(1)模型似然函数选取;(2)b样条基函数的阶数选取,并将b样条基函数嵌入贝叶斯多层模型中;(3)层次贝叶斯b样条模型先验分布选取。

本实施例中选取威布尔分布对失效数据进行描述。对于b样条基函数阶数:当阶数p为小于2时,阶数过低不易拟合非线性变化的数据,当阶数高于5时,较高的阶数导致模型计算复杂,且拟合效果较差。本实施例中将阶数设为3。

对于步骤三中的(2)问题,威布尔分布的尺度参数β用log函数加以限定,层次贝叶斯b样条模型主要结构表达式为

式中,αs,j表示在位于s区域的j个b样条系数,εx,s为log函数模型的误差项,bj,3(x)为三次b样条基函数。

步骤三中剩余步骤即对先验分布的选取。先验分布选取原则为,最贴近参数分布的分布作为先验分析,但实际中往往难以明确参数的具体分布,此时对模型的未知参数先验给予无信息先验均匀分布,但在小样本条件下,数据不足以推算出先验参数的后验分布,此时可结合专家信息给出适当的先验分布。

在样本数据量较少时,模型易对数据造成过拟合,层次贝叶斯b样条模型系数αs,j控制模型的拟合效果,可对系数取为

式中,τs为b样条系数αs,j的平滑因子。

τs先验分布可取值域为正的τs~halfcauchy(5),α1,s与αs,j可分别取高斯分布α1,s~n(0,10)与αs,j~n(αs,j-1,20),对误差项的方差σε取为具有正值域的均匀分布σε~uniform(0.01,3)。

步骤四,层次贝叶斯b样条模型参数后验抽样。为实现参数联合后验分布的抽样,采用no-u-turnsampler抽样算法对模型参数进行5000次迭代抽样,老练次数设置为2000,利用mcmc算法对模型参数和后验估计进行计算。

贝叶斯b样子样条与采用一阶自回归先验时层次贝叶斯b样条模型(模型b),二次线性贝叶斯模型(模型c)对比分析:

未优化b样条系数的层次贝叶斯b样条模型中,b样条系数αs,j服从高斯随机游走先验分布,即

αs,j~n(αs,j-1,σα)(24)

二次线性贝叶斯模型中线性表达式为:

log(β)=a1t+a2t2+εx,s(25)

图3中,灰色区域为模型拟合置信区间,红色粗实线为本文模型的拟合曲线,带星号蓝色虚线为模型b的拟合结果,黑色虚线为模型c的拟合结果。

本实例图3对比结果中可以分析,采用模型b对模型每阶段变化趋势有较好的跟随性,能跟随数据波形而变化,但容易造成过拟合。采用模型c时结果能较好拟合数据变化趋势,但在数据有明显变化时,对数据有欠拟合现象。

表1给出了层次贝叶斯b样条与采用二阶线性回归贝叶斯模型时的rmse值,从表中可以看出,本文算法的rmse值均小于模型b与模型c,对数据具有最好的拟合效果。

表1各个模型rmse值计算结果

步骤五,计算电能表可靠度:

对新电能表的短时预测结果可靠度见图4,它由基于层次贝叶斯b样条的3000个后验样本生成。图3显示了电能表故障率可靠度随时间增加而减小,在运行6年之后,电能表可靠度约为0.96,表明该种类电能表在三省环境条件下工作时具有较高的可靠性。

本申请同时提供一种电能表失效率的评估装置500,请参看图5其特征在于,包括:

数据获取单元510,用于获取电能表的失效数据,采用标准差离群值法,对所述电能表的失效数据的噪声点进行清理;

模型建立单元520,用于根据失效数据特性与模型复杂度,选取对应的b样条基函数阶数;根据电能表故障数据的分布选择对应的似然函数,将b样条函数嵌入贝叶斯模型中,建立层次贝叶斯b样条模型;将清理噪声点后的有效数据进行规一化处理后,作为层次贝叶斯b样条模型的输入数据,对所述模型进行训练;

预估单元530,用于根据电能表的失效数据,通过所述层次贝叶斯b样条模型预估所述电能表的失效率。

通过本申请提供的方法,将b样条基函数与多层贝叶斯相结合,形成的层次贝叶斯b样条算法对电能表失效信息进行拟合,预估出电能表的失效率和可靠度的概率分布,具备融合多区域的失效数据特点,特别适用于小样本数据分析,提高了电能表失效率的准确率。

以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员依然可以对本发明的具体实施方式进行修改或者等同替换,而这些未脱离本发明精神和范围的任何修改或者等同替换,其均在申请待批的本发明的权利要求保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1