基于电能表状态检修的电能表备品备件预测方法与流程

文档序号:12721608阅读:409来源:国知局

本发明涉及电能表计量和数据挖掘技术领域,具体是一种基于电能表状态检修的电能表备品备件预测方法。



背景技术:

国网安徽省电力公司拥有2500万只电能表,绝大部分电能表属于IV、V类电能表,总计25,363,693只(约占98%)。III类电能表约占安徽公司运行电能表的101,852(1.5%),余下的I、II类电能表占比不到0.5%。目前是根据DL/T448-2000《电能计量装置技术管理规程》要求将电能表分为I、II、III、IV、V五个等级,I、II、III类电能表开展现场随机抽查,对抽查的电能表进行校验,及按规定的时间进行定期轮换。由于各个电能表制造商的制造工艺、元器件批次质量以及运行环境不同,就会存在部分电能表未到期就已出现质量问题及引起用户投诉率高;还有部分电能表质量较好,到期更换造成浪费。这些真正实际需要更换电能表数和因政策、环境等因素需要新增的电能表数常常是凭经验判断,无法准确预测,所以需要利用机器学习中的算法来准确预测来年需要准备多少只电能表。



技术实现要素:

由于以往采购电能表都是靠经验决定,没有科学依据,该方式很难有效地对需求进行预测,而备品备货预测则为能够更好地减少库存、节约成本、缩短时间提供了科学合理的依据与方法,因此备品备货预测研究具有一定的实际意义。

为了实现上述目的,本发明是通过如下的技术方案来实现:

一种基于电能表状态检修的电能表备品备件预测方法,其特征在于:具体包括以下几个步骤:

(1)、以厂商和批次为对象,分析所属电能表的多维度指标,并利用逐步回归分析法从原始变量中找出包含信息量最多的变量;

(2)、利用统计平均数法对步骤(1)得出的主变量进行加权打分;

(3)、通过非健康值的计算公式将步骤(2)中的加权打分值降成一个维度的非健康值;

(4)、通过min-max标准化对步骤(3)中的非健康值进行线性变换,使结果值映射到[0-1]之间,最终用散点图展现出各批次电能表的非健康值分布;

(5)、通过梯度树提升算法对电能表将来未知的非健康值进行预测,得到电能表非健康值模型;

(6)、通过Arima时间序列算法对每年新增户数进行预测分析;

(7)、将非健康值超过临界值的电表数与通过预测后得到的电能表非健康模型中非健康值将超过临界值的电表数和每年新增户数相加,即为本次备品备货的数量。

所述的基于电能表状态检修的电能表备品备件预测方法,其特征在于:步骤(1)中,所述的多维度指标包括故障率、报废率、待报废率、折旧率、检定不合格率。

所述的基于电能表状态检修的电能表备品备件预测方法,其特征在于:步骤(1)中,所述的逐步回归分析法的计算步骤如下:

(1-1)、先将被解释变量y对每个解释变量x1,x2,x3……做简单回归,再对每一个回归方程进行统计检验分析(相关系数,拟合优度,标准误差)选出最优的回归方程,也称基本回归方程;

(1-2)、将其他解释变量逐一的引进到基本回归方程中,如果引入一个新的解释变量使拟合优度有提升,而其他的参数和回归系数仍然合理,那说明这个解释变量是有利的,可以保留;如果引入之后拟合优度不明显,对回归系数也没什么影响,则不必保留;如果新解释变量不仅改变了拟合优度,而且对其他回归系数的数值和符号也产生了重要的影响,那么这个新变量是不利变量,引进后会使模型出现多重共线性问题;不利变量也不一定要舍去,如果它对被解释变量确实是不可缺少的,则不能简单的舍去,应该寻找更合适的模型,重新进行估计;如果通过检验证明回归模型存在两个明显线性相关的解释变量,并且其中一个变量可以很好地被另一个变量所解释,那么可以省去对被解释变量影响较小的变量,保留影响较大的变量。

所述的基于电能表状态检修的电能表备品备件预测方法,其特征在于:步骤(2)中,所述的统计平均数法具体的步骤如下:

(2-1)、确定行业专家进行初评:将待定的主变量交给各位专家,并请专家在不受外界干扰的前提下独立的给出各项指标的权数值;

(2-2)、回收专家意见:将各位专家的数据收回,并分别计算电能表整体运行状态各项指标的加权打分的均值和标准差。

所述的基于电能表状态检修的电能表备品备件预测方法,其特征在于:步骤(3)中,所述的非健康值的计算公式如下:

其中,w为故障种类,Ai为故障率,Fi为故障率权值,其中,故障包括电能表倒走、电能表反向潜动、电能表电池欠压、电能表总与各费率之和不一致;

G2为待报废率,K2为待报废率权值;

G3为报废率,K3为报废率权值;

G4为折旧率,K4为折旧率权值;

G5为检测不合格率,K5为检测不合格率权值。

所述的基于电能表状态检修的电能表备品备件预测方法,其特征在于:步骤(4)中,线性变换的函数如下:

其中,x为样本中的数据,max为样本数据的最大值,min为样本数据的最小值。

所述的基于电能表状态检修的电能表备品备件预测方法,其特征在于:步骤(5)中,所述的梯度树提升模型如下:

(5-1)、首先初始化:

f0(x)=argminc∑i=1NL(yi,c);

估计一个使损失函数极小化的常数值,此时它只有一个节点的树;

(5-2)、迭代的建立M棵提升树:

for m=1 to M:(第一层循环),

for i=1 to N:(第二层循环),

计算损失函数的负梯度在当前模型的值,并将它作为残差的估计值:

对于rmi拟合一棵回归树,得到第m棵树的叶节点区域Rmj,j=1,2,…,J,

for j=1to J:(第二层循环),计算如下:

cmj=argminc∑xi∈RmjL(yi,fm-1(xi)+c);

利用线性搜索估计叶节点区域的值,使损失函数极小化;

然后,更新fm(x)=fm-1(x)+∑Jj=1cmjI(x∈Rmj);

(5-3)、最后得到的fm(x)就是最终的模型:

f~(x)=fM(x)=∑m=1M∑j=1JcmjI(x∈Rmj)。

所述的新增户数,其特征在于:步骤(6)中,所述的Arima时间序列模型如下:

(6-1)、根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别;

(6-2)、对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零;

(6-3)、根据时间序列模型的识别规则,建立相应的模型,若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型;其中,截尾是指时间序列的自相关函数(ACF)或偏自相关函数(PACF)在某阶后均为0的性质(比如AR的PACF);拖尾是指ACF或PACF并不在某阶后均为0的性质(比如AR的ACF)。

(6-4)、进行参数估计,检验是否具有统计意义;

(6-5)、进行假设检验,诊断残差序列是否为白噪声;

(6-6)、利用已通过检验的模型进行预测分析。

本发明的有益效果:

本发明主要从三大方面考虑电能表备品备货:第一:通过将电能表的计划检修提升到状态检修,以厂商和批次为单位,通过降维的思想为每批电能表打上非健康值这个标签,用来衡量每个批次的好坏程度,决定哪些批次在资源有限的情况下应该优先更换;第二:通过建立电能表非健康值预测模型,找出那些暂时问题不是很严重的批次在之后的发展变化中是否会成为优先选择更换的批次:第三:由于每年都会有新增户数安装电表的需求,这部分电表也是备品备货主要组成之一,所以通过观看近几年各地区人口增长的走势,结合政策导向,利用时间序列算法预测未来时间里有可能新增的户数。

附图说明

图1为本发明的电能表备品备货工作流程图。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。

参见图1,其具体实现步骤如下:

本发明是基于大数据统计分析电能表的非健康值和以往每年新增户数,利用机器学的梯度树提升算法和Arima时间序列算法对电能表未来的非健康值和新增户数进行预测分析,其具体实现步骤如下:

S1:选取所有批次电能表的一个月数据进行降维处理,数据降维基本原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间,从而获得一个关于原数据集紧密的低维表示。利用逐步回归分析法从原始变量中找出少数几个主变量,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。

逐步回归分析法的计算步骤如下:

1、先将被解释变量y对每个解释变量x1,x2,x33……做简单回归,再对每一个回归方程进行统计检验分析(相关系数,拟合优度,标准误差)选出最优的回归方程,也称基本回归方程;

2、将其他解释变量逐一的引进到基本回归方程中,如果引入一个新的解释变量使拟合优度有提升,而其他的参数和回归系数仍然合理,那说明这个解释变量是有利的,可以保留;如果引入之后拟合优度不明显,对回归系数也没什么影响,则不必保留。如果新解释变量不仅改变了拟合优度,而且对其他回归系数的数值和符号也产生了重要的影响,那么这个新变量是不利变量,引进后会使模型出现多重共线性问题。不利变量也不一定要舍去,如果它对被解释变量确实是不可缺少的,则不能简单的舍去,应该寻找更合适的模型,重新进行估计。如果通过检验证明回归模型存在两个明显线性相关的解释变量,并且其中一个变量可以很好地被另一个变量所解释,那么可以省去对被解释变量影响较小的变量,保留影响较大的变量。

S2:由第一步得出模型的主要变量后,利用统计平均数法,对主要的几个变量进行加权打分,再通过非健康值的计算公式降成一个维度,非健康值计算出来后需要min-max标准化,最终用散点图展现出各批次电能表的非健康值分布。

1、统计平均数法(Statistical average method)是根据所选择的各位专家对各项评价指标所赋予的相对重要性系数分别求其算术平均值,计算出的平均数作为各项指标的权重。其基本步骤是:第一步,确定行业专家进行初评。将待定的电能表运行状态、报废费和折旧率权数的指标提交给各位专家,并请专家在不受外界干扰的前提下独立的给出各项指标的权数值;第二步,回收专家意见。将各位专家的数据收回,并计算电能表整体运行状态涉及的各项指标的权数均值和标准差;第三步,分别计算电能表整体运行状态各项指标权重的平均数。

2、建立非健康度分析模型如下:

(Gi、Ai:变量,Ki、Fi:该变量对应的权重),

Ai:故障率,Fi:故障率权值;(故障包括电表倒走,电能表反向潜动、电能表电池欠压、电能表总与各费率之和不一致等);

G2:待报废率,K2:待报废率权值;

G3:报废率,K3:报废率权值;

G4:折旧率,K4:折旧率权值;

G5:检测不合格率,K5:检测不合格率权值。

3、min-max标准化(Min-Max Normalization):

通过min-max标准化对原始数据的线性变换,使结果值映射到[0-1]之间。转换函数如下:

其中,max为样本数据的最大值,min为样本数据的最小值。

S3:通过梯度树提升分析预测算法对非健康值进行预测,梯度树提升步骤如下:

1、首先初始化:

f0(x)=argminc∑i=1NL(yi,c);

估计一个使损失函数极小化的常数值,此时它只有一个节点的树;

2、迭代的建立M棵提升树:

for m=1to M:(第一层循环),

for i=1to N:(第二层循环),

计算损失函数的负梯度在当前模型的值,并将它作为残差的估计值:

对于rmi拟合一棵回归树,得到第m棵树的叶节点区域Rmj,j=1,2,…,J,

for j=1to J:(第二层循环),计算如下:

cmj=argminc∑xi∈RmjL(yi,fm-1(xi)+c);

利用线性搜索估计叶节点区域的值,使损失函数极小化;

然后,更新fm(x)=fm-1(x)+∑Jj=1cmjI(x∈Rmj)。

3、最后得到的fm(x)就是我们最终的模型:

f~(x)=fM(x)=∑m=1M∑j=1JcmjI(x∈Rmj)

S4:通过Arima时间序列算法预测新增户数,Arima时间序列算法步骤如下:

1、根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。

2、对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。

3、根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。(其中,截尾是指时间序列的自相关函数(ACF)或偏自相关函数(PACF)在某阶后均为0的性质(比如AR的PACF);拖尾是指ACF或PACF并不在某阶后均为0的性质(比如AR的ACF)。)

4、进行参数估计,检验是否具有统计意义。

5、进行假设检验,诊断残差序列是否为白噪声。

6、利用已通过检验的模型进行预测分析。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1