基于时序演化基因模型的计量装置时钟误差趋势预测方法与流程

文档序号:18270050发布日期:2019-07-27 09:34阅读:196来源:国知局
基于时序演化基因模型的计量装置时钟误差趋势预测方法与流程

本发明涉及电力运维领域,尤其涉及基于时序演化基因模型的计量装置时钟误差趋势预测方法。



背景技术:

电能计量装置设备的正常稳定运行,影响着电网公司的发展和其运营的经济效益。其中,时钟作为计量装置的基本组成设备之一,其准确与否直接关系到计量设备能否准确计量不同时段的数据。然而,由于不精准的时钟同步信号、装置晶振时钟频率不满足规程要求、通讯延时、装置响应延时以及校时软件实现方法不同等众多原因,不可避免地会造成电能计量装置时间与标准时间发生偏差。

然而,已有工作均只能解决特定场景的时钟误差问题,不够通用化。更换了计量装置亦或是装置由于其它更多不同的问题产生时钟偏差时,就无法沿用先前的防范措施。造成这些问题的根本原因在于已有工作往往从计量装置的设计、产生误差的原因等特定原因出发进行展开,而缺少对海量历史误差记录的充分分析与利用。



技术实现要素:

本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供基于时序演化基因模型的计量装置时钟误差趋势预测方法,以达到实现未来时钟误差范围的预测目的。为此,本发明采取以下技术方案。

基于时序演化基因模型的计量装置时钟误差趋势预测方法,包括以下步骤:

1)获取用电信息采集系统的数据,数据包括采集系统中电能装置历史的时钟及其误差记录,电能装置历史对时记录,电表台区停电记录;

2)将数据输入时序演化基因模型中,预测将来的时钟误差走势;时序演化基因模型为基于循环神经网络与生成对抗网络的神经网络模型;

时序演化基因模型对数据的处理包括以下步骤:

201)对于电表时钟误差,在一定窗口上划分成若干子序列;

202)分析窗口子序列误差变化的特征,通过分类器,将具有类似分布的子序列分到一块;

203)进行时序演化基因的训练,通过生成对抗网络,挖掘生成这些子序列分布特征的基因;

204)组合历史上各个子序列的基因,通过循环神经网络分析其演化过程,分析其演化模式,预测其将来的时钟误差走势。

作为优选技术手段:为增加通用性和加快处理的速度,在时序演化基因模型中,将电表时钟误差分为四种,分别为:单一变化型:时钟误差朝着一定方向逐步变化,最终超过可容纳的范围;剧烈波动型:时钟误差变化剧烈;平稳变化型:时钟误差基本趋平;自我恢复型:时钟误差朝着一个方向剧烈变化,但有明显的回调。

作为优选技术手段:在步骤201)中,在一条完成的时间序列上,划分成若干子序列,对于每一时间分段:xn={x1,…,xτ};

在步骤202)中,分类器区分出每一时间窗口内时钟变化所属的类型,类型为单一变化型、剧烈波动型、平稳变化型或自我恢复型;

在步骤203)中,通过变分自编码机vae对每一个xn进行特征抽取,变分自编码机vae包涵编码器e和解码器g;编码器e将xn编码出包涵多维混合高斯分布的均值μ,方差δ组合的特征隐层zn,然后解码器g通过采样这个多维混合分布还原样本;通过kl散度公式来减少特征隐层zn与采样之间的误差,具体公式如下:

解码器g在再采样的zn上进行反编码,还原出真实样本,然后使得判别器d识别不出尽可能犯错误,其目标函数为:

判别器d目标将真实样本和生成样本进行区分,其目标函数为:

其中pr指的真实样本中的分布,pz指的一个随机分布,我们一般用均匀高斯分布来表示。判别器与生成器之间就像进行了一个对抗游戏,互相制约,互相进步,从而捕捉到更加好的分段分布特征zn;

完成时序演化基因的训练之后,进行步骤204);

在步骤204)中,模型组合每一时段的基因特征zn与真实样本xn,通过循环神经网络qn对整体的演化过程进行挖掘分析,输出下月的发生异常的概率p和时钟估计值xn+1:

xn+1=σ(ψ(qn)+b)

式中:w和b为神经网络的参数,w为权重参数,b为偏置。

有益效果:本技术方案通过分析电能计量设备在过去的时间误差记录,挖掘时钟误差趋势的不同模式,并利用机器学习技术,实现未来时钟误差范围的预测。本技术方案不过多依赖于领域知识和人工先验,因此不局限于特定装置与造成误差的原因,可以自适应于不同的场景,从而提供更为通用的方案,解决泛化的电能装置时钟误差问题。

附图说明

图1是本发明的时序演化基因”模型示意图。

图2是观察到的四种不同的时钟演化案例。

图3是数据聚为4类后的平均时钟序列

图4是回归实验:预测接下来一个月4个星期的时钟误差值。

图5(a)、图(b)、图(c)、图(d)、图(e)、图(f)是演化模式识别的能力分析图。

具体实施方式

以下结合说明书附图对本发明的技术方案做进一步的详细说明。

本发明的目标,是通过分析电能计量设备在过去的时间误差记录,挖掘时钟误差趋势的不同模式,并利用机器学习技术,实现未来时钟误差范围的预测。由此,本发明的模型不过多依赖于领域知识和人工先验,因此不局限于特定装置与造成误差的原因,可以自适应于不同的场景,从而提供更为通用的方案,解决泛化的电能装置时钟误差问题。

本发明采用的模型为时序演化基因模型,是基于循环神经网络与生成对抗网络的最新神经网络模型。对于电表时钟误差,在一定窗口上划分成若干子序列,模型可以分析窗口子序列误差变化的特征,通过模型的分类器,将具有类似分布的子序列分到一块。通过生成对抗网络,挖掘生成这些子序列分布特征的基因。组合历史上各个子序列的基因,通过循环神经网络分析其演化过程,分析其演化模式(单一变化型、波动型等),预测其将来的时钟误差走势。

如图1所示,显示了时序演化基因模型的整体神经网络结构。在一条完成的时间序列上,对于每一时间分段:xn={x1,…,xτ},分类器c区分出每一时间窗口内时钟变化所属的类型i,之后通过变分自编码机(vae)(包涵编码器网络e,解码器网络g)对每一个xn进行特征抽取。具体来说,编码器e将xn编码出包涵多维混合高斯分布的均值,方差组合的特征隐层zn,然后解码器g通过采样这个多维混合分布还原样本。通过kl散度来减少编码与采样之间的误差,具体公式如下:

生成器网络g在再采样的zn上进行反编码,还原出真实样本,然后使得判别器识别不出尽可能犯错误,其目标函数为:

判别器网络d目标将真实样本和生成样本进行区分,其目标函数为:

网络整体的训练过程就像两个矛和盾之间互相竞争一样,两者之间互相竞争,一起进步。

完成“时序演化基因”的训练之后,模型组合每一时段的基因(zn)与真实样本xn,通过循环神经网络qn对整体的演化过程进行挖掘分析,输出下月的发生异常的概率p和时钟估计值xn+1:

xn+1=σ(ψ(qn)+b)

以下以具体实施例对本技术方案作进一步的说明。

1.数据来源

数据主要来源于国家电网用电信息采集系统,具体包括采集系统中电能装置历史的时钟及其误差记录,电能装置历史对时记录,电表台区停电记录,包涵5个地级市200万低压用户电表从2017年1月到2018年5月的数据,进行了观察分析。时钟数据每周采集一次,一月内正常应有4次采集数据。

2.数据观察

通过观察了随机采样的1000组数据,大体总结出4种不同类型的时钟变化趋势。如图2所示,从左到右依次是:单一变化型,剧烈波动型,平稳变化型,自我恢复型。图中红点表示当前发生时钟异常。

可以看到,单一变化型,时钟误差朝着一定方向逐步变化,最终超过可容纳的范围,究其原因,很可能是晶振所导致;剧烈波动型,时钟误差变化剧烈,导致的原因可能与通信延迟,电表质量,天气因素有关;平稳变化型,时钟误差基本趋平,电表质量比较好,很少发生超过120s的误差;自我恢复型,时钟误差朝着一个方向剧烈变化,但有明显的回调,究其原因,很可能是对时系统对其产生了作用。

2.1聚类分析

对200万低压电表时间跨度17个月的数据通过聚类算法,聚成4类,观察是否与观察到的4中类型基本吻合。对聚类出的每类样本,画出其平均时序演化图,如图3所示。发现基本吻合之前的人工发现。

3“时序演化基因”模型在浙江省计量装置时钟误差趋势预测的实验结果

模型在某公司提供的5个地级市200万低压用户电表的数据上通过回归实验与分类预测实验来验证模型的效果。回归实验中,模型读取电表前12个月每月采集的时钟数据(通信延迟,误差时间)后,输出下一个月该电表4次时钟数据采集的具体数值估计。分类预测实验,模型同样读取电表前12个月每月采集的时钟数据,输出下一个月内该电表是否会出现超过120s的故障状态。均方根误差(rmse)和准确率,查全率(precision,recall)作为评价指标来衡量模型的具体表现。

3.1回归预测——预测下月电表时钟误差采集值

图4展示了模型在回归上的测试效果。此任务的输出是预测接下来一个月内每个星期(一共四个星期)采集的时钟误差数据值。模型对比了多种现在工业主流的时序回归算法:arima、lstm,与单独用cave,cgan做生成器来学习时序特征的方法。可以看到,“时序演化基因”模型在这几个比较方法中取得了最好的效果。归一化后整体的数值预测误差在0.5上下波动。

3.2分类预测结果——预测下月电表时钟是否会发生超过120s的故障状态

表1展示了预测下月电表是否会发生异常(时钟误差超过120s)的结果。此任务是一个二分类问题,模型对比了近年来最新的时序分类预测算法:ed,dtw,cid等近邻方法,fs,tsf等时序建模方法,mc-dcnn,lstm等神经网络模型。

表格1当前版本模型的测试结果

可以看到,“时序演化基因”算法(eg+ff)在预测电能表时钟异常上有更好的表现。通过小范围和大范围两个数据集的测试,验证了“时序演化基因”算法的有效性。不依托任何专家知识下,通过模型对数据的自我分析,挖掘出了若干有意义的趋势变化特征,在预测时钟的未来走势上,表现良好。

4模型对计量装置时钟演化过程的可解释性分析

模型在给出异常预测的同时,能给出其具体的判断原因;具体来说,模型是否可以准确的识别出之前观察到的四种演化模式并作出相应的故障原因分析。

以下为此进行证明:

将不同基因所生成的样本各个时刻的均值方差通过折线图进行比较。如图5(e)所示,基因3的平均时钟误差显着大于其他基因,且方差值相比其他基因要大,这表明基因3是一个对应电能表异常状态的“异常基因”。图5(a)-(d)可视化了四种不同的电能表时钟误差的样例,它们分别代表着四种演化模式下的典型案例。下面的热力图展现了“时序演化基因”模型按时间顺序识别出的时序的分布基因,及基因的演化过程(在热力图中,y轴表示在不同时间将每个样本分配到当前基因的概率。例如,通过遵循单调模式演变的时钟误差首先保持较小的值,然后随着时间的推移而保持增长,如图5(a)所示。相应地,看到的模型捕捉到了这个过程并且倾向于首先将“正常基因”分配给样本,同时最终确定它具有“异常基因”(即基因3)。因此,看到模型分配基因的进化方式与单调模式相同。在其他三种模式中也可以观察到类似的结果。特别是,模型将“正常基因”和“异常基因”交替分配给具有自我恢复模式和剧烈波动模式的电能表,图5(b)-(c),同时倾向于继续为具有平稳变化模式的样本分配“正常基因”,如图5(d)所示。

模型最后验证了是否对识别不同的时钟演化模式有效果。将的模型与之前用k-means的方式进行的时钟演化模式识别做比较。用轮廓系数(一种量化评估聚类效果的方法,是综合了类间距离和类内密度的综合性评价指标)来作为比较。正如图5(f)所示,本技术方案采用的方法(eg)具有比k-means更好的时钟演化模式识别的能力。

以上图1所示的基于时序演化基因模型的计量装置时钟误差趋势预测方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行形状、结构等方面的等同修改,均在本方案的保护范围之列。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1