异常用电检测模型的建立方法与流程

文档序号:12468778阅读:230来源:国知局
异常用电检测模型的建立方法与流程

本发明涉及一种异常用电检测模型的建立方法。



背景技术:

异常用电(窃电、计量装置异常)是造成线损异常的重要因素,会给用电和电网安全带来隐患。但目前,异常用电检测存在如下难题:发现难、取证难、异常用电量计量难。特别是低压台区,用户多且分散,难以有效检测,这给低压线损管理带来困难,损害了供电企业利益。

具体而言,在营配调的大背景下,电力系统信息化程度不断提高,配用电数据量也随之迅猛增长,用电信息采集系统、营销业务系统、线损精细化平台等系统已积累了大量、丰富、完整的用户数据,但缺乏有效合理的数据分析手段。当前由技术人员对用电数据进行人工分析,采用电量突变阈值比较或浅层学习,进行异常用电检测研究,效果欠佳。且阈值需人为设定,具有较大的不确定性。

异常用电引起的线损异动是影响线损指标的一项重要因素,以低压供电用户为例,其用电量一直占据用电量的大比例。然而,目前低压用户因异常用电造成的线损水平较大,局部线损水平甚至达到50%以上,这些低压高线损台区多分布在老城居民区和商业经营集中区,都存在用电环境复杂不易掌握, 缺乏有效的反窃电技术手段等情况,已成为影响线损指标的重灾区,目前缺乏有效的线损异动监测及异常用电定位技术。

目前异常用电检测存在如下难点:

异常用电发现难:低压用电反窃电信息主要来自于群众举报与营业普查,群众举报很难覆盖所有台区用电情况,不确定性大;营业普查花费人力物力巨大,效率低,无法常态化进行,且供电企业普遍存在电力客户多、用电检查人员数量少的问题,窃电发现难已成为目前反窃电工作存在的最大问题。

异常用电取证难:由于电能有别于其他商品,其生产、运输和销售同时完成,因而电能被盗不同于其他商品被盗,有其独特的表现:①窃电现场难于保持,窃电者完全可以迅速销毁窃电工具,不留下一点痕迹;②窃电时间不固定,窃电证据难捕捉。

异常用电量计量难:因电能的特殊性,目前即使异常用电被发现,具体的电量也难以精确计算,只能通过调查询问和收集有关资料后再确定电能数据。《供电营业规则》规定,当窃电时间无法查明时,窃电日数至少按180天计算。但此计算方法简单粗暴,易遭遇质疑。结果是:供电企业的损失不能被较快的、全额的追回;窃电者没有得到应有的制裁。更为严重的是,窃电行为日益严重,对全社会的用电秩序带来了严重影响。



技术实现要素:

本发明的目的在于提供一种异常用电检测模型的建立方法,结合人工智能领域前沿技术对多平台用电数据进行分析,深度挖掘海量数据中隐藏的用户用电行为模式,定位异常用电嫌疑用户,让异常用电监测更智能、更高效。

为了达到上述目的,本发明的技术方案是提供一种异常用电检测模型的建立方法,对训练集用户的用电信息进行有效特征的提取,建立用于深度学习的初始训练数据集;在初始训练数据集中,将无标定是否异常用电的数据,作为所述异常用电检测模型的输入,在深度降噪自编码网络进行从底层到顶层的逐层无监督学习,获得网络各层编码器和译码器的参数;在网络顶层设置有高斯过程分类器,通过已标定是否异常用电的数据进行监督学习,从顶层向底层传输误差,对网络各层编码器和译码器的参数进行调整。

优选地,异常用电检测模型的输入是是用电信息的时-频特征。

优选地,提取用电信息的时-频特征,包含对用户信息中单项指标的时间序列分别进行整体经验模态分解和小波时-频分解。

优选地,所述单项指标包含以下的一个或多个:日用电量、台区线损、用户性质、功率因素、合同容比量、零电量、日电量突变、月电量突变、典型行业用户指标、历史用电服务指标、抄表日前后电量、电能表失电记录、电能表开盖记录。

优选地,所述异常用电检测模型输出异常度嫌疑系数,并根据异常度嫌疑系数对用户的异常度疑似概率进行排序;异常度嫌疑系数越大的用户的异常度疑似概率越高。

优选地,根据低压居民用户和低压非居民用户的用电信息,建立相应的异常用电检测模型。

优选地,输入至所述异常用电检测模型的用电信息,包含用户电量信息、用户属性及表计事件信息。

优选地,由用电信息采集系统、营销业务系统、线损精细化管理平台中的一个或多个,向所述异常用电检测模型提供所述用电信息。

本发明所述异常用电检测模型的建立方法,其优点在于:

本发明通过对异常用电行为机理的分析,执行基于整体经验模态分解-小波变换-熵的异常用户行为特征的提取,剔除噪声信号分量,获取多源信号的有用特征。本发明综合考虑了噪声、深度学习和高斯过程,建立了基于深度降噪自编码网络-高斯过程的异常用电行为识别模型。通过海量数据进行模型训练,再利用模型根据用户用电信息数据自动分析用户用电行为,自动判别用电异常嫌疑用户,缩小用电检查范围。模型的输入为海量用户的电量信息、用户属性及表计事件信息,输出为异常用电嫌疑用户列表。本发明基于异常用电检测模型,为异常用电监测与定位建立梯级检测机制,先筛查嫌疑用户再有针对性的采集监测,可以有效缩小用电检查范围,节省现场监测的人力物力,降低公司运营成本。

附图说明

图1是一种自动编码器的原理示意图;

图2a是传统的神经网络结构示意图;

图2b是深度学习结构的示意图;

图3是异常用电检测建模流程;

图4a、图4b分别是指标功率因素由EEMD-HT时频分解得到的EEMD模态分解和希尔伯特黄变换能量谱示意图;

图5是指标功率因素的小波时频分解示意图;

图6a、图6b分别是指标有功总电能由EEMD-HT时频分解得到的EEMD模态分解和希尔伯特黄变换能量谱示意图;

图7是指标有功总电能的小波时频分解示意图。

具体实施方式

本发明所述的异常用电检测模型,应用于一种异常用电监测与定位处理系统。从用电信息采集系统、营销业务系统、线损精细化平台等处,获取海量用户用电信息,作为异常用电检测模型的输入,由模型自动提取有效特征并分类,输出嫌疑异常用户的列表;以便用电检查人员对筛选出的嫌疑用户进行现场检查,对异常用户进行查处。其中,利用人工智能领域前沿技术——深度学习(Deep Learning,以下简称 DL)算法,构建本发明所述基于深度降噪自编码网络-高斯过程的人工智能异常用电检测模型。

如图1所示是一种自动编码器(Auto-Encoder, AE)的实现原理,输入信号(input)传送给一个编码器(encoder)得到用以表示该输入信号的相应编码(code),之后连接一个解码器(decoder)从编码转换得到一个重构信息(reconstruction),如果重构信息与输入信号很像(理想情况下两者是一样的),则有理由相信这个编码是靠谱的。因此,通过调整编码器和解码器的参数,使得重构误差最小,这时候就得到了输入信号的第一个表示,即前述的编码信息。输入的是无标签数据时,误差的来源就是直接重构后与原输入相比得到。

在图1所示自动编码器的基础上,将一定比例的背景噪声添加到输入信号中,则在学习去掉噪声的过程中,学习到输入向量最本质的、最稳定的特征表达,从而获得一种降噪自动编码器(Denoise Auto-Encoder, DAE)。训练完成之后,降噪自编码网络对含有背景噪声的输入数据有了更强的适应性,对输入信号的有更加鲁棒的表达。

本发明所述深度降噪自编码网络(Deep Denoise Auto-Encoder Network, DDAEN)是由若干个降噪自动编码器DAE组成,原始数据作为第一层DAE的输入,逐层训练,将训练好的L-1层的输出作为第L层的输入。在逐层训练时,训练准则是最小化重构误差,而训练时会将神经网络展开为编码器和解码器,即展开为三层的神经网络,通过误差方向传播算法修改权值。通过这种方法获得的编码器与解码器权值,不存在转置的约束关系。在逐层训练过程中从原始数据在特征空间的复杂分布开始,逐层变换成低维、光滑的分布,即忽略掉一些微小的噪声,去掉原始数据的冗余,使得数据分布更加简单。通过梯度下降算法去训练DDAEN,可以对异常用电检测模型的评价体系指标进行多层学习,进而获取异常用电检测模型的评价标的抽象特征。

具体而言,本发明中进行深度学习训练的过程,包含:

1)自下上升的非监督学习(从底层开始,一层一层的往顶层训练),采用无标定是否异常用电的数据分层训练各层参数,这一步可以看作是一个无监督训练过程,是和传统神经网络区别最大的部分:具体的,先用无标定数据训练第一层,训练时先学习第一层的参数(这一层可以看作是得到一个使得输出和输入差别最小的三层神经网络的隐层),由于模型容量(capacity)的限制以及稀疏性约束,使得得到的模型能够学习到数据本身的结构,从而得到比输入更具有表示能力的特征;在学习得到第n-1层后,将n-1层的输出作为第n层的输入,训练第n层,由此分别得到各层的参数。

2)自顶向下的监督学习(通过带标签的数据进行训练,误差自顶向下传输,对网络进行微调);基于第1)步得到的各层参数进一步调节(fine-tune)整个多层模型的参数,这一步是一个有监督训练过程;第一步类似神经网络的随机初始化初值过程,由于DL的第一步不是随机初始化,而是通过学习输入数据的结构得到的,因而这个初值更接近全局最优,从而能够取得更好的效果;所以模型效果好很大程度上归功于第一步的特征学习(feature learning)过程。传统神经网络与深度学习DL结构的比较,参见图2a、图2b所示。

如图3所示,是异常用电检测工作流程。本发明中异常用电检测模型的工作过程包括训练和测试两部分。训练过程即为异常用电检测模型建立过程,测试过程即为根据建立的模型进行用户用电异常度预测。

A训练过程:

A1)对训练集海量用户的电量、电表事件指标等信息,进行时-频特征提取,建立深度学习的初始训练数据集;

A2)对于基于深度降噪自编码网络-高斯过程的异常用电检测模型,将无标签的初始训练数据集输入模型,通过无监督的逐层学习获取较为优化的网络初始权值;

A3)在网络顶层附加有监督学习的高斯过程分类器(通过带标签的数据进行训练,误差自顶层向底层传输;标签表示是否为异常用电用户),对模型的整体网络参数进行进一步细微调节,最终获取异常用电检测模型。

为提升模型预测准确性,可以为不同类型的用户建立不同的模型,发明中即针对低压居民用户和低压非居民用户分别建模。

B、测试过程:

1)提取被测用户电量、电表事件指标等信息时-频特征;

2)将提取的特征,输入至异常用电检测模型,模型输出被测用户异常嫌疑系数。嫌疑系数越大,异常用电可能性越大。

本发明中基于深度学习算法,以日用电量、台区线损、用户性质、功率因素、合同容比量、零电量、日电量突变、月电量突变、典型行业用户指标、历史用电服务指标、抄表日前后电量、电能表失电记录、电能表开盖记录等作为异常用电检测模型的单项指标,对这些单项指标的时间序列分别进行整体经验模态分解和小波时-频分解,分别提取时频域特征作为深度学习模型的初始输入数据集(图4a及图4b、图5分别给出一个指标的整体经验模态分解和小波分解谱图;图6a及图6b、图7分别给出另一个指标的整体经验模态分解和小波时频分解图)。

在此基础上,建立基于深度降噪自编码网络—高斯过程的异常用电检测模型的评价体系,以评价体系的底层单项指标的时频特征作为输入向量设计训练样本,建立深度降噪自编码网络结构、选取高斯过程模型作为顶层分类预警器。应用训练样本对深度学习网络进行训练,最后以异常度嫌疑系数作为输出,通过分析嫌疑系数大的用户用电情况,找出具有异常用电行为的用户属性特征及判断规则。

本发明通过深度降噪自编码网络—高斯过程模型深入学习海量数据,快速从不同维度提取数据的有效特征,并给出异常度疑似概率排序。利用此模型只需监测异常度排序靠前的少数用户,即可查出大部分异常用户,解决异常用电发现难的难题。

尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1