一种基于集成ELM的配电网窃电嫌疑用户智能识别方法与流程

文档序号:11143377阅读:632来源:国知局
一种基于集成ELM的配电网窃电嫌疑用户智能识别方法与制造工艺

本发明涉及配电网反窃电技术领域,具体涉及一种基于集成ELM的配电网窃电嫌疑用户智能识别方法。

技术背景

因用电用户有意或无意的非法用电行为,导致营销系统不能正常计费收费,给电力系统在运行过程中造成一定的损失,为了避免和减少这些损失,需要对用户的用电使用情况实时监测,防止和减少窃电和漏电的情况出现。

传统的防窃电措施通常是定期巡检线路、定期校验电表、用户举报窃电等手段,这些手段效率低、对人的依赖大,目标也不明确,需要一个智能的分析手段来判定用户的用电是否正常,再对重点监控的用户实时告警,为现场勘察是否偷电提供依据,即采用大数据分析与挖掘技术对窃电嫌疑用户进行智能识别。

目前,BP神经网络算法凭借强大的自学习与自适应能力较为广泛应用于防窃电预测领域,但其收敛速度慢,对样本依赖性强等缺点也影响了预测的效率及精度。基于上述背景,本发明提出了一种基于集成ELM(Extreme Learning Machine,极限学习机)的配电网窃电嫌疑用户智能识别方法。该方法集合了ELM较快的学习速度与集成学习的高精度性,并从线损、窃电告警、电量及负荷多个维度分析用户窃电嫌疑,能实现窃电行为的快速有效识别,从而将反窃电管理模式提升至“事前预防、事中控制”的管理水平。



技术实现要素:

本发明涉及一种基于集成ELM的配电网窃电嫌疑用户智能识别方法,主要包括以下步骤:

步骤1:获取学习数据和预测数据并进行数据清洗;

步骤2:构建窃电评价指标体系:告警特征、电量特征及负荷特征,形成学习样本和预测样本;

步骤3:将所述的学习样本划分为训练集和测试集,利用所述的训练集学习集成ELM窃电嫌疑用户识别模型,并基于所述的测试集评估模型效果。

步骤4:将预测样本作为所述的集成ELM窃电嫌疑用户识别模型输入量,输出每一用户的窃电嫌疑系数,锁定窃电嫌疑用户。

所述的基于集成ELM的配电网窃电嫌疑用户智能识别方法,其特征在于,所述的学习数据和预测数据,包含用户档案、告警、行度及负荷四种类型;所述的学习数据中必须包含正常用户样本与窃电用户样本,所述的测试数据仅包含窃电嫌疑线路下的部分用户,而窃电嫌疑线路通过线损进行定位。

所述的基于集成ELM的配电网窃电嫌疑用户智能识别方法,其特征在于,所述的窃电评价指标体系,包含告警、电量及负荷三大特征,所述的告警特征为窃电告警系数,所述的电量特征包括斜率及截距,所述的负荷特征包括斜率及截距,为当前时间往前推移的天数。

所述的基于集成ELM的配电网窃电嫌疑用户智能识别方法,其特征在于,所述的窃电告警系数的计算公式为:

其中,表示所有窃电告警组合(包括单个的)的权重之和,表示天内出现的所有告警组合的最大子集的权重,而告警及其组合的权重将根据其对窃电的影响程度的大小有专业人员设定。

所述的基于集成ELM的配电网窃电嫌疑用户智能识别方法,其特征在于,所述的斜率、截距、斜率及截距将通过构建一元线性回归方程得到,具体模型为:

其中,,,,为用电量,为时间编号(以天为单位),为负荷,故、分别表示在第天的前天的用电量及负荷,有,,,。

所述的集成ELM窃电嫌疑用户识别模型,包含如下几个步骤:

(1)初始化ELM模型参数,包括:极限学习机隐含层神经元个数,训练极限学习机个数,基于准确率集成极限学习机分类器的个数,基于差异度集成的极限学习机的个数;

(2)基于不同,用训练样本(矩阵)训练生成个极限学习机;

(3)用每个极限学习机识别测试集样本,计算每一个极限学习机分类器的确率:

(4)根据识别率大小,选择个识别效果较好的极限学习机。

(5)对于筛选出的个极限学习机,采用Q统计法计算任何,()间的差异度,计算公式为:

其中,与表示极限学习机,均预测正确与均预测错误的样本数,表示预测错误而预测正确的样本数,相反,表示预测正确而预测错误的样本数。

(6)将个极限学习机组合为个分类器集,计算每个分类器集的差异度:

表示第个分类器集中极限学习机()间的差异度。

(7)比较所有极限学习机分类器集的差异度,最大对应的极限学习机集合则为集成ELM模型。

(8)当利用上述集成ELM模型进行预测时,采用投票法得到综合判断结果。

本发明提出的集成ELM窃电嫌疑用户识别模型,综合考虑了单一ELM的高学习效率与高泛化能力,针对单一ELM模型训练精度较弱的缺点,对其采用集成学习的方式进行改进。同时,为保证集成ELM模型的多样性及有效性,对于不同的单一ELM采用不同的网络结构(隐含层神经元不同),并利用准确率与差异度对其进行筛选,使最终集成的组合ELM模型最优,对窃电嫌疑用户的识别效果明显优于传统的单一ELM模型。在指标的选择上,模型从与窃电有关告警、平均电量及其变化趋势、平均负荷及其变化趋势多个维度分析用户窃电的可能性,能有效识别用户窃电行为,将反窃电管理模式提升至“事前预防、事中控制”的管理水平。

附图说明

图1 基于集成ELM的配电网窃电嫌疑用户智能识别方法的主要流程图;

图2 集成ELM模型的主要流程图;

图3 单一ELM模型的示意图;

图4 本发明模型的ROC曲线与传统单一LM模型的比较图。

具体实施方式

下面结合附图和实施例对本发明的技术方案进行详细的说明。

本实施例为基于本发明集成ELM窃电嫌疑用户智能识别模型对广东电网江门供电局蓬江窃电嫌疑用户做出预测,结合图1的模型建立与求解过程,具体步骤如下:

步骤1:获取学习数据和预测数据并进行数据清洗;

步骤2:构建窃电评价指标体系:告警特征、电量特征及负荷特征,形成学习样本和预测样本;

步骤3:将所述的学习样本划分为训练集和测试集,利用所述的训练集学习集成ELM窃电嫌疑用户识别模型,并基于所述的测试集评估模型效果。

步骤4:将预测样本作为所述的集成ELM窃电嫌疑用户识别模型输入量,输出每一用户的窃电嫌疑系数,锁定窃电嫌疑用户。

所述的步骤1具体说明如下:

本实施例涉及的数据来源于2016年1月至2016年10月广东省江门市蓬江区内配网用户档案(用户编号、用电类型)、窃电告警(用户编号、告警名称、告警时间)、行度(用户编号、日期、日走字)、负荷(用户编号,日期,负荷)数据,其中行度及告警数据的时间间隔为1小时。其中2016年1月份至9月份的窃电用户及部分正常用户组数据为学习数据,2016年10月份部分用户数据为预测数据。本过程可以描述为:

S1.1:学习数据抽取。从江门供电局计量自动化系统抽取蓬江供电局2016年1月至2016年9月窃电用户及部分正常用户上述四种类型数据。

S1.2:预测数据抽取,具体包含以下3个子步骤:

1)筛选10月份月线损超出正常范围线路为窃电嫌疑线路;

2)针对窃电嫌疑线路下用户,结合用电类型,排除路灯专变、学校用电等窃电嫌疑微小用户,并定义工业用电、商业用电等其余用电户为待预测用户。

3)针对待预测用户,从江门供电局计量自动化系统抽取2016年10月份数据组成测试数据。

S1.3:数据清洗,具体包括:缺失数据的插补与异常数据的处理。

所述的步骤2具体说明如下:

S2.1:针对清洗后的学习与预测数据,计算每个用户每天的总电量及总负荷, 整理其告警组合;

S2.2:计算每一个用户每一天的窃电告警系数:

其中,表示所有窃电告警组合(包括单个的)的权重之和,表示天内出现的所有告警组合的最大子集的权重,而告警及其组合的权重将根据其对窃电的影响程度的大小有专业人员设定。

S2.3:利用一元回归模型计算每一个用户每一天的电量特征,即斜率、截距:

其中,,,为用电量,为时间编号(以天为单位),表示在第天的前天的用电量,有,,此处有的取值为5。

S2.4:利用一元回归模型计算每一个用户每一天的电量特征,即斜率、截距:

其中,,,为负荷,为时间编号(以天为单位),表示在第天的前天的负荷,有,,此处有的取值为5。

S2.5:形成学习样本和预测样本。对于学习样本,需根据用户在某一日期是否窃电为每一条记录打标签,1表示窃电,0表示未窃电,最终形成学习样本和预测样本如表1,表2示例所示:

表1 学习样本示例

表2 测试样本示例

结合附图2,所述的步骤3具体说明如下:

S3.1:划分训练集与测试集,比例为7:3;

S3.2:利用训练集学习集成ELM模型;

S3.3:利用测试集评估集成ELM模型。

S3.2子步骤:

1)S3.1:初始化ELM模型参数,包括:极限学习机隐含层神经元个数,训练极限学习机个数,基于准确率集成极限学习机分类器的个数,基于差异度集成的极限学习机的个数,本实施例中,、、、的取值分别为:、100、60、30。

2)S3.2:基于不同,用训练样本(矩阵)训练生成个极限学习机,具体包括:

a.判断生成的极限学习机的个数是否满足,否,转b,是,结束S3.2。

b.基于的取值范围,随机产生的具体数值;

c.基于和样本特征个数(本模型为5),随机生成极限学习机输入层到隐含层连接权重矩阵(ⅹ);

d.计算隐含层与输出层间连接权重,得到单一极限学习机模型。返回a。

3)用每个极限学习机识别测试集样本,计算每一个极限学习机分类器的确率:

4)根据识别率大小,选择个识别效果较好的极限学习机。

5)对于筛选出的个极限学习机,采用Q统计法计算任何,()间的差异度,计算公式为:

其中,与表示极限学习机,均预测正确与均预测错误的样本数,表示预测错误而预测正确的样本数,相反,表示预测正确而预测错误的样本数。

6)将个极限学习机组合为个分类器集,计算每个分类器集的差异度:

表示第个分类器集中极限学习机()间的差异度。

7)比较所有极限学习机分类器集的差异度,最大对应的极限学习机集合则为集成ELM模型。

8)当利用上述集成ELM模型进行预测时,采用投票法得到综合判断结果。

所述的S3.3的具体过程描述如下:

将测试集作为上述集成ELM模型的输入,预测测试集中每一用户在某一天的窃电嫌疑概率,并将0.5作为划分是否窃电的阈值,并将结果绘制为ROC曲线。

ROC曲线是衡量一个分类模型分类效果高低的标准,一般情况下,ROC曲线包含的面积越大。图3中本发明算法所代表的ROC曲线位于传统单一ELM模型的上方,证明了集成ELM模型的识别效果优于传统单一ELM。

所述的步骤4具体说明如下:

将预测样本作为所述的集成ELM窃电嫌疑用户识别模型输入量,输出每一用户的窃电嫌疑系数,锁定窃电嫌疑用户,后续可继续监测嫌疑用户的用电行为再进行现场取证。

综合以上分析,本发明提出的集成ELM窃电嫌疑用户识别模型,综合考虑了单一ELM的高学习效率与高泛化能力,且针对单一ELM模型训练精度较弱的缺点,对其采用集成学习的方式进行改进。同时,为保证集成ELM模型的多样性及有效性,对于不同的单一ELM采用不同的网络结构(隐含层神经元不同),并利用准确率与差异度对其进行筛选,使最终集成的组合ELM模型最优,对窃电嫌疑用户的识别效果明显优于传统的单一ELM模型。在指标的选择上,模型从与窃电有关告警、平均电量及其变化趋势、平均负荷及其变化趋势多个维度分析用户窃电的可能性,能有效识别用户窃电行为,将反窃电管理模式提升至“事前预防、事中控制”的管理水平。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1