基于用电采集系统的多时间尺度用电异常分析方法与流程

文档序号:11201026阅读:408来源:国知局
基于用电采集系统的多时间尺度用电异常分析方法与流程

本发明属于监测领域,尤其涉及一种用于电网用户用电数量异常的原因确定方法。



背景技术:

台区线损率为台区总供电量与台区总售电量的差值除以台区总供电量,它是供电公司一项非常重要的考核指标,直接影响着公司的经济效益。

目前,大多数供电公司要求台区线损率在10%以内。然而,由于受人员、设备、窃电等因素的影响,导致用电出现异常,从而使得台区线损率较高,需要进行排查和消缺。以往大多通过现场巡检或基于用户每月电量、月度线损情况,凭经验来确定电能计量异常用户,这些传统的方法时效性差、准确率低。因此如何有效的处理用电异常问题引起了现场运维人员的广泛关注。

用电信息采集系统能够对用电信息进行实时监控、分析和处理。随着用电采集系统的推广应用,采集覆盖范围从专变用户逐步扩大到居民用户、一般工商业用户等,每日获取的用电数据量也越来越全面。这些用电数据之间存在着关联性,潜藏着用电行为等大量有价值的信息,能够为用电异常分析提供依据。

目前已有学者基于用电采集系统,提出了相关的分析方法。例如,“基于离群点算法和用电信息采集系统的反窃电研究”(《电力系统保护与控制》,程超,张汉敬,景志敏等,2015,43(17):p69-74.)中,分析了窃电手段及原理,进而基于电压电流值的规律,结合离群点检测法确定了窃电判定算法。“基于密度聚类和frechet判别分析的电价执行稽查方法”(《电网技术》,彭显刚,郑伟钦,林利祥等.2015,39(11):p3195-3201.)以数据挖掘技术为基础,提出了一种基于密度聚类分析和frechet距离判别的异常用户甄别方法。“基于数据挖掘的计量装置在线监测与智能诊断系统的设计与实现”(《电测与仪表》,肖坚红,严小文,周永真,等.2014,51(14):p1-5.)中提出和研制了一套计量装置在线检测和智能诊断系统,能够分析出用户窃电和计量装置故障等情况。

上述研究取得了一定进展,然而这些文献仅对某一种方法进行了分析,而这些方法有各自的适用范围,能够处理的异常情况也有限制。

因此,如何在用户电量海量数据的基础上,对数据和方法进行归类和预处理,分析出各种方法的适用情况,使其能够推广应用,辅助工作人员进行电能计量异常排查还需要进一步的研究。



技术实现要素:

本发明所要解决的技术问题是提供一种基于用电采集系统的多时间尺度用电异常分析方法。其基于用电信息采集系统,按照时间尺度长短,对用电信息采集系统采集的数据进行分类,将用电采集系统获取的数据梳理成了短期用电数据和中长期用电数据;针对短期用电数据,利用电流电压等电气信息,结合相关的限值判定方法,辨识用电异常用户;针对中长期用电数据,利用日用电量和月用电量等电气信息,结合聚类算法和相关系数法,查找用电异常情况,进而实现了多时间尺度用电异常的分析,可从不同的时间尺度角度搜索到异常用电嫌疑用户。

本发明的技术方案是:提供一种基于用电采集系统的多时间尺度用电异常分析方法,包括通过用电信息采集系统采集用户用电的数据,其特征是:

首先按照时间尺度,对用电信息采集系统采集的数据进行分类;

所述的时间尺度分为短期时间尺度数据和中长期时间尺度数据;

所述的短期时间尺度数据包括每时刻电流电压集合和每日24小时电流电压集合;

所述的中长期时间尺度数据包括月度每日用电量集合和年度每月用电量集合;

对短期时间尺度数据,采用电流电压判定算法进行用户用电异常辨识;

对中长期时间尺度数据,采用聚类算法和相关系数法进行用户用电异常辨识;

所述的基于用电采集系统的多时间尺度用电异常分析方法,按照时间尺度,将用电采集系统获取的数据,梳理成了短期用电数据和中长期用电数据,从而从不同的时间尺度角度搜索到异常用电嫌疑用户。

具体的,在进行短期时间尺度的用电异常分析时,所述的电流电压判定算法用电压偏移系数βu和三相电流不平衡率βi作为用电异常的判断元素,电压偏移系数βu和三相电流不平衡率βi的具体计算方式如下:

式中u为电压;ue为额定电压;imax为三相中最大的相电流;iav为三相电流平均值;

根据电压偏移系数βu和三相电流不平衡率βi计算用户a相、b相和c相的电压偏移系数βau、βbu、βcu以及电流不平衡率βi,并做以下判断:

式中:分别为电压偏移系数和电流不平衡率的限值;

当各相的电压偏移系数βu、三相电流不平衡率βi与电压偏移系数的限值电流不平衡率的限值的布尔值为“真”时,则表示该用户存在用电异常嫌疑。

具体的,在进行中长期时间尺度的用电异常分析时,所述的聚类算法首先通过聚类分析得到该用电类别的典型用电负荷曲线,进而将需要排查的用户与典型用电负荷曲线进行比较,进而找出用电异常嫌疑用户。

其所述的聚类算法为k-means算法。

具体的,在进行中长期时间尺度的用电异常分析时,所述的相关系数法计算台区线损和用户电表显示电量之间的相关系数,若相关性高,则该用户存在异常嫌疑。

具体的,在计算台区线损和用户电表显示电量之间的相关系数时,对于台区线损δw和用户电量wo,i,所述相关系数ri的计算公式如下:

式中:wo,i为用户电表显示电量,δwi为计量误差,δw为台区线损,e(·)为期望值函数;

若相关系数ri大于其阈值则表示该用户存在用电异常嫌疑。

本发明的技术方案,在基于月度每日用电量集合对中长期数据进行用户用电异常辨识时,按照下列步骤进行:

步骤1:选取台区线损合理的用户最近的一个月30天日用电量数据作为样本数据,提取待分析的台区用户最近一个月30天日用电量数据做为分析数据;

步骤2:针对样本数据和分析数据中缺失部分,利用三次样条插值结合线性插值的方法补充缺失数据,其中满足三次样条插值条件的采用三次样条插值,不满足时,采用线性插值处理;

步骤3:在补全所有用电量数据后,为了消除不同量纲的影响,更好的体现用电变化规律,需要对原始数据进行归一化处理,把数据压缩在区间[0,1]之间。具体处理公式如下:

式中:w、w′分别为用户日用电量的原始数据和变换后的数据;wmin和wmax分别为用户在一个月内的日用电量最小值和最大值;

步骤4:对归一化后的样本数据按照用电性质进行分类,并利用聚类分析查找出用电异常嫌疑用户;

步骤5:根据待分析台区的关口总表数据和用户日用电量数据,计算出台区日线损量,进而利用相关系数法计算台区日线损量和用户日用电量之间的皮尔逊相关系数,查找出用电异常嫌疑用户;

步骤6:对步骤4和步骤5中发现的用电异常嫌疑用户进行现场核查,找出用电异常用户。

本发明的技术方案,在基于年度每月用电量集合对中长期数据进行用户用电异常辨识时,所分析的数据从一个月30日的日用电量数据变成一年12月的月用电量数据,其它计算过程与基于月度每日用电量集合对中长期数据进行用户用电异常辨识是的步骤相同。

与现有技术比较,本发明的优点是:

1.按照时间尺度,将用电采集系统获取的数据梳理成了短期用电数据和中长期用电数据,进而提出了一种多时间尺度用电异常分析方法来辨识用电异常情况;

2.基于电流电压判定算法的短期异常用电分析方法具有较高的准确性,适用于辨识专变终端用户异常情况;

3.聚类算法和相关系数法具有不同的适用范围,都能够有效的查找用电异常用户;

4.基于月度数据的异常分析方法较基于年度数据的方法实时性好,但年度数据真实性好,都有一定的分析价值。

附图说明

图1是本发明用电异常分析方法总体框架示意图;

图2是本发明k-means算法的计算流程示意图;

图3是基于月度用电数据得到居民用户30日的典型负荷曲线;

图4是基于月度用电数据得到商业用户30日的典型负荷曲线。

具体实施方式

下面结合附图和实施例对本发明做进一步说明。

本发明的技术方案,基于用电信息采集系统,按照时间尺度长短,将用电数据划分为短期用电数据和中长期用电数据,进而提出了多时间尺度用电异常分析方法。该方法针对短期时间尺度,利用电流电压等电气信息,结合相关的限值判定方法,辨识用电异常用户;针对中长期时间尺度,利用日用电量和月用电量等电气信息,结合聚类算法和相关系数法,查找用电异常情况。

考虑到用电信息采集系统获取的数据量较大,包含的信息量较多,因此按照时间尺度对数据进行分类,进而提出了相关的分析方法来识别用户异常的嫌疑用户。基于用电信息采集系统的多时间尺度用电异常分析方法总体框架如图1所示。

具体过程如下:首先按照时间尺度,对系统采集的数据进行分类,短期数据可分为每时刻电流电压集合和每日24小时电流电压集合,中长期数据可分为月度每日用电量集合和年度每月用电量集合,针对短期数据可采用电流电压判定算法进行异常辨识,针对中长期数据可采用聚类算法和相关系数法进行异常辨识,从而从不同的时间尺度角度搜索到异常用电嫌疑用户。

本发明所述的方法针对不同用户,具体操作存在一定的差别。目前用来采集用电信息的装置主要有两种,一种是专变终端,另一种是集中器。其中专变终端能够获取用户的电流电压和用电量等信息,对于这部分用户,可采用短期和中长期时间尺度的异常用电分析方法进行综合判断;而集中器一般没有开通获取电流电压信息的通道,只能获取用户用电量信息,对于这部分用户可采用中长期时间尺度的异常用电分析方法进行异常辨识。

1、短期时间尺度的用电异常分析方法

1.1、电压电流判定算法

专变终端主要是对三相用户采集信息,正常情况下,对于三相用户而言,电压会维持在额定值附近,同时电流不平衡率也较小。当出现明显的电压偏移或存在较大的不平衡电流时,表明此用户可能用电异常,需要排查。因此本文选用电压偏移系数βu和三相电流不平衡率βi作为用电异常的判断元素,具体计算公式如下:

式中:u为电压;ue为额定电压;imax为三相中最大的相电流;iav为三相电流平均值。

1.2基于实时用电数据的分析方法

专变终端可以实时获取用户的电压、电流数据,进而基于这些数据,根据式(1)和式(2)计算用户a相、b相和c相的电压偏移系数βau、βbu、βcu以及电流不平衡率βi,并做以下判断:

式中:分别为电压偏移系数和电流不平衡率的限值。当式(3)结果为布尔值true时,则表示该用户存在用电异常嫌疑。

1.3基于日用电数据的分析方法

专变终端会按照15min的时间间隔,对用户的电压和电流数据进行采样,绘制日电压和电流曲线。考虑到异常用电通常会维持几个小时以上,因此从中选取各整点时刻的电压、电流数据作为分析的依据即可说明问题。每日24小时的三相最大电压偏移系数欧式距离du和三相电流不平衡率欧式距离di计算公式分别如下:

若du值超过其限值或di值超过其限值则表示该用户存在用电异常嫌疑。

2、中长期时间尺度的异常用电分析方法

2.1聚类算法

对于相同用电类别的用户,相互之间的用电行为特征具有一定的相似性。基于这一特征,首先可以通过聚类分析得到该用电类别的典型用电负荷曲线,进而将需要排查的用户与典型用电负荷曲线进行比较,找出用电异常嫌疑用户。

在各种聚类方法中,k-means聚类算法具有收敛速度快、易于实现等优点,被广泛应用于用电负荷分析中,因此本技术方案选用该方法。

k-means算法的具体计算流程如图2所示。

基于k-means算法可以得到聚类中心集合,即典型用电负荷集合q={q1,q2,…,qk}。进而将需要排查的用电负荷数据w与q对比,计算最小欧式距离dw:

dw=min[dist(w,q1),dist(w,q2),...,dist(w,qk)](6)

式中:dist(·)为欧式距离函数。若dw值超过其限值则表示该用户存在用电异常嫌疑。

2.2相关系数法

表计计量误差的计算公式如下:

式中:为用户实际用电量;wo,i为表计显示电量。对于同一种表计回路接线错误,通常用户电表显示电量和真实电量是线性关系,如下所示:

因此式(7)可以转化成:

从上式可以看出,当用户电表显示电量wo,i越大,计量误差δwi就越大,台区线损δw也就越大,wo,i与台区线损之间具有明显的相关性。因此可以利用相关系数法计算台区线损和用户电表显示电量之间的相关系数,若相关性高,则该用户存在异常嫌疑。在常用的相关系数中,皮尔逊相关系数能够有效的衡量两个变量之间线性相关程度,因此可选用该方法进行用电异常分析。对于台区线损δw和用户电量wo,i,皮尔逊相关系数计算公式如下:

式中:e(·)为期望值函数。若ri大于其阈值则表示该用户存在用电异常嫌疑。

2.3基于月度用电数据的分析方法

基于月度用电数据的分析方法计算过程如下:

步骤1:选取台区线损合理的用户最近的一个月30天日用电量数据作为样本数据,提取待分析的台区用户最近一个月30天日用电量数据做为分析数据;

步骤2:针对样本数据和分析数据中缺失部分,利用三次样条插值[11]结合线性插值的方法补充缺失数据,其中满足三次样条插值条件的采用三次样条插值,不满足时,采用线性插值处理;

步骤3:在补全所有用电量数据后,为了消除不同量纲的影响,更好的体现用电变化规律,需要对原始数据进行归一化处理,把数据压缩在区间[0,1]之间。具体处理公式如下:

式中:w、w′分别为用户日用电量的原始数据和变换后的数据;wmin和wmax分别为用户在一个月内的日用电量最小值和最大值。

步骤4:对归一化后的样本数据按照用电性质进行分类,并利用聚类分析查找出用电异常嫌疑用户;

步骤5:根据待分析台区的关口总表数据和用户日用电量数据,计算出台区日线损量,进而利用相关系数法计算台区日线损量和用户日用电量之间的皮尔逊相关系数,查找出用电异常嫌疑用户;

步骤6:对步骤4和步骤5中发现的用电异常嫌疑用户进行现场核查,找出用电异常用户。

2.4基于年度用电数据的分析方法

基于年度用电数据的分析方法和基于月度用电数据的分析方法类似,只是将所分析的数据从一个月30日的日用电量数据变成一年12月的月用电量数据,其它步骤和计算过程相同。

实施例:

3.1短期时间尺度的异常用电实例分析

以某地区线损较高的5个台区139个专变终端用户为分析对象,验证短期时间尺度的异常用电分析方法的有效性。

根据实时数据可以判断出异常嫌疑用户数量为6个,具体的表号(最后8位)和异常现象如表1所示。经现场排查发现,该6个表计全部存在异常。

表1基于实时数据的分析结果

根据日用电数据可以判断出异常用电的用户为9个,除了表1中的6个用户外,还有2个用户存在异常用电嫌疑,如表2所示,经现场排查,确实存在计量问题。

由此可见,基于电流电压判定算法的短期异常用电分析方法具有较高的准确性。

表2基于日用电数据的分析结果

3.2中长期时间尺度的异常用电实例分析

为了验证聚类算法的有效性,首先选取台区线损合理的5789户居民用户和1951户商业用户作为样本数据进行聚类分析,得出典型负荷曲线,然后将某个包含62户居民用户和7户商业用户的台区作为分析对象,与典型负荷曲线进行对比,判断出嫌疑用户。

在聚类分析中,居民用户和商业用户的聚类数分别设置为15个和10个,基于月度用电数据得到30日的典型负荷曲线如图3和图4所示。

将分析对象与典型负荷曲线进行对比,距离限值取1.1,共分析出7户居民用户有异常嫌疑,现场排查发现其中5户表计确实存在异常,准确率为71.43%,具体情况如表3所示,由此可见聚类算法能够有效的甄别出嫌疑用户。

表3基于聚类算法的分析结果

为了验证相关系数法的有效性,计算62户居民用户和7户商业用户与台区线损的相关系数,并选取相关系数大于0.9的作为嫌疑用户,具体计算结果如表4所示,共包含4户居民和1户商业用户,经现场排查发现,2户居民用户和1户商业用户存在用电异常,准确率为60%。

对比聚类算法和相关系数法可以发现:聚类算法查找到的居民用户异常数量和准确率都高于相关系数法,而相关系数法比聚类算法多查出了一户商业用户用电异常,由此可见两种算法具有不同的适用性。

表4基于相关系数法的分析结果

基于年度数据,利用聚类分析算法查出用电异常嫌疑用户7户,查实4户,准确率为57.14%;利用相关系数法查出用电异常嫌疑用户6户,查实3户,准确率为50%。

相比于月度数据,基于年度数据的用电异常排查方法准确率都要略低一点,经分析,主要包括以下两个原因:(1)月度数据包括30个时段,而年度数据包含12个时段,月度数据样本量大,能够更好的反映用电变化的规律;(2)月度数据采样周期短,而年度数据采样周期长,月度数据能够更好的反映用电变化的实时性。但是由于采集通道问题,日用电量数据会存在一定程度缺失,即使利用插值方法弥补,也会存在部分失真现象,而对于月用电量数据,由于有人工补抄环节,所以数据较为完整,体现的信息更为真实,因此基于年度数据的用电异常排查方法也有一定的价值。

3.3多时间尺度的异常用电实例分析

利用所提出的多时间尺度用电异常分析方法,对21个台区2079个用户进行分析,共排查用电异常嫌疑用户97户,查实用户62户,此21个台区平均月线损率下降了8.23%,由此可见所提方法能够有效的辅助监控人员及时甄别用户异常用电情况。

由于本发明的技术方案按照时间尺度,将用电采集系统获取的数据梳理成了短期用电数据和中长期用电数据,进而提出了一种多时间尺度用电异常分析方法来辨识用电异常情况,通过实例分析可以得出以下结论:

(1)基于电流电压判定算法的短期异常用电分析方法具有较高的准确性,适用于辨识专变终端用户异常情况。

(2)聚类算法和相关系数法具有不同的适用范围,都能够有效的查找用电异常用户。

(3)基于月度数据的异常分析方法较基于年度数据的方法实时性好,但年度数据真实性好,都有一定的分析价值。

本发明可广泛用于供电公司用电管理和用户用电异常情况辨识领域。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1