一种窃电识别方法、装置及电子设备与流程

文档序号:20363832发布日期:2020-04-10 23:53阅读:185来源:国知局
一种窃电识别方法、装置及电子设备与流程

本申请涉及电力技术领域,尤其涉及一种窃电识别方法、装置及电子设备。



背景技术:

随着社会发展以及智能化用电设备等的增加,社会用电需求量不断增大,窃电行为也随之增加,尤其是低压用电用户,虽然每户的用电量相对较少,但用户基数大,而且经常出现整片区域联动窃电的现象,导致因低压窃电造成的经济损失就能达到数亿甚至数十亿元,因此需要对存在窃电行为的用户进行有效识别。

目前,通常是在获得用电指标之后对指标进行定级,并主观设定指标的权重以对指标进行加权,进而通过得到用户窃电嫌疑分数的大小来识别存在窃电的用户。

可见,这种方案中主观性较强,导致识别准确率较低。



技术实现要素:

有鉴于此,本申请提供一种窃电识别方法、装置及电子设备,如下:

一种窃电识别方法,包括:

获得至少一个用户的用户用电数据,所述用户用电数据至少包括用户标识、所述用户标识对应的用户日用电量;

获得至少一个台区的台区用电数据,所述台区用电数据至少包括台区标识、所述台区标识对应的一个或多个用户标识和所述台区标识对应的台区日管理线损;

监测所述用户标识对应的用户日用电量是否小于或等于第一阈值以及所述用户标识对应的台区日管理线损是否大于或等于第二阈值;

在所述用户标识对应的用户日用电量小于或等于所述第一阈值且所述用户标识对应的台区日管理线损大于或等于所述第二阈值且持续的天数大于或等于第三阈值的情况下,生成所述用户标识对应的第一识别结果,所述第一识别结果表征所述用户标识对应的用户从所述用户日用电量小于或等于所述第一阈值且所述台区日管理线损大于或等于所述第二阈值对应的起始日期开始存在窃电的嫌疑;

其中,在所述用户标识对应的用户日用电量大于所述第一阈值或所述用户标识对应的台区日管理线损小于所述第二阈值的情况下,所述方法还包括:

获得目标时长内的所述用户标识对应的用户日用电量和所述用户标识对应的台区日管理线损之间的相关系数,所述目标时长为大于或等于2天的时长;

在所述相关系数大于或等于第四阈值的情况下,生成所述用户标识对应的第二识别结果,所述第二识别结果表征所述用户标识对应的用户在所述目标时长内存在窃电的嫌疑。

上述方法,优选的,在所述目标时长内任一所述用户标识对应的用户日用电量和所述用户标识对应的台区日管理线损之间的相关系数小于所述第四阈值的情况下,所述方法还包括:

获得目标时长内用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数;其中,所述用户群对应于一个或多个所述用户标识,所述用户群对应的群日用电量为所述用户群中的用户标识对应的用户日用电量的和,所述用户群对应的台区日管理线损为所述用户群中的用户标识对应的台区日管理线损;所述目标时长为大于或等于2天的时长;

在所述相关系数大于或等于所述第四阈值的情况下,生成所述用户群对应的第三识别结果,所述第三识别结果表征所述用户群在所述目标时长内存在窃电的嫌疑。

上述方法,优选的,在所述目标时长内任一所述用户标识对应的用户日用电量和所述用户标识对应的台区日管理线损之间的相关系数小于所述第四阈值的情况下,所述方法还包括:

获得用户群,所述用户群中包括所述台区标识对应的所有用户标识;

获得目标时长内所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数;其中,所述用户群对应的群日用电量为所述用户群中的用户标识对应的用户日用电量的和,所述用户群对应的台区日管理线损为所述用户群中的用户标识对应的台区日管理线损;所述目标时长为大于或等于2天的时长;

在所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数大于或等于所述第四阈值的情况下,生成所述用户群对应的第三识别结果,所述第三识别结果表征所述用户群中的用户标识对应的用户在所述目标时长内存在窃电的嫌疑;

在所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数小于所述第四阈值的情况下,在所述用户群中删除所述目标时长内所对应的用户日用电量和台区日管理线损之间的相关系数最小的用户标识,返回重新执行所述获得目标时长内所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数,直到所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数大于或等于所述第四阈值。

上述方法,优选的,在所述目标时长内任一所述用户标识对应的用户日用电量和所述用户标识对应的台区日管理线损之间的相关系数小于所述第四阈值的情况下,所述方法还包括:

获得用户群,所述用户群中包括所述台区标识对应的用户标识中,在目标时长内所对应的用户日用电量和台区日管理线损之间的相关系数大的用户标识;

获得所述目标时长内所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数;其中,所述用户群对应的群日用电量为所述用户群中的用户标识对应的用户日用电量的和,所述用户群对应的台区日管理线损为所述用户群中的用户标识对应的台区日管理线损;所述目标时长为大于或等于2天的时长;

在所述用户群中添加所述台区标识对应的剩余用户标识中的一个用户标识;

获得所述目标时长内添加所述用户标识的用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数的变化量;

如果所述变化量表征所述相关系数增加,返回执行所述步骤:在所述用户群中添加所述台区标识对应的剩余用户标识中的一个用户标识,直到所述台区标识对应的剩余用户标识为空;

如果所述变化量表征所述相关系数减小,在所述用户群中删除最近添加的用户标识,返回执行所述步骤:在所述用户群中添加所述台区标识对应的剩余用户标识中的一个用户标识,直到所述台区标识对应的剩余用户标识为空;

在所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数大于或等于所述第四阈值的情况下,生成所述用户群对应的第三识别结果,所述第三识别结果表征所述用户群中的用户标识对应的用户在所述目标时长内存在窃电的嫌疑。

上述方法,优选的,所述目标时长为从所述用户用电数据中对应的最近日期向前所选取的指定时长。

上述方法,优选的,还包括:

在所述用户标识对应的用户日用电量或台区日管理线损满足以下任意一种的排除条件的情况下,删除所述用户标识对应的识别结果;

其中,所述排除条件包括:

在所述用户标识对应的用户日用电量满足与所述用户标识对应的台区日售电量的比例值大于第五阈值;

连续最多第六阈值的次数中所获得所述用户标识对应的用户日用电量和所述用户标识对应的台区日管理线损之间的相关系数大于所述第四阈值;

在所述目标时长内累计所述用户标识对应的用户日用电量为0的天数在所述目标时长内的比例值超过第七阈值;

所述用户标识对应的台区日管理线损小于0;

在所述目标时长中选定的部分时长内所获得所述用户标识对应的用户日用电量和所述用户标识对应的台区日管理线损之间的相关系数小于第八阈值;

在所述用户标识对应的接线方式为三相接线方式的情况下,所述用户标识对应的用户日用电量与所述用户标识对应的台区日管理线损之间的比值处于预设的比值区间;

所述用户标识对应的功率因数小于第九阈值。

一种窃电识别装置,所述装置包括:

用户用电获得单元,用于获得至少一个用户的用户用电数据,所述用户用电数据至少包括用户标识、所述用户标识对应的用户日用电量;

台区用电获得单元,用于获得至少一个台区的台区用电数据,所述台区用电数据至少包括台区标识、所述台区标识对应的一个或多个用户标识和所述台区标识对应的台区日管理线损;

用电监测单元,用于监测所述用户标识对应的用户日用电量是否小于或等于第一阈值以及所述用户标识对应的台区日管理线损是否大于或等于第二阈值;

第一结果生成单元,用于在所述用户标识对应的用户日用电量小于或等于所述第一阈值且所述用户标识对应的台区日管理线损大于或等于所述第二阈值且持续的天数大于或等于第三阈值的情况下,生成所述用户标识对应的第一识别结果,所述第一识别结果表征所述用户标识对应的用户从所述用户日用电量小于或等于所述第一阈值且所述台区日管理线损大于或等于所述第二阈值对应的起始日期开始存在窃电的嫌疑;

第二结果生成单元,用于在所述用户标识对应的用户日用电量大于所述第一阈值或所述用户标识对应的台区日管理线损小于所述第二阈值的情况下,获得目标时长内的所述用户标识对应的用户日用电量和所述用户标识对应的台区日管理线损之间的相关系数,所述目标时长为大于或等于2天的时长;在所述相关系数大于或等于第四阈值的情况下,生成所述用户标识对应的第二识别结果,所述第二识别结果表征所述用户标识对应的用户在所述目标时长内存在窃电的嫌疑。

一种电子设备,包括:

存储器,用于存储应用程序及应用程序运行所产生的数据;

处理器,用于执行所述应用程序,以实现:获得至少一个用户的用户用电数据,所述用户用电数据至少包括用户标识、所述用户标识对应的用户日用电量;获得至少一个台区的台区用电数据,所述台区用电数据至少包括台区标识、所述台区标识对应的一个或多个用户标识和所述台区标识对应的台区日管理线损;监测所述用户标识对应的用户日用电量是否小于或等于第一阈值以及所述用户标识对应的台区日管理线损是否大于或等于第二阈值;在所述用户标识对应的用户日用电量小于或等于所述第一阈值且所述用户标识对应的台区日管理线损大于或等于所述第二阈值且持续的天数大于或等于第三阈值的情况下,生成所述用户标识对应的第一识别结果,所述第一识别结果表征所述用户标识对应的用户从所述用户日用电量小于或等于所述第一阈值且所述台区日管理线损大于或等于所述第二阈值对应的起始日期开始存在窃电的嫌疑;在所述用户标识对应的用户日用电量大于所述第一阈值或所述用户标识对应的台区日管理线损小于所述第二阈值的情况下,获得目标时长内的所述用户标识对应的用户日用电量和所述用户标识对应的台区日管理线损之间的相关系数,所述目标时长为大于或等于2天的时长;在所述相关系数大于或等于第四阈值的情况下,生成所述用户标识对应的第二识别结果,所述第二识别结果表征所述用户标识对应的用户在所述目标时长内存在窃电的嫌疑。

从上述技术方案可以看出,本申请公开的一种窃电识别方法、装置及电子设备,通过同时监测用户日用电量和对应的台区日管理线损,进而在监测到用户日用电量小于或等于第一阈值且同时监测到相应的台区日管理线损大于或等于第二阈值时,进一步持续监测这种状态是否能够维持一定天数,进而来确定相应用户是否存在窃电嫌疑,而如果没有监测到用户日用电量小于或等于第一阈值或者相应的台区日管理线损大于或等于第二阈值的情况,那么可以利用目标时长内用户标识对应的用户日用电量和台区日管理线损之间的相关系数来判断用户是否存在窃电嫌疑,由此,本申请中能够避免单靠加权用电指标所导致的识别准确率低的情况,进而达到提高窃电识别准确率的目的。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例一提供的一种窃电识别方法的流程图;

图2-图5分别为本申请实施例一的另一流程图;

图6为本申请实施例二提供的一种窃电识别装置的结构示意图;

图7为本申请实施例三提供的一种电子设备的结构示意图;

图8-图12分别为本申请实施例的应用示例图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

如图1所示,为本申请实施例一提供的一种窃电识别方法的实现流程图,该方法可以适用于能够进行数据处理的电子设备中,如计算机或服务器等。本实施例中的技术方案主要用于实现对用户是否存在窃电嫌疑进行识别,并提高窃电识别准确率。

具体的,本实施例中的方法可以包括以下步骤:

步骤101:获得至少一个用户的用户用电数据。

其中,用户用电数据至少包括有用户标识和用户标识对应的用户日用电量。

具体的,本实施例中可以先获得用户标识对应的至少一个电表标识,并获得每个电表标识对应的表码数据、电表标识对应的电表接线方式以及电表标识对应的综合倍率;之后,针对每个用户标识对应的电表标识:

如果用户标识对应的只有一个电表标识,那么将电表标识对应的表码数据中当前日的正向有功冻结示值减去前一日的正向有功冻结示值,得到差值后再乘以综合倍率,得到相应电表标识对应的乘积,该乘积即为该用户标识对应的用户日用电量;

如果用户标识对应于多个电表标识,那么将电表标识对应的表码数据中当前日的正向有功冻结示值减去前一日的正向有功冻结示值,得到差值后再乘以综合倍率,得到相应电表标识对应的乘积,之后,再将每个电表标识对应的乘积进行加和后得到该用户标识对应的用户日用电量。

步骤102:获得至少一个台区的台区用电数据。

其中,台区用电数据至少包括台区标识、台区标识对应的一个或多个用户标识,还包括台区标识对应的台区日管理线损。

具体的,本实施例中可以先获得台区关口表的表码数据以及对应的综合倍率;之后,将台区关口表的表码数据中当前日的正向有功冻结示值减去前一日的正向有功冻结示值,得到差值后再乘以综合倍率,得到相应台区标识对应的日售电量,再将台区标识对应的台区日售电量减去该台区标识下所有用户标识对应的用户日用电量之和之后,得到的差值即为该台区标识对应的台区日线损,之后,对该台区标识对应的台区日线损取3%-5%得到该台区标识对应的台区日技术线损,相应的,台区标识对应的台区日线损中扣去台区日技术线损之和,即可得到台区标识对应的台区日管理线损。

步骤103:监测用户标识对应的用户日用电量是否小于或等于第一阈值以及用户标识对应的台区日管理线损是否大于或等于第二阈值。

其中,用户标识对应的台区日管理线损是指:用户标识对应的台区标识所对应的台区日管理线损。

需要说明的是,第一阈值和第二阈值可以为根据需求预先设置。

步骤104:在用户标识对应的用户日用电量小于或等于第一阈值且用户标识对应的台区日管理线损大于或等于第二阈值且持续的天数大于或等于第三阈值的情况下,生成用户标识对应的第一识别结果。

其中,第一识别结果表征用户标识对应的用户在用户日用电量小于或等于第一阈值且台区日管理线损大于或等于第二阈值对应的起始日期下存在窃电的嫌疑。

具体的,本实施例中在生成用户标识对应的第一识别结果时,是监测到两个条件同时满足,一个条件为用户标识对应的用户日用电量小于或等于第一阈值且用户标识对应的台区日管理线损大于或等于第二阈值,另一个条件则是用户标识对应的用户日用电量小于或等于第一阈值且用户标识对应的台区日管理线损大于或等于第二阈值所维持的天数是大于或等于第三阈值的。

需要说明的是,用户标识对应的用户日用电量小于或等于第一阈值且用户标识对应的台区日管理线损大于或等于第二阈值所维持的天数可以是指连续的日期天数。

相应的,在用户标识对应的用户日用电量小于或等于第一阈值且用户标识对应的台区日管理线损大于或等于第二阈值维持到第三阈值对应的起始日期时,确定用户标识对应的用户在该日期下存在窃电的嫌疑,此时生成用户标识对应的第一识别结果。

例如,本实施例中从监测到用户标识对应的用户日用电量降低到原用户日用电量的80%以下(小于或等于原用户日用电量的80%)且用户标识对应的台区日管理线损增加到原台区日管理线损的120%以上(大于或等于原台区日管理线损的120%)的第一天开始,从1开始记录天数,直到监测到用户标识对应的用户日用电量小于或等于第一阈值且用户标识对应的台区日管理线损大于或等于第二阈值已经持续到第n天,此时记录的天数n到达第三阈值n,由此生成第一识别结果,该第一识别结果表征用户标识对应的用户在第1天开始存在窃电的嫌疑。

步骤105:在用户标识对应的用户日用电量大于第一阈值或用户标识对应的台区日管理线损小于第二阈值的情况下,获得目标时长内用户标识对应的用户日用电量和用户标识对应的台区日管理线损之间的相关系数。

也就是说,本实施例中在监测用户日用电量和台区日管理线损时,可能没有监测到用户标识对应的用户日用电量小于或等于第一阈值且用户标识对应的台区日管理线损大于或等于第二阈值的情况,此时为了进一步提高窃电识别准确率,本实施例中通过目标时长内用户日用电量和台区管理线损之间的相关程度来判断用户标识对应的用户在目标时长内是否出现窃电嫌疑,此时,本实施例中可以利用获得皮尔逊相关系数的算法,对用户标识对应的用户日用电量和用户标识对应的台区日管理线损在目标时长内的相关系数进行计算,以得到在目标时长内的用户标识对应的用户日用电量和用户标识对应的台区日管理线损的相关系数,该相关系数是处于-1到1之间的数值。

其中,目标时长可以为大于或等于2天的任意时长,为了提高准确率,本实施例中可以设置目标时长为30天或31天(可以参考当前月份的天数),具体可以以用户用电数据中对应的最近日期向前选取指定时长,即为目标时长,例如,以当前日的前一日如11月30日(用户电表和台区关口表均具有表码数据的最近日期)向前取30天,得到从11月1日到11月30日的目标时长。

步骤106:在相关系数大于或等于第四阈值的情况下,生成用户标识对应的第二识别结果。

其中,第二识别结果表征用户标识对应的用户在目标时长内存在窃电的嫌疑。

需要说明的是,相关系数对应的第四阈值的大小可以根据需求设置,例如,如果需要提高窃电识别的灵敏度,可以将第四阈值设置为较小的数值,如果需要提高窃电识别的准确度,可以将第四阈值设置为较大的数值,在具体实现中,本申请实施例可以根据对灵敏度和准确度的需求,平衡设置第四阈值的大小。

从上述技术方案可以看出,本申请实施例一公开的一种窃电识别方法,通过同时监测用户日用电量和对应的台区日管理线损,进而在监测到用户日用电量小于或等于第一阈值且同时监测到相应的台区日管理线损大于或等于第二阈值时,进一步持续监测这种状态是否能够维持一定天数,进而来确定相应用户是否存在窃电嫌疑,而如果没有监测到用户日用电量小于或等于第一阈值或者相应的台区日管理线损大于或等于第二阈值的情况,那么可以利用目标时长内用户标识对应的用户日用电量和台区日管理线损之间的相关系数来判断用户是否存在窃电嫌疑,由此,本实施例中能够避免单靠加权用电指标所导致的识别准确率低的情况,进而达到提高窃电识别准确率的目的。

在具体实现中,本申请实施例中可能会发现在目标时长内任一用户标识对应的用户日用电量和台区日管理线损之间的相关系数均没有大于获得等于第四阈值,那么可能存在某个集体存在窃电的嫌疑,因此,本实施例中为了提高窃电识别的准确率,可以对存在集体窃电的用户群进行识别,具体可以通过以下几种方式实现:

在第一种方式中,如图2中所示,可以通过以下步骤对存在集体窃电的用户群进行识别:

步骤201:获得目标时长内用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数。

其中,用户群对应于一个或多个用户标识,用户群里的用户标识是可以变换的,但是用户群里的用户标识肯定是对应于同一个台区标识的,即用户标识对应的用户是属于同一个台区的。

需要说明的是,用户群对应的群日用电量为:用户群中的用户标识对应的用户日用电量的和,例如,用户群中包括用户标识a和用户标识b,相应的用户群对应的群日用电量为:用户标识a对应的用户日用电量加上用户标识b对应的用户日用电量所得到的和;

而用户群对应的台区日管理线损为:用户群中的用户标识对应的台区日管理线损。其中,用户群中的用户标识均为对应于同一个台区标识的,因此,用户群中任意一个用户标识所对应的台区日管理线损均是相同的。例如,用户群中包括用户标识a和用户标识b,相应的用户群对应的台区日管理线损即为用户标识a或用户标识b对应的台区日管理线损。

具体的,本实施例中可以利用获得皮尔逊相关系数的算法,对目标时长内用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数进行计算,该相关系数是处于-1到1之间的数值。

步骤202:在用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数大于或等于第四阈值的情况下,生成用户群对应的第三识别结果。

其中,第三识别结果表征用户群中的用户标识对应的用户在目标时长内存在窃电的嫌疑。

需要说明的是,如果发现用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数大于或等于第四阈值,那么能够确定群日用电量与台区日管理线损之间的相关程度较大,即使在用户群中的每个用户标识对应的用户日用电量和台区日管理线损之间的相关系数小于第四阈值,那么也可以认为用户群中的用户标识对应的用户的用电行为对台区日管理线损是产生较大影响的,此时可以生成三识别结果,以表征该用户群存在集体窃电的嫌疑,即用户群中的用户标识对应的用户在目标时长内存在窃电的嫌疑。

例如,如果发现包含用户标识a和用户标识b的用户群x的群日用电量和相应的台区日管理线损在第n-29天到第n天之间的相关系数大于0.85,那么表征从第n-29天开始到第n天之间的时长内用户群x存在集体窃电的嫌疑,此时生成第三识别结果,以表征用户群中的用户标识对应的用户在目标时长内存在窃电的嫌疑。

在第二种方式中,如图3中所示,可以通过以下步骤对存在集体窃电的用户群进行识别:

步骤301:获得用户群。

其中,用户群中包括台区标识对应的所有用户标识。也就是说,在对集体窃电进行识别时,先默认一个台区内所有的用户均存在窃电嫌疑,此时将台区内所有用户的用户标识加入到用户群中。

例如,一个台区内具有4个用户,相应的台区标识对应于用户标识a、用户标识b、用户标识c和用户标识d,在初始的用户群中具有用户标识a、用户标识b、用户标识c和用户标识d。

步骤302:获得目标时长内用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数。

其中,用户群对应于一个或多个用户标识,用户群里的用户标识肯定是对应于同一个台区标识的。

需要说明的是,用户群对应的群日用电量为:用户群中的用户标识对应的用户日用电量的和,例如,用户群中包括用户标识a、用户标识b、用户标识c和用户标识d,相应的用户群对应的群日用电量为:用户标识a对应的用户日用电量、用户标识b对应的用户日用电量、用户标识c对应的用户日用电量再加上用户标识d对应的用户日用电量所得到的和。而用户群对应的台区日管理线损为:用户群中的用户标识对应的台区日管理线损。

具体的,本实施例中可以利用获得皮尔逊相关系数的算法,对目标时长内用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数进行计算,该相关系数是处于-1到1之间的数值。

步骤303:在目标时长内用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数大于或等于第四阈值的情况下,生成用户群对应的第三识别结果。

其中,第三识别结果表征用户群中的用户标识对应的用户在目标时长内存在窃电的嫌疑。

例如,如果发现包含用户标识a、用户标识b和用户标识c的用户群x的群日用电量和相应的台区日管理线损在第n天到第n+29天之间的相关系数大于0.85,那么表征从第n天开始到第n+29天之间的时长内用户群x存在集体窃电的嫌疑,此时生成第三识别结果,以表征用户群中的用户标识对应的用户在目标时长内存在窃电的嫌疑。

步骤304:在相关系数小于第四阈值的情况下,在用户群中删除目标时长内所对应的用户日用电量和台区日管理线损之间的相关系数最小的用户标识,返回执行步骤302,以重新获得目标时长内用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数,直到用户群中已经没有用户标识,结束窃电识别,此时表征当前台区中的用户的窃电嫌疑均较低,或者,直到在用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数大于或等于第四阈值的情况下,执行步骤303生成第三识别结果,而此时的用户群中可能只包含一个台区内的部分用户的用户标识,此时的用户群中的用户标识对应的用户在目标时长内均存在窃电的嫌疑。

其中,在目标时长内用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数小于第四阈值的情况下,表征用户群内肯定存在没有窃电嫌疑或者窃电嫌疑较小的用户标识,此时,可以先将用户群中目标时长内所对应的用户日用电量和台区日管理线损之间的相关系数最小的用户标识进行删除,也就是说将窃电嫌疑最小的用户标识从用户群中删除,再重新获得新的用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数,如果重新获得的相关系数仍然小于第四阈值,那么继续将用户群中目标时长内所对应的用户日用电量和台区日管理线损之间的相关系数最小的用户标识进行删除,也就是说,如果在目标时长内用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数小于第四阈值,那么按照用户群中的用户标识对应的目标时长内用户日用电量和台区日管理线损之间的相关系数从小到大的顺序,对用户标识进行依次删除,直到用户群中已经没有用户标识,结束窃电识别,此时表征当前台区中的用户的窃电嫌疑均较低,或者,直到删除部分用户标识的用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数大于或等于第四阈值,此时,生成第三识别结果,以表征当前的用户群中剩余的用户标识对应的用户在目标时长内存在集体窃电的嫌疑。

例如,用户群x中初始具有用户标识a、用户标识b、用户标识c和用户标识d,如果发现用户群x的群日用电量和相应的台区日管理线损在第n-29天到第n天之间的相关系数小于0.85,那么,删除用户群x中的所对应的用户日用电量和台区日管理线损之间的相关系数最小的用户标识d,再重新获得用户群x的群日用电量和相应的台区日管理线损在第n-29天到第n天之间的相关系数,如果在删除用户标识d之后的用户群x的群日用电量和相应的台区日管理线损在第n-29天到第n天之间的相关系数已经大于0.85,那么表征从第n-29天开始到第n天之间的时长内,当前的用户群x存在集体窃电的嫌疑,此时生成第三识别结果,以表征用户群中的用户标识对应的用户在目标时长内存在窃电的嫌疑,而如果删除用户标识d之后的用户群x的群日用电量和相应的台区日管理线损在第n-29天到第n天之间的相关系数仍然小于0.85,那么可以继续删除用户群x中的所对应的用户日用电量和台区日管理线损之间的相关系数最小的用户标识,直到用户群x的群日用电量和相应的台区日管理线损在第n-29天到第n天之间的相关系数大于或等于0.85。

在第三种方式中,如图4中所示,可以通过以下步骤对存在集体窃电的用户群进行识别:

步骤401:获得用户群。

其中,用户群中包括台区标识对应的一个用户标识,该用户标识所对应的目标时长内用户日用电量和台区日管理线损之间的相关系数在台区标识所对应的所有用户标识中是最大的。也就是说,在对集体窃电进行识别时,先默认一个台区内所有的用户均不存在窃电嫌疑,并将窃电嫌疑最大(用户日用电量和台区日管理线损之间的相关系数在台区标识所对应的所有用户标识中是最大)的用户标识添加到用户群中。

例如,一个台区内具有4个用户,相应的台区标识对应于用户标识a、用户标识b、用户标识c和用户标识d,在初始的用户群中可以添加有用户标识a,用户标识a为台区标识所对应的4个用户标识中,所对应的目标时长内用户日用电量和台区日管理线损之间的相关系数是最大的。

步骤402:获得目标时长内用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数。

其中,用户群对应于一个或多个用户标识,用户群里的用户标识肯定是对应于同一个台区标识的。

需要说明的是,用户群对应的群日用电量为:用户群中的用户标识对应的用户日用电量的和。而用户群对应的台区日管理线损为:用户群中的用户标识对应的台区日管理线损。

步骤403:在用户群中添加台区标识对应的剩余用户标识中的一个用户标识。

其中,添加到用户群的用户标识可以是台区标识对应的剩余用户标识中,目标时长内所对应的用户日用电量和台区日管理线损之间的相关系数最大的用户标识。

需要说明的是,台区标识对应的剩余用户标识中需要删除已经被添加到用户群的用户标识。

步骤404:获得目标时长内添加用户标识的用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数的变化量。

例如,本实施例中首先获得添加用户标识的用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数,再将该相关系数减去添加用户标识之前的用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数,得到相关系数的变化量。

步骤405:如果变化量表征相关系数增加,返回执行步骤403,以在用户群中添加台区标识对应的剩余用户标识中的一个用户标识,直到台区标识对应的剩余用户标识为空,也就是说,台区标识对应的所有用户标识均被添加到过用户群。

其中,变化量表征相关系数增加,表明最近添加的用户标识对用户群对应的相关系数产生了增加的效果,该用户标识对应的用户存在集体窃电的嫌疑较大,此时用户群中保留最近添加的用户标识。

而此时用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数可能仍然小于第四阈值,也可能已经大于或等于第四阈值,但需要将台区标识对应的所有用户标识均向用户群添加一遍。

步骤406:如果变化量表征相关系数减小,在用户群中删除最近添加的用户标识,返回执行步骤403,以在用户群中添加台区标识对应的剩余用户标识中的一个用户标识,直到台区标识对应的剩余用户标识为空,也就是说,台区标识对应的所有用户标识均被添加到过用户群;

其中,变化量表征相关系数减小,表明最近添加的用户标识对用户群对应的相关系数产生了降低的效果,该用户标识对应的用户存在集体窃电的嫌疑较小,此时用户群中不保留最近添加的用户标识。

而此时用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数可能仍然小于第四阈值,也可能已经大于或等于第四阈值,但需要将台区标识对应的所有用户标识均向用户群添加一遍。

步骤407:在用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数大于或等于第四阈值的情况下,生成用户群对应的第三识别结果。

其中,第三识别结果表征用户群中的用户标识对应的用户在目标时长内存在窃电的嫌疑。

需要说明的是,如果在将台区标识对应的剩余用户标识中窃电嫌疑最大的用户标识添加到用户群中之后,重新获得的相关系数是否大于或等于第四阈值,均继续将台区标识对应的剩余用户标识中目标时长内所对应的用户日用电量和台区日管理线损之间的相关系数最大的用户标识添加到用户群中,直到台区标识对应的每个用户标识均被添加到用户群中一次,此时再判断重新获得的相关系数是否大于或等于第四阈值,如果重新获得的相关系数仍然是小于第四阈值的,那么表明台区内的用户窃电的嫌疑均较小且集体窃电的嫌疑也小,此时,不需要生成第三识别结果;而如果重新获得的相关系数大于或等于第四阈值,那么表明虽然台区内的单个用户窃电嫌疑较小(用户标识对应的用户日用电量与台区日管理线损在目标时长内的相关系数小于第四阈值),但是用户群中对应的用户是存在集体窃电的较大嫌疑的,此时,生成第三识别结果,以表征当前的用户群中当前的用户标识对应的用户在目标时长内存在集体窃电的嫌疑。

例如,如果台区内每个用户标识a、b、c和d对应的用户日用电量和台区日管理线损在第n-29天到第n天之间的相关系数均小于0.85,那么,先在用户群x中初始添加用户标识a,并依次添加剩余的用户标识b、c和d,每次添加都根据添加用户标识后的用户群的群日用电量和台区日管理线损在第n-29天到第n天之间的相关系数是否有增加来决定是否保留最近添加的用户标识,例如,在添加用户标识b之后,如果发现相关系数减小,那么就删除用户群中的用户标识b,如果发现相关系数增加,那么就保留用户群中的用户标识b,直到剩余的用户标识b、c和d均被添加一次,再判断当前的用户群对应的相关系数是否到达或者超过第四阈值,如果是,那么就生成第三识别结果,以表征当前的用户群中当前的用户标识对应的用户在目标时长内存在集体窃电的嫌疑。

基于以上实现方式,本实施例中在生成第一识别结果或第二识别结果以确定用户标识对应的用户存在窃电的嫌疑之后,还需要对其进行嫌疑的排除验证,以避免出现识别错误的情况,由此进一步提高窃电识别的准确率,如下所示:

在用户标识对应的用户日用电量或台区日管理线损满足以下任意一种的排除条件的情况下,删除用户标识对应的识别结果,也就是说,本实施例中对用户标识对应的用户日用电量和/或台区日管理线损进行分析,如果满足以下任意一种排除条件,那么表明之前的识别结果是存在误差的,此时删除相应用户标识对应的第一识别结果或第二识别结果,排除条件如下1-7所示:

1、在用户标识对应的用户日用电量满足与用户标识对应的台区日售电量的比例值大于第五阈值。例如,在设定的目标时长如30天内,用户标识对应的平均的用户日用电量占台区日售电量的30%或以上,那么表明该用户标识对应的用户被视为用电大户,用电大户很可能因为无功功率占比多等原因导致台区整体管理线损上升,因此,会降低其窃电嫌疑,并不是没有窃电嫌疑的。

2、连续最多第六阈值的次数中所获得用户标识对应的用户日用电量和用户标识对应的台区日管理线损之间的相关系数大于第四阈值。例如,对于设置的多个连续的目标时长内,连续2次或只有1次中所获得用户标识对应的用户日用电量和用户标识对应的台区日管理线损之间的相关系数大于第四阈值,那么可以确定该用户标识对应的用户的窃电嫌疑较小。以30天为例,在1-32天内,如图5中所示,连续计算1-30天、2-31天、3-32天的3个30天内的用户日用电量与台区日管理线损之间的相关系数,而如果连续出现次数小于3次的相关系数大于第四阈值,那么表明用户日用电量和台区日管理线损之间的相关是偶然的,由此,本实施例中通过设置这个排除条件,以避免嫌疑用户出现的偶然性。

3、在目标时长内累计用户标识对应的用户日用电量为0的天数在目标时长内的比例值超过第七阈值。例如,在目标时长如30天内,用户标识对应的用户日用电量为0的累计天数占比超过33%,那么表明该用户的电表因无人居住等原因不用电,导致用电量一直为0,由此,可以降低该用户的窃电嫌疑。

4、用户标识对应的台区日管理线损小于0。例如,出现线损计算错误的情况。

5、在目标时长中选定的部分时长内所获得用户标识对应的用户日用电量和用户标识对应的台区日管理线损之间的相关系数小于第八阈值。例如,在目标时长30天的最后十天内,用户日用电量与台区日管理线损之间的相关系数小于第八阈值0.6,那么表明整体30天的相关系数高主要受前20天的影响,那么这个相关系数高可能具有偶然性。

6、在用户标识对应的接线方式为三相接线方式的情况下,用户标识对应的用户日用电量与用户标识对应的台区日管理线损之间的比值处于预设的比值区间。例如,针对三相用电用户,三相的用电量一般是平衡的。对于窃电用户而言,一般的窃电手法是单相窃电或双相窃电,如果是单相窃电,窃电部分全部计入管理线损,则会出现用户日用电量与台区管理线损的比例为2:1,(因此设置一个上下0.2的浮动范围即为区间(1.8,2.2));如果是双相窃电,则会出现用户日用电量与台区管理线损的比例为1:2(因此设置一个上下0.2的浮动范围即为区间(0.3,0.7),这里这个区间改动)。如果不在这两个区间,表明用户窃电的嫌疑较低。

7、用户标识对应的功率因数小于第九阈值。例如,功率因数过低主要是由于在总功率中无功功率占比较高,此时这部分无功功率会计入管理线损,造成台区管理线损上升,也会造成管理线损与用户用电量同比例变化的情况,这种现象的出现非窃电行为造成,因此,如果用户标识对应的用户的用电功率因数小于第九阈值如0.8等,那么此时可以确定用户窃电的嫌疑较低。

参考图6,为本申请实施例二提供的一种窃电识别装置的结构示意图,该装置可以配置在能够进行数据处理的电子设备中,如计算机或服务器等。本实施例中的技术方案主要用于实现对用户是否存在窃电嫌疑进行识别,并提高窃电识别准确率。

具体的,本实施例中的装置可以包括以下功能单元:

用户用电获得单元601,用于获得至少一个用户的用户用电数据,用户用电数据至少包括用户标识、用户标识对应的用户日用电量;

台区用电获得单元602,用于获得至少一个台区的台区用电数据,台区用电数据至少包括台区标识、台区标识对应的一个或多个用户标识和台区标识对应的台区日管理线损;

用电监测单元603,用于监测用户标识对应的用户日用电量是否小于或等于第一阈值以及用户标识对应的台区日管理线损是否大于或等于第二阈值;

第一结果生成单元604,用于在用户标识对应的用户日用电量小于或等于第一阈值且用户标识对应的台区日管理线损大于或等于第二阈值且持续的天数大于或等于第三阈值的情况下,生成用户标识对应的第一识别结果,第一识别结果表征用户标识对应的用户从所述用户日用电量小于或等于所述第一阈值且所述台区日管理线损大于或等于所述第二阈值对应的起始日期开始存在窃电的嫌疑。

第二结果生成单元605,用于在所述用户标识对应的用户日用电量大于所述第一阈值或所述用户标识对应的台区日管理线损小于所述第二阈值的情况下,获得目标时长内的所述用户标识对应的用户日用电量和所述用户标识对应的台区日管理线损之间的相关系数,所述目标时长为大于或等于2天的时长;在所述相关系数大于或等于第四阈值的情况下,生成所述用户标识对应的第二识别结果,所述第二识别结果表征所述用户标识对应的用户在所述目标时长内存在窃电的嫌疑。

第三结果生成单元606,用于获得目标时长内用户群对应的群日用电量和用户群对应的台区日管理线损之间的相关系数;其中,用户群对应于一个或多个用户标识,用户群对应的群日用电量为用户群中的用户标识对应的用户日用电量的和,用户群对应的台区日管理线损为用户群中的用户标识对应的台区日管理线损;目标时长为大于或等于2天的时长;在相关系数大于或等于第四阈值的情况下,生成用户群对应的第三识别结果,第三识别结果表征用户群在目标时长内存在窃电的嫌疑。

从上述技术方案可以看出,本申请实施例二提供的一种窃电识别装置,通过同时监测用户日用电量和对应的台区日管理线损,进而在监测到用户日用电量小于或等于第一阈值且同时监测到相应的台区日管理线损大于或等于第二阈值时,进一步持续监测这种状态是否能够维持一定天数,进而来确定相应用户是否存在窃电嫌疑,而如果没有监测到用户日用电量小于或等于第一阈值或者相应的台区日管理线损大于或等于第二阈值的情况,那么可以利用目标时长内用户标识对应的用户日用电量和台区日管理线损之间的相关系数来判断用户是否存在窃电嫌疑,由此,本申请中能够避免单靠加权用电指标所导致的识别准确率低的情况,进而达到提高窃电识别准确率的目的。

在一种实现方式中,第三结果生成单元606,还用于获得用户群,所述用户群中包括所述台区标识对应的所有用户标识;获得目标时长内所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数;其中,所述用户群对应的群日用电量为所述用户群中的用户标识对应的用户日用电量的和,所述用户群对应的台区日管理线损为所述用户群中的用户标识对应的台区日管理线损;所述目标时长为大于或等于2天的时长;在所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数大于或等于所述第四阈值的情况下,生成所述用户群对应的第三识别结果,所述第三识别结果表征所述用户群中的用户标识对应的用户在所述目标时长内存在窃电的嫌疑;在所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数小于所述第四阈值的情况下,在所述用户群中删除所述目标时长内所对应的用户日用电量和台区日管理线损之间的相关系数最小的用户标识,返回重新执行所述获得目标时长内所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数,直到所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数大于或等于所述第四阈值。

或者,第三结果生成单元606,还用于获得用户群,所述用户群中包括所述台区标识对应的用户标识中,在目标时长内所对应的用户日用电量和台区日管理线损之间的相关系数大的用户标识;获得所述目标时长内所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数;其中,所述用户群对应的群日用电量为所述用户群中的用户标识对应的用户日用电量的和,所述用户群对应的台区日管理线损为所述用户群中的用户标识对应的台区日管理线损;所述目标时长为大于或等于2天的时长;在所述用户群中添加所述台区标识对应的剩余用户标识中的一个用户标识;获得所述目标时长内添加所述用户标识的用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数的变化量;如果所述变化量表征所述相关系数增加,返回执行所述步骤:在所述用户群中添加所述台区标识对应的剩余用户标识中的一个用户标识,直到所述台区标识对应的剩余用户标识为空;如果所述变化量表征所述相关系数减小,在所述用户群中删除最近添加的用户标识,返回执行所述步骤:在所述用户群中添加所述台区标识对应的剩余用户标识中的一个用户标识,直到所述台区标识对应的剩余用户标识为空;在所述用户群对应的群日用电量和所述用户群对应的台区日管理线损之间的相关系数大于或等于所述第四阈值的情况下,生成所述用户群对应的第三识别结果,所述第三识别结果表征所述用户群中的用户标识对应的用户在所述目标时长内存在窃电的嫌疑。

在一种实现方式中,所述目标时长为从所述用户用电数据中对应的最近日期向前所选取的指定时长。

在一种实现方式中,本实施例中的装置还用于:

在用户标识对应的用户日用电量或台区日管理线损满足以下任意一种的排除条件的情况下,删除用户标识对应的识别结果;

其中,排除条件包括:

在用户标识对应的用户日用电量满足与用户标识对应的台区日售电量的比例值大于第五阈值;

连续最多第六阈值的次数中所获得用户标识对应的用户日用电量和用户标识对应的台区日管理线损之间的相关系数大于第四阈值;

在目标时长内累计用户标识对应的用户日用电量为0的天数在目标时长内的比例值超过第七阈值;

用户标识对应的台区日管理线损小于0;

在目标时长中选定的部分时长内所获得用户标识对应的用户日用电量和用户标识对应的台区日管理线损之间的相关系数小于第八阈值;

在用户标识对应的接线方式为三相接线方式的情况下,用户标识对应的用户日用电量与用户标识对应的台区日管理线损之间的比值处于预设的比值区间;

用户标识对应的功率因数小于第九阈值。

需要说明的是,本实施例中的装置内各单元的具体实现可以参考前文中相应内容,此处不再描述。

参考图7,为本申请实施例三提供的一种电子设备的结构示意图,该电子设备可以为能够进行数据处理的电子设备中,如计算机或服务器等。本实施例中的技术方案主要用于实现对用户是否存在窃电嫌疑进行识别,并提高窃电识别准确率。

具体的,本实施例中的电子设备可以包括以下结构:

存储器701,用于存储应用程序及应用程序运行所产生的数据;

处理器702,用于执行应用程序,以实现:获得至少一个用户的用户用电数据,用户用电数据至少包括用户标识、用户标识对应的用户日用电量;获得至少一个台区的台区用电数据,台区用电数据至少包括台区标识、台区标识对应的一个或多个用户标识和台区标识对应的台区日管理线损;监测用户标识对应的用户日用电量是否小于或等于第一阈值以及用户标识对应的台区日管理线损是否大于或等于第二阈值;在所述用户标识对应的用户日用电量小于或等于所述第一阈值且所述用户标识对应的台区日管理线损大于或等于所述第二阈值且持续的天数大于或等于第三阈值的情况下,生成所述用户标识对应的第一识别结果,所述第一识别结果表征所述用户标识对应的用户从所述用户日用电量小于或等于所述第一阈值且所述台区日管理线损大于或等于所述第二阈值对应的起始日期开始存在窃电的嫌疑;在所述用户标识对应的用户日用电量大于所述第一阈值或所述用户标识对应的台区日管理线损小于所述第二阈值的情况下,获得目标时长内的所述用户标识对应的用户日用电量和所述用户标识对应的台区日管理线损之间的相关系数,所述目标时长为大于或等于2天的时长;在所述相关系数大于或等于第四阈值的情况下,生成所述用户标识对应的第二识别结果,所述第二识别结果表征所述用户标识对应的用户在所述目标时长内存在窃电的嫌疑。

从上述技术方案可以看出,本申请实施例三提供的一种电子设备,通过同时监测用户日用电量和对应的台区日管理线损,进而在监测到用户日用电量小于或等于第一阈值且同时监测到相应的台区日管理线损大于或等于第二阈值时,进一步持续监测这种状态是否能够维持一定天数,进而来确定相应用户是否存在窃电嫌疑,而如果没有监测到用户日用电量小于或等于第一阈值或者相应的台区日管理线损大于或等于第二阈值的情况,那么可以利用目标时长内用户标识对应的用户日用电量和台区日管理线损之间的相关系数来判断用户是否存在窃电嫌疑,由此,本申请中能够避免单靠加权用电指标所导致的识别准确率低的情况,进而达到提高窃电识别准确率的目的。

需要说明的是,本实施例的电子设备中处理器的具体实现可以参考前文中相应内容,此处不再描述。

综合以上实施例内容,本申请的技术方案中基于“双漏斗模型”和“时间序列强相关模型”的窃电识别方案,可精确识别用户的窃电行为,其大致可描述如图8中所示:

1、获取用户与台区数据,确定台区下用户范围、台区关口表表码数据、用户表码数据和综合倍率等信息;

2、根据1中的数据,针对每一个台区,计算台区在设定时间窗内的日管理线损,以及台区下每个用户的日用电量;

3、依据双漏斗模型,排查是否存在短期窃电用户;

4、依据时间序列强相关模型,针对每个用户,计算用户用电量与所在台区管理线损的时间序列相关行性,排查是否存在长期窃电用户;

5、依据时间序列强相关模型,利用启发式算法,计算用户群与所在台区管理线损的时间序列相关系性,排查是否存在用户集体窃电行为;

6、按照相关性高低进行排序,将相关性高的用户或者用户群列入一次窃电嫌疑用户清单;

7、按以上方式得到一次窃电嫌疑清单后,需通过以下二次筛选规则,排除部分用户嫌疑:

①在设定时间窗内,用户的平均日用电量占台区平均日售电量的30%及以上;

②用户日用电量序列与台区日管理线损序列的强相关现象连续出现次数小于3次;

③在设定时间窗内,用户日用电量为0的累计天数占比超过33%;

④台区管理线损出现负值;

⑤在设定时间窗的最后三分之一时间段内,用户日用电量序列与台区日管理线损序列相关性小于0.6;

⑥对于三相用电用户,用户平均日用电量与台区平均日管理线损的比值不在(0.3,0.7),且不在(1.8,2.2)这两个区间内;

⑦用户的功率因数小于0.8。

其中,台区线损由管理线损和技术线损两部分组成,技术线损主要与供电设备参数相关,是线损中不可避免的一部分。针对同一台区,技术线损基本稳定,约占线损的3%-5%,管理线损主要是由窃电等管理因素造成。

本申请的技术方案中对于初期窃电的用户而言基于时间点的判别:在某个时间点(某天)会表现出台区线损突增,用户日用电量突降,且在观察时间窗内,用户日用电量并未出现明显回升,台区线损未出现明显回落的现象,双漏斗模型正是基于这一点来发现初始窃电嫌疑用户的。

而本申请的技术方案中对于长期窃电的用户而言采用基于时间序列的判别:大部分低压窃电用以等比例窃电手法为主,所谓等比例窃电,即用电量越多,窃电量越多,而窃电量是构成管理线损的主要组成部分,因此会出现用户用电量与台区管理线损同趋势变化的现象,这是时间序列强相关模型的主要思想来源。基于台区管理线损和用户用电量的时间序列强相关模型的主要计量标准是皮尔逊相关系数。皮尔逊相关系数可以理解为,判断两个变量在变化过程中,是同方向变化还是反方向变化,以及同向或反向变化程度如何。相关系数越大,同向变化程度越大,因此,说明台区管理线损与用户用电量越相关,也即台区管理线损与窃电量越相关,用户的窃电嫌疑越大。

以下以低压窃电的识别为例,对本申请的技术方案进行举例说明:

本申请中从现有业务数据入手,实现低压窃电用户的精准识别,总体技术方案如下:

(1)低压用户用电数据采集

目前,可获取的关于低压用户用电行为的信息主要包括用户信息:用户号、资产号、用户表码数据、接线方式、用户所属台区号、综合倍率等;台区信息:台区号、台区关口表表码数据、综合倍率等;历史违约记录:违约用户、违约日期、违约类型等。从营销业务应用系统和用电信息采集系统采集上述相关数据。

(2)低压用户用电数据加工与筛选

本申请的技术方案涉及的主要分析指标包括:台区线损、台区管理线损、用户日用电量、用户接线方式(三相四线or单相)。由于采集错误或漏采等原因,导致出现很多不符合业务实际的数据,比如用电量空值、负线损等,这些错误数据需要剔除,而非通过平滑等方法填充或修正数据。

(3)用电数据分析

其中,本申请的技术方案中主要包括两条技术路线:

①双漏斗模型

在设定时间窗内(如30天),如果台区k(k为大于或等于1的正整数)的用户i(i为大于或等于1的正整数)在第n天出现台区管理线损突增,用户日用电量突降,且在第n天后,未出现管理线损回落,用电量升高的现象,则可初步判断,用户i从第n天开始窃电。该方案主要用于识别短期窃电的用电用户;除此之外,针对长期窃电的用户,该方案可用于寻找用户起始窃电时间点。

②时间序列强相关模型

1)台区下单用户窃电:在设定时间窗内(如30天)扫描台区k下的所有用户,计算每个用户的日用电量与台区日管理线损的相关系数,如果某个用户i与台区的日管理线损相关性达到给定阈值δ,则用户i为窃电嫌疑用户,列入一次窃电嫌疑清单。

2)台区下多用户集体窃电:利用启发式算法,迭代生成用户群,计算用户群总日用电量与台区日管理线损的相关系数,如果存在某个用户群与台区的日管理线损相关性达到给定阈值δ,则用户群存在集体窃电嫌疑,列入一次窃电嫌疑清单。

(4)二次筛选与清单输出

经分析得到的一次窃电嫌疑清单还不能直接作为窃电排查的依据,需根据第3节“本专利的基本原理以及相关方案”的二次筛选规则进行一次嫌疑用户的自动筛查,输出最终的嫌疑清单。

本申请的整体技术方案如下图9。以下对本申请的技术方案所实现的产品进行说明:

其中,产品的核心模块主要包括短期窃电识别模块、长期窃电识别模块以及嫌疑清单二次筛选模块:

(1)短期窃电识别模块

短期窃电识别模块主要以双漏斗模型支撑,输入设定时间窗内台区日管理线损与用户日用电量数据,输出短期窃电嫌疑用户清单。通过对某台区k下每个用户的日用电量与台区k的日管理线损两个(“双”)计量量进行同时间点过滤(“漏斗”),如果检测到某个时间点n,出现用户i日用电量突降超20%,台区管理线损突增超20%,则用户i存在从时间点n开始窃电的嫌疑。主要原理图如图10中所示。

(2)长期窃电识别模块

长期窃电识别模块主要以时间序列强相关模型支撑,在设定时间窗内,如未发现起始嫌疑窃电时间点,则将台区管理线损序列与用户日用电量序列数据输入该模块,输出一次窃电嫌疑用户清单。

时间序列强相关模型主要依据皮尔逊相关系数,两个时间序列的皮尔逊相关系数可描述为图11中所示。其中,横轴与纵轴分别代表两个时间序列,上方的数字表示两个序列的相关系数,即相关程度大小。

其中,所得到的相关系数在[-1,1]之间变化,越接近1,则表明两个序列正相关程度越大,变化趋势越同步。相关系数取值范围与相关程度判别如下表1:

表1:相关系数范围与相关程度对应表

时间序列强相关模型计算方法如公式(1):

时间序列强相模型的整体识别流程如图12中所示。其中:

在从台区数据和用户数据中计算出台区k的日供电量(日售电量)之后,判断台区k日供电量是否存在负值或空值,如果没有,那么计算台区k下每个用户的用户日用电量,再判断台区k下是否存在用户日用电量是否为负值或空值的情况,如果没有,那么计算台区k日售电量和台区k日线损,如果台区k不存在负线损或空线损,那么可以计算台区k日管理线损,计算台区k与所属台区k的每个用户的相关系数,并利用启发式算法迭代生成用户群,计算用户群与台区k的相关系数,以便在相关系数大于阈值的时候,将相应用户或用户群列入一次嫌疑清单,直到所有台区(k=1开始)都扫描并识别完成,输出一次嫌疑清单。

其中,图12中提到的启发式算法,主要受逐步回归思想启发:

①逐步剔除法:计算台区k下所有用户的日用电量总和序列与台区k的日管理线损序列的相关性,如果相关性大于阈值δ,则台区k存在所有用户集体窃电的嫌疑;如果相关性小于阈值δ,则按单个用户日用电量序列与台区日管理线损序列的相关性从小到大从用户集合中剔除,直到用户集合的日用电量序列与台区管理序列相关性大于阈值δ,结束。

②逐步添加法:对台区k下所有用户按其日用电量序列与台区日管理线损序列的相关性从大到小逐步引入用户集合中,在引入过程中随时检验当前用户集的总日用电量序列与台区日管理线损序列的相关性,如果相关性大于等于阈值δ,则获得嫌疑用户群,如果相关性小于阈值δ,则不断引入用户,在这个过程中,如果相关性增加或不变,则保留用户;否则从用户集中剔除,直到再添加任意一个用户,相关性都会降低为止。

(3)一次嫌疑清单二次筛选模块

该模块主要是针对长期窃电识别模块输出的一次嫌疑清单进行的,输出最终的长期窃电嫌疑用户清单。通过对历史低压窃电用户的分析以及对用户本身的多维度分析(如低压动力用户所属行业、用户数据数据质量、是否有功率因数偏低所致等),设计出二次筛选嫌疑用户的规则,如下表2:

表2:一次嫌疑清单筛选规则

综上,本申请的技术方案中具有以下特点:

(1)基于少量指标的窃电识别思想。本申请提到的技术方案均只依赖于台区线损数据和用户用电量数据两个指标,即可达到75%以上的识别准确率,打破了当前主流数据分析方法获取数据难的壁垒(如:需额外召测用户详细用电信息或获取外围信息(行业信息、天气因素等)等);同时,克服了主观设定指标阈值与权重的缺陷。

(2)长短期低压窃电识别技术的应用。针对长期窃电用户和短期窃电用户分别应用“时间序列强相关模型”和“双漏斗模型”,一方面,能够更加全面的分析用户用电行为,提升模型的召回率;另一方面,能够更具针对性的分析不同类型窃电用户的用电特征,提升模型准确率。除此之外,本申请提出启发式算法,可有效识别用户集体窃电行为,这是当前所有识别方法所不具备的。

(3)缩小排查范围,降低排查成本。依据业务经验与现状,本发明总结了一套窃电嫌疑用户二次筛选规则,可以有效补充“时间序列强相关模型”数据分析能力强,业务总结能力不足的弊端,缩小一线人员排查窃电的范围,有效降低人员现场排查成本。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1