窃电用户识别方法和装置与流程

文档序号:17726776发布日期:2019-05-22 02:34阅读:442来源:国知局
窃电用户识别方法和装置与流程

本申请涉及数据处理技术领域,更具体地说,涉及一种窃电用户识别方法和装置。



背景技术:

窃电是指用电客户以减少计量电能和降低缴纳电费为目的,采用欠压法、欠流法等手段进行电能窃取。用电客户的窃电行为不仅给供电单位带来了巨大的经济损失,而且还可能会导致用电安全隐患。

为了确定用电客户是否存在窃电行为,需要供电企业的工作人员在现场定量检测,才可以最终查找到窃电用户。然而,由于用电客户的数量较大,且窃电行为的手法也具有多样性,如果仅凭供电企业的工作人员巡查窃电用户,则复杂度较高,且效率较低。



技术实现要素:

本申请的目的是提供一种窃电用户识别方法和装置,以基于用户的用户数量识别出存在窃电嫌疑的窃电用户,有利于提高识别窃电用户的便捷性和高效性。

为实现上述目的,本申请提供了如下技术方案:

一种窃电用户识别方法,包括:

获取待分析的目标用户的用电数据;

依据所述目标用户的用电数据,并利用预先训练得到的深度学习模型,确定所述目标用户具有窃电行为的概率,所述深度学习模型为利用多个历史窃电用户的用电数据为训练样本训练得到的;

在基于所述深度学习模型确定出所述目标用户具有窃电行为的概率超过所述深度学习模型中预先学习出的目标阈值的情况下,将所述目标用户识别为存在窃电风险的用户。

优选的,所述依据所述目标用户的用电数据,并利用预先训练得到的深度学习模型,确定所述目标用户具有窃电行为的概率,包括:

依据所述目标用户的用电数据,并利用预先训练得到的深度学习模型,确定所述目标用户分别具有多种不同类型的窃电行为的概率,所述深度学习模型为利用多个历史窃电用户的用电数据以及所述历史窃电用户对应的窃电行为类型训练得到的;

所述在基于所述深度学习模型确定出所述目标用户具有窃电行为的概率超过所述深度学习模型中预先学习出的目标阈值的情况下,将所述目标用户识别为存在窃电风险的用户,包括:

在基于所述深度学习模型确定出所述目标用户具有至少一种类型的窃电行为的概率超过所述深度学习模型中预先学习出的目标阈值的情况下,将所述目标用户识别为存在窃电风险的用户。

优选的,所述依据所述目标用户的用电数据,并利用预先训练得到的深度学习模型,确定所述目标用户分别具有多种不同类型的窃电行为的概率,包括:

按照预置的多个用电指标各自对应的用电数据范围,从所述多个用电指标中,确定与所述目标用户的用电数据匹配的至少一个目标用电指标;

依据所述至少一个目标用电指标,并利用预先训练得到的深度学习模型,确定所述目标用户分别具有多个不同类型的窃电行为的概率,所述深度学习模型为利用多个历史窃电用户各自对应的至少一个用电指标以及所述历史窃电用户对应的窃电行为类型训练得到的,所述历史窃电用户对应的至少一个用电指标为依据所述历史窃电用户的用电数据确定出的。

优选的,所述深度学习模型通过如下方式训练得到:

获取多个历史窃电用户的用电数据;

针对每个历史窃电用户,按照预置的多个用电指标各自对应的用电数据范围,从所述多个用电指标中,确定与该历史窃电用户的用电数据匹配的至少一个用电指标;

基于所述多个历史窃电用户各自对应的至少一个用电指标,对所述多个历史窃电用户的用电数据进行聚类,以将所述多个历史窃电用户的用电数据聚类为表征不同类型窃电行为的多个窃电行为类别;

依据每个所述历史窃电用户对应的至少一个用电指标以及每个所述历史窃电用户的用电数据所归属的窃电行为类别,对深度学习模型进行训练,直至所述深度学习模型的预测精准度符合要求。

优选的,还包括:

获取所述目标用户的用电数据对应的目标采集日期以及所述目标采集日期的天气温度;

确定所述目标采集日期所属的日期类型;

依据所述目标采集日期对应的日期类型和天气温度,从所述目标用户对应的多个历史采集日期中,确定出用于预测所述目标采集日期的用电情况的至少一个目标历史采集日期;

利用所述目标用户在所述至少一个历史采集日期的用电数据,预测所述目标用户在所述目标采集日期的预测用电数据;

当所述目标用户的用电数据与所述预测用电数据之间的数据偏差超过预设值,且基于所述深度学习模型将所述目标用户识别为存在窃电风险的用户,则确定所述目标用户为存在窃电嫌疑的用户。

优选的,还包括:

获取所述目标用户的用电数据对应的目标采集日期以及所述目标采集日期的天气温度;

确定所述目标采集日期所属的日期类型;

依据所述目标采集日期对应的日期类型和天气温度,从所述目标用户对应的多个历史采集日期中,确定出用于预测所述目标采集日期的用电情况的至少一个目标历史采集日期,其中,每个所述历史采集日期均关联有所述历史采集日期的日期类型和天气温度;

利用所述目标用户在所述至少一个历史采集日期的用电数据,预测所述目标用户在所述目标采集日期的预测用电数据;

在所述基于深度学习模型确定出所述目标用户具有窃电行为的概率未超过所述目标阈值的情况下,如果所述目标用户的用电数据与所述预测用电数据之间的数据偏差超过预设值时,将所述目标用户识别为存在窃电风险的用户。

优选的,所述依据所述目标采集日期对应的日期类型和天气温度,从所述目标用户对应的多个历史采集日期中,确定出用于预测所述目标采集日期的用电情况的至少一个目标历史采集日期,包括:

当所述目标采集日期对应的日期类型为节假日时,则从所述目标用户对应的多个历史采集日期中,确定与该目标采集日期为同一节假日的目标历史采集日期;

当所述目标采集日期对应的日期类型不属于节假日时,则采用动态时间规整算法,并结合所述目标采集日期的天气温度,从所述目标用户对应的多个历史采集日期中,确定与所述目标采集日期以及所述目标采集日期的天气温度之间的相似度满足要求的至少一个目标历史采集日期。

另一方面,本申请还提供了一种窃电用户识别装置,包括:

数据获取单元,用于获取待分析的目标用户的用电数据;

概率确定单元,用于依据所述目标用户的用电数据,并利用预先训练得到的深度学习模型,确定所述目标用户具有窃电行为的概率,所述深度学习模型为利用多个历史窃电用户的用电数据为训练样本训练得到的;

窃电识别单元,用于在基于所述深度学习模型确定出所述目标用户具有窃电行为的概率超过所述深度学习模型中预先学习出的目标阈值的情况下,将所述目标用户识别为存在窃电风险的用户。

优选的,所述概率确定单元,具体为,用于依据所述目标用户的用电数据,并利用预先训练得到的深度学习模型,确定所述目标用户分别具有多种不同类型的窃电行为的概率,所述深度学习模型为利用多个历史窃电用户的用电数据以及所述历史窃电用户对应的窃电行为类型训练得到的;

所述窃电识别单元,具体为用于在基于所述深度学习模型确定出所述目标用户具有至少一种类型的窃电行为的概率超过所述深度学习模型中预先学习出的目标阈值的情况下,将所述目标用户识别为存在窃电风险的用户。

优选的,所述概率确定单元,包括:

指标确定子单元,用于按照预置的多个用电指标各自对应的用电数据范围,从所述多个用电指标中,确定与所述目标用户的用电数据匹配的至少一个目标用电指标;

模型分析子单元,用于依据所述至少一个目标用电指标,并利用预先训练得到的深度学习模型,确定所述目标用户分别具有多个不同类型的窃电行为的概率,所述深度学习模型为利用多个历史窃电用户各自对应的至少一个用电指标以及所述历史窃电用户对应的窃电行为类型训练得到的,所述历史窃电用户对应的至少一个用电指标为依据所述历史窃电用户的用电数据确定出的。

通过以上方案可知,在本申请实施例中,预先根据已确定的存在窃电行为的多个历史窃电用户的用电数据训练得到深度学习模型,这样,在获取到待分析的目标用户的用电数据之后,可以根据该目标用户的用电数据,并利用该深度学习模型预测该目标用户具有窃电行为的概率,从而直接根据该目标用户具有窃电行为的概率便可以分析出该目标用户是否属于具有窃电嫌疑的用户,进而有利于有针对性的排查并确定存在窃电行为的用户,进而无需工作人员依次到现场巡查各个用户的用电状况,有利于提高确定窃电用户的销量,并降低确定窃电用户的复杂度。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种窃电用户识别方法的一种流程示意图;

图2为本申请实施例中训练深度学习模型的一种训练流程示意图;

图3为本申请实施例中提供的一种窃电用户识别方法的又一种流程示意图;

图4为本申请实施例中提供的一种窃电用户识别装置的一种组成结构示意图。

说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的部分,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示的以外的顺序实施。

具体实施方式

本申请的窃电用户识别方法和装置适用于任意具有数据处理功能的计算机设备,如,服务器、个人计算机等。

本申请通过对用户的用电数据进行分析,识别出存在窃电嫌疑的用户,从而为最终定位出窃电用户提供数据依据,有利于提高确定窃电用户的效率和精准度。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

如图1,其示出了一种窃电用户识别方法一个实施例的流程示意图,本实施例的方法可以应用于如上提到的计算机设备,本实施例的方法可以包括:

s101,获取待分析的目标用户的用电数据。

其中,为了便于区分,本申请实施例中将待分析的用电客户称为目标用户。

待分析的目标用户的用电数据为该目标用户在用电过程中产生,用于反映该目标用电状况相关的数据。如,用电数据为用户用电过程中的电力桉树,例如,电压信息、电流信息、电量信息、功率、线损信息等等。

可以理解的是,在本申请实施例中,目标用户的用电数据可以根据需要设定采集用电数据的周期或者时长,具体不加限制。如可以获取目标用户在指定时间段内产生的用电数据,例如,目标用户某天的用电数据;或者,目标用户某天在各个不同时间段内的用电数据等等。

s102,依据该目标用户的用电数据,并利用预先训练得到的深度学习模型,确定该目标用户具有窃电行为的概率。

其中,该深度学习模型为利用多个历史窃电用户的用电数据为训练样本训练得到的。

可以理解的是,历史窃电用户是当前时刻之前已确定真实存在窃电行为的用户。而未确定窃电用户的其他用户有可能也存在窃电行为,因此,在窃电分析中,并不能准确得到不存在窃电行为的用户的用电数据。在该种情况下,为了保证识别窃电行为的模型的可靠性,在本申请实施例中,仅仅将历史窃电用户的用电数据作为训练样本,并利用训练样本对深度学习模型进行训练。

可以理解的是,历史窃电用户的用电数据可以反映出窃电用户的用电特征,相应的,训练得到的深度学习模型可以基于窃电用户的用户特征,来分析该目标用户的用电数据是否符合窃电用户的用户特征以及与窃电用户的用户特征的符合程度,从而得到该用户具有窃电行为的概率。

可选的,由于窃电手法不同,使得不同窃电用户的用电数据也会呈现有不同特征,因此,为了能够更为准确的分析出用户是否具有窃电行为,在本申请实施例中,在利用历史窃电用户的用电数据训练深度学习模型时,还会先根据历史窃电用户的用电数据,确定该历史窃电用户的窃电行为类型。相应的,可以利用多个历史窃电用户的用电数据以及每个历史窃电用户对应的窃电行为类型训练得到该深度学习模型。

其中,窃电行为类型用于表征用户采用哪种窃电方式实现窃电。例如,窃电方式可以分流法、分压法、绕越法和增容法等,相应的,窃电行为类型可以分为采用分流法窃电,采用分压法窃电、采用绕越法窃电以及采用增容法窃电等等。

可以理解的是,由于深度学习模型的训练考虑到了历史窃电用户的窃电行为类型,因此,该深度学习模型可以用于预测用户分别属于多个窃电行为类型的概率。

相应的,根据该目标用户的用电数据,并利用预先训练得到的深度学习模型,可以确定该目标用户分别具有多种不同类型的窃电行为的概率。

可以理解的是,考虑到正常用电用户的用电数据可能与该多类窃电行为类型对应的用电数据均不相符,因此,该深度学习模型还可以包括:预测用户不属于该多个窃电行为类型的概率。在该种情况下,将目标用户的用电数据输入该深度学习模型之后,该深度学习模型不仅会属于用户分别属于多个窃电行为类型的概率,还会输出用户不属于该多个窃电行为类型的概率。基于这几个概率,可以分析出用户是否存在窃电嫌疑。

可选的,为了使得深度学习模型能够更为准确的识别出用户属于不同类型的窃电行为的概率,在本申请实施例中,还可以确定该历史窃电用户的用电数据所对应的至少一个用电指标。相应的,可以利用多个历史窃电用户各自对应的至少一个用电指标以及历史窃电用户对应的窃电行为类型训练深度学习模型。

其中,该用电指标可以理解为预先设定的表征用电数据中所涉及的用电类型。如,用电指标可以包括:线损增速、电流不平衡、功率超容、潮流反向、负荷下线、电量降速、电压过低等等。

其中,每种用电指标可以表征用户的用电数据处于该用电指标对应的用电数据范围内。具体的,每种用电指标可以分别对应用电数据范围。如,以电压过低这一用电指标为例,如果用户的用电数据中表征电压低于预设值,则可以表征该用户的用电数据中存在电压过低这一用电指标。

相应的,可以按照预置的多个用电指标各自对应的用电数据范围,确定历史窃电用户的用电数据对应的至少一个用电指标。

在基于历史窃电用户的用电指标训练深度学习模型的前提下,在获取到目标用户的用电数据之后,可以按照预置的多个用电指标各自对应的用电数据范围,从预设的多个用电指标中,确定与该目标用户的用电数据匹配的至少一个目标用电指标。相应的,可以依据该至少一个目标用电指标,并利用预先训练得到的深度学习模型,确定该目标用户分别具有多个不同类型的窃电行为的概率。

s103,在基于该深度学习模型确定出该目标用户具有窃电行为的概率超过深度学习模型中预先学习出的目标阈值的情况下,将该目标用户识别为存在窃电风险的用户。

其中,该目标阈值可以训练深度学习模型过程中确定出,如,在训练深度学习模型过程中,依据各个历史窃电用户属于各个窃电行为的概率来综合确定。

可以理解的是,将该目标用户识别为存在窃电风险的用户可以是标识该目标用户,或者是输出该目标用户的用电数据,以便提示计算机设备的使用者该目标用户的用电数据存在异常或者该目标用户存在窃电风险。

可选的,在深度学习模型可以确定出该目标用户分别具有多种不同类型窃电行为的概率的情况下,确定用户是否属于存在窃电风险的用户的方式可以有多种。如,在一种可能实现方式中,可以在基于该深度学习模型确定出目标用户具有至少一种类型的窃电行为的概率超过深度学习模型中预先学习出的目标阈值的情况下,将该目标用户识别为存在窃电风险的用户。

其中,在预先训练得到的该深度学习模型中不同类型的窃电行为所对应的目标阈值可能相同,也可能不同。

举例说明,假设窃电行为分为四类,分别为分流法、分压法、绕越法和增容法这四种类型,则将目标用户的用电数据输入到该深度学习模型之后,该深度学习模型可以分别确定出用户属于采用分流法窃电的概率,属于分压法窃电的概率、属于绕越法窃电的概率以及属于增容法窃电的概率。如果通过该深度学习模型确定出目标用户属于这四种窃电行为类型中任意一种窃电行为类型的概率超过该窃电行为类型的目标阈值,则可以判定该目标用户属于存在窃电风险的用户。

可见,在本申请实施例中,预先根据已确定的存在窃电行为的多个历史窃电用户的用电数据训练得到深度学习模型,这样,在获取到待分析的目标用户的用电数据之后,可以根据该目标用户的用电数据,并利用该深度学习模型预测该目标用户具有窃电行为的概率,从而直接根据该目标用户具有窃电行为的概率便可以分析出该目标用户是否属于具有窃电嫌疑的用户,进而有利于有针对性的排查并确定存在窃电行为的用户,进而无需工作人员依次到现场巡查各个用户的用电状况,有利于提高确定窃电用户的销量,并降低确定窃电用户的复杂度。

可以理解的是,利用作为训练样本的历史窃电用户的用电数据训练深度学习模型的方式可以有多种。为了便于理解本申请中深度学习模型的训练过程,下面以深度学习模型为利用历史窃电用户对应的用电指标训练深度学习模型为例进行说明。

如,参见图2,其示出了本申请一种训练用于识别窃电行为概率的深度学习模型的一种流程示意图,本流程可以包括:

s201,获取多个历史窃电用户的用电数据。

s202,针对每个历史窃电用户,按照预置的多个用电指标各自对应的用电数据范围,从该多个用电指标中,确定与该历史窃电用户的用电数据匹配的至少一个用电指标。

如,根据历史窃电用户的用电数据以及各个用电指标的计算方式,分别计算或者确定历史窃电用户的线损、功率、负荷以及电压等用电指标的取值,可以确定该历史窃电用户的用电数据符合哪些用电指标。

s203,基于该多个历史窃电用户各自对应的至少一个用电指标,对该多个历史窃电用户的用电数据进行聚类,以将该多个历史窃电用户的用电数据聚类为表征不同类型窃电行为的多个窃电行为类别。

其中,将多个历史窃电用户对应的多个用电指标作为输入变量,并采用聚类算法对该多个历史窃电用户的用电数据进行聚类,以将多个历史窃电用户的用电数据聚类为多个类别。

可以理解的是,由于聚类出的每个类别内的用电数据所对应的用电指标的特点有所不同,而不同用电指标可以反映出不同的窃电方式,因此,本申请实施例中,聚类出的每个类别可以称为窃电行为类别,且不同的窃电行为类别用于表征不同类型的窃电行为。

举例说明,按照每个历史窃电用户对应的至少一个用电指标,将多个历史窃电用户的用电数据进行聚类,可以聚类出四个窃电行为类别所表征的窃电类型分别为:分流法、分压法、绕越法和增容法。

可以理解的是,在本申请中聚类方式可以有多种,对此不加限制。可选的,本申请才可以采用二阶聚类算法进行聚类。

其中,二阶聚类也称为两步聚类。第一步为:预聚类和准聚类过程:构建聚类特征树,分成很多子类。第二步,正式聚类。将以第一步完成的预聚类作为输入,对输入内容使用分层聚类的方法进行再聚类。

相应的,聚类过程中可以比较集群之间的距离,最小的两个集群会合并成一个集群,然后一直重复,直到所有集群已经合并。其中,计算集群之间的距离可以采用对数似然距离。

s204,依据各个历史窃电用户对应的至少一个用电指标以及每个历史窃电用户的用电数据所归属的窃电行为类别,对待训练的深度学习模型进行训练,直至该深度学习模型的预测精准度符合要求。

如,将每个历史窃电用户对应的至少一种用电指标作为输入内容输入到待训练的深度学习模型中,以通过该待训练的深度学习模型预测该历史窃电用户分别属于多个不同类型的窃电行为类别的概率,并通过深度学习模型预测该历史窃电用户属于每个类型的窃电行为类型的概率是否超过该类型的窃电行为类型对应的阈值,得到利用该深度学习模型预测出该历史窃电用户属于的窃电行为类别。将深度学习模型预测出结果与该历史窃电用户实际对应的窃电行为类别进行比对,以得到该深度学习模型对多个历史窃电用户进行预测的精准度。

如果该精准度超过设定值,则认为深度学习模型训练完成;否则,则可以调整该深度学习模型的内部参数,并重新利用多个历史窃电用户对应的至少一种用电指标对深度学习模型进行训练,直至该深度学习模型的预测精准度符合要求。

可以理解的是,图2仅仅是本申请实施例中训练深度学习模型的一种训练过程,但是在历史窃电用户的用电数据作为训练样本的前提下,还可以有其他方式训练该深度学习模型,本申请对此不加限制。

可以理解的是,深度学习模型是利用历史已知的历史窃电用户的用电数据训练得到,在该种情况下,如果用户采用不同于之前历史窃电用户的窃电方式进行窃电时,利用该深度学习模型可能无法判别出该用户存在窃电嫌疑。

为了能够更为全面、准确的识别出所有可能存在窃电嫌疑的用户,本申请还可以基于该目标用户的历史用电情况,对该目标用户当前的用电情况进行预测,并比较预测的用电情况与该目标用户实际的用电情况,结合比较结果,来辅助分析该目标用户是否存在窃电嫌疑。

如,参见图3,其示出了本申请一种窃电用户识别方法又一个实施例的流程示意图,本实施例的方法可以包括:

s301,获取待分析的目标用户的用电数据,该目标用户的用电数据对应的目标采集日期以及该目标采集日期的天气温度。

在本实施例中,在获取用电数据的同时,还会获取该目标用户的用电数据对应的目标采集日期以及该目标采集日期的天气温度。

其中,该目标采集日期为采集该目标用户的用电数据的日期。可以理解是的,考虑到目标用户的用电数据可以为某一天、某一段时间或者某些时刻采集到的用电数据,相应的该目标采集日期也可以是某一天,一段时间所包含的日期范围,或者某个日期内的某些时刻。

其中,该目标采集日期的天气温度为该目标采集日期或者该目标采集日期内各个时间段对应的天气温度。如,目标采集日期表征某天的日期,则该天气温度为该天的天气温度;如果该目标采集日期为多天构成的日期段,则可以天气温度可以包括该日期段内每天各自对应的天气温度。

s302,按照预置的多个用电指标各自对应的用电数据范围,从多个用电指标中,确定与该目标用户的用电数据匹配的至少一个目标用电指标。

s303,依据该至少一个目标用电指标,并利用预先训练得到的深度学习模型,确定该目标用户分别具有多个不同类型的窃电行为的概率。

该步骤s302和s303可以参见前面实施例的相关介绍,在此不再赘述。

需要说明的是,本实施例是为了便于描述以基于目标用户对应的用电指标来分析该目标用户分别具有多个不同类型的窃电行为的概率为例进行介绍。但是可以理解的是,当基于目标用户的用电数据,并利用训练出的深度学习模型,预测该目标用户具有窃电行为的概率的其他方式也同样适用于本实施例,在此不加限制。

s304,在基于该深度学习模型确定出目标用户具有至少一种类型的窃电行为的概率超过该深度学习模型中预先学习出的目标阈值的情况下,将该目标用户识别为存在窃电风险的用户。

s305,确定该目标采集日期所属的日期类型。

其中,日期类型可以包括:节假日和非节假日两大类,其中,非节假日可以包括;周末和工作日。

其中,本申请实施例中,该目标采集日期为某天对应的日期时,可以直接确定该天对应的日期类型,当该目标采集日期对应的包含多天的一段时间时,则可以分别确定该目标采集日期包含的每天各自对应的日期类型。

本申请的发明人研究发现:用电客户在节假日、周末以及工作日时所产生的用电量等用电数据会存在很大差别,因此,日期类型影响到了用电数据,需要结合目标用户的用电数据产生的日期所对应的日期类型,来进行后续预测该目标用户的用电数据的操作。

可以理解的是,通过其他方式确定出该目标用户具有窃电行为的概率的情况下,在该概率未超过目标阈值的情况下,同样可以确定该目标采集日期的日期类型以及后续的其他操作。

可以理解的是,该步骤s305可以与前面步骤s302到s304中利用深度学习模型识别用户是否具有窃电风险过程中任意一个步骤同时执行。当然,也可以先执行完前面步骤s302到s304,再执行该步骤s305,本申请对此不加限制。

s306,依据该目标采集日期对应的日期类型和天气温度,从该目标用户对应的多个历史采集日期中,确定出用于预测该目标采集日期的用电情况的至少一个目标历史采集日期。

其中,每个历史采集日期均关联有该历史采集日期的日期类型和天气温度。

其中,目标历史采集日期为影响用电状况的影响因素与该目标采集日期对应的影响因素相似的历史日期,如用电影响因素最为相近的历史日期。具体的,目标历史日期为该目标采集日期之前,且日期类型和天气温度均与该目标采集日期的匹配度满足要求的日期。同时,计算机设备从该目标用户的历史用电数据中查询到该目标历史采集日期对应的用电数据。

当然,该目标历史采集日期对应的月份以及具体日期也与该目标采集日期的日期时间较为接近,如,日期的月份或者天数差距小于预设时长。

例如,将处于该目标采集日期对应的当前年之前的历史年中,与该目标采集日期的月份的时长差距小于指定数量月(如,与该采集日期的月份相同)的一段日期均作为目标历史采集日期。

确定目标历史采集日期的方式可以有多种,如,考虑到用电数据一般至少以天统计,目标采集日期对应的该目标历史采集日期可以认为是目标采集日期的相似日,而确定相似日可以采用动态时间规整算法,来确定具有最小规则距离的日期对,每个日期对可以包括一个目标采集日期与一个目标历史采集日期的对应关系。

可选的,考虑到不同年份的节假日都为同一天,如每天国庆节都是十月一,且用户正常用电的情况下,用户在不同年的同一节假日的用电情况基本相似,在该种情况下,如果该目标采集日期对应的日期类型为节假日时,则可以从该目标用户对应的多个历史采集日期中,确定与该目标采集日期为同一节假日的目标历史采集日期。

如果该目标采集日期对应的日期类型不属于节假日时,则采用动态时间规整算法,并结合该目标采集日期的天气温度,从该目标用户对应的多个历史采集日期中,确定与该目标采集日期以及所述目标采集日期的天气温度之间的相似度满足要求的至少一个目标历史采集日期。

为了便于理解基于动态规整算法,匹配目标历史采集日期的过程,下面举例说明,确定出目标用户对应的属于周末或工作日的多个历史采集日期后,可以构建出由该多个历史采集日期的天气温度组成的第一温度序列told={t1,t2.....tm}。同时,构建由该目标采集日期所属的当前年中包含该目标采集日期在的多个周末或者工作日对应的天气温度所组成的第二温度序列满足m大于等于n。

第一温度序列和第二温度序列为该动态规整算法的输入。

在匹配时,可以将第一温度序列中的第一个温度与第二温度序列中的第一个温度的组合表示为(1,1),从(1,1)点出发搜索至(m,n),其中,(m,n)表示第一个温度序列中的最后一天的温度与第二个温度序列中最后一天的温度。在搜索过程中,可以展开若干条路径,可计算每条路径达到(m,n)点时的总的积累距离,通过逐点向前寻找就可以求得整条路径,具有最小累积距离者即为规整路径。

如,对于(i,j),可到达该格点的只可能是(i-1,j-1),(i-1,j)以及(i,j-1),那么选择这3个距离中最小的路径延伸而通过(i,j)。求解两序列匹配时,累计距离最小所对应的规整函数d(i,j),它表示为序列told上点i和tnew上的点j之间的规整路径距离:

d(i,j)=dist(i,j)+min{d(i-1,j),d(i,j-1),d(i-1,j-1)}(公式一);

其中dist(i,j)为told上点i和tnew上的点j之间的欧式距离。

算法输出为:最小规整距离,点和点之间匹配关系结果。其中,点与点的匹配关系结果可以表征天气温度相似的历史采集日期与目标采集日期。

可见,基于动态时间规整,每个目标采集日期都可以找到历史中的相似历史采集日期。

s307,利用该目标用户在该至少一个历史采集日期的用电数据,预测该目标用户在该目标采集日期的预测用电数据。

其中,为了与实际采集到的该目标用户的用电数据进行区分,将预测出的该目标用户在该目标采集日期的用电数据称为预测用电数据。

可以理解的是,基于该至少一个历史采集日期的用电数据预测该目标采集日期的预测用电数据的方式可以有多种,本申请对此不加限制。如,利用该至少一个历史采集日期的用电数据构建用电趋势曲线,结合用电趋势曲线,预测该目标用户在该目标采集日期的用电数据。又如,利用回归算法,并结合该至少一个历史采集日期的用电数据,预测该目标用户在该目标采集日期的用电数据。

s308,当该目标用户的用电数据与该预测用电数据之间的数据偏差超过预设值,且利用深度学习模型将该目标用户识别为存在窃电风险的用户,则确定该目标用户为存在窃电嫌疑的用户。

在本实施例中,为了避免误检测,并实现能够更为精准的识别出存在窃电嫌疑的用户,在利用历史窃电用户的用电数据训练出的深度学习模型对目标用户进行风险识别的同时,还会利用该目标用户的用电数据对应的目标采集日期以及天气温度等影响用电的影响因素来预测目标用户的预测用电数据,以便依据预测用电数据与该采集到的该目标用户的用电数据的比较结果,以及该深度学习预测模型预测出的结果来综合确定该目标用户是否具备窃电嫌疑。

如,在利用深度学习模型将该目标用户识别为存在窃电风险的用户的同时,如果采集到的用电数据与预测用电数据中相同项的差值超过预设值,则认为该目标用户属于存在窃电嫌疑的用户。如,比较用电数据的电压与预测用电数据中的电压之间的差值是否超过预设值。

其中,该预设值可以根据需要设定。

可以理解的是,在所述基于深度学习模型确定出所述目标用户具有窃电行为的概率未超过目标阈值的情况下,,为了减少该目标用户采用区别于历史窃电用户的窃电方式进行窃电,而导致该深度学习模型无法识别的情况,本申请实施例还可以结合预测出的用电数据与该采集到的用电数据进行比对,以分析该目标用户是否存在窃电嫌疑,从而有利于更为全面的定位出存在窃电嫌疑的用户。

也就是说,在基于深度学习模型确定出所述目标用户具有窃电行为的概率未超过目标阈值的情况下,如果目标用户的用电数据与预测用电数据之间的数据偏差超过预设值时,也可以将该目标用户识别为存在窃电风险的用户。

对应本申请的一种窃电用户识别方法,本申请还提供了一种窃电用户识别装置。

如,参见图4,其示出了本申请一种窃电用户识别装置的一种组成结构示意图,本实施例的装置可以包括:

数据获取单元401,用于获取待分析的目标用户的用电数据;

概率确定单元402,用于依据所述目标用户的用电数据,并利用预先训练得到的深度学习模型,确定所述目标用户具有窃电行为的概率,所述深度学习模型为利用多个历史窃电用户的用电数据为训练样本训练得到的;

窃电识别单元403,用于在基于所述深度学习模型确定出所述目标用户具有窃电行为的概率超过所述深度学习模型中预先学习出的目标阈值的情况下,将所述目标用户识别为存在窃电风险的用户。

在一种实现方式中,所述概率确定单元,具体为,用于依据所述目标用户的用电数据,并利用预先训练得到的深度学习模型,确定所述目标用户分别具有多种不同类型的窃电行为的概率,所述深度学习模型为利用多个历史窃电用户的用电数据以及所述历史窃电用户对应的窃电行为类型训练得到的;

所述窃电识别单元,具体为用于在基于所述深度学习模型确定出所述目标用户具有至少一种类型的窃电行为的概率超过所述深度学习模型中预先学习出的目标阈值的情况下,将所述目标用户识别为存在窃电风险的用户。

可选的,所述概率确定单元,包括:

指标确定子单元,用于按照预置的多个用电指标各自对应的用电数据范围,从所述多个用电指标中,确定与所述目标用户的用电数据匹配的至少一个目标用电指标;

模型分析子单元,用于依据所述至少一个目标用电指标,并利用预先训练得到的深度学习模型,确定所述目标用户分别具有多个不同类型的窃电行为的概率,所述深度学习模型为利用多个历史窃电用户各自对应的至少一个用电指标以及所述历史窃电用户对应的窃电行为类型训练得到的,所述历史窃电用户对应的至少一个用电指标为依据所述历史窃电用户的用电数据确定出的。

可选的,该装置还可以包括:模型训练单元,用于通过如下方式训练所述深度学习模型:

获取多个历史窃电用户的用电数据;

针对每个历史窃电用户,按照预置的多个用电指标各自对应的用电数据范围,从所述多个用电指标中,确定与该历史窃电用户的用电数据匹配的至少一个用电指标;

基于所述多个历史窃电用户各自对应的至少一个用电指标,对所述多个历史窃电用户的用电数据进行聚类,以将所述多个历史窃电用户的用电数据聚类为表征不同类型窃电行为的多个窃电行为类别;

依据每个所述历史窃电用户对应的至少一个用电指标以及每个所述历史窃电用户的用电数据所归属的窃电行为类别,对深度学习模型进行训练,直至所述深度学习模型的预测精准度符合要求。

在一种可能的实现方式中,还包括:

参数获取单元,用于在所述数据获取单元获取待分析的目标用户的用电数据的同时,获取所述目标用户的用电数据对应的目标采集日期以及所述目标采集日期的天气温度;

第一类型确定单元,用于确定所述目标采集日期所属的日期类型;

日期匹配单元,用于依据所述目标采集日期对应的日期类型和天气温度,从所述目标用户对应的多个历史采集日期中,确定出用于预测所述目标采集日期的用电情况的至少一个目标历史采集日期;

数据预测单元,用于利用所述目标用户在所述至少一个历史采集日期的用电数据,预测所述目标用户在所述目标采集日期的预测用电数据;

第一综合识别单元,用于当所述目标用户的用电数据与所述预测用电数据之间的数据偏差超过预设值,且基于所述深度学习模型将所述目标用户识别为存在窃电风险的用户,则确定所述目标用户为存在窃电嫌疑的用户。

在又一种可能的实现方式中,该装置还包括:

参数获取单元,用于在所述数据获取单元获取待分析的目标用户的用电数据的同时,获取所述目标用户的用电数据对应的目标采集日期以及所述目标采集日期的天气温度;

第二类型确定单元,用于确定所述目标采集日期所属的日期类型;

日期匹配单元,用于依据所述目标采集日期对应的日期类型和天气温度,从所述目标用户对应的多个历史采集日期中,确定出用于预测所述目标采集日期的用电情况的至少一个目标历史采集日期,其中,每个所述历史采集日期均关联有所述历史采集日期的日期类型和天气温度;

数据预测单元,用于利用所述目标用户在所述至少一个历史采集日期的用电数据,预测所述目标用户在所述目标采集日期的预测用电数据;

第二综合识别单元,用于在所述基于深度学习模型确定出所述目标用户具有窃电行为的概率未超过所述目标阈值的情况下,如果所述目标用户的用电数据与所述预测用电数据之间的数据偏差超过预设值时,将所述目标用户识别为存在窃电风险的用户。

可选的,在以上实施例中,所述日期匹配单元,包括:

第一匹配子单元,用于当所述目标采集日期对应的日期类型为节假日时,则从所述目标用户对应的多个历史采集日期中,确定与该目标采集日期为同一节假日的目标历史采集日期;

第二匹配子单元,用于当所述目标采集日期对应的日期类型不属于节假日时,则采用动态时间规整算法,并结合所述目标采集日期的天气温度,从所述目标用户对应的多个历史采集日期中,确定与所述目标采集日期以及所述目标采集日期的天气温度之间的相似度满足要求的至少一个目标历史采集日期。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1