本发明属于数据识别领域,涉及基于集成学习算法的用户异常用电行为识别方法及系统,在充分利用现有数据的基础上,提升了用电稽查的工作效率。
背景技术:
随着电力客户数量快速增长,窃电现象也日益严重,窃电不仅损害了供电公司的经济利益,同时也给用电安全带来了隐患。目前窃电手段已由原来的简单方式,发展到设备智能化、手段专业化、行为隐蔽化、实施规模化的高科技窃电,传统检查方法难以获取证据。
技术实现要素:
为了解决窃电现象日益严重的问题,本发明利用统计的数据进行分析处理,旨在提供基于集成学习算法的用户异常用电行为识别方法及系统,能快速识别疑似窃电用户,为用电稽查工作提供依据。
基于集成学习算法的用户异常用电行为识别方法,包括以下步骤:
步骤一、获取电网的所有电力数据;
步骤二、将步骤一获得的电力数据进行筛选,剔除不符合数据协议格式要求的电力数据;
步骤三、将步骤二合格的电力数据进行标注,标注方式包括区域,日期,消费额以及用户年龄;
步骤四、构建学习模型,将上述标注的电力数据按照标注方式输入至学习模型中;
步骤五、所述学习模型根据对应的学习算法定位出疑似异常用电用户。
在本发明的一个优选实施例中,所述标注方式中用户年龄设定为第一权重值,其次区域设定为第二权重值,以及消费设定为第三权重值,消费额设定为第四权重值;所述第一权重值的权重值最大,第一权重值、第二权重值、第三权重值以及第四权重值之和为1。
在本发明的一个优选实施例中,所述第一权重值为0.3-0.6。
在本发明的一个优选实施例中,对用户年龄的用电行为筛选,并将筛选的结果进行分割,并计算用户年龄与异常用电用户的关联度。
在本发明的一个优选实施例中,采用有监督学习的方式构建学习模型,即将步骤四合格的电力数据称为训练数据,每组训练数据有一个明确的结果并建立一个学习过程,学习电力数据的内在结构以便合理地组织数据得到结果。
在本发明的一个优选实施例中,还包括步骤六:输出疑似异常用电用户信息步骤;将定位出疑似异常用电用户信息进行整合,并定期输送至管理系统中,并最终确定异常用电用户。
在本发明的一个优选实施例中,调出已定位出疑似异常用电用户所在的区域历史电力数据以及线路总损耗数据,若同时历史电力数据以及线路总损耗数据均产生偏差,则认定疑似异常用电用户为异常用电用户。
基于集成学习算法的用户异常用电行为识别系统,包括:
电力数据获取模块,所述电力数据获取模块收集所有用户的电力数据;
筛选模块,将获得的电力数据进行筛选,剔除不符合数据协议格式要求的电力数据;
处理模块,将电力数据按照标注方式输入至所述处理模块中,所述处理模块定位出疑似异常用电用户。
在本发明一个优选实施例中,所述电力数据的标注方式包括区域,日期,消费额以及用户年龄。
在本发明一个优选实施例中,还包括比对模块,所述比对模块调出已定位出疑似异常用电用户所在的区域历史电力数据以及线路总损耗数据,若同时历史电力数据以及线路总损耗数据均产生偏差,则认定疑似异常用电用户为异常用电用户。
通过以上技术方案,本发明的技术效果在于:
本发明根据电力数据中包含的区域,日期,消费额以及用户年龄等信息,利用学习算法,快速发现用电异常,准确率高,能有效帮助有关部门缩小排查范围,并为电力公司节约人力物力资源。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的原理框图。
图2为本发明的系统的结构框图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。
实施例1:
参照图1,基于集成学习算法的用户异常用电行为识别方法,包括以下步骤:
步骤一、获取电网的所有电力数据;
步骤二、将步骤一获得的电力数据进行筛选,剔除不符合数据协议格式要求的电力数据;
步骤三、将步骤二合格的电力数据进行标注,标注方式包括区域,日期,消费额以及用户年龄;
步骤四、构建学习模型,将上述标注的电力数据按照标注方式输入至学习模型中;
步骤五、所述学习模型根据对应的学习算法定位出疑似异常用电用户。
还包括步骤六:输出疑似异常用电用户信息步骤;将定位出疑似异常用电用户信息进行整合,并定期输送至管理系统中,并最终确定异常用电用户。
本发明根据现有的电力数据进行分析,整合,能快速锁定疑似异常用电用户,然后进一步根据疑似异常用电用户确定出异常用电用户,即从大量数据中优选选择出疑似异常用电用户,使得后续处理数据较少,提供了准确度。
为了进一步提升准确度以及速度,上述调出已定位出疑似异常用电用户所在的区域历史电力数据以及线路总损耗数据,若同时历史电力数据以及线路总损耗数据均产生偏差,则认定疑似异常用电用户为异常用电用户。
进一步地,所述标注方式中用户年龄设定为第一权重值,其次区域设定为第二权重值,以及消费设定为第三权重值,消费额设定为第四权重值;所述第一权重值的权重值最大,第一权重值、第二权重值、第三权重值以及第四权重值之和为1;即本发明筛选了4个权重参数进行确定,所述第一权重值(用户年龄)为0.3-0.6。
本发明中优选选择用户年龄作为首要权重值,一般来说年轻用户的用电数据普遍多余年老客户的用电数据;
具体地,对用户年龄的用电行为筛选,并将筛选的结果进行分割,并计算用户年龄与异常用电用户的关联度。并同时结合消费额进行整体认定,即年轻用户消费额较多的,相应的电力数据应该也高;年老客户消费额较少的,相应的电力数据同样较少。
实施例2:
本实施例2相较于实施1中详细说明如何构建学习模型:
采用有监督学习的方式构建学习模型,即将步骤四合格的电力数据称为训练数据,每组训练数据有一个明确的结果并建立一个学习过程,学习电力数据的内在结构以便合理地组织数据得到结果。
在学习模型中,通过不断地对整个算法进行优化、训练,建议内在的一整套学习方式,根据电力数据的特殊性构建电力数据的结果。
实施例3:
相较于实施例1、实施例2给出的识别方法,本实施例中给出了具体的识别系统:
参数图2,基于集成学习算法的用户异常用电行为识别系统,包括:
电力数据获取模块,所述电力数据获取模块收集所有用户的电力数据;
筛选模块,将获得的电力数据进行筛选,剔除不符合数据协议格式要求的电力数据;
处理模块,将电力数据按照标注方式输入至所述处理模块中,所述处理模块定位出疑似异常用电用户;所述电力数据的标注方式包括区域,日期,消费额以及用户年龄。
还包括比对模块,所述比对模块调出已定位出疑似异常用电用户所在的区域历史电力数据以及线路总损耗数据,若同时历史电力数据以及线路总损耗数据均产生偏差,则认定疑似异常用电用户为异常用电用户。
本发明根据电力数据中包含的区域,日期,消费额以及用户年龄等信息,利用学习算法,快速发现用电异常,准确率高,能有效帮助有关部门缩小排查范围,并为电力公司节约人力物力资源。