一种基于模糊神经网络的用电异常行为识别方法与流程

文档序号：15183045发布日期：2018-08-17 07:00阅读：239来源：国知局

本发明属于用电数据分析与处理以及数据挖掘技术领域，特别涉及一种利用模糊神经网络算法对用电异常行为进行识别的方法。

背景技术：

窃电漏电等用电异常行为是电力行业经常需要面对的问题，这些异常用电行为会导致电费的漏收或少收，从而给电力企业带来可观的经济损失。

针对这类问题，传统的防止窃电漏电等异常用电行为的方案有定期巡检、用户举报、电表定期校验，但是这几种方法都具有较强的人工依赖性，查漏抓窃的目标也不够明确。

目前，我国很多供电局主要通过用电巡检人员、计量工作人员等利用计量系统的异常报警功能和电量数据查询功能对用户用电量情况进行在线监控，通过采集电力负荷异常、电量使用异常、终端和主站报警、以及失压失流、电流过复合等报警信息来构建分析模型，实时监测用电行为，以发现用户是否存在窃电、漏电等用电异常行为。这种方法需要工作人员在线监督，在采集电量异常、负荷异常、终端报警、主站报警等信息过程中存在终端误报和信息冗余问题。同时这种方法还存在成本高、模型复杂、监测结果的准确性不够等问题，尤其在涉及多种复杂现象和多种因素的窃电、漏电等异常用电行为的案例中，无法实现有效的监控。

技术实现要素：

本发明要解决的技术问题是如何低成本、高效、准确地对窃电、漏电等用电异常行为进行识别。

为了解决上述技术问题，本发明的技术方案是提供一种基于模糊神经网络的用电异常行为识别方法，其特征在于，步骤为：

步骤1：数据抽取；

从用电数据库中选择性地抽取部分用户的用电负荷、终端报警和违约窃电处罚信息的原始数据作为样本数据；从样本数据中设立白名单用户，剔除不可能存在用电异常行为的用户，初步审视正常用电用户和异常用电用户的用电数据特征；

步骤2：数据预处理；

由于原始数据中存在杂数据和缺失数据，这些多余的或缺少的数据会影响分析效果，会使分析预测结果产生偏差，故需要对原始数据进行预处理；数据预处理过程包括数据清洗、缺失值处理、异常值处理、数据变换、数据格式化；

步骤3：模型构建；

在分析历史用电异常行为案例的基础上，设计用电异常行为评价指标体系；利用预处理后的数据构建专家样本，再划分出训练数据集和测试数据集；以异常用电行为标志为输入项，以异常用电嫌疑系数为输出项，构建模糊神经网络模型；

步骤4：异常用电行为识别诊断；

将测试数据输入所构建的模糊神经网络模型，进行异常用电行为诊断；

步骤5：模型评价分析及优化；

对异常用电诊断结果做出评价，设定目标评价，优化模型。

优选地，所述步骤1中，不可能存在用电异常行为的用户包括银行、学校、工商、税务。

优选地，所述步骤1包括以下步骤：

步骤1-1：提取与窃电漏电等异常用电行为有关的历史数据，包括用电负荷数据、终端报警数据、违约窃漏电处罚信息等。体现窃漏电行为的数据指标包括用电异常、负荷异常、终端报警、主站报警、线损异常；

电量异常指分时电量和总电量超差1％，日电量特征同比超差30％，月冻结电量超差30％；

负荷异常指用功率环比突变30％，变压器负载率过大，三相电流不平衡；

线损异常指供电线路线损大于10％，线损同比超差30％，线损明细异常；

主站报警指分时/总表码不等，实时表码飞走，实时表码逆时，功率因数偏小，负载率过大等；

终端报警指电压缺相/断相，零序电压偏大，电压逆向序，电流过负荷等。

表征异常用电特征的关键时间点是用户用电出现异常行为的开始和结束时间，而用电负荷数据在这些时间点上也会存在相应的变化特征，因此抽取数据必须包含关键时间点前后范围内的相关数据，然后通过用电负荷数据计算用电量，公式如下：

其中，fi为第l天的用电量，mi为第l天每隔15分钟的总的有功功率，对其累加求和得到当天用电量。

步骤1-2：对数据进行初步地探索分析，从而发现数据内在的特征规律，帮助选择合适的数据预处理和数据分析技术，包括分布分析、周期性分析、用电量探索分析，其特征在于：

分布分析：对一个时间段内的各个用电类别的异常用电用户的用电分布情况进行统计，其中非居民用户的用电数据排除在外；

周期性分析：随机性地抽取异常用电电用户和正常用户的用电数据，呈周期性地对其用电电量进行测试对比，发现其趋势；

用电量探索分析：从用电数据中标记下降或上升趋势明显异于整体用电趋势的时间点，这些点为嫌疑异常用电的电量指标特征。

优选地，所述步骤2包括以下步骤：

步骤2-1：数据清洗。为了建模需要，筛选出有用的数据，必须要进行数据清洗，要对异常数据进行检测(异常数据包括离群值和异常值)，过滤掉不存在窃电漏电等异常用电行为的非居民用电数据、用电量和平时相比明显下降的节假日用电数据。

步骤2-2：缺失值处理。对于原始用电数据，尤其是在实时负荷数据抽取过程中，会存在一定的数据缺失，如果不补齐这些数据，会严重影响日线损率数据的准确性。采用拉格朗日插值法进行数据插补，包括以下子步骤：

步骤2-2-1：从原始数据集中确定出因变量和自变量；

步骤2-2-2：取出缺失值前后5个数据，如果遇到数据不存在或者为空的情况，则直接将数据舍去，将仅有的数据组成一组；

步骤2-2-3：根据取出来的10个数据组成一组。然后采用拉格朗日多项式插值公式

其中，n数据量，ln(x)为缺失值的插值结果，x为缺失值对应的下标序号，xi为非缺失值yi的下表序号，xj为非缺失值yj的下表序号。

步骤2-2-4：对全部缺失值进行插补，一直到不存在缺失值为止。

步骤2-3：节假日数据修正。和工作日相比，节假日的用电量和实时负荷数据要明显偏低，因此需要对特殊类型的日期用电数据进行修正处理，使不同日期类型的数据在一段时间周期内具有连贯性与可比性。其特征在于：

周六修正系数＝最近一个月采集周期内的工作日平均电量/周六平均电量

节假日修改系数＝最近一个月采集周期内的工作日平均电量/节假日的平均电量。

步骤2-4：数据变换。样本数据如电量、负荷虽然能在预定程度上反应用户异常用电行为的一些特征规律，但如果要拿这些数据用作模型构建的专家样本，在特征上还是不够明显的，因此需要进行重构操作。通过数据变换得到新的评价指标来表示异常用电行为的特征规律。

更优选地，所述步骤2-4中，数据变换的指标包括电量指标、负荷指标以及线损指标。

进一步地，所述电量指标即日用电量移动平均后做差分，统计连续变化量；需要先计算日用电量移动平均agv_en，即n天的用电平均量，计算公式如下：

式中，ei为日用电量；

再计算日用电量移动差分dif_en，即连续n天的用电移动平均累计变化量

进一步地，所述负荷指标即实时负荷平均方差的累计变化量；需要先计算实时负荷前n-1日每一时刻的移动平均值，avg_ln，1到avg_ln，96的计算公式如下：

其中：ln，t为第n日第t时刻的负荷；li，t为第i日第t时刻的负荷，avg_ln，t是前n-1天的第t时刻平均负荷；n为大于等于1的整数；

再计算移动平均方差avg_rmsen：

其中：*为

最后计算累计变化量dif_ln：

进一步地，所述线损指标计算方法如下：

一条线路同时给m个用户供给，m为正整数，如果第l天的线路供电量为sl，线路上各个用户的总的用电量为线路的线损率tl为

根据前后设定天数的线损率平均值，判断其增长率是否大于1％；如果增长率大于1％，则判定为存在窃漏电嫌疑对象；设将当日前后p天设定为统计窗口期，p为设定的正整数，分别统计当日与前p天之间的线损率平均值和统计当日与后p天之间的线损平均值若比的增长率大于1％，则认为存在窃漏电嫌疑，

线损指标e(i)为

优选地，所述步骤3包括以下步骤：

步骤3-1：设计评价指标体系判定是否存在窃电漏电等异常用电嫌疑，其设计原则包括评价指标能否真实反映异常用电状态、样本数据是否方便采集。

步骤3-2：在预处理数据的基础上结合评价指标体系，构建专家样本库。专家样本以日为单位表示用电情况，输入项包括5e指标、5ee指标、5l指标、pv指标、5ll指标、5lle指标、isf指标、adc指标、cu指标sstype，输出项为异常用电行为嫌疑系数。其中，5e为n天电量移动平均查分梯度累积量，5ee为5e指标趋势，5ll为n天线损平均差分梯度累计量，5lle为5ll指标趋势，adc为用户的容量变化标志，cu为转户标志，5l为n天内最大负荷与基准负荷查分梯度值，isf为是否计量故障，sstype为用电类别，pv为峰谷负荷，y为是否存在异常用电行为。

步骤3-3：通过分类预测模型的构建来实现异常用电行为评价，采用模糊神经网络构建预测模型。

所述模糊神经网络指具有模糊权系数，或者输入信号是模糊量，它是模糊系统与神经网络结合的产物。模糊神经网路主要利用神经网络调整模糊逻辑推理系统和模糊推理规则的形式来构建神经网络。模糊规则通过学习神经网络，用“权值”的形式来体现，从而转换为权值的确定和修改。模糊神经网络在常规的神经网络中输入“模糊输入信号”和“模糊权值”。其结构像神经网络，功能上是模糊系统，它是多层网络，除了输入节点和输出节点外，还有多个隐含层。相邻两层之间都有连接，同时每个连接都对应着一个权值。神经网络各层特征在于：

第一层为输入层，有9个输入节点，分别与影响用电评价的9个评价指标相对应；

第二层为模糊化层，输入变量共有10个：(x1，x2，…，x10)，将每个输入变量划分为模糊集合a1、a2、a3，即3个模糊度，18个变量，共划分为9×3＝27个模糊度，每个节点的激活函数分别为输入变量xi的各个模糊度的隶属函数，其输出分别为输入变量xi的各个模糊度的隶属度函数值，即[0，1]之间的值，共存在30个神经元：

隶属度函数μa(x)采用高斯函数

其中，c为隶属度函数的中心，σ为隶属度函数的宽度。利用随机函数在建模初期对c和σ进行初始化，然后再利用网络训练来不断修正调整，直到稳定；

第三层为模糊推理层，这一层的每个节点仅与第二层中每个节点中的一个连接，共计9个3的点数相乘，即19683条规则；

第四层为去模糊化层，节点数为输出变量模糊度划分的个数，包括总体评价的两个类别：正常用电和异常用电。这一层与第三层全互连，连接权值为wij；

第五层为输出层，这层将第四层每个节点的输出转化为输出变量的精确值。该层节点数为输出变量的个数，即异常用电的嫌疑系数。

相比现有技术，本发明提供的基于模糊神经网络的用电异常行为识别方法具有如下有益效果：

1、本发明通过对原始数据抽取以及预处理，对各种用异常用电数据进行分类，形成专家样本库，构建模糊神经网络模型；再通过对模型的训练、模型的验证、模型的评价，实现智能化、自动化的诊断。该方案无需工作人员在线监督，解决了通过采集电量异常、负荷异常、终端报警、主站报警等信息过程中的终端误报和信息冗余问题，同时也避免了传统建模方法中模型输入指标权重依赖专家知识和经验的主观性和不确定性。

2、本发明根据历史用电以及用电异常数据建立专家样本库，设计异常用电行为评价指标体系，采用模糊评价模型和神经网络方法，构建识别诊断模型，减小了人工建模的复杂度，实现了系统的自动训练学习和建模，达到快速又精准的定位异常用电嫌疑用户，为获取窃电、漏电等异常用电行为提供了便利。

3、本发明基于模糊神经网络进行用电异常行为的识别，通过对数据的预处理，结合模糊神经网络，利用模糊评价法和神经网络评价法的优点，在解决涉及多种复杂现象和多种因素的窃电漏电等异常用电行为的案例中具有显著优势。

附图说明

图1用电异常行为识别系统工作流程图，表示整个系统方案的实现流程；

图2为模糊神经网络结构图；

图3为用电异常行为评价指标架构图，该架构展示了用电异常行为的评价指标体系。

具体实施方式

附图中图1给出本发明方案的整体实现流程，该发明提供的一种基于模糊神经网络的用电异常行为识别方法，具体实施步骤如下：

1、样本用电数据抽取。

以某企业用户用电数据为样本，首先对用电数据进行抽取，抽取出建立模型相关的有用数据。从样本数据中抽取出用户名、用户编号、用电地址、用电类别、实时负荷等数据。通过用电负荷数据计算用电量，公式如下：

其中，fl为第l天的用电量，mi为第l天每隔15分钟的总的有功功率，对其累加求和得到当天用电量。

进一步的，通过电量异常、负荷异常、终端报警、主站报警、线损异常等信息反馈异常用电行为。

其中，电量异常指：分时电量和总电量超差1％，日电量特征同比超差30％，月冻结电量超差30％；

负荷异常指：用功率环比突变30％，变压器负载率过大，三相电流不平衡；

线损异常指：供电线路线损大于10％，线损同比超差30％，线损明细异常；

主站报警指：分时/总表码不等，实时表码飞走，实时表码逆时，功率因数偏小，负载率偏大。

终端报警指：电压缺相/断相，零序电压偏大，电压逆向序，电流过负荷等。

进一步的，对数据进行初步地探索分析，包括如下分析：

分布分析：对一个时间段内的各个用电类别的异常用电用户的用电分布情况进行统计，其中非居民用户的用电数据排除在外；

周期性分析：随机性地抽取异常用电用户和正常用户的用电数据，呈周期性地对其用电量进行测试对比，发现其趋势；

用电量探索分析：从用电数据中标记下降或上升趋势明显异于整体用电趋势的时间点，这些点为嫌疑异常用电的电量指标特征。

2、用电数据预处理。

对这些数据进行一定程度的过滤或插补来处理原始数据中存的杂数据和缺失数据，以达到更好的分析效果，避免分析预测结果产生一定程度上的偏差。该过程包括以下步骤：

(1)数据清洗。对异常数据进行检测，异常数据包括离群值和异常值，要删除含有异常值的记录，修正平均值。然后过滤掉不会存在窃漏电行为的非居民用电数据和用电量和平时相比明显下降的节假日用电数据。

(2)缺失值处理。采用拉格朗日插值法进行数据插补。具体步骤如下：

先从原始数据集中确定出因变量和自变量；

进一步的，取出缺失值前后5个数据，如果遇到数据不存在或者为空的情况，则直接将数据舍去，将仅有的数据组成一组；

进一步的，根据取出来的10个数据组成一组，采用拉格朗日多项式插值公式进行插值；

进一步的，对全部缺失值进行查补，一直到不存在缺失值为止。

(3)节假日数据修正。

对特殊类型的日期用电数据进行修正处理，使不同日期类型的数据在一段时间周期内具有连贯性与可比性。处理方法如下：

周六修正系数＝最近一个月采集周期内的工作日平均电量/周六平均电量；

节假日修改系数＝最近一个月采集周期内的工作日平均电量/节假日的平均电量。

(4)数据变换。对数据进行进一步地重构操作，通过数据变换得到新的评价指标来表示异常用电行为所具有的特征规律。该过程包括以下步骤：

计算电量指标，即日用电量移动平均后做差分，统计连续变化量。先计算日用电量移动平均agv_en，即n天的用电平均量，计算公式如下：

其中，ei为日用电量；

进一步的，计算日用电量移动差分dif_en，即连续n天的用电移动平均累计变化量，以0.02作为阈值；

进一步的，计算负荷指标，即实时负荷平均方差的累计变化量。先计算实时负荷前n-1日每一时刻的移动平均值，avg_ln，1到avg_ln，96的计算公式如下：

其中：ln，t为第n日第t时刻的负荷；li，t，为第i日第t时刻的负荷，avg_ln，t是前n-1天的第t时刻平均负荷；n为大于等于1的整数；

进一步的，再计算移动平均方差avg_rmsen：

上式中*为

进一步的，计算累计变化量dif_ln：

进一步的，计算线损指标。一条线路同时给多个用户供给，如果第l天的线路供电量为sl，线路上各个用户的总的用电量为线路的线损率tl为

进一步的，根据前后几天的线损率平均值，判断其增长率是否大于1％，如果增长率大于1％，则判定为存在窃漏电嫌疑对象。将当日前后5天设定为统计窗口期，分别统计当日与前5天之间的线损率平均值和统计当日与后5天之间的线损平均值若比的增长率大于1％，则认为存在窃漏电嫌疑，线损指标e(i)为

3、模型构建。

在分析历史窃电漏电等违规用电案例的基础上，设计异常用电行为评价指标体系，用电异常行为评价指标架构图如图3所示，包括电量指标、负荷指标、线损指标、报警指标及其它特定的指标。利用预处理数据构建专家样本，再划分出训练数据集和测试数据集。

进一步的，利用模糊神经网络构建预测模型，以用电异常嫌疑系数作为输入构建模糊神经网络模型，异常用电行为标志为输出项，模糊神经网络结构图如图2所示，图2中，x1～xn为n个模糊输入信号，a1～am、为每一层网络m个模糊集合的模糊权值，y为输出信号。

4、用电异常行为识别诊断。

将测试数据进行如步骤1样本用电数据抽取、步骤2用电数据预处理，计算得到各项数据指标，然后调用构建并训练好的模型进行用电异常行为的识别诊断。

5、模型评价分析及优化。

对用电异常行为识别诊断结果做出评价，设定目标评价，不断训练，优化模型。

以上所述，仅为本发明的一个参考实施例，并非对本发明任何形式上和实质上的限制，应当指出，对于本技术领域的普通技术人员，在不脱离本发明方法的前提下，还将可以做出若干改进和补充，这些改进和补充也应视为本发明的保护范围。凡熟悉本专业的技术人员，在不脱离本发明的精神和范围的情况下，当可利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化，均为本发明的等效实施例；同时，凡依据本发明的实质技术对上述实施例所作的任何等同变化的更动、修饰与演变，均仍属于本发明的技术方案的范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐凯;方建安
技术所有人：东华大学
我是此专利的发明人

上一篇：一种稀土磁盘压榨机反冲洗装置的制作方法
上一篇：一种二氢大豆苷元的制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。