基于逻辑回归概率分析优化模型的反窃电分析预警方法与流程

文档序号:11231409阅读:1004来源:国知局
基于逻辑回归概率分析优化模型的反窃电分析预警方法与流程
本发明涉及一种基于逻辑回归概率分析优化模型的反窃电分析预警方法。
背景技术
:近年来,我国用电相关的纠纷案件数量亦逐年上升,尤其窃电问题,且窃电手段不断变化发展,使得窃电范围不断扩大,对电力系统的正常运行造成了阻碍。为规范管理生产生活用电,提高电能利用率,推进电力企业健康、稳定发展,开展用电检查与反窃电工作是电力企业一项迫切工作。早期,传统的电费收取方式为人工手抄表,体力劳动强且涉外人员数量不足,窃电查处问题也由涉外人员承担,用电检查人员数量难以满足需求,其次,由于传统用电管理思想观念根深蒂固,供电企业对违约用电窃电行为不够重视,造成用电检查及打击窃电行为力度低,助长了违约用电和窃电行为;随着社会进步、经济发展,用户用电数量不断增多,社会生产生活对电能的需求量越来越大,电力企业也随之引进智能电表,以用电信息采集系统和sg186营销业务应用系统有效实现远程费控,然而窃电查处问题并未随之解决,且在经济利益的驱使下,窃电者不再局限于过去的居民、个体等,逐渐发展成为了集体企业、中外合作企业等,发展速度十分快,严重干扰了电力企业供电安全与秩序,此外,随着科学技术日新月异,高科技手段被窃电人员广泛应用,随着窃电技术的智能化、科技化发展,使得高科技含量的窃电方式越来越多,如无线遥控、有线远方控制等,此类窃电手段往往十分隐蔽,传统用电检查方法根本无法检测,且用电检查人员综合素质较低,难以满足用电检查和反窃电工作的现代化需求。因此,亟需采取有效方法,利用电力企业现有系统所提供数据实现反窃电分析,对窃电嫌疑用户进行概率推测和预警,精准识别重大窃电嫌疑用户,提高反窃电工作成效,加强我国电力企业对电能输出的高效监管力度,通过建立强有力的反窃电监控预警手段,加大反窃电的查处惩治力度,维护正常的供用电秩序,保障公司经营效益。目前,窃电手段上大致可分为两大类,如下表所示针对违约用电与窃电问题带来的电力企业用电监管问题,本专利提出解决方案:基于用电信息采集系统和sg186营销业务应用系统积累的大量客户用电信息,结合大量典型窃电案例,综合考虑各种窃电因素,抽象识别窃电行为的普遍因素,将逻辑回归算法、离散弗雷歇距离算法和层次聚类分析算法相结合建立反窃电分析与处理方法,对窃电嫌疑用户进行概率推测和预警,精准识别重大窃电嫌疑户,通过建立预警、排查和处理反馈的闭环工作机制,完成模型的自我优化。技术实现要素:本发明为了解决上述问题,提出了一种基于逻辑回归概率分析优化模型的反窃电分析预警方法,本发明可以实现一种闭环工作的反窃电预警机制,满足完成精准识别重大窃电嫌疑户的业务需求。为了实现上述目的,本发明采用如下技术方案:一种基于逻辑回归概率分析优化模型的反窃电分析预警方法,采集用电数据,提取用电数据的窃电数据,构建专家样本库,基于专家样本库数据,通过不同维度对关联数据进行分析,建立基于窃电行为的特征数据库,进而利用逻辑回归算法构建用户窃电概率分析模型,得到各个用户的窃电概率,确定具有窃电嫌疑的用户。进一步的,上述方法还包括采集具有窃电嫌疑的用户的历史用电行为轨迹库,并基于离散弗雷歇距离算法构建用户行为趋势分析模型,将目前用电数据曲线与用户历史用电轨迹对比,以优化确定的有窃电嫌疑的用户的结果。进一步的,上述方法还包括基于用户用电数据,建立典型类别用电行为特征库,基于层次聚类分析算法构建高价低用判别模型,通过用户用电轨迹与典型类别用电行为对比,确定高价低压违约窃电用电用户。进一步的,上述方法还包括根据确定的窃电嫌疑用户,进行排查,将排查结果反馈至专家样本库,对模型不断优化修正。通过不同维度对关联数据进行分析,包括但不限于用户基本信息、用户电价、计量点、电能表、收费信息、信用信息、各类窃电因素、计量装置事件或违约用电因素。上述方法可以同时建立用户窃电概率分析模型、用户行为趋势分析模型和高价低用判别模型,以保证窃电用户结果的正确性和完整性。构建用户窃电概率分析模型的具体过程包括:(1)基于用户用电数据选取等比例窃电样本数据与正常用电样本数据作为模型样本集,从模型样本集内分别随机抽取相应比例的数据构成训练集数据及测试集数据;(2)定义训练集数据的参数,采用拟牛顿法对目标函数进行最优求解,不断迭代,直到满足迭代条件;(3)根据计算所得的最优化目标函数构成用户窃电概率分析模型,对用户窃电概率分析模型模型进行样本测试,比较概率,概率与类别比例相比较获取对应类标号,进行测试样本分类;(4)计算测试集数据的测试参数,判断是否满足用户窃电概率分析初始模型要求,若不满足,则返回步骤(2)重新定义参数,若满足,则构建完成用户窃电概率分析模型,并输出本次更新模型。所述步骤(2)中,参数具体包括用户数据向量、特征权重向量、目标函数、类别集合、初始化迭代次数和允许误差,且用户数据向量定义x=(x1,x2,x3,…),特征权重向量为θ=(θ1,θ2,θ3,…),则目标函数f(θ)=θt*x,类别集合c={c1,c2},初始化迭代次数k=0,允许误差ε>0,基于一定范围对θ随机赋值。进一步的,构建用户行为趋势分析模型的过程包括:(a)接收监控池内的窃电嫌疑用户的相关数据,包含近期用电数据及历史用电数据;(b)判断用户是否属于专变用户,若是,则基于用户的历史用电数据信息生成用户用电典型行为趋势曲线,若否则进入下一步;(c)判定用户属于公变用户,对公变台区内所有用户分别建立用户用电量典型行为趋势曲线;(d)基于离散弗雷歇距离判别算法,将用户近期用电趋势曲线与典型行为趋势曲线离散化后,取二者之间的距离最大值作为曲线相似度;(e)基于不同类别用户设定不同的相似度阈值,曲线相似度超出阈值范围,则输出窃电嫌疑用户。基于层次聚类分析算法构建高价低用判别模型的过程包括:(i)接收用户数据及用户用电数据,并通过对用户用电历史数据进行层次聚类,将用户分入其所属的行业类别;(ii)基于层次聚类法获取各用电类型的典型类用电范围趋势曲线,并建立典型类用电行为特征库;(iii)采用弗雷歇距离判别算法,计算用户用电轨迹曲线与其所在类的典型类用电范围趋势曲线的相似度;(iv)基于不同类别用户设定不同的相似度阈值,曲线相似度超出阈值范围,则输出高价低用违约窃电嫌疑用户。与现有技术相比,本发明的有益效果为:(1)本发明基于逻辑回归算法建立用户窃电概率分析模型,采用拟牛顿算法求解最优目标函数,有效减少迭代求解次数,实现对一般窃电嫌疑用户的初步筛查,基于离散弗雷歇距离算法构建行为趋势分析模型实现对用户自身用电数据曲线对比,辅助用户窃电概率分析模型提高预警有效性,构成逻辑回归概率分析优化模型,精准识别重大窃电嫌疑用户。(2)本发明采用预警、排查和处理反馈的闭环工作机制不断丰富专家样本库,模型根据反馈案例持续进行学习训练、优化重构,不断提高模型的精度和泛化能力,提供一种强有力的反窃电监控预警手段,加大反窃电的查处惩治力度,维护正常的供用电秩序。(3)本发明针对基于逻辑回归概率分析优化模型不易判别的高价低用窃电行为,构建基于层次聚类分析算法的高价低用判别模型,实现对用户归类用电范围趋势曲线对比,有效判定用户高价低用违约窃电行为,提高识别窃电嫌疑用户的精准度。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为反窃电分析预警与处理方法总体流程图;图2为基于逻辑回归算法建立用户窃电概率分析模型数据流程图;图3为行为趋势分析模型数据流程图;图4为高价低用判别模型数据流程图;图5为反窃电分析预警与处理方法实施例流程图;图6(a)1类典型用电曲线,用电时间在6到22点之间,在9点~11点和17点达到峰值,用电电流在2.5a之内;图6(b)2类典型用电曲线,用电时间在6到24点之间,在8点和17点之间比较平稳,用电电流在8a之内;图6(c)某一用户窃电数据曲线。具体实施方式:下面结合附图与实施例对本发明作进一步说明。应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
技术领域
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。正如
背景技术
所介绍的,现有技术中存在的窃电手段往往十分隐蔽,传统用电检查方法根本无法检测,且用电检查人员综合素质较低,难以满足用电检查和反窃电工作的现代化需求的不足,为了解决如上的技术问题,本申请提出了一种基于逻辑回归概率分析优化模型的反窃电分析预警与处理方法。一种基于逻辑回归概率分析优化模型的反窃电分析预警与处理方法,步骤如下:a用户数据及用户用电数据输入;b基于用户用电数据,精简窃电案例,构建专家样本库;c基于专家样本库数据,通过不同维度对关联数据进行分析,建立基于窃电行为的特征数据库,即反窃电预警诊断指标体系;d基于反窃电预警诊断指标体系,利用逻辑回归算法构建用户窃电概率分析模型,模型输出疑似窃电用户的窃电概率,将重大窃电嫌疑用户加入监控池;e根据监控池内用户数据建立用户历史用电行为轨迹库,并基于离散弗雷歇距离算法构建用户行为趋势分析模型,将监控池内用户近期用电数据曲线与用户历史用电轨迹对比,删除假窃电用户;f基于用户用电数据,建立典型类别用电行为特征库,基于层次聚类分析算法构建高价低用判别模型,通过用户用电轨迹与典型类别用电行为对比,输出高价低压违约窃电用电用户;g根据各模型输出的窃电用户数据生成窃电排查工单,现场排查;h根据现场核实结果反馈完善专家样本库,对各模型不断优化修正。所述步骤d中构建用户窃电概率分析模型的一般生成过程为:d1.基于用户用电数据选取等比例窃电样本数据与正常用电样本数据作为模型样本集,从模型样本集内分别随机抽取相应比例的数据构成训练集数据及测试集数据;d2.将训练集数据进行用户数据向量定义x=(x1,x2,x3,…),特征权重向量为θ=(θ1,θ2,θ3,…),则目标函数f(θ)=θt*x,类别集合c={c1,c2},初始化迭代次数k=0,允许误差ε>0,基于一定范围对θ随机赋值;d3.进入迭代求解过程,k=k+1;d4.采用拟牛顿法对目标函数进行最优求解,目标函数的梯度计算海森矩阵hk+1其中,p(k)=θ(k+1)-θ(k),q(k)=▽f(θ(k+1))-▽f(θ(k)),pi2表示被正确分类为c2类的实例个数,置海森矩阵h1为单位矩阵;梯度下降方向d(k)=-hk▽f(3)进而从x(k)出发,延方向d(k)搜索,求步长λk,求解方程满足如下更新特征权重向量θ=(θ1,θ2,θ3,…),θ(k+1)=θ(k)+λkd(k)(5)d5.将特征权重向量θ代入目标函数f(θ),判断下式是否成立||▽f(θ(k+1))>ε||(6)若成立,则返回d3继续进入迭代求解过程,若不成立,则获得本次计算所得的最优化目标函数,进入下一步;d6.基于最优化目标函数构成用户窃电概率分析模型,对用户窃电概率分析模型模型进行样本测试,比较概率,概率与类别比例相比较获取对应类标号,进行测试样本分类,其中,xj为测试样本数据,属于d1所得的测试集数据;d7.计算测试集数据的测试参数,判断是否满足用户窃电概率分析初始模型要求,若不满足,则返回d2对θ更新随机赋值,若满足,则进入下一步;d8.构建完成用户窃电概率分析模型,并输出本次更新模型。所述步骤e构建用户行为趋势分析模型的一般生成过程为:e1.接收监控池内的窃电嫌疑用户的相关数据,包含近期用电数据及历史用电数据;e2.判断用户是否属于专变用户,若是,则基于用户的历史用电数据信息生成用户用电典型行为趋势曲线,若否则进入下一步;e3.判定用户属于公变用户,对公变台区内所有用户分别建立用户用电量典型行为趋势曲线;e4.基于离散弗雷歇距离判别算法,将用户近期用电趋势曲线与典型行为趋势曲线离散化后,取二者之间的距离最大值作为曲线相似度,即e5.基于不同类别用户设定不同的相似度阈值,曲线相似度超出阈值范围,则输出窃电嫌疑用户。所述步骤f基于层次聚类分析算法构建高价低用判别模型的一般生成过程为:f1.接收用户数据及用户用电数据,并通过对用户用电历史数据进行层次聚类,将用户分入其所属的行业类别;f2.基于层次聚类法获取各用电类型的典型类用电范围趋势曲线,并建立典型类用电行为特征库;f3.采用弗雷歇距离判别算法,计算用户用电轨迹曲线与其所在类的典型类用电范围趋势曲线的相似度;f4.基于不同类别用户设定不同的相似度阈值,曲线相似度超出阈值范围,则输出高价低用违约窃电嫌疑用户。综上,本发明以基于逻辑回归算法建立用户窃电概率分析模型实现对窃电嫌疑用户的判别,以行为趋势分析模型实现对用户窃电概率分析模型进行辅助判别,二者构建形成逻辑回归概率分析优化模型,此外以高价低用判别模型针对违约窃电行为进行识别,采用一种闭环工作的反窃电预警机制,满足完成精准识别重大窃电嫌疑户的业务需求。本方案主要依赖基于逻辑回归概率分析优化模型,完成筛查疑似窃电用户的预警服务。作为本发明的一种典型实施例,如图1所示,基于国网山东省电力公司用电信息采集系统为背景实施平台,反窃电分析预警与处理包含与外围系统连接的输入输出信息模块,包含一存储单元包含三类数据库,一类数据库存储输入信息与信息预定义,一类数据库存储解决方案与测试结果,一类数据库存储专家样本库与样本特征。参考图5,是本发明基于逻辑回归概率分析优化模型的反窃电分析预警与处理的具体实施过程,步骤包括如下:1.自sg186营销业务应用系统搜集从2009年~2016年的窃电样本1万例,对应相关窃电用户从用电信息采集系统获取用户计量指标数据、sg186营销业务应用系统获取用户档案类数据、采集终端获取异常事项数据,此外,从山东省各地市覆盖全面的抽取无窃电记录用户1万例,其对应相关数据作为正常用户数据,窃电样本数据与正常用户数据构成数据样本集,数据抽取流程自动化,并有自动调度功能;2.基于1万余例可用窃电样本,对样本进行典型窃电案例精简,初始获取77例典型窃电案例的专家样本库;3.基于77例典型窃电案例反向分析,建立基于窃电行为的特征数据库,即反窃电预警诊断指标体系,初始选取的特征数据库如下表所示4.随机抽取80%窃电样本数据与正常用电样本数据将构成训练集数据,剩余20%的窃电样本数据与正常用电样本数据构成测试集数据,将训练集数据分为用户档案类数据向量x=(x1,x2,x3,…),计量检测指标类向量y=(y1,y2,y3,…),异常事项类数据向量z=(z1,z2,z3,…),特征权重向量分别为u=(u1,u2,u3,…),w=(w1,w2,w3,…),v=(v1,v2,v3,…),定义类别集合c={c1,c2},初始化迭代次数k=0,允许误差ε>0,在[-11]范围内对θ随机赋值,置海森矩阵h1为单位矩阵,随后采用拟牛顿法对目标函数进行迭代最优求解,根据式(1)~(6)计算更新特征权重向量θ=(θ1,θ2,θ3,…),并代入目标函数f(θ),直至超出迭代条件;5.通常经过5~7次迭代过程,将本次计算所得的最优化目标函数传输至模型测试环节,从而形成用户窃电概率分析初始模型,e1为0.4万例测试集数据,对初始模型进行样本测试,比较概率,概率与类别比例相比较获取对应类标号,进行测试样本分类,计算模型正确率、召回率及精准率,判断是否满足用户窃电概率分析初始模型要求,若不满足,则返回4对特征权重向量θ更新随机赋值,经过3次特征权重向量重新赋值,最终获取满足用户窃电概率分析模型,并输出本次更新模型,其正确率、召回率及精准率如下表所示准确率accuracy0.88精准率precision0.97召回率recall0.78真阳性true-positive1563.0假阳性false-positive44.0真阴性true-negative437.0假阴性false-negative1956.0其中,真、假表示样本实际是否是窃电数据;阴阳表示数据通过模型后输出结果是否是窃电(模型判断是窃电的为阳,反之为阴),模型输出的重大嫌疑用户1607例数据进入监控池;6.基于监控池内的窃电嫌疑用户1607例及其相关数据,分为专变用户及公变用户,分别基于用户的历史用电数据信息生成用户用电趋势曲线,以1例教育类专变用户为例,如图6(a)(b)所示,图中展示了用电类型为教育类用电的窃电用户正常用电期间典型用电的2条曲线,从图中可以看出,用户用电变化都有一定的趋势,不会出现骤增和骤减的情况,而且出现波峰和波谷的时间大概相近,基于离散弗雷歇距离判别算法,将用户近期趋势曲线与典型趋势曲线离散化后,取二者之前的距离最大值作为曲线相似度,如图6(c)所示,为该用户的窃电数据曲线,可以看到当用户发生窃电时,其用电电流在10点变得特别高,此趋势与2类典型特征曲线均有较大距离,可判定其存在窃电嫌疑,基于不同类别用户设定不同的相似度阈值,曲线相似度超出阈值范围,则输出窃电嫌疑用户,最终删除未窃电用户31例,使窃电概率分析模型的预测精准率为99%,减少实际巡检工作;7.基于用户用电数据,选取某一地市用户用电数据为例,随机选取用户用电数据9.7686万例,选用一年中的电量数据作为分析基准,建立典型类别用电行为特征库,即通过比对分析各用电类型的典型用电曲线趋势,使用层次聚类法对数据进行分类,聚类结果如下表所示所示通过用户用电轨迹与典型类别用电行为对比,输出高价低用违约窃电用电用户12例,如下表所示用电类型\单位高价抵用违约窃电嫌疑用户教育用电4农业用电2一般工商业用电68.以行为趋势分析模型辅助对用户窃电概率分析模型进行优化,构成逻辑回归概率分析优化模型,对随机选取用户用电数据9.7686万例进行窃电用户预警,推送窃电嫌疑用户71例;9.根据各模型输出的窃电嫌疑用户生成窃电排查工单,现场进行检查取证、查处工作,对现场排查确认的窃电用户,确认窃电行为及采用的窃电方式;10.现场核实结果反馈至sg186营销业务应用系统,提取有效的窃电数据作为案例加入专家样本库中,完善反窃电预警诊断指标体系,根据反馈的窃电案例对逻辑回归概率分析优化模型不断修正优化。以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1