反窃电模型生成方法及装置与流程

文档序号:17080243发布日期:2019-03-09 00:10阅读:540来源:国知局
反窃电模型生成方法及装置与流程

本申请涉及电力系统领域,具体而言,涉及一种反窃电模型生成方法及装置。



背景技术:

窃电给正常供电秩序和安全用电带来极大影响。窃电负荷波动较大,一些窃电方式野蛮粗暴,轻则损坏低压电气设施,重则连锁反应造成局部供电中断。并且窃电者多数是非专业技术人员,窃电时极易引发触电造成伤亡,威胁着自己和他人的人身安全。目前国内用电检查人员主要利用计量装置单一异常诊断模型进行反窃电筛查,所使用的数据主要来源于用电信息采集系统,通过比对电压、电流、功率之间的数据采集异常,辅助决策树和支持向量机等算法开展窃电用户筛选工作,窃电与计量装置异常在此类技术中难以区分,误判率,漏判率较高,效率低下,进而无法满足精准的反窃电预警需求。



技术实现要素:

为了克服现有技术中的上述不足,本申请的目的在于提供一种反窃电模型生成方法,应用于反窃电系统,所述反窃电系统包括机器学习模型,所述方法的步骤包括:

获取多个用户的用电相关原始数据,所述用电相关原始数据包括用电信息采集系统的的计量数据、营销业务应用系统的档案类数据和一体线损平台的线损数据;

通过聚类因子从所述用电相关原始数据中获取不同行业用电特征库,所述聚类因子表示不同行业用电特征信息;

根据窃电特征从所述用电相关原始数据中获取反窃电样本库,所述窃电特征表示反映窃电行为的相关用电数据;

将所述行业用电特征库和所述反窃电样本库交由所述机器学习模型学习训练,进而获得反窃电模型,所述反窃电模型包括一预设关联矩阵,所述关联矩阵包括有预设的窃电异常行为对应的异常系数,所述异常系数用于计算表示用户窃电嫌疑的窃电嫌疑系数。

可选地,所述反窃电模型生成方法还包括以下步骤:

剔除所述电信息采集系统的计量数据中的突变数据和缺点大于预设比例的数据,所述缺点大于预设比例的数据表示每间隔一预设间隔时间所采集的所述计量数据为空值,且空值数量大于预设比例的数据;

对所述营销业务应用系统的档案类数据进行事件信息清洗、表码清洗、负荷曲线数据清洗和用电明细清洗,所述事件信息清洗用于排除用户更换电表的因素,所述表码清洗用于剔除电表中统计数值中突然增加的数值、突然减少的数值和小数点异常的数值,所述负荷曲线数据清洗用于剔除不满足电压、电流和功率关系的数值,所述用电明细清洗用于剔除档案类数据中的空值数据;

对筛选后的计量数据、清洗后的档案数据和线损数据进行无量纲处理。

可选地,所述通过聚类因子从所述用电相关原始数据中获取不同行业用电特征库,所述聚类因子表示不同行业用电特征信息的步骤包括:

通过功率曲线、日平均功率、周平均功率、三相不平衡率、负载率、功率因数和日用电量构造聚类因子;

根据所述聚类因子,通过聚类算法获取不同行业用电特征库。

可选地,所述根据所述聚类因子,通过聚类算法获取不同行业用电特征库的步骤包括:

根据的k-means聚类算法获取不同行业的负荷特性,所述负荷特性表示行业用电的日高峰用电特征,日峰谷用电特征、工作日用电特性和季节性用电特性;

根据所述根据dbscan(dbscan,density-basedspatialclusteringofapplicationswithnoise)聚类算法识别出异常用电行为;

根据所述用电相关原始数据,通过负荷特性和异常用电行为获取行业用电特征库。

可选地,所述根据窃电特征从所述用电相关原始数据中获取反窃电样本库的步骤包括:

根据pearson相关系数(pearsoncorrelationcoefficient)判断所述用电相关原始数据中窃电行为导致的数据指标之间的相关性;

根据lda(lda,lineardiscriminantanalysis)或pca(pca,principalcomponentanalysis)算法获取所述数据指标的排名;

根据所数据指标的排名结果从所述用电相关原始数据中获取反窃电样本。

本申请的另一目的在于提供一种反窃电模型生成装置,应用于反窃电模型生成装置,所述反窃电系统包括机器学习模型,所述反窃电装置包括数据获取模块、行业用电特征库获取模块、反窃电样本库获取模块和反窃电模型获取模块;

所述反窃电装置包括数据获取模块用于获取多个用户的用电相关原始数据,所述用电相关原始数据包括用电信息采集系统的的计量数据、营销业务应用系统的档案类数据和一体线损平台的线损数据;

所述行业用电特征库获取模块用于通过聚类因子从所述用电相关原始数据中获取不同行业用电特征库,所述聚类因子表示不同行业用电特征信息;

所述反窃电样本库获取模块用于根据窃电特征从所述用电相关原始数据中获取反窃电样本库,所述窃电特征表示反映窃电行为的相关用电数据;

所述反窃电模型获取模块用于将所述行业用电特征库和所述反窃电样本库交由所述机器学习模型学习训练,进而获得反窃电模型,所述反窃电模型包括一预设关联矩阵,所述关联矩阵包括有预设的窃电异常行为对应的异常系数,所述异常系数用于计算表示用户窃电嫌疑的窃电嫌疑系数。

可选地,所述反窃电生成模型还包括数据处理模块,所述数据处理模块通过以下方式对所述用电相关原始数据进行处理:

剔除所述电信息采集系统的计量数据中的突变数据、缺点数据大于预设比例的数据,所述缺点数据表示每间隔一预设间隔时间所采集的数据为空值的数据;

对所述营销业务应用系统的档案类数据进行事件信息清洗、表码清洗、负荷曲线数据清洗和用电明细清洗,所述事件信息清洗用于排除用户更换电表的因素,所述表码清洗用于剔除电表中统计数值中突然增加的数值、突然减少的数值和小数点异常的数值,所述负荷曲线数据清洗用于剔除不满足电压、电流和功率关系的数值,所述用电明细清洗用于剔除档案类数据中的空值数据;

对筛选后的计量数据、清洗后的档案数据和线损数据进行无量纲处理后获得用电相关原始数据。

可选地,所述行业用电特征库获取模块通过以下方式获取不同行业用电特征库:

通过功率曲线、日平均功率、周平均功率、三相不平衡率、负载率、功率因数和日用电量构造聚类因子;

根据所述聚类因子,通过聚类算法获取不同行业用电特征库。

可选地,所述反窃电样本库获取模块根据所述聚类因子通过以下方式获取反窃电样本库:

根据的k-means聚类算法获取不同行业的负荷特性,所述负荷特性表示行业用电的日高峰用电特征,日峰谷用电特征、工作日用电特性和季节性用电特性;

根据所述根据dbscan聚类算法识别出异常用电行为;

根据所述用电相关原始数据,通过负荷特性和异常用电行为获取行业用电特征库。

可选地,所述反窃电样本库获取模块通过以下方式获取反窃电样本库:

根据pearson相关系数判断所述用电相关原始数据中窃电行为导致的数据指标之间的相关性;

根据lda或pca算法获取所述数据指标的排名;

根据所数据指标的排名结果从所述用电相关原始数据中获取反窃电样本库。

相对于现有技术而言,本申请具有以下有益效果:

本申请提供的反窃电模型生成方法及装置,通过对用电信息采集系统的计量数据、营销业务应用系统的档案类数据和一体线损平台的线损数据进行处理,所述预处理包括数据筛选和数据清洗,进而剔除掉一些无用的干扰数据。将经过筛选和清洗后的数据进行归一化处理。所述机器学习模型通过使用归一化处理后的数据进行训练学习,进而获得反窃电模型。其中,所述反窃电模型包括一预设关联矩阵,所述关联矩阵包括有预设的窃电异常行为对应的异常系数,所述异常系数用于计算表示用户窃电嫌疑的窃电嫌疑系数。本方案所提供的技术手通过反窃电模型提供窃电嫌疑清单和窃电嫌疑分析报告,为精确的反窃电预警提供参考。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的反窃电系统的硬件结构图;

图2为本申请实施例提供的反窃电方法的步骤流程图;

图3为本申请实施例提供的步骤s400的子步骤流程图;

图4为本申请实施例提供的反窃电装置结构图;

图5a和图5b为本申请实施例提供的高压关联矩阵;

图6为本申请实施例提供的低压关联矩阵。

图标:100-反窃电系统;130-处理器;110-反窃电装置;120-机器可读存储器;1101-数据获取模块;1103-行业用电特征库获取模块;1104-反窃电样本库获取模块;1105-反窃电模型获取模块。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。

请参照图1,图1是本申请的反窃电系统100的硬件结构图。所述图像处理系统包括处理器130、机器可读存储器120和反窃电装置110。

所述处理器130、机器可读存储器120、反窃电装置110各元件之间直接或者间接的电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接,以实现数据信号或控制信号的传输。

其中,所述机器可读存储器120可以是,但不限于,随机存取存储器(randomaccessmemory,ram),只读存储器(readonlymemory,rom),可编程只读存储器(programmableread-onlymemory,prom),可擦除只读存储器(erasableprogrammableread-onlymemory,eprom),电可擦除只读存储器(electricerasableprogrammableread-onlymemory,eeprom)等。其中,机器可读存储器120用于存储程序,所述处理器130在接收到执行指令后,执行所述程序。

所述处理器130可能是一种集成电路芯片,具有信号的处理能力。上述的处理器130可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器130等。

请参考图2所示的本实施例提供的一种应用于图1所示的反窃电系统100的方法所对应的步骤流程图,所述反窃电系统100包括有机器学习的模型。本方案通过基于大量用电数据通过机器学习的方式获得反窃电模型。以下将该方法的各个步骤进行详细的阐述。

步骤s100,获取多个用户的用电相关原始数据,所述用电相关原始数据包括用电信息采集系统的的计量数据、营销业务应用系统的档案类数据和一体线损平台的线损数据。

为了提高反窃电系统100的高效和准确性,所述反窃电系统100需要大量的用户用电数据做分析,并从中找出和窃电相关的数据特征。所述用户用电数据越多,所述反窃电系统100预测窃电行为越准确。

其中,所述用电信息系统的计量数据包括供电系统负荷曲线数据、用电事件相关数据和冻结类数据。所述负荷曲线数据包括电力系统的功率曲线数据、电压曲线数据、电流曲线数据和功率因素曲线数据。所述用电事件相关数据包括电压越限数据、停电事件、上电事件、电压不平衡事件、电路不平衡事件、功率因素异常事件、潮流反向事件、电能表开盖事件、恒定磁场干扰事件和相序异常事件。所述冻结类数据包括测量点日冻结电能示数、测量日冻结电能量数据、测量点日冻结总及分相有功功率数据、测量点日冻结电压统计数据和测量点日冻结电流越限统计数据。

所述营销业务应用系统的档案类数据包括客户基础信息数据、信用相关的违法窃电信息、用户用电业务变更信息和历史窃电信心。所述客户基础信息数据包括用户编号、用户状态、用户分类、用电类别、行业类别、合同容量、运行容量、供电电压、计量方式、接线方式、线路标志和台区标志。所述信用相关的违法窃电信息包括窃电检查结果标识、窃电发生时间、违约用电性质、违约用电类别、窃电现象描述、窃电现场取证记录、追补电量、追补电费、违约使用电费。所述用户用电业务变更信息包括换表id号、原表号、新表号和换表日期。

所述一体线损平台的线损数据包括台区线路电能损失数据和分线线路损失数据。

所述用户用电相关数据量越大,用电类型信息越丰富,窃电数据越详细越有利于所述反窃电系统100的提高预测窃电行为的准确性。

可选地,所述反窃电系统100获取到所述用户的用电相关数据后,对所诉多个用户的用电相关原始数据进行数据预处理。

所述用电信息采集系统的的计量数据、营销业务应用系统的档案类数据和一体线损平台的线损数据的原始数据中包含大量的不完整、不一致和有异常的数据。所述异常数据严重影响数据挖掘和数据建模的执行效率,甚至有可能导致建立的模型出现偏差。所述对数据进行预处理尤为重要。所述反窃电系统100对所述数据的预处理包括数据筛选、数据清洗和数据转换。

所述反窃电系统100通过数据筛选的方式剔除掉所述用电信息采集系统的的计量数据中突变数据、缺点大于预设比例的数据。所述突变数据包括电量数据、负荷数据、电流数据和电压数据中发生突变的数据。所述反窃电系统100在剔除掉突变数据的位置进行平滑处理,使得所述计量数据保持完整。所述缺点大于预设比例的数据表示所述反窃电系统100每间隔一预设时所采取的计量数据中为空值,且空值数据量大于预设比例的数据,本实施例中,所述比例为80%。所述反窃电系统100对于缺点量少的数据,进行缺点补全进而得到完整的数据。

所述反窃电系统100通过数据清洗的方式剔除掉所述营销业务应用系统的档案类数据中的异常因素,进而使得剩下的数据精简有效。所述反窃电系统100通过事件清洗的方式剔除短时间内重复上报或者逻辑错误的采集事件,进而排除异常事件的影响。进一步地,所述反窃电系统100通过表码清洗的方式剔除掉所述档案数据中突然增加或者突然减小的数据,以及小数点位置异常的数据。进一步地,所述反窃电系统100通过负荷曲线数据清洗的方式对功率曲线与日用电量之间的关系曲线进行校正,同时对电压、电流曲线与功率曲线之间的关系曲线进行校正,以及通过用电明细数据清洗的方式提出掉电压数据、电流数据、功率数据中的空值数据。

所述反窃电系统100通过数据转换的方式将所述用电信息采集系统的的计量数据、营销业务应用系统的档案类数据和一体线损平台的线损数据的原始数据进行无量纲和归一化处理得到编码后的数据。所述编码后的数据使得所述机器学习模型能够识别。

步骤s200,通过聚类因子从所述用电相关原始数据中获取不同行业用电特征库,所述聚类因子表示不同行业用电特征信息。

用电行业不同决定了其符合特性的差异性,为了反映电性行业日峰谷特征、工作日用电特征和季节性用电特征。所述反窃电系统100通过聚类因子对所述用户用电数据进行聚类划分。所述聚类因子包括功率曲线、日平均功率、周平均功率、三相不平衡率、负荷率、功率因素和日用电特征作为聚类因子。所述反窃电系统100在对所述用户用电数据进行聚类之前,需要对所述用户用电数据通过以下公式进行标准化处理,

其中,pi为i用户的不同聚类因子,p为聚类因子,表征某一用户某一个特征的具体数值。

所述反窃电系统100通过聚类算法对所述用户用电数据进行分类聚集。所述聚类算法包括k-means聚类算法和dbscan聚类算法。

其中,所述k-means聚类算法属于无监督学习算法中的一种,根据特征之间的距离作为聚类的准则。所述反窃电系统100根据所述k-means聚类算法通过轮廓系数自动选取聚类个数,提高聚类的准确性及行业的总体负荷特性。该算法算法设计原理简单;计算过程中只需要设置一个参数。

进一步地,所述dbscan聚类算法是一种基于密度的聚类算法,通过密度可达关系导出的最大密度相连的样本集合作为其一个类别。所述反窃电系统100根据所述dbscan聚类算法通过自动选择最优的簇与簇之间的距离,较好的识别异常用电行为。

步骤s300,根据窃电特征从所述用电相关原始数据中获取反窃电样本库,所述窃电特征表示反映窃电行为的相关用电数据。

所述反窃电系统100根据所述用电信息采集系统的的计量数据、营销业务应用系统的档案类数据和一体线损平台的线损数据获得多个维度的特征向量。所述反窃电系统100通过如图3所示的步骤s300的子步骤流程图获得反窃电特征库。

步骤s3001,根据pearson相关系数(pearsoncorrelationcoefficient)判断所述用电相关原始数据中窃电行为导致的数据指标之间的相关性。

所述反窃电系统100为了从大量的所述用户用电数据中获得用户窃电行为导致的所述用户用电数据中各数据特征之间的相关性,通过pearson相关系数判断各个各数据特征之间的相关性,同时剔除掉存在高度工线性的数据特征。

步骤s3002,根据线性判别式分析(lda,lineardiscriminantanalysis)或主成分分析(pca,principalcomponentanalysis)算法获取所述数据指标的排名。

所述反窃电系统100为从能够反映窃电行为导致的数据特征中找出各个特征之间的重要性排名,所述反窃电系统100采用线性判别式分析(lda,lineardiscriminantanalysis)或主成分分析(pca,principalcomponentanalysis)算法等降维处理方法,分别得到各个不同特征之间的重要性排名。

其中,所述主成分分析(pca,principalcomponentanalysis)算法用于数据降维,其实现原理主是通过对特征矩阵的正交变换,计算其各主成分的方差贡献度,最后保留贡献度大的几个主成分。该算法降低模型处理的复杂度,解决了特征之间的多重共线问题。

所述线性判别式分析(lda,lineardiscriminantanalysis)是一种有监督的降维处理方法,主要是把高维度数据投影到低维度上,保持投影后类内距离很近,类间距离很远,该算法在降维过程中可以使用类别的先验知识经验。

步骤s3003,根据所数据指标的排名结果从所述用电相关原始数据中获取反窃电样本。

步骤s400,将所述行业用电特征库和所述反窃电样本库交由所述机器学习模型学习训练,进而获得反窃电模型,所述反窃电模型包括一预设关联矩阵,所述关联矩阵包括有预设的窃电异常行为对应的异常系数,所述异常系数用于计算表示用户窃电嫌疑的窃电嫌疑系数。

所述反窃电系统100,将所述反窃电样本交由所述机器学习框架进行训练和学习获得反窃电模型。所述机器学习模型包括bp神经网络、xgboost算法、逻辑回归算法、离群点算法。所述反窃电系统100通过上诉机器学习模型或者算法进行训练、测试和评价选择,通过各种算法的组合优势,提高反窃电系统100预警模型的准确性。

可选地,所述预设的关联矩阵包括高压关联矩阵和低压关联矩阵,所述高压关联矩阵如图5a和图5b所示,所述低压关联矩阵如图6所示,所述关联矩阵的中包括关联因素和剔除因素,不同的关联系数和剔除系数拥有不同的异常系数。所诉反窃电模型根据用户的用电相关的特征数据,输出用户的关联系数。所述反窃电系统100模型根据关联系数,通过以下公式计算得到的窃电嫌疑系数;

其中,bi为基准值,pij为关联系数,rm为剔除因素,k为窃电嫌疑系数。

可选地,所述反窃电系统100根据所诉反窃电系数判断用户是否有窃电嫌疑。其中,k<0.6表示用户无窃电嫌疑,0.6≤k<0.8表示用户有窃电嫌疑,k≥0.8表示用户窃电嫌疑极高,需要派遣相关人员现场进行确认。所述反窃电系统100根据所述窃电嫌疑系数输出用户的基本信息,窃电嫌疑报告,佐证数据。其中,所述用户的基本信息包括户号、计量点号、表号。所述窃电嫌疑报告包括嫌疑系数、用电特性描述。所述佐证数据表示用于支持用户有窃电嫌疑的用户用电数据特征。

本实施例还提供一种反窃电装置110,如图4所示,该反窃电装置110可以包括至少一个可以软件或固件(firmware)的形式存储于所述机器可读存储器120中或固化在所述变速器的控制单元的操作系统(operatingsystem,os)中的软件功能模块。所述处理器130可以用于执行所述机器可读存储器120中存储的可执行模块,例如所述反窃电装置110所包括的软件功能模块及计算机程序等。

所述反窃电模装置用于反窃电系统100,所述反窃电系统100包括机器学习模型,所述反窃电装置110包括数据获取模块1101、行业用电特征库获取模块1103、反窃电样本库获取模块1104和反窃电模型获取模块1105。

所述数据获取模块1101用于获取多个用户的用电相关原始数据,所述用电相关原始数据包括用电信息采集系统的的计量数据、营销业务应用系统的档案类数据和一体线损平台的线损数据。

在本实施例中,所述反窃电装置110包括数据获取模块1101用于执行图2中步骤s100,关于数据获取模块1101的详细描述可以参考步骤s100的详细描述。

所述行业用电特征库获取模块1103用于通过聚类因子从所述用电相关原始数据中获取不同行业用电特征库,所述聚类因子表示不同行业用电特征信息。

在本实施例中,所述行业用电特征库获取模块1103用于执行图2中步骤s200,关于行业用电特征库获取模块1103的详细描述可以参考步骤s200的详细描述。

所述反窃电样本库获取模块1104用于根据窃电特征从所述用电相关原始数据中获取反窃电样本库,所述窃电特征表示反映窃电行为的相关用电数据。

在本实施例中,所反窃电样本库获取模块1104用于执行图2中步骤s300,关于反窃电样本库获取模块1104的详细描述可以参考步骤s300的详细描述。

所述反窃电模型获取模块1105用于将所述行业用电特征库和所述反窃电样本库交由所述机器学习模型学习训练,进而获得反窃电模型,所述反窃电模型包括一预设关联矩阵,所述关联矩阵包括有预设的窃电异常行为对应的异常系数,所述异常系数用于计算表示用户窃电嫌疑的窃电嫌疑系数。

在本实施例中,所述反窃电模型获取模块1105用于执行图2中步骤s400,关于反窃电模型获取模块1105的详细描述可以参考步骤s400的详细描述。

可选地,所述反窃电模型生成装置还包括所述数据处理模块,数据处理模块通过以下方式对所述用户用电相关数据进行处理。

剔除所述电信息采集系统的计量数据中的突变数据和缺点大于预设比例的数据,所述缺点大于预设比例的数据表示每间隔一预设间隔时间所采集的所述计量数据为空值,且空值数量大于预设比例的数据;

对所述营销业务应用系统的档案类数据进行事件信息清洗、表码清洗、负荷曲线数据清洗和用电明细清洗,所述事件信息清洗用于排除用户更换电表的因素,所述表码清洗用于剔除电表中统计数值中突然增加的数值、突然减少的数值和小数点异常的数值,所述负荷曲线数据清洗用于剔除不满足电压、电流和功率关系的数值,所述用电明细清洗用于剔除档案类数据中的空值数据;

对筛选后的计量数据、清洗后的档案数据和线损数据进行无量纲处理。

可选地,所述行业用电特征库获取模块1103通过以下方式获取行业用电特征库:

通过功率曲线、日平均功率、周平均功率、三相不平衡率、负载率、功率因数和日用电量构造聚类因子;

根据所述聚类因子,通过聚类算法获取不同行业用电特征库。

可选地,所述反窃电样本库获取模块1104根据所述聚类因子通过以下方式获取反窃电样本库:

根据的k-means聚类算法获取不同行业的负荷特性,所述负荷特性表示行业用电的日高峰用电特征,日峰谷用电特征、工作日用电特性和季节性用电特性;

根据所述根据dbscan聚类算法识别出异常用电行为;

根据所述用电相关原始数据,通过负荷特性和异常用电行为获取行业用电特征库。

可选地,所述反窃电样本库获取模块1104通过以下方式获取反窃电样本库:

根据pearson相关系数判断所述用电相关原始数据中窃电行为导致的数据指标之间的相关性;

根据lda或pca算法获取所述数据指标的排名;

根据所数据指标的排名结果从所述用电相关原始数据中获取反窃电样本。

综上所述,本申请提供的反窃电模型生成方法及装置,通过对用电信息采集系统的计量数据、营销业务应用系统的档案类数据和一体线损平台的线损数据进行处理,所述预处理包括数据筛选和数据清洗,进而剔除掉一些无用的干扰数据。将经过筛选和清洗后的数据进行归一化处理。所述机器学习模型通过使用归一化处理后的数据进行训练学习,进而获得反窃电模型。其中,所述反窃电模型包括一预设关联矩阵,所述关联矩阵包括有预设的窃电异常行为对应的异常系数,所述异常系数用于计算表示用户窃电嫌疑的窃电嫌疑系数。本方案所提供的技术手通过反窃电模型提供窃电嫌疑清单和窃电嫌疑分析报告,为精确的反窃电预警提供参考。

在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1