基于雷达图综合评价法的零电量用户排查方法与流程

文档序号:18234169发布日期:2019-07-24 08:35阅读:497来源:国知局
基于雷达图综合评价法的零电量用户排查方法与流程

本发明涉及一种零电量用户排查方法,尤其涉及基于雷达图综合评价法的零电量用户排查方法。



背景技术:

随着用电客户的增多及客户用电形式的多样化,用电异常的类型越来越多,系统产生的异常数据量大,准确度偏低,排查处理耗费大量人力物力。部分用电异常无法及时发现处理,既给供电企业造成了经济损失,又威胁电网安全运行及人身安全。其中,用电异常中的零电量用户排查工作量巨大,仅浙江省2018年三季度的零电量低压用户就有279.5万户,采用原始普查方式往往耗费大量人力物力,而抽样调查又往往忽略很多异常用户。如何从大量零电量用户中精准定位异常用户进行排查成为亟待解决的问题。



技术实现要素:

本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供基于雷达图综合评价法的零电量用户排查方法,以达到零电量异常用户精准的定位,缩小排查范围的目的。为此,本发明采取以下技术方案。

基于雷达图综合评价法的零电量用户排查方法,包括以下步骤:

1)筛选出零电量用户目标群体,从电力系统计量采集系统和营销系统提取用户多源数据;

2)提取零电量用户排查关键因子,包括用户基本属性、用户用电量特征、用户所属台区特征和用户重要异常事件四个特征;

3)对多源数据进行预处理,对缺失数据进行填充,并对各个数据进行归一化处理;

4)确定关键因子综合权重uk′;

5)选取雷达图综合评价方法对零电量用户进行排序,获取零电量用户的排查得分和顺序;绘制各个用户的综合评价雷达图,对用户的总体评分和单个关键因子评分进行分析;

其中绘制第k个用户的雷达图的步骤包括:

501)确定关键因子对应的雷达图的扇形圆心角为θk=2πu′k;将各项用电风险特征按综合权重从大到小排序为uk=(uk1,…,ukm),依据排序后的圆心角θk=2πuk=(θk1,...,θkm)进行绘图;

502)作单位圆,通过圆心Ok作射线OkPk1,与圆交于点Pk1;作射线OkPk2,使∠Pk1OkPk2=θk1;同理,根据θki依次绘制射线OkPk3、OkPk4、…、OkPkm;依次作扇形区的角平分线;

503)第k个用户排序后的关键因子为即为距离圆点的长度,根据长度Rk在角平分线上标出相应的点Ak、Bk、…、Ek;

504)依次连接Pk1、Ak、Pk2、Bk、…、Ek、Pk1,得到第k个用户的综合评价雷达图;利用雷达图法对第k个零电量用户进行综合评价时,封闭多边形总面积Sk越大,说明该用户的排查优先度越高;Ck表示m项评价关键因子各自所对应的四边形面积的最大值,Ck越大说明该用户的单项关键因子重要性越高:

6)根据零电量用户的排序结果,进行现场的零电量电力用户排查。

作为优选技术手段:在步骤4)中,根据历史数据及现场排查数据确定关键因子的权重。

作为优选技术手段:在步骤4)中,基于CRITIC方法确定各个关键因子的权重,分析各个关键因子对零电量用户发生异常的影响程度;

作为优选技术手段:在步骤3)中,对多源数据进行预处理包括户日用电量阈值筛选和用户日用电量拟合,缩小异常用户目标群体,户日用电量阈值筛选包括反向电能量筛选、用电量阈值筛选、用电量趋势筛选;

反向电能量筛选时,如果用户存在反向电量,则该用户极大概率存在“进出线反接”异常,则认为该用户需要进行排查;

用电量阈值筛选时,通过确认用户在15个月的日用电量情况,设定用户日用电量阈值,对15个月内日用电量一直小于阈值的用户进行筛选排除,认为这些用户大概率属于“无人居住”状态;

用电量趋势筛选时,分析零电量用户去年和今年的用电量趋势变化情况,通过线性拟合系数来反映;当前该用户该时期是零电量状态,故今年累加用电量的线性拟合系数为0;对用户去年同期累加电量进行线性拟合,得到第i个用户的的拟合系数为ρi,设定反映用户用电趋势的拟合系数阈值ρ0,对于ρi<ρ0的零电量用户,考虑该用户“季节性用电”的几率较大,出现异常的概率不高,故去除ρi<ρ0的零电量用户。

作为优选技术手段:在步骤5)中,对通过预处理剩下的零电量用户进行分析,综合考虑零电量用户的采集信息和营销信息;其中,用户的基本属性包括用户的电压等级、受电容量、城乡类别信息、电价形式;用户的用电量特征包括用户的用电量同比、环比和离散系数;用户所属台区特征包括用户所在台区线损越限时间占比;用户异常事件包括用户换表时间、现场核抄时间。

作为优选技术手段:CRITIC方法是基于评价关键因子的对比强度以及评价关键因子之间的冲突性来确定评价关键因子的客观权重;其中,评价关键因子的对比强度表示的是该关键因子在不同评价对象的取值差异性;评价关键因子之间的冲突性则是用关键因子之间的相关性来衡量;采用基尼系数和肯德尔系数分别来衡量关键因子在不同评价对象的取值差异性和评价关键因子之间的冲突性。

作为优选技术手段:通过基尼系数表征关键因子的差异性,该数值越大,则表明提取的零电量用户关键因子的差异越大;反之,如果该数值越小,则表明提取的零电量用户关键因子的差异越小;第j个关键因子的基尼指数可以定义为:

式中:N为零电量用户的数目;zij表示为第i个零电量用户的第j个关键因子值。

肯德尔系数是用于衡量多列等级变量相关程度的一种相关系数;对于都具有N个元素的两列变量和其第i 个变量值分别为Zij和Zik(1≤i≤N),其中j∈{1,2,...,M},k∈{1,2,...,M};假设XjR和XkR分别为Zij和Zik在和的排序值,则XjR和XkR对应排序值变量可以搭配组成变量对的集合,XR该变量对集合的第i个变量对为(XjR,XkR);第j 个和第k个关键因子之间的肯德尔相关系数为:

式中:A为常数,其值为N(N-1)/2;Ncc和Ndc分别表示变量对的集合XR中变量排序值相等的变量对数目和变量值排序值不相等的变量对数目;和分别表示变量和中具有相同变量值的个数;第j个关键因子与其他关键因子的整体肯德尔相关系数定义为:

当关键因子j肯德尔系数为1时,则表明该关键因子与其他关键因子具有一致的等级相关性;而肯德尔系数为0时,则表明该关键因子与其他关键因子是相互独立的;

综合基尼系数和肯德尔系数用于确定各个关键因子的客观权重,即关键因子j的客观权重表示为:

有益效果:

1、本技术方案对零电量用户的排查优先度进行排序,实现了零电量异常用户较为精准的定位,大大缩小了排查范围,节省了人力物力。

2、通过计算用户雷达图的特征参数给出其综合评价结果,这样可以形象地反映各评价关键因子的独立权重和关键因子间的相互影响,对零电量用户排查优先度进行排序,可以根据实际排查能力确定零电量用户的排查范围。

3、本技术方案可在提取的零电量电力用户排查关键因子的基础上,利用基于纯数据驱动的CRITIC权重方法,来确定各个关键因子的客观权重,体现用户关键因子的重要度,有效地降低了零电量用户进行现场核查的工作量,对零电量用户就计量差错或窃电行为存在的可能性大小进行有针对性的轻重缓急排序,有利于后续的监督检查。且不依赖于专家经验,用户排查关键因子权重的方法客观。

附图说明

图1是本发明的流程图。

图2是本发明的多关键因子综合评价的雷达图。

图3是排查评分前10的用户的排序结果图。

图4是排查评分后10的用户的排序结果图。

图5是排名第一用户雷达图。

图6是排名第一用户的日用电量信息。

图7排名最后一名用户的雷达图。

图8排名最后一名用户的日用电量信息。

图9是零电量电力用户关键因子提取结构图。

图10基于CRITIC方法确定的零电量电力用户关键因子权重图。

具体实施方式

以下结合说明书附图对本发明的技术方案做进一步的详细说明。

实施例一:

如图1所示,本方法主要步骤如下所示:

首先,从电力系统计量采集系统和营销系统获取用户多源数据信息,通过分析用户多源数据;提取零电量用户排查关键因子,包括用户基本属性、用户用电量特征、用户所属台区特征和用户重要异常事件四个特征;然后进行数据的预处理,对缺失关键因子进行填充,并对各个关键因子进行归一化处理,结合专家经验等方法确立方法确定各个关键因子的权重;最后,选取雷达图综合评价方法对零电量用户进行排序,获取零电量用户的排查得分和顺序,并绘制各个用户的综合评价雷达图,对用户的总体评分和单个关键因子评分进行分析。

以下对各步骤进行详细说明:

1.零电量电力用户排查优先度多源数据搜集

电力营销系统、用电信息采集系统和生产PMS系统等各类业务系统已全面覆盖全部电力用户,用户各类信息的在线化程度越来越高,从频度和维度上对用户进行特征评估和画像的可能性也越来越高,这些系统使得采集用户各类信息数据更为精准便利,可以为本项目提供有效的数据支撑。本项目从营销系统和用电信息采集系统获取零电量用户的用电数据信息。

2.零电量电力用户排查优先度关键因子提取

从多源信息中提取零电量电力用户排查关键因子,综合分析零电量用户的采集信息和营销信息,选取以下关键因子做为零电量用户排查的关键因子,分为用户基本属性、用户用电量特征、用户所属台区特征和用户重要异常事件四个主要特征因素。用户的基本属性包括用户的城乡类别、合同容量、电压等级等基本信息;用户的用电量特征包括用户的用电量同环比等信息;用户台区特征主要是用户所在台区线损率的越限频率特征;用户重要异常事件主要是用户的现场核抄、业扩查勘等事件,如图9所示。

3.对多源数据进行预处理,对缺失数据进行填充,并对各个数据进行归一化处理;

对多源数据进行预处理包括户日用电量阈值筛选和用户日用电量拟合,缩小异常用户目标群体,户日用电量阈值筛选包括反向电能量筛选、用电量阈值筛选、用电量趋势筛选;

反向电能量筛选时,如果用户存在反向电量,则该用户极大概率存在“进出线反接”异常,则认为该用户需要进行排查。

用电量阈值筛选时,通过确认用户在15个月的日用电量情况,设定用户日用电量阈值,对15个月内日用电量一直小于阈值的用户进行筛选排除,认为这些用户大概率属于“无人居住”状态;

用电量趋势筛选时,分析零电量用户去年和今年的用电量趋势变化情况,通过线性拟合系数来反映;当前该用户该时期是零电量状态,故今年累加用电量的线性拟合系数为0;对用户去年同期累加电量进行线性拟合,得到第i个用户的的拟合系数为ρi,设定反映用户用电趋势的拟合系数阈值ρ0,对于ρi<ρ0的零电量用户,考虑该用户“季节性用电”的几率较大,出现异常的概率不高,故去除ρi<ρ0的零电量用户。

4.确定零电量电力用户关键因子权重

结合专家经验、CRITIC方法等权重设置方法和实际排查情况,对提取的用户基本属性、用户用电量特征、用户所属台区特征和用户重要异常事件等关键因子确定权重。

5.零电量电力用户排查优先度排查优先度决策方法

4.1雷达图综合评价法

传统雷达图法各关键因子轴的夹角是等分关系,弱化了关键因子自身权重的影响;且扇形区域为相邻两个关键因子共同拥有,难以清晰地划分各项关键因子在综合评价中权重的不同。基于此,对传统雷达图法进行改进,绘制第k个用户的雷达图的步骤如下:

1)确定关键因子对应的雷达图的扇形圆心角为θk=2πu′k。若关键因子的顺序不同,则圆心角顺序不同,绘制出的多边形形状不同,不便于比较不同用户的雷达图。故将各项用电风险特征按综合权重从大到小排序为 uk=(uk1,...,ukm),依据排序后的圆心角θk=2πuk=(θk1,...,θkm)进行绘图。

2)作单位圆,通过圆心Ok作射线OkPk1,与圆交于点Pk1;作射线OkPk2,使∠Pk1OkPk2=θk1;同理,根据θki依次绘制射线OkPk3、OkPk4、…、OkPkm;依次作扇形区的角平分线。

3)第k个用户排序后的关键因子值为即为距离圆点的长度,根据长度Rk在角平分线上标出相应的点Ak、Bk、…、Ek。

4)依次连接Pk1、Ak、Pk2、Bk、…、Ek、Pk1,得到如图2所示的第k个用户的综合评价雷达图。

利用雷达图法对第k个零电量用户进行综合评价时,封闭多边形总面积Sk越大,说明该用户的排查优先度越高;Ck表示五项评价关键因子各自所对应的四边形面积的最大值,Ck越大说明该用户的单项关键因子重要性越高:

4.2基于雷达图综合评价法的零电量电力用户排查优先度决策结果

基于营销系统和计量采集系统获取的多源零电量用户数据,提取零电量电力用户排查关键因子结果如表1所示:

表1部分零电量电力用户关键因子提取结果

利用CRITIC法得到的权重对数据进行加权处理权重设置结果如表2 所示:

表2基于CRITIC方法的权重结果

将加权后的关键因子数据采用雷达图综合评价法进行排序,获取各个用户的排序结果如图3和图4所示:

4.3单个用户雷达图分析

获取单个用户的雷达图,可以直观展示该用户在每个关键因子上的得分情况及综合评分,通过对用户的原始电量数据和原始关键因子信息进行分析,确定发明的可行性与准确性。分别对本发明中排名第一用户和排名最后一名的用户进行分析,结果如下:

a)排名第一用户分析

排名第一的零电量用户雷达图及其关键因子信息和用户用电量信息如图5、图6、表3所示:

表3排名第一的用户的关键因子取值

从图5雷达图可以看出,用户各个关键因子在同比电量上关键因子得分低,在合同容量关键因子上的得分不高,在其它关键因子上的得分均很高,总体评分高。

从图6用户从2017年1月到2018年6月的日用电量曲线可以看出,用户用电量较高,却在4、5、6三个月份出现了长达三个月的零电量情况,反映了一定的用电异常信息,在很大程度上属于用电异常。

从表3可以看出,该用户属于城镇居民,属于低压用户中的380V电压等级,不是营销系统中的最高信用等级用户,且根据制定的异常事件规则,四件异常事件全部发生,电量离散系数较大,去年同期电量较高,且该用户零电量事件的出现引起了台区线损的提高。

因此,该零电量用户出现异常的可能性较大,故其排查评分高具有合理性。

b)排名第二用户分析

排名最后一位的零电量用户雷达图及其关键因子信息和用户用电量信息如图7、图8、表3所示:

表4排名最后一名的用户的关键因子取值

从图7可以看出,用户除了在信用等级、重要异常事件、合同容量、居民类型、电压等级上有少量的评价得分外,在其它关键因子上的评分都为0,总体评分低。

从图8用户从2017年1月到2018年6月的日用电量曲线可以看出,用户用电量保持稳定,日用电量一直为0,该用户可能长期无居民居住,零电量异常的可能性较小。

从表4可以看出,该用户属于城镇居民,属于低压用户中的220V电压等级,除了不属于最高信用等级和异常事件发生了3次外,其它关键因子信息均未体现用电异常。

以上分析可以看出,该用户属于普通低压居民用户,且发生零电量异常的可能性不大,排查优先度应该不高,符合实际情况。

实施例二:

与实施例一相同之处不再赘述,不同之处在于,在本实施例中,采用采用CRITIC方法确定零电量电力用户关键因子权重,具体为:

4.1CRITIC方法

CRITIC是一种适用于确定多属性决策问题中属性权重的客观赋权法。该方法是基于评价关键因子的对比强度以及评价关键因子之间的冲突性来确定评价关键因子的客观权重。其中,评价关键因子的对比强度表示的是该关键因子在不同评价对象的取值差异性;评价关键因子之间的冲突性则是用关键因子之间的相关性来衡量。在本文中,采用基尼系数(Gini coefficient)和肯德尔系数(Kendall coefficient)分别来衡量关键因子在不同评价对象的取值差异性(即评价关键因子的对比强度)和评价关键因子之间的冲突性。

基尼系数在此发明中用于表征零电量用户关键因子的差异状况;该数值越大,则表明提取的零电量用户关键因子的差异越大;反之,如果该数值越小,则表明提取的零电量用户关键因子的差异越小。因此,第j个关键因子的基尼指数可以定义为:

式中:N为零电量用户的数目;zij表示为第i个零电量用户的第j个关键因子值。

肯德尔系数是用于衡量多列等级变量相关程度的一种相关系数。对于都具有N个元素的两列变量和其第i 个变量值分别为Zij和Zik(1≤i≤N),其中j∈{1,2,...,M},k∈{1,2,...,M}。假设XjR和XkR分别为Zij和Zik在和的排序值,则XjR和XkR对应排序值变量可以搭配组成变量对的集合,XR该变量对集合的第i个变量对为(XjR,XkR)。因此,第j个和第k个关键因子之间的肯德尔相关系数可以定义为:

式中:A为常数,其值为N(N-1)/2;Ncc和Ndc分别表示变量对的集合XR中变量排序值相等的变量对数目和变量值排序值不相等的变量对数目;和分别表示变量和中具有相同变量值的个数。因此,第j个关键因子与其他关键因子的整体肯德尔相关系数可以定义为:

当关键因子j肯德尔系数为1时,则表明该关键因子与其他关键因子具有一致的等级相关性;而肯德尔系数为0时,则表明该关键因子与其他关键因子是相互独立的。

从上述可以看出,基尼系数和肯德尔系数分别可以用于衡量评价关键因子的对比强度和评价关键因子之间的冲突性。因此,综合基尼系数和肯德尔系数可以用于确定各个关键因子的客观权重,即关键因子j的客观权重可以表示为:

4.2基于CRITIC方法确定提取的零电量用户关键因子权重

基于选取的用户基本属性、用户用电量特征、用户所属台区特征和用户重要异常事件四个主要特征因素进行数据的预处理,对缺失关键因子进行填充,并对各个关键因子进行归一化处理,部分用户提取的关键因子如表5所示;

表5部分零电量用户的关键因子提取结果

采用CRITIC权重确立方法确定各个关键因子的权重。基于以获取的数据信息,已采用如下关键因子做分析,首先进行归一化处理,然后利用 CRITIC法分析用户数据,获取各个关键因子的权重信息如图10所示。

对CRITIC方法确定的零电量电力用户排查优先度关键因子的权重结果进行分析,可以看出该批次用户的异常事件和电压等级的权重较高,说明该批次用户的异常事件和电压等级对零电量用户排查的影响程度最大;其次是用户所属台区线损、合同容量及用户用电量离散系数对零电量用户排查优先度的影响程度也较大;而用户的信用等级、同比电量和环比电量对用户排查优先度的影响较小。

以上图1所示的基于雷达图综合评价法的零电量用户排查方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行形状、结构等方面的等同修改,均在本方案的保护范围之列。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1