一种企业级电力用户智能分类方法及装置与流程

文档序号:26554501发布日期:2021-09-08 00:42阅读:113来源:国知局
一种企业级电力用户智能分类方法及装置与流程

1.本发明涉及电力用户服务管理技术领域,尤其涉及一种企业级电力用户智能分类方法及装置。


背景技术:

2.自第二次工业革命进入电气时代以来,电能逐渐成为不可或缺的能源形式之一,在我们的生活中起到重大的作用,社会生产、日常生活等各方各面都离不开电能的利用。电能的广泛使用意味着电力用户数量的不断攀升,如何高效有序地管理庞大的用户量对减少供电局工作量、快速响应用户需求等具有重要意义。
3.目前供电局主要依据报装容量和电能敏感度等电量信息实现电力用户的分类管理。一方面,现有分类可能造成不同行业的用户归为一类,而在服务需求上却缺乏相似性,达不到智能分类的意义;另一方面,电力大数据信息具有探究行业动态的潜在价值,现有分类无法对此进行深入挖掘。由此而言,基于行业属性对电力用户重新分类能够有效解决上述问题。
4.但随着社会经济结构日益复杂,地区产业转型持续推进,新兴产业层出不穷,现有行业分类比较单一粗糙,难以适应各地区具体实际产业分布情况。为使得分类结果划分行业类别的用户数量相当,需要对现有行业分类标准作一定的修改,以适应不同地区实际情况。


技术实现要素:

5.本发明所要解决的技术问题在于,提供一种企业级电力用户智能分类方法及装置,以减少各类用户在数量上的差异性,实现相似用户统一管理。
6.为了解决上述技术问题,本发明实施例提供一种企业级电力用户智能分类方法,包括:
7.步骤s1,修正行业分类标准以匹配目标地区实际情况,形成初次分类标准;
8.步骤s2,按照所述初次分类标准生成已知行业的企业级电力用户集合,并利用所述已知行业的企业级电力用户集合经自然语言处理分别训练基于名称

行业映射关系的第一对照词库和基于经营范围

行业映射关系的第二对照词库;
9.步骤s3,获取目标地区待分类的企业级电力用户名称;
10.步骤s4,判断是否能按名称对待分类企业级电力用户进行初次行业分类,若能则根据第一对照词库对所述用户进行初次行业分类,若不能则根据第二对照词库,按照经营范围对待分类企业级电力用户进行初次行业分类;
11.步骤s5,根据各初次分类行业内的用户日负荷序列确定最佳聚类数,进一步得到最终分类。
12.进一步地,所述步骤s1具体包括:在《国民经济行业分类》标准基础上,结合目标地区各行业企业实际数量规模,增补该标准中不涉及的新兴产业,拆解企业数量较多的行业
条目,删除没有或极少相关企业的行业条目,合并企业数量较少的行业条目,得到m个行业分类条目trade1,trade2,

,trade
m

13.进一步地,所述步骤s2中,基于名称

行业映射关系的第一对照词库list 1具体为:对已知行业的企业级电力用户的名称分词后,将其中带有明显行业属性的词汇及该行业组成第一对照词库list 1,即:
[0014][0015]
其中,词汇word
ij
需满足在第i个行业的企业级电力用户名称中多次出现,且在除第i个行业外的企业级电力用户名称极少出现,即:
[0016][0017]
上式中,n
ij
表示词汇word
ij
在第i个行业的企业级电力用户名称分词结果中出现的次数;n
i
表示第i个行业的企业级电力用户名称分词结果总词数;α为灵敏度系数,α≥1;n

ij
表示词汇word
ij
在除第i个行业外的企业级电力用户名称分词结果中出现的次数;σ为准确率系数,0≤σ≤1。
[0018]
进一步地,所述步骤s2中,基于经营范围

行业映射关系的第二对照词库list 2具体为:对已知行业的企业级电力用户的经营范围分词后,利用改进tf

idf算法提取每个行业的经营范围关键词,并对每个行业的关键词按q
ij
值排序,过滤掉无意义关键词后,取排序前若干个关键词与对应行业组成第二对照词库list 2,即:
[0019][0020][0021]
上式中,w
i
表示第i个行业经营范围分词结果总词数;w
ij
表示关键词j在第i个行业的企业级电力用户经营范围分词结果中出现的次数;w

ij
表示关键词j在除第i个行业外的企业级电力用户经营范围分词结果中出现的次数。
[0022]
进一步地,所述步骤s4具体包括:根据第一对照词库list 1对该用户进行初次行业分类,包括:对待分类企业级电力用户名称进行分词,若分词结果中含有list 1中的word
ij
,则将该用户归为第i个行业的用户,若不含list 1中任意一个word
ij
,则不能按名称分类;再根据第二对照词库list 2对该用户进行初次行业分类,包括:先从网上爬取该用户
的经营范围并对其分词,进而将分词结果与第二对照词库list 2进行匹配,统计分词结果所含对照词库list 2中各行业对应的词语的个数以及顺序号,比较与各行业的匹配个数,确定匹配个数最多的行业为该用户所属行业,当存在与多个行业匹配个数相同时,则比较顺序号与个数的乘积和,确定该乘积和最小的行业为该用户所属行业。
[0023]
进一步地,所述步骤s5具体包括:对企业级电力用户完成行业分类后,利用k

means聚类方法对各行业内用户的日负荷序列进行聚类,逐步增加聚类数直至当前聚类数下的每个聚类簇中存在不少于一定比例的用户至少与同一簇下1个用户日负荷序列间的pearson相关系数大于某一给定值时,确定该聚类数为最佳聚类数,并将此聚类结果作为最终分类结果。
[0024]
进一步地,所述步骤s5具体包括:对企业级电力用户完成行业分类后,利用k

means聚类方法并设置聚类数t=1对各行业内用户的日负荷序列x
i
进行聚类,然后逐步增加聚类数t直至当前聚类数下的每个聚类簇x
i,k
(k=1,2,

,t)中存在不少于一定比例μ的用户日负荷序列x
i,k,p
至少与同一簇下的1个其它用户日负荷序列x
i,k,q
间的pearson相关系数大于某一给定值m,即
[0025][0026]
上式中,cov(
·
,
·
)表示协方差;σ表示标准差;e(
·
)表示样本期望;
[0027]
则确定该聚类数t为最佳聚类数,并将此聚类结果作为最终分类结果。
[0028]
进一步地,确定完待分类用户所属行业后,将其纳入步骤s2已知行业的企业级电力用户集合中,用于修正第一对照词库list 1和第二对照词库list 2。
[0029]
进一步地,已知行业的企业级电力用户集合包含用户的名称和经营范围信息,其中名称在供电局用户档案中获取,经营范围利用网络爬虫在国家企业信用信息公示系统网上批量获取。
[0030]
本发明还提供一种企业级电力用户智能分类装置,包括:
[0031]
修正模块,用于修正行业分类标准以匹配目标地区实际情况,形成初次分类标准;
[0032]
训练模块,用于按照所述初次分类标准生成已知行业的企业级电力用户集合,并利用所述已知行业的企业级电力用户集合经自然语言处理分别训练基于名称

行业映射关系的第一对照词库和基于经营范围

行业映射关系的第二对照词库;
[0033]
获取模块,用于获取目标地区待分类的企业级电力用户名称;
[0034]
初次分类模块,用于判断是否能按名称对待分类企业级电力用户进行初次行业分类,若能则根据第一对照词库对所述用户进行初次行业分类,若不能则根据第二对照词库,按照经营范围对待分类企业级电力用户进行初次行业分类;
[0035]
最终分类模块,用于根据各初次分类行业内的用户日负荷序列确定最佳聚类数,进一步得到最终分类。
[0036]
本发明实施例的有益效果在于:通过获取目标地区企业级电力用户名称及其经营范围等信息以及日负荷值序列并修正行业分类标准以适应目标地区实际行业布局情况,从而基于行业属性和负荷特征实现对企业级电力用户的智能分类,减少各类用户在数量上的差异性,提高业务人员的工作效率,达到相似用户统一管理的目的,并且便于增值业务的有
效推广。本发明还能够自动识别用户的行业属性并按重制的行业分类标准进行高效精准分类,避免了大量人力资源的投入。
附图说明
[0037]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]
图1是本发明实施例一一种企业级电力用户智能分类方法的流程示意图。
[0039]
图2是本发明实施例一一种企业级电力用户智能分类方法的具体流程示意图。
具体实施方式
[0040]
以下各实施例的说明是参考附图,用以示例本发明可以用以实施的特定实施例。
[0041]
请参照图1所示,本发明实施例一提供一种企业级电力用户智能分类方法,包括:
[0042]
步骤s1,修正行业分类标准以匹配目标地区实际情况,形成初次分类标准;
[0043]
步骤s2,按照所述初次分类标准生成已知行业的企业级电力用户集合,并利用所述已知行业的企业级电力用户集合经自然语言处理分别训练基于名称

行业映射关系的第一对照词库和基于经营范围

行业映射关系的第二对照词库;
[0044]
步骤s3,获取目标地区待分类的企业级电力用户名称;
[0045]
步骤s4,判断是否能按名称对待分类企业级电力用户进行初次行业分类,若能则根据第一对照词库对所述用户进行初次行业分类,若不能则根据第二对照词库,按照经营范围对待分类企业级电力用户进行初次行业分类;
[0046]
步骤s5,根据各初次分类行业内的用户日负荷序列确定最佳聚类数,进一步得到最终分类。
[0047]
具体地,请结合图2所示,步骤s1中,目标地区统计年鉴可从该地区的统计局官网上查阅。所述修正行业分类标准以匹配该地区实际情况,具体为:在《国民经济行业分类》标准基础上,结合目标地区各行业企业实际数量规模,对行业分类条目进行“增拆删并”操作,即增补该标准中不涉及的新兴产业,拆解企业数量较多的行业条目,删除没有或极少相关企业的行业条目,合并企业数量较少的行业条目,使得各行业的相关企业数量相当,得到m个行业分类条目trade1,trade2,

,trade
m

[0048]
步骤s2中,按上述标准生成已知行业的企业级电力用户集合,并利用该集合经自然语言处理分别训练基于名称

行业映射关系的第一对照词库list 1和基于经营范围

行业映射关系的第二对照词库list 2。已知行业的企业级电力用户集合包含用户的名称和经营范围信息,其中名称在供电局用户档案中获取,经营范围可利用网络爬虫在国家企业信用信息公示系统网上批量获取。
[0049]
基于名称

行业映射关系的第一对照词库list 1具体为:对已知行业的企业级电力用户的名称分词后,将其中带有明显行业属性的词汇及该行业组成对照词库list 1,即:
[0050][0051]
其中,词汇word
ij
需满足在第i个行业的企业级电力用户名称中多次出现,且在除第i个行业外的企业级电力用户名称极少出现,即:
[0052][0053]
上式中,n
ij
表示词汇word
ij
在第i个行业的企业级电力用户名称分词结果中出现的次数;n
i
表示第i个行业的企业级电力用户名称分词结果总词数;α为灵敏度系数,α≥1;n

ij
表示词汇word
ij
在除第i个行业外的企业级电力用户名称分词结果中出现的次数;σ为准确率系数,0≤σ≤1。
[0054]
基于经营范围

行业映射关系的第二对照词库list 2具体为:对已知行业的企业级电力用户的经营范围分词后,利用改进tf

idf算法提取每个行业的经营范围关键词,并对每个行业的关键词按q
ij
值排序,过滤掉无意义关键词后,取排序前若干个关键词与对应行业组成对照词库list 2,即:
[0055][0056][0057]
上式中,w
i
表示第i个行业经营范围分词结果总词数;w
ij
表示关键词j在第i个行业的企业级电力用户经营范围分词结果中出现的次数;w

ij
表示关键词j在除第i个行业外的企业级电力用户经营范围分词结果中出现的次数。
[0058]
步骤s4中,根据第一对照词库list 1对该用户进行初次行业分类,即对待分类企业级电力用户名称进行分词,若分词结果中含有list 1中的word
ij
,则将该用户归为第i个行业的用户,若不含list 1中任意一个word
ij
,则不能按名称分类。根据第二对照词库list 2对该用户进行初次行业分类,即先从网上爬取该用户的经营范围并对其分词,进而将分词结果与基准词库list 2进行匹配,统计分词结果所含对照词库list 2中各行业对应的词语的个数以及顺序号,比较与各行业的匹配个数,确定匹配个数最多的行业为该用户所属行业。当存在与多个行业匹配个数相同时,则比较顺序号与个数的乘积和,确定该乘积和最小的行业为该用户所属行业。
[0059]
最后,确定完待分类用户所属行业后,将其纳入步骤s2已知行业的企业级电力用户集合中,用于修正list 1和list 2。
[0060]
步骤s5中,根据初次分类行业内的用户日负荷序列确定最佳聚类数,具体为:对企业级电力用户完成行业初次分类后,首先,利用k

means聚类方法并设置聚类数t=1对各行业内用户的日负荷序列x
i
进行聚类,然后逐步增加聚类数t直至当前聚类数下的每个聚类簇x
i,k
(k=1,2,

,t)中存在不少于一定比例μ的用户日负荷序列x
i,k,p
至少与同一簇下的1个其它用户日负荷序列x
i,k,q
间的pearson相关系数大于某一给定值m,即
[0061][0062]
上式中,cov(
·
,
·
)表示协方差;σ表示标准差;e(
·
)表示样本期望。
[0063]
则确定该聚类数t为最佳聚类数,并将此聚类结果作为最终分类结果。
[0064]
以下以深圳市实际企业级电力用户作为目标对象来说明本发明实施例的基于行业属性和负荷特征的企业级电力用户智能分类方法。
[0065]
1)修正行业分类标准以匹配该地区实际情况。
[0066]
以深圳市为例,查阅深圳市统计局官网发布的统计年鉴,深圳市企业以高新制造业为主。因此,在《国民经济行业分类》标准基础上,结合深圳市各行业企业的实际数量规模,对行业分类条目进行“增拆删并”操作,即增补该标准中不涉及的新兴产业,拆解企业数量较多的行业条目,删除没有或极少相关企业的行业条目,合并企业数量较少的行业条目,使得各行业的相关企业数量相当,最终重制深圳市行业分类条目如下表所示:
[0067]
表1行业分类条目(适应深圳地区)
[0068][0069]
即得到36个行业分类条目trade1,trade2,

,trade
36

[0070]
2)按上述标准生成已知行业的企业级电力用户集合,并利用该集合经自然语言处理分别训练基于名称

行业映射关系的对照词库list 1和基于经营范围

行业映射关系的对照词库list 2。
[0071]
本实施例按上述重制的行业分类标准,根据用户名称和经营范围对500家企业级电力用户进行了人工分类,由此构成已知行业的企业级电力用户集合。
[0072]
利用该集合,一方面对用户名称分词后,将其中带有明显行业属性的词汇及该行业组成对照词库list 1,即:
[0073][0074]
其中,词汇word
ij
需满足在第i个行业的企业级电力用户名称中多次出现,且在除第i个行业外的企业级电力用户名称极少出现,即:
[0075][0076]
上式中,n
ij
表示word
ij
在第i个行业的企业级电力用户名称分词结果中出现的次数;n
i
表示第i个行业的企业级电力用户名称分词结果总词数;α为灵敏度系数,α≥1,此处设为2;n

ij
表示在除第i个行业外的企业级电力用户名称分词结果中出现的次数;σ为准确率系数,0≤σ≤1,此处设为0.9。
[0077]
另一方面,对用户的经营范围分词后,利用改进tf

idf算法提取每个行业的经营范围关键词,并对每个行业的关键词按q
ij
值排序,过滤掉无意义关键词后,取排序前若干个关键词与对应行业组成对照词库list 2,即:
[0078][0079][0080]
上式中,w
i
表示第i个行业经营范围分词结果总词数;w
ij
表示关键词j在第i个行业的企业级电力用户经营范围分词结果中出现的次数;w

ij
表示关键词j在除第i个行业外的企业级电力用户经营范围分词结果中出现的次数。
[0081]
由此获得list 1和list 2分别为:
[0082][0083]
[0084]
3)获取目标地区待分类的企业级电力用户名称;
[0085]
4)判断是否能按名称对待分类企业级电力用户进行行业分类,若能则根据对照词库list 1对该用户进行行业分类,若不能则利用网络爬虫在国家企业信用信息公示系统网上获取该用户的经营范围,再根据对照词库list 2对该用户进行行业分类;
[0086]
以下表2为例,对表2内的50个企业级电力用户按上述方式进行行业初次分类,所得部分结果如表2所示:
[0087]
表2行业分类部分结果
[0088]
[0089][0090]
其中,本实施例所得结果有43个用户与实际所属行业相同的,准确率达86%。实际上,准确率与用于训练模型的已知行业的企业级电力用户集合数量关联较大,本实施例仅将少量的500个用户用作已知行业的企业级电力用户集合,在此情况下能达到86%的准确率可说明本发明所提的基于行业属性和负荷特征的企业级电力用户智能分类方法具有可实施性。实际应用可扩充已知行业的企业级电力用户集合用于训练模型。
[0091]
5)根据各初次分类行业内的用户日负荷序列确定最佳聚类数,进一步得到最终分类。
[0092]
对上述企业级电力用户完成行业初次分类后,以显示器件制造业内的15个企业级电力用户为例,首先,利用k

means聚类方法并设置聚类数t=1对各行业内用户的日负荷序列x
i
进行聚类,然后逐步增加聚类数t直至当前聚类数下的每个聚类簇x
i,k
(k=1,2,

,t)中存在不少于一定比例μ(此处设为90%)的用户日负荷序列x
i,k,p
至少与同一簇下的1个其它用户日负荷序列x
i,k,q
间的pearson相关系数大于某一给定值m(此处设为0.5),即
[0093][0094]
上式中,cov(
·
,
·
)表示协方差;σ表示标准差;e(
·
)表示样本期望。
[0095]
则确定该聚类数t为最佳聚类数,并将此聚类结果作为最终分类结果。
[0096]
本实施例中,发现聚类数=1时,两两用户日负荷序列间的pearson相关系数如表3所示,可见仅有序号为9的1个用户与其余用户日负荷序列间的pearson相关系数小于0.5,即满足上述条件,故确定1为最佳聚类数,并将此聚类结果作为最终分类结果,即显示器件制造业内的企业级电力用户均属同一类用户。
[0097]
表3显示器件制造业两两用户日负荷序列间的pearson相关系数
[0098][0099]
上述的实施例验证了本发明提出的基于行业属性和负荷特征的企业级电力用户智能分类方法,拥有一定的可行性和有效性,推广后可为电网公司和社会带来相当可观的经济效益。
[0100]
相应于本发明实施例一一种企业级电力用户智能分类方法,本发明实施例二提供一种企业级电力用户智能分类装置,包括:
[0101]
修正模块,用于修正行业分类标准以匹配目标地区实际情况,形成初次分类标准;
[0102]
训练模块,用于按照所述初次分类标准生成已知行业的企业级电力用户集合,并利用所述已知行业的企业级电力用户集合经自然语言处理分别训练基于名称

行业映射关系的第一对照词库和基于经营范围

行业映射关系的第二对照词库;
[0103]
获取模块,用于获取目标地区待分类的企业级电力用户名称;
[0104]
初次分类模块,用于判断是否能按名称对待分类企业级电力用户进行初次行业分类,若能则根据第一对照词库对所述用户进行初次行业分类,若不能则根据第二对照词库,按照经营范围对待分类企业级电力用户进行初次行业分类;
[0105]
最终分类模块,用于根据各初次分类行业内的用户日负荷序列确定最佳聚类数,进一步得到最终分类。
[0106]
有关本实施例的工作原理及过程,请参照前述实施例一的说明,此处不再赘述。
[0107]
综上所述,相比于现有技术,本发明实施例带来的有益效果在于:通过获取目标地区企业级电力用户名称及其经营范围等信息以及日负荷值序列并修正行业分类标准以适应目标地区实际行业布局情况,从而基于行业属性和负荷特征实现对企业级电力用户的智能分类,减少各类用户在数量上的差异性,提高业务人员的工作效率,达到相似用户统一管理的目的,并且便于增值业务的有效推广。本发明还能够自动识别用户的行业属性并按重制的行业分类标准进行高效精准分类,避免了大量人力资源的投入。
[0108]
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1