一种基于标签聚类技术的电力大客户用电行为分析方法与流程

文档序号:17541933发布日期:2019-04-29 14:44阅读:315来源:国知局
一种基于标签聚类技术的电力大客户用电行为分析方法与流程

本发明属于电力营销智能应用技术领域,具体涉及一种基于标签聚类技术的电力大客户用电行为分析方法。



背景技术:

客户用电行为分析,以海量的客户用电行为数据为基础,通过识别不同客户群体的行为特征,从而达到科学的客户认知、风险管理、个性化营销和服务的目的。与传统的客户用电行为分析相比,基于数据挖掘的客户用电行为分析能够提高客户行为分析的精确度,并实现对客户的用电行为进行定量化描述。与专业部门开展的分析相比,基于大数据的客户用电行为分析更加注重对客户用电风险的预测和大客户用电效益的挖掘,促进公司运营效率和服务水平的提升。

目前国内外专家学者基于电力客户用电数据,开展了大量的研究工作,例如采用聚类分析实现了客户用电行为特征优选,在降低计算复杂度的同时提高了客户用电行为分析的准确度;采用数据挖掘、云计算、动态博弈等技术开展用电行为分析研究,为提高客户需求感知、提升服务水平提供了支撑;以客户用电行为分析为手段,实现了负荷削峰填谷和多能互补供需优化,提高了电网运行安全稳定性。

在大数据技术快速发展的背景下,客户标签和画像技术在电商、互联网领域得到广泛应用。



技术实现要素:

本发明所要解决的技术问题是针对上述现有技术的不足,提供一种基于标签聚类技术的电力大客户用电行为分析方法。

为实现上述技术目的,本发明采取的技术方案为:

一种基于标签聚类技术的电力大客户用电行为分析方法,包括以下步骤:

1)结合数据资源维度,建立客户用电行为指标体系;

2)基于客户属性和数据分布,制定客户指标计算规则,将客户用电行为指标转化为标签;

3)采用k-means算法对形成的客户标签系列进行聚类,得到典型客户群体分类;

4)基于客户用电行为标签聚类结果,对客户群体进行画像分析,使客户用电行为分析更加简洁、直观。

为优化上述技术方案,采取的具体措施还包括:

步骤1)中,用电行为指标体系涵盖合同容量、用电类型、季节特性、温度敏感度、负荷稳定性、容量利用率、电量增长率、峰谷特性和周休特性,共计9个典型指标。

步骤2)中,基于客户档案信息、业务人员工作经验和数据分布情况,划定指标阈值,并根据不同阈值的特征,将用电行为指标定义为具有业务意义的标签。

步骤3)中,采用k-means算法对形成的客户标签系列进行聚类具体包括以下步骤:

3.1)对用户标签集向量进行相异度分析(相异度可以用欧式距离度量,距离越大,相异度越高),找出相异度最大的k个用户,作为并行k-means算法聚类算法的初始聚类中心;

3.2)将所有用户标签与k个聚类中心进行相似度计算,并将用户归入相似度最高的聚类中心中;

3.3)所有用户标签全部分类完成后,对各类别下的所有用户群取平均值,并以此平均值更新各类别当前的聚类中心,检查当前所有聚类中心与上一次迭代得到的聚类中心差值是否均小于预设阀值,若是,则返回步骤3.2),否则,转入步骤3.4);

3.4)聚类结束,显示聚类结果。

本发明具有以下有益效果:

基于电力客户用电数据,梳理分析客户用电行为特征指标,并采用k-means算法实现了客户标签聚类,使客户用电行为分析结果更加直观。

附图说明

图1是本发明实施例的用户标签聚类流程图;

图2是本发明实施例的客户标签分布情况图。

具体实施方式

以下结合附图对本发明的实施例作进一步详细描述。

本发明的一种基于标签聚类技术的电力大客户用电行为分析方法,包括以下步骤:

1)结合数据资源维度,建立客户用电行为指标体系:

客户标签聚类的目标是快速掌握不同客户群体的用电特征,从而实现不同用电群体的差异化服务。因此,在标签的选择上,需要考虑最能反映客户用电特征的。基于海量的客户档案、负荷、电量数据,综合考虑客户用电特征、影响因素,经过多次梳理和业务分析,筛选得到了涵盖合同容量、用电类型、季节特性、温度敏感度、容量利用率等维度,共计9个典型指标的电力大客户用电行为指标体系。如表1所示。

表1筛选后的客户用电行为标签

2)基于客户属性和数据分布,制定客户指标计算规则,将客户用电行为指标转化为标签:

基于客户档案信息、业务人员工作经验和数据分布情况,划定指标阈值,并根据不同阈值的特征,将用电行为指标定义为具有业务意义的标签。

(1)合同容量

标签说明:企业的合同容量代表着企业的生产规模,一般而言合同容量大的其用电量也大,容量和电量电费方面能体现出企业的用电价值,是供电公司最为关注的企业类型。而且在售电侧改革的背景下,这类用户是最值得争取的。

标签分档:按照合同容量的大小,可分为合同容量大、合同容量较大、合同容量中等、合同容量较小、合同容量小五个级别。

(2)用电类型

标签说明:包括工业用电、商业用电、住宅用电、农业排灌用电、非工业用电、农业生产用电、以及临时接电七种类型。其中农业排灌用电、农业生产用电具有典型的季节性和间歇性,临时接电要注意其规范性和安全性。

标签分档:工业用电、商业用电、住宅用电、农业排灌用电、非工业用电、农业生产用电、临时接电。

(3)季节负荷特性

计算公式:

式中:下标sp、su、fa、wi分别为春、夏、秋、冬四季的缩写,分别为企业最近3年春、夏、秋、冬有功负荷均值,为企业最近3年有功负荷均值,rsp、rsu、rfa、rwi分别为春、夏、秋、冬四季平均负荷相对于全年负荷的上升幅度。

标签说明:用季节平均负荷的比值,反映企业负荷对季节的敏感性,这里选取3~5月为春季,6~8月为夏季、9~11月为秋季、12~2月为冬季。当rsp>1.5时,该企业为春季敏感型,当rwi>1.5时,该企业为冬季敏感型企业,其它季节以此类推。

标签分档:春季敏感型、夏季敏感型、秋季敏感型、冬季敏感型、春秋敏感型、夏冬敏感型、无季节偏好。

(4)温度敏感度

计算方法:统计最近3年用户所在地区日平均温度、最近3年用户日平均负荷,将温度按1℃为单位划分,将属于各温度区间的日期进行汇总,计算各温度区间内所有日期的平均负荷,得到各温度区间内的用户平均负荷。

标签分档:高温敏感型、低温敏感型、高低温敏感型、适温敏感型、温度不敏感。

(5)负荷稳定性

计算公式:

f=σ/μ×100%

式中:σ为用户负荷标准差,μ为用户负荷平均值,f称为用户负荷的变异系数,它可以用于表征用户负荷的离散程度。

标签说明:用户负荷变异系数的计算对象为用户最近1年平均负荷曲线。

标签分档:负荷稳定、负荷较为稳定、负荷波动较大、负荷波动大。

(6)容量利用率

计算公式如下:

式中:为用户年平均负荷,为用户年平均运行容量。

标签说明:用户的容量利用率反映了用户的运行容量利用情况,若用户运行容量利用率较低,则可建议用户申请减容,减少容量费用,若用户运行容量利用率高,则需提醒用户注意安排生产,防止因超容产生罚款。

标签分档:容量利用率高、容量利用率较高、容量利用率较低、容量利用率低。

(7)电量增长率

计算公式:

re=(et-et-1)/et-1×100%

式中:et、et-1分别为用户在本统计周期和上一统计周期的用电量,本发明选取周期为年,即为本年用电量与上年用电量,re为年用电量增长率。

标签说明:与用户平均负荷类似,用户电量增长情况可以直接反映用户订单量变化、生产经营状况,能够为评估用户电费回收风险提供信号。

标签分档:电量高增长、电量低增长、电量无增长、电量负增长。

(8)峰谷特性

计算公式:

rpv=ep/ev

式中:ep、ev分别为用户在本统计周期内的峰电量和谷电量,本项目选取周期为年,即为本年度峰电量和谷电量,re为峰谷比。当re>1.5时,用户为峰用电偏好;当re<2/3时,用户为谷用电偏好;当1.5<re<2/3时,用户为峰谷均衡型。

标签说明:用户峰谷特性反映了用户对峰谷电价制度的敏感程度,通过引导用户调整峰谷用电,可以使区域性负荷稳定性提高,起到削峰填谷的作用。

标签分档:峰用电偏好型、谷用电偏好型、峰谷均衡型。

(9)周休特性

计算方法:选取最近3年用户日电量数据,剔除节假日所在周,进行周平均电量统计,得到周一~周日七天的平均用电量,寻找用电量明显下降的日期,即为企业的周休日。

标签说明:周休特性的判断,能够为制定配网检修计划、有序用电提高数据参考。

标签分档:五天工作制、六天工作制、七天工作制、无规律。

由于k-means算法只能对数值向量进行聚类分析,因此根据标签属性,对上述标签做数值化处理,如表2所示。

表2用户用电行为标签属性数值化处理

3)采用k-means算法对形成的客户标签系列进行聚类,得到典型客户群体分类:

参见图1,采用k-means算法对形成的客户标签系列进行聚类具体包括以下步骤:

3.1)对用户标签集向量进行相异度分析(相异度可以用欧式距离度量,距离越大,相异度越高),找出相异度最大的k个用户,作为并行k-means算法聚类算法的初始聚类中心;

3.2)将所有用户标签与k个聚类中心进行相似度计算,并将用户归入相似度最高的聚类中心中;

3.3)所有用户标签全部分类完成后,对各类别下的所有用户群取平均值,并以此平均值更新各类别当前的聚类中心,检查当前所有聚类中心与上一次迭代得到的聚类中心差值是否均小于预设阀值,若是,则返回步骤3.2),否则,转入步骤3.4);

3.4)聚类结束,显示聚类结果。

4)基于客户用电行为标签聚类结果,对客户群体进行画像分析,使客户用电行为分析更加简洁、直观:

以某地区2000户工商业客户为实施例,首先对各客户标签进行统计分析,其标签分布如图2所示。

客户标签分布特性如下:

(1)合同容量分布相对均衡,从小到大均有分布;

(2)用电类型主要分为工业和商业;

(3)季节敏感度而言,春秋两季敏感和夏冬两季敏感客户较多,季节特性在工业客户而言更多是由于季节性订单产生,而商业客户而言是由于温差导致;

(4)温度敏感度而言,高低温敏感客户最多,温度不敏感客户也较多;

(5)负荷稳定性方面,大多数客户负荷稳定性较高;

(6)容量利用率方面,大多数客户的容量利用率处于较高、高水准;

(7)电量增长率而言,大多数客户都在持平、上升、下降三个档位,并未出现电量猛增或骤降的客户;

(8)峰谷偏好上,峰偏好客户最多,这些客户基本上白天负荷高,谷偏好客户相对较少,这些客户基本上夜间负荷高,无偏好客户最少,这类客户多半是全天用电或者随机用电;

(9)工休特性而言,七天工作制客户最多,五天工作制客户最少。

采用k-means算法对客户标签进行聚类,得到如下四类典型特征客户:

表3客户标签特征

类别1客户描述性画像:大型工业客户,合同容量大,春秋季敏感、适温条件下用电量大,负荷稳定性高、容量利用率高,用电量与去年持平,典型的谷电偏好客户,一周工作七天。这类客户大多为钢铁、水泥等高耗能企业,由于夜间电价较低,大多选择在夜间开足马力生产;在夏冬季节由于限电、订单等多方面原因,用电量有所下降,春秋季用电量反而更高。

类别2客户描述性画像:小型工业客户,合同容量中等,受温度影响夏季负荷、用电量均有所上升,负荷稳定性高、容量利用率高,典型的峰电量偏好客户,一周工作七天。这类客户大多为纺织、轻工等行业,合同容量、用电量并不是特别大,因此选择在白天生产,夏季空调负荷上来会导致该类型客户负荷、用电量上升。

类型3客户描述性画像:服务型商业客户,合同容量较小,夏冬季节考虑顾客舒适度,空调负荷均较高,负荷稳定性较高、容量利用率较高,服务型商户大多白天营业,因此负荷也集中在白天,这类客户在节假日生意更好,一周开门营业七天。

类型4客户描述性画像:办公型商业客户,合同容量较小,夏冬季节考虑办公环境舒适度,空调负荷较高,负荷稳定性较高、容量利用率较高,办公型商户员工白天上班,因此负荷集中在白天,一周大多工作五天或者六天。

客户用电行为分析能够精准识别客户用电模式、深入挖掘客户用电需求,为引导客户改善用电行为、提高电网运行效率提供支撑。而标签和画像技术的应用,能够使客户用电行为分析更加简洁、直观。实施例表明,本发明选取的客户标签合理有效,采用的标签聚类算法效果显著,且用电行为模型可扩展性强、适用性好,能够方便快捷地应用到营销生产工作中。

以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1