本发明属于电能计量技术领域,尤其是一种基于海量低压台区用电数据的典型低压台区用电模型构建方法。
背景技术:
作为配电管理的最底层单元,低压台区的精细化、实时化管理势在必行。自国网公司全面推进智能电能表换装及用电信息采集系统建设以来,目前已实现全域4.26亿只智能电能表的在线运行,积累了大量的居民用电数据。这些数据具有海量、异构的特点,蕴含着丰富的居民用户用电信息。对这些用电数据进行深入挖掘,提取出用户的用电行为特点,有利于电网对低压台区进行精细化、实时化管理,同时也能了解用户个性化、差异化的服务需求,实现精准营销。
技术实现要素:
本发明的目的在于克服现有技术的不足之处,提供一种基于海量低压台区用电数据的典型低压台区用电模型构建方法,通过挖掘海量用户用电数据,建立可表征低压台区用户用电行为的多维度特征参数集,构建典型用户用电行为模型,从而构造用户画像。
本发明解决其技术问题是采取以下技术方案实现的:
一种基于海量低压台区用电数据的典型低压台区用电模型构建方法,其特征在于:包括以下几个步骤:
⑴对从数据库中查询得到的居民用电数据进行清洗;
⑵应用主成分分析方法对用电数据进行降维;
⑶计算低压居民用电评价指标集;
⑷基于k-means聚类分析法,对低压电力用户进行分类。
而且,所述步骤⑴,对于确实的居民用电数据,去数据缺失日期前、后各五天内同一时刻的用电数据的均值作为缺失值。
而且,所述步骤⑵具体为,对某电力用户,设xi,j表示该用户在第i天时刻j的用电数据,应用主成分分析降维的详细步骤:
①对所有样本进行中心化:
②计算样本的协方差矩阵xxt;
③对矩阵xxt进行特征值分解;
④取最大的特征值对应的特征向量,得到特征向量矩阵w;
⑤对原始数据x进行变换z=wtx,得到向量z,完成降维。
而且,所述步骤⑶具体为,基于主成分分析得到的用电向量z,计算指标峰值功率、峰时系数、谷时系数、负荷率,各指标计算方法如下:
峰值功率s1=当日功率最大值;
峰时系数s2=高峰时段用电量/当日总用电量;
谷时系数s3=低谷时段用电量/当日总用电量;
负荷率s4=平均负荷/总负荷;
通过计算,每个电力用户都可以表示为一个1×4的行向量矩阵:s=[s1s2s3s4]。
而且,所述步骤⑷具体为:
①从数据集
②对数据集中的第i个样本点si,计算其与各聚类中心点的欧式距离,并获取si所属的类别标号:
式中μj代表样本si与k个簇相比距离最近的簇;
③按照下式重新计算k个聚类中心:
④重复步骤②和③,直到满足平方误差准则:
本发明的优点和积极效果是:
1、本发明通过典型低压台区用电模型的构建,形成标准统一的结构化特征数据形式,正确建立可表征低压台区用户用电行为的多维度特征参数集,并提取出电力用户的典型用电模式。
2、本发明可以为实现台区下各智能表运行误差远程诊断评估和快速处置提供良好的数据基础,以及未来需求响应政策制定、台区损耗管理等提供技术支持,提升低压台区精细化管理水平。
附图说明
图1为本方法流程图。
具体实施方式
下面并通过具体实施例对本发明作进一步详述,以下实施例只是描述性的,不是限定性的,不能以此限定本发明的保护范围。
一种基于海量低压台区用电数据的典型低压台区用电模型构建方法,从居民用电的峰值功率、峰时系数、谷时系数、负荷率四个指标来表征居民用户用电模式,基于k-means聚类分析方法对电力用户进行分类。
包括以下几个步骤:
⑴对从数据库中查询得到的居民用电数据进行清洗;
在用电数据采集的过程中,难免受到系统延时等各种影响,发生数据丢失。对于电力用户而言,其每日的负荷曲线通常具有横向相似性,故参考数据缺失日期前后五天内同一时刻的用电数据,取这十天同时刻用电量的均值作为缺失值。
⑵应用主成分分析方法对用电数据进行降维;
若只取少数几天的日用电数据,则不能充分反映出电力居民的用电特点;但如果选取的时间跨度太长,数据太多,又会极大的加重计算负担。故应用主成分分析方法,在保留用电数据特征的同时,对其进行降维处理。
具体的,对某电力用户,设xi,j表示该用户在第i天时刻j的用电数据,应用主成分分析降维的详细步骤:
①对所有样本进行中心化:
②计算样本的协方差矩阵xxt;
③对矩阵xxt进行特征值分解;
④取最大的特征值对应的特征向量,得到特征向量矩阵w;
⑤对原始数据x进行变换z=wtx,得到向量z。
显然,通过主成分分析,原始数据是一个i×j的矩阵,将其转化为一个1×j的向量,完成了降维。
⑶计算低压居民用电评价指标集;
基于主成分分析得到的用电向量z,计算指标峰值功率、峰时系数、谷时系数、负荷率。各指标计算方法如下:
峰值功率s1=当日功率最大值;
峰时系数s2=高峰时段用电量/当日总用电量;
谷时系数s3=低谷时段用电量/当日总用电量;
负荷率s4=平均负荷/总负荷;
通过计算,每个电力用户都可以表示为一个1×4的行向量矩阵:s=[s1s2s3s4]。
⑷基于k-means聚类分析法,对低压电力用户进行分类。
①从数据集
②对数据集中的第i个样本点si,计算其与各聚类中心点的欧式距离,并获取si所属的类别标号:
式中μj代表样本si与k个簇相比距离最近的簇。
③按照下式重新计算k个聚类中心:
④重复步骤②和③,直到满足平方误差准则:
尽管为说明目的公开了本发明的实施例,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换、变化和修改都是可能的,因此,本发明的范围不局限于实施例所公开的内容。