电力用户信息标签化方法和装置、电子设备以及存储介质与流程

文档序号:20704965发布日期:2020-05-12 16:17阅读:191来源:国知局
电力用户信息标签化方法和装置、电子设备以及存储介质与流程
本发明涉及电力
技术领域
,尤其涉及一种电力用户信息标签化方法和装置。
背景技术
:目前,能源市场竞争日益激烈,了解海量用户需求是电力公司提升服务水平、增强竞争力的关键。电力物联网的发展及智能电表的普及,使用户数据得以高效采集。用户画像(即用户信息标签)是根据用户数据(如社会属性、生活习惯、消费行为等)挖掘出的标签化用户模型。构建用户画像可以实现用户隐性特征显性化,帮助企业了解用户,洞察用户需求、发掘目标用户、挖掘用户调控潜力,精细化定位人群特征,为电力公司智能化管理提供理论依据,从而完善产品运营,提升营销策略和综合能源服务水平,提升用户体验。目前对电力用户行为分析的方法大多仅直接进行聚类,将相似用电模式的用户归类,进一步分析用户用电行为及调控潜力,例如:基于年度/月度负荷曲线,提取分段平均电量、波动率等特征,分析用户年度用电特点;以削峰填谷为目标,分析提取表征用户用电高峰及季节性变化的特征量,研究各类用户适合参与的需求响应项目;以年用电量预测为主要分析目标,基于经济、气候及电价等关联影响因素研究了用户用电模式聚类分析;利用居民及中小商业的用电行为实验数据,研究了分时电价等激励机制对用户行为的影响;但是,现有方法采用的行为习惯数据一般是通过问卷调研及项目实验获得,实施难度大且样本量小,难以覆盖所有典型用户,准确率低。技术实现要素:针对现有技术中的问题,本发明提供一种电力用户信息标签化方法、装置、电子设备以及计算机可读存储介质,能够至少部分地解决现有技术中存在的问题。为了实现上述目的,本发明采用如下技术方案:第一方面,提供一种电力用户信息标签化方法,包括:获取一用户的三相电表数据;对该三相电表数据进行聚类得到典型负荷曲线图片;利用预训练的vgg模型对该典型负荷曲线图片进行分类得到该用户的用电特性特征标签。进一步地,对该三相电表数据进行聚类得到典型负荷曲线图片时采用k-means聚类算法,包括:根据该三相电表数据获取该用户一段时间内每日的峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率;将该用户一段时间内的日负荷曲线进行归一化后形成行向量矩阵,该日负荷曲线为由峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数、日最小负荷率构成的向量;对该行向量矩阵进行聚类;根据各类的聚类中心生成该典型负荷曲线图片。进一步地,该根据该三相电表数据获取该用户一段时间内每日的峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率包括:根据日高峰时段用电量以及日总用电量得到峰时耗电率;根据日最大的运行负荷得到日负荷峰值时刻;根据日低谷时段用电量以及日总用电量得到谷时耗电率;根据日最大的运行负荷以及日最小运行负荷统计日负荷周期数;根据日最小负荷以及日最大负荷得到日最小负荷率。进一步地,该对该行向量矩阵进行聚类,包括:根据预设初始类数对该行向量矩阵进行聚类;重聚类步骤:计算每个向量距离各类的聚类中心的欧氏距离,并且,将每个向量重新分配给最近的聚类中心所在的类;判断重聚类后各类的聚类中心是否移动;若是,返回重聚类步骤;若否,将不满足约束条件的类划分为两个类,直至所有类均满足约束条件或者类数等于预设最大类数。进一步地,电力用户信息标签化方法还包括:构建vgg模型;采用已知标签的典型负荷曲线图片样本集对该vgg模型进行训练得到预训练的vgg模型。进一步地,电力用户信息标签化方法还包括:获取已知标签的测试用典型负荷曲线图片;应用该已知标签的测试用典型负荷曲线图片对该预训练的vgg模型进行测试,并将该模型的输出作为测试结果;基于该测试结果及已知标签,判断预训练的vgg模型是否符合预设要求;若是,则将当前模型作为用于用电特性特征标签分类的目标模型;若否,则对当前模型进行优化和/或应用更新后的训练样本集重新进行模型训练。进一步地,电力用户信息标签化方法还包括:获取该用户的物联网数据;利用预建立的用户行为分析模型处理该物联网数据以及该三相电表数据得到用户行为特征标签。进一步地,电力用户信息标签化方法还包括:获取该用户的电费数据;对该用户的电费数据进行分类得到该用户的消费习惯特征标签。第二方面,提供一种电力用户信息标签化装置,包括:三相电表数据获取模块,获取一用户的三相电表数据;聚类模块,对该三相电表数据进行聚类得到典型负荷曲线图片;用电特性分类模块,利用预训练的vgg模型对该典型负荷曲线图片进行分类得到该用户的用电特性特征标签。进一步地,该聚类模块包括:用户数据获取子模块,根据该三相电表数据获取该用户一段时间内每日的峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率;矩阵构建子模块,将该用户一段时间内的日负荷曲线进行归一化后形成行向量矩阵,该日负荷曲线为由峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数、日最小负荷率构成的向量;聚类子模块,对该行向量矩阵进行聚类;图片生成子模块,根据各类的聚类中心生成该典型负荷曲线图片。进一步地,该用户数据获取子模块包括:峰时耗电率获取单元,根据日高峰时段用电量以及日总用电量得到峰时耗电率;日负荷峰值时刻获取单元,根据日最大的运行负荷得到日负荷峰值时刻;谷时耗电率获取单元,根据日低谷时段用电量以及日总用电量得到谷时耗电率;日负荷周期数获取单元,根据日最大的运行负荷以及日最小运行负荷统计日负荷周期数;日最小负荷率获取单元,根据日最小负荷以及日最大负荷得到日最小负荷率。进一步地,该聚类子模块包括:初始聚类单元,根据预设初始类数对该行向量矩阵进行聚类;重聚类单元,计算每个向量距离各类的聚类中心的欧氏距离,并且,将每个向量重新分配给最近的聚类中心所在的类;中心移动判断单元,判断重聚类后各类的聚类中心是否移动;约束单元,将不满足约束条件的类划分为两个类,直至所有类均满足约束条件或者类数等于预设最大类数。进一步地,电力用户信息标签化装置还包括:模型构建模块,构建vgg模型;模型训练模块,采用已知标签的典型负荷曲线图片样本集对该vgg模型进行训练得到预训练的vgg模型。进一步地,电力用户信息标签化装置还包括:测试图片获取模块,获取已知标签的测试用典型负荷曲线图片;模型测试模块,应用该已知标签的测试用典型负荷曲线图片对该预训练的vgg模型进行测试,并将该模型的输出作为测试结果;测试判断模块,基于该测试结果及已知标签,判断预训练的vgg模型是否符合预设要求;模型输出模块,将当前模型作为用于用电特性特征标签分类的目标模型;模型调整模块,对当前模型进行优化和/或应用更新后的训练样本集重新进行模型训练。进一步地,电力用户信息标签化装置还包括:物联网数据获取模块,获取该用户的物联网数据;行为分类模块,利用预建立的用户行为分析模型处理该物联网数据以及该三相电表数据得到用户行为特征标签。进一步地,电力用户信息标签化装置还包括:电费数据获取模块,获取该用户的电费数据;消费习惯分类模块,对该用户的电费数据进行分类得到该用户的消费习惯特征标签。第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现上述的电力用户信息标签化方法的步骤。第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的电力用户信息标签化方法的步骤。本发明提供的电力用户信息标签化方法、装置、电子设备以及计算机可读存储介质,该方法包括:获取一用户的三相电表数据;对该三相电表数据进行聚类得到典型负荷曲线图片;利用预训练的vgg模型对该典型负荷曲线图片进行分类得到该用户的用电特性特征标签,将k-means聚类与深度卷积神经网络结合用于电力用户信息标签化,获取电力用户行为画像,实施难度小且样本量大,能够覆盖所有典型用户,准确率高。为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1是本发明实施例中的电力用户信息标签化方法的流程示意图一;图2示出了本发明实施例中几种用户用电特性;图3示出了图1中步骤s200的具体步骤;图4示出了图3中步骤s210的具体步骤;图5示出了图3中步骤s240的具体步骤;图6是本发明实施例中的电力用户信息标签化方法的流程示意图二;图7示出了本发明实施例中6类典型用户行为;图8是本发明实施例中的电力用户信息标签化装置的结构框图;图9为本发明实施例电子设备的结构图。具体实施方式为了使本
技术领域
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。现有分析电力用户行为的方法所采用的行为习惯数据一般是通过问卷调研及项目实验获得,实施难度大且样本量小,难以覆盖所有典型用户,准确率低。为至少部分解决现有技术中存在的上述技术问题,本发明实施例提供了一种电力用户信息标签化方法,将k-means聚类与深度卷积神经网络结合用于电力用户信息标签化,获取电力用户行为画像,实施难度小且样本量大,能够覆盖所有典型用户,准确率高。图1是本发明实施例中的电力用户信息标签化方法的流程示意图一;如图1所示,该电力用户信息标签化方法至少可以包括以下内容:步骤s100:获取一用户的三相电表数据。其中,三相电表数据为电力系统侧在指定时间段进行采集统计得到,记录有功电量、无功电量、有功功率、无功功率、功率因素、最大需量、电流、电压、电费、用电量、日高峰时段用电量、日总用电量、日最大的运行负荷、日低谷时段用电量、日最小运行负荷以及各参数所对应的时刻等。步骤s200:对所述三相电表数据进行聚类得到典型负荷曲线图片;其中,采用k-means聚类算法对所述三相电表数据进行聚类得到典型负荷曲线图片,k均值聚类算法(k-meansclusteringalgorithm)是一种迭代求解的聚类分析算法。步骤s300:利用预训练的vgg模型对所述典型负荷曲线图片进行分类得到所述用户的用电特性特征标签。其中,vgg模型利用不同神经元对图片特征进行提取,并使用不同大小的卷积核对图像进行卷积或者下采样。vgg模型的网络深度较大,且准确率较高,具体结构参见表1:表1:vgg模型值得说明的是,用电特性特征标签包括:用户行为模式和居民用电负荷模式,用户行为模式分为工作日上班族、工作日居家族、休闲日宅居族、休息日外出族、老人居家族、上班与老人混居族等,居民用电负荷模式分为平稳型、午间负荷型、晚间负荷型、单峰型、双峰型、三峰型和其它型等,参见图2。综上所述,本发明实施例提供的电力用户信息标签化方法,将k-means聚类与深度卷积神经网络vgg结合用于电力用户信息标签化,获取电力用户行为画像,实施难度小且样本量大,能够覆盖所有典型用户,准确率高。通过用户画像能够准确捕捉用户精细化特征及精确锁定目标客户群,细化了用户行为分析粒度,有助于更好的了解用户特征,通过不同的标签对电力用户进行综合画像有利与分析用户行为特征,掌握不同时段的用电需求,从而进行合理的调配,为电力营销和调配进行决策支撑,为用电需求侧管理、优化客户服务管理规范提供辅助决策,充分了解用户习惯和诉求,为差异化服务、针对性规划提出指导建议。在一个可选的实施例中,参见图3,该步骤s200可以包括以下内容:步骤s210:根据所述三相电表数据获取所述用户一段时间内每日的峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率。步骤s220:将所述用户一段时间内的日负荷曲线进行归一化后形成行向量矩阵,所述日负荷曲线为由峰值耗电率βh、日负荷峰值时刻tmax、谷时耗电率βl、日负荷周期数nt、日最小负荷率构成的向量η;具体地,根据选取的5个特征,将用户某日的日负荷曲线表示为βh,tmax,βl,nt,η)向量。为使不同特征上的数据具有可比性,也为了方便计算特征权重,将向量归一化处理,例如某一用户n天对应的n条日负荷曲线可以表示为一个5n的行向量矩阵x:步骤s230:对所述行向量矩阵进行聚类;步骤s240:根据各类的聚类中心生成所述典型负荷曲线图片。具体地,提取各类的聚类中心的日负荷曲线,在matlab中生成典型负荷曲线,将各典型负荷曲线汇总后得到典型负荷曲线图片。在一个可选的实施例中,参见图4,该步骤s210具体包括以下内容:步骤s211:根据日高峰时段用电量wh以及日总用电量wn得到峰时耗电率βh;具体地,βh=wh/wn。步骤s212:根据日最大的运行负荷pd.max得到日负荷峰值时刻;具体地,日最大的运行负荷pd.max所对应的时刻为日负荷峰值时刻。步骤s213:根据日低估时段用电量wl以及日总用电量wn得到谷时耗电率;具体地,βl=wl/wn。步骤s214:根据日最大的运行负荷pd.max以及日最小运行负荷pd.min统计日负荷周期数nt;具体地,ph>pd.max-0.3(pd.max-pd.min)pl>pd.max+0.3(pd.max-pd.min)ph为高负荷,pl为低负荷,一日中负荷在ph和pl之间变换一次记为0.5周期,一日总周期数为nt,日负荷周期数表征了负荷波动性。步骤s215:根据日最小负荷pd.min以及日最大负荷pd.max得到日最小负荷率η。具体地,η=pd.min/pd.max。在一个可选的实施例中,参见图5,该步骤s240可以包括以下内容:步骤s241:根据预设初始类数kmin对所述行向量矩阵进行聚类。其中,将数据随机划分为数量为kmin的类,并计算每个类的聚类中心(均值向量)mu(u=1,2,…,kmin)。步骤s242:计算每个向量距离各类的聚类中心的欧氏距离;具体地,此时的类数量为kmin个,每个类中的向量个数分别为:n1,n2,…,nr,…,nk,nr表示第r个聚类中向量的个数,第j列为第j维特征,j的取值为1~5,代表上述的5个特征中的一个。首先,计算第j(j=1,2,…,5)维特征的权重wj:其中,wj∈[0,1],cj为特征j对聚类的贡献度,具体地:cj=dm/dn根据上式可以得知,若想要贡献度cj比较大,就需要类间距离dm较大,类内距离dn较小。如果类间距离dm较小,类内距离dn较大,则说明此特征的贡献度比较小,从而分配给此特征的权重就比较小。所以说cj可以度量出聚类的性能。所有kmin个聚类在第j维特征上的类间距离之和dm为:mj为类中全部数据在第j维特征上的均值,mrj为第r个聚类在第j维特征上的均值。所有kmin个聚类在第j维特征上的类内距离之和dn为:xij为该类矩阵中第i行第j列,mrj为第r个聚类在第j维特征上的均值。然后,根据上述计算得到的权重wj计算每个向量距离每个类的聚类中心的欧氏距离d,具体地:mu为每个类的聚类中心,xi为该类矩阵中第i行第j列,muj为第u个聚类在第j维特征上的均值。步骤s243:将每个向量重新分配给最近的聚类中心所在的类;具体地,将所有向量均重新分配后,完成重聚类过程,重新计算每个类的聚类中心。步骤s244:判断重聚类后各类的聚类中心是否移动;若是,返回步骤s242;若否,执行步骤s245;具体地,判断本次重聚类后每个类的聚类中心与本次重聚类前每个类的聚类中心是否发生移动,若是,返回步骤s242,直至本次重聚类后每个类的聚类中心与本次重聚类前每个类的聚类中心未发生移动。步骤s245:将不满足约束条件的类划分为两个类,并执行上述步骤s242至s244,直至所有类均满足约束条件或者类数等于预设最大类数。具体地,将当前的所有类均标记为未检验聚类,然后对各未检验聚类进行检验,具体为:判断未检验聚类是否满足聚类误差指标,即判断未检验聚类是否满足以下条件的约束:mrj为第r个聚类在第j维特征上的均值。c为可容忍误差阈值,即对聚类结果能够接受的总体最大误差,举例来说,可为0.3~0.6,如0.4;er为第r个聚类的总代表误差;nk为属于第r个聚类的数量。将满足约束条件的未检验聚类标记为已检验聚类;对于不满足约束条件的类,再次划分为两个新的聚类,并执行上述步骤s242至s244,并将最终得到的两个新的聚类标记为未检验聚类执行检验步骤,直至所有未检验聚类均已标记为已检验聚类或者未检验聚类和已检验聚类的聚类总数量达到预设的最大聚类数量kmax。值得说明的是,通过采用上述聚类方案,能够有效对相似向量进行聚类,利于提高后续分析的准确性。在一个可选的实施例中,该电力用户信息标签化方法还可以包括:步骤a:构建vgg模型;步骤b:采用已知标签的典型负荷曲线图片样本集对所述vgg模型进行训练得到预训练的vgg模型。在一个进一步地实施例中,该电力用户信息标签化方法还可以包括:步骤c:获取已知标签的测试用典型负荷曲线图片;步骤d:应用所述已知标签的测试用典型负荷曲线图片对所述预训练的vgg模型进行测试,并将该模型的输出作为测试结果;步骤e:基于所述测试结果及已知标签,判断预训练的vgg模型是否符合预设要求;若是,执行步骤f;若否,执行步骤g。步骤f:将当前模型作为用于用电特性特征标签分类的目标模型;步骤g:对当前模型进行优化和/或应用更新后的训练样本集重新进行模型训练。在一个可选的实施例中,参见图6,该电力用户信息标签化方法还可以包括以下内容:步骤s400:获取所述用户的物联网数据以及电费数据。其中,物联网数据可通过电器节点传感器采集识别得到。步骤s500:利用预建立的用户行为分析模型处理所述物联网数据以及所述三相电表数据得到用户行为特征标签。具体地,考虑日历因素影响下的用户作息行为习惯分析用户行为,寻找用户用电在时间上的规律性。用户行为分析模型如下:lgwap={(ts,te)p(ti)w(av)m(ldif)c(lreg)}其中,(ts,te)为用户的起居时间,根据物联网数据,基于春夏天的多日的用电负荷曲线,截取居民早晚电器启停时刻综合判断用户作息时间;p(ti)为负荷曲线特征,利用负荷量及出现的时段判断;w(av)为电量消耗水平,利用用户年用电量的所处阶梯;m(ldif)为电器类型数量(空调、电采暖(功率分档)、电动汽车、电热水器、智能厨电、洗衣机、普通厨电、基本照明、冰箱等),通过一年的辨识数据求合集(根据电器节点传感器采集识别数据);c(lreg)为大功率可调负荷总容量,通过一年的辨识数据综合推算(例如空调、电暖等大功率可调负荷电器可根据一年中使用境况的不同进行综合推算)。考虑用户行为的高差异性,所有判断因子均以区段进行表示,根据统计数据估算出估算各个区段的上下限值。若并非所有标签均满足,则以该类用户的主要判据为主,如:上班族受上班时间约束,工作日用电规律性极强;工作日居家族全天用电,且电器类型多;老人居家族早睡早起,电量小;混居族则早起晚睡,整日持续用电,参见图7以及表2。表2:用户行为类别(ts,te)p(ti)w(av)m(ldif)c(lreg)1晚睡早起早峰晚峰中中中2晚睡晚起早峰晚峰高多大3早睡早起早中晚峰低多小4早起晚睡早中晚峰高多大其中,表中w(av)根据用户年用电量的所处阶梯分成低、中、高三类。低于2880千瓦时为低,2880-4800为中,4800以上为高。表中m(ldif)低于5为少,5-20为中,20以上为多。表中c(lreg)低于500为少,500-1000为中,1000以上为多。步骤s600:对所述用户的电费数据进行分类得到所述用户的消费习惯特征标签。在现行阶梯电价政策下,电费与电量已不是线性相关,因此电费成本与调控的潜力及意愿都为正相关。阶梯电费占比:总电费:式中:cj1cj2cj3分别为用户第一、二、三阶梯的电费;ci为第i个用户的总电费。时间以1年计。当用户的总电费低于1500元则为消费习惯特征标签为低,当用户的总电费低于1500-3500元则为消费习惯特征标签为中,当用户的总电费在3500元以上则为消费习惯特征标签为高。最后,基于用户子标签特征值进行综合画像,并对用户定性标签进行直观展示,参见表3。表3:用户定性标签在一个可选的实施例中,该电力用户信息标签化方法还可以包括:数据清洗步骤。具体地,通过各种方式收集来的数据通常是不完整的,存在数据缺失、数据错误、离群值、数据不一致等问题,因此在使用数据进行电力用户信息标签化之前,需要进行数据清洗,删除其中噪声,进行数据过滤,保证数据完整性和一致性,生成干净正确的数据通过调用机器学习算法进行建模。综上,通过在北京市电力用户中,随机挑选了3000户居民用户包括了20多个社区,每30min采集一次,每个用户每天采集48个数据点,获取用户三相电表数据、物联网数据以及电费数据(如整年的电量、电费及网络行为统计数据、总负荷以及分项辨识负荷曲线数据等),得到总共100万多条负荷曲线,进行了电力用户信息标签化,并在标签化后进行了抽样验证,证明本发明实施例提供的电力用户信息标签化的精度达到90%以上。综上所述,本发明实施例提供的电力用户信息标签化方法,能够根据用户历史行为分析将电力用户分类,结合聚类和神经网络,抽象出一个用户的信息全貌,精准、快速地分析用户行为习惯,帮助用户节约用电,同时还能降低能源的消耗,提高能源的利用率,实现智能用电。基于同一发明构思,本申请实施例还提供了一种电力用户信息标签化装置,可以用于实现上述实施例所描述的方法,如下面的实施例所述。由于电力用户信息标签化装置解决问题的原理与上述方法相似,因此电力用户信息标签化装置的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图8是本发明实施例中的电力用户信息标签化装置的结构框图。如图8所示,该电力用户信息标签化装置具体包括:三相电表数据获取模块10、聚类模块20以及用电特性分类模块30。三相电表数据获取模块10获取一用户的三相电表数据。其中,三相电表数据为电力系统侧在指定时间段进行采集统计得到,记录有功电量、无功电量、有功功率、无功功率、功率因素、最大需量、电流、电压、电费、用电量、日高峰时段用电量、日总用电量、日最大的运行负荷、日低谷时段用电量、日最小运行负荷以及各参数所对应的时刻等。聚类模块20对所述三相电表数据进行聚类得到典型负荷曲线图片。其中,采用k-means聚类算法对所述三相电表数据进行聚类得到典型负荷曲线图片,k均值聚类算法(k-meansclusteringalgorithm)是一种迭代求解的聚类分析算法。用电特性分类模块30利用预训练的vgg模型对所述典型负荷曲线图片进行分类得到所述用户的用电特性特征标签。其中,vgg模型利用不同神经元对图片特征进行提取,并使用不同大小的卷积核对图像进行卷积或者下采样。vgg模型的网络深度较大,且准确率较高。值得说明的是,用电特性特征标签包括:用户行为模式和居民用电负荷模式,用户行为模式分为工作日上班族、工作日居家族、休闲日宅居族、休息日外出族、老人居家族、上班与老人混居族等,居民用电负荷模式分为平稳型、午间负荷型、晚间负荷型、单峰型、双峰型、三峰型和其它型等。综上所述,本发明实施例提供的电力用户信息标签化装置,将k-means聚类与深度卷积神经网络vgg结合用于电力用户信息标签化,获取电力用户行为画像,实施难度小且样本量大,能够覆盖所有典型用户,准确率高。通过用户画像能够准确捕捉用户精细化特征及精确锁定目标客户群,细化了用户行为分析粒度,有助于更好的了解用户特征,通过不同的标签对电力用户进行综合画像有利与分析用户行为特征,掌握不同时段的用电需求,从而进行合理的调配,为电力营销和调配进行决策支撑,为用电需求侧管理、优化客户服务管理规范提供辅助决策,充分了解用户习惯和诉求,为差异化服务、针对性规划提出指导建议。在一个可选的实施例中,该聚类模块包括:用户数据获取子模块、矩阵构建子模块、聚类子模块以及图片生成子模块。用户数据获取子模块,根据所述三相电表数据获取所述用户一段时间内每日的峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率;矩阵构建子模块,将所述用户一段时间内的日负荷曲线进行归一化后形成行向量矩阵,所述日负荷曲线为由峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数、日最小负荷率构成的向量;具体地,根据选取的5个特征,将用户某日的日负荷曲线表示为βh,tmax,βl,nt,η)向量。为使不同特征上的数据具有可比性,也为了方便计算特征权重,将向量归一化处理,例如某一用户n天对应的n条日负荷曲线可以表示为一个5n的行向量矩阵x:聚类子模块,对所述行向量矩阵进行聚类;图片生成子模块,根据各类的聚类中心生成所述典型负荷曲线图片。具体地,提取各类的聚类中心的日负荷曲线,在matlab中生成典型负荷曲线,将各典型负荷曲线汇总后得到典型负荷曲线图片。在一个可选的实施例中,所述用户数据获取子模块包括:峰时耗电率获取单元、日负荷峰值时刻获取单元、谷时耗电率获取单元、日负荷周期数获取单元以及日最小负荷率获取单元。峰时耗电率获取单元,根据日高峰时段用电量wh以及日总用电量wn得到峰时耗电率βh;具体地,βh=wh/wn。日负荷峰值时刻获取单元,根据日最大的运行负荷pd.max得到日负荷峰值时刻;具体地,日最大的运行负荷pd.max所对应的时刻为日负荷峰值时刻。谷时耗电率获取单元,根据日低估时段用电量wl以及日总用电量wn得到谷时耗电率;具体地,βl=wl/wn。日负荷周期数获取单元,根据日最大的运行负荷pd.max以及日最小运行负荷pd.min统计日负荷周期数nt;具体地,ph>pd.max-0.3(pd.max-pd.min)pl>pd.max+0.3(pd.max-pd.min)ph为高负荷,pl为低负荷,一日中负荷在ph和pl之间变换一次记为0.5周期,一日总周期数为nt,日负荷周期数表征了负荷波动性。日最小负荷率获取单元,根据日最小负荷pd.min以及日最大负荷pd.max得到日最小负荷率η。具体地,η=pd.min/pd.max。在一个可选的实施例中,所述聚类子模块包括:初始聚类单元、重聚类单元、中心移动判断单元以及约束单元。初始聚类单元,根据预设初始类数对所述行向量矩阵进行聚类;重聚类单元,计算每个向量距离各类的聚类中心的欧氏距离,并且,将每个向量重新分配给最近的聚类中心所在的类;中心移动判断单元,判断重聚类后各类的聚类中心是否移动;约束单元,将不满足约束条件的类划分为两个类,直至所有类均满足约束条件或者类数等于预设最大类数。在一个可选的实施例中,该电力用户信息标签化装置还可以包括:模型构建模块以及模型训练模块。模型构建模块,构建vgg模型;模型训练模块,采用已知标签的典型负荷曲线图片样本集对所述vgg模型进行训练得到预训练的vgg模型。在一个可选的实施例中,电力用户信息标签化装置还可以包括:测试图片获取模块、模型测试模块、测试判断模块、模型输出模块以及模型调整模块。测试图片获取模块,获取已知标签的测试用典型负荷曲线图片;模型测试模块,应用所述已知标签的测试用典型负荷曲线图片对所述预训练的vgg模型进行测试,并将该模型的输出作为测试结果;测试判断模块,基于所述测试结果及已知标签,判断预训练的vgg模型是否符合预设要求;模型输出模块,将当前模型作为用于用电特性特征标签分类的目标模型;模型调整模块,对当前模型进行优化和/或应用更新后的训练样本集重新进行模型训练。在一个可选的实施例中,电力用户信息标签化装置还可以包括:物联网数据获取模块以及行为分类模块。物联网数据获取模块,获取所述用户的物联网数据;行为分类模块,利用预建立的用户行为分析模型处理所述物联网数据以及所述三相电表数据得到用户行为特征标签。在一个可选的实施例中,该电力用户信息标签化装置还可以包括:电费数据获取模块以及消费习惯分类模块。电费数据获取模块,获取所述用户的电费数据;消费习惯分类模块,对所述用户的电费数据进行分类得到所述用户的消费习惯特征标签。上述实施例阐明的装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为电子设备,具体的,电子设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。在一个典型的实例中电子设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现下述步骤:获取一用户的三相电表数据;采用k-means聚类算法对所述三相电表数据进行聚类得到典型负荷曲线图片;利用预训练的vgg模型对所述典型负荷曲线图片进行分类得到所述用户的用电特性特征标签。从上述描述可知,本发明实施例提供的电子设备,可用于电力用户信息标签化,将k-means聚类与深度卷积神经网络结合用于电力用户信息标签化,获取电力用户行为画像,实施难度小且样本量大,能够覆盖所有典型用户,准确率高。下面参考图9,其示出了适于用来实现本申请实施例的电子设备600的结构示意图。如图9所示,电子设备600包括中央处理单元(cpu)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram))603中的程序而执行各种适当的工作和处理。在ram603中,还存储有系统600操作所需的各种程序和数据。cpu601、rom602、以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。以下部件连接至i/o接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现下述步骤:获取一用户的三相电表数据;采用k-means聚类算法对所述三相电表数据进行聚类得到典型负荷曲线图片;利用预训练的vgg模型对所述典型负荷曲线图片进行分类得到所述用户的用电特性特征标签。从上述描述可知,本发明实施例提供的计算机可读存储介质,可用于电力用户信息标签化,将k-means聚类与深度卷积神经网络结合用于电力用户信息标签化,获取电力用户行为画像,实施难度小且样本量大,能够覆盖所有典型用户,准确率高。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1