一种用电数据在多时间尺度上的分析方法与流程

文档序号:17149356发布日期:2019-03-19 23:16阅读:230来源:国知局
一种用电数据在多时间尺度上的分析方法与流程

本申请涉及数据分析技术,特别涉及一种用电数据在多时间尺度上的分析方法。



背景技术:

随着电力行业信息化程度不断提升以及智能电网的快速普及,用电负荷数据呈现多元化、海量化趋势,用电负荷分析和用电用户侧写成为电力行业当前关注的热点。常见的用电负荷分析大多参考单日或全年用电负荷数据,缺乏时间维度上的衔接与扩展,对用户的侧写也停留在简单根据用电指标进行聚类,异常用户排查往往由人工实现。如何能从多时间维度对用电负荷进行分析、掌握更准确的用户用电模式以及自动筛选异常离群用户,成为当前亟需解决的问题。

公开号为cn107220906a的发明专利申请公开了一种基于用电采集系统的多时间尺度用电异常分析方法,该方法中多时间尺度来自采集装置的多尺度,即对日度、月度、年度数据集合进行处理,这样就需要对不同时间尺度数据采取分别处理,各自选取指标分析,处理复杂度较高。

公开号为cn106529707a的发明专利申请公开了一种负荷用电模式识别方法,对用电模式计算物理学指标,再根据指标进行聚类。这样的处理方式下,指标的选取和定义对结果影响很大,处理结果不稳定。

由上述可见,目前的多时间尺度的数据分析都存在问题。



技术实现要素:

本申请提供一种用电数据在多时间尺度上的分析方法,能够从多时间维度对用电负荷进行分析。

为实现上述目的,本申请采用如下技术方案:

一种用电数据在多时间尺度上的分析方法,包括:

将用户的用电数据以周为单位构成向量,通过构建rbm受限玻尔兹曼机模型,进行隐层特征的深度学习,并输出隐层特征向量;

对所述隐层特征向量进行聚类,得到不同的周用电模式簇;计算不同周用电模式簇间的相似度;

根据同一用户所有周用电模式聚类结果,构建用户的全年用电数据向量;

根据不同周用电模式簇间的相似度和所有用户的全年用电数据向量,生成用户相似度矩阵,所述用户相似度矩阵中的每个点表示两两用户间全年用电数据向量的相似度;

根据所述用户相似度矩阵,将所有用户的全年用电数据向量进行初次聚类,得到不同的用户年用电模式簇。

较佳地,在将所有用户的全年用电数据向量进行初次聚类后,该方法进一步包括:在每个所得的用户年用电模式簇内,进行dbscan二次聚类,确定异常离群的用户全年用电数据向量,并将其对应的用户作为异常离群用户;并输出二次聚类后的用户年用电模式。

较佳地,通过kmeans聚类方法对隐层特征向量进行聚类。

较佳地,所述生成用户相似度矩阵包括:

对于任意两个用户,根据所述不同周用电模式簇间的相似度,确定所述任意两个用户每周用电模式间的相似度,并统计各周相似度之和作为所述任意两个用户全年用电数据向量的相似度。

较佳地,通过kmeans聚类方法将所有用户的全年用电数据向量进行初次聚类。

较佳地,所述进行二次聚类包括:进行二次聚类时,根据预先设定的离群指标进行优化,使离群指标达到最优。

较佳地,所述离群指标为

其中,cin表示所有点到本类中其它点距离的平均值,cout表示所有点到其它类中各点距离的平均值,ceer表示异常点到各类中所有点平均距离的最小值。

由上述技术方案可见,本申请中,将用户的用电数据以周为单位构成向量,通过构建rbm受限玻尔兹曼机模型,进行隐层特征的深度学习,并输出隐层特征向量。通过隐层特征向量的学习,实现特征抽取和数据降维,以简化后续处理。接下来,对隐层特征向量进行聚类,得到不同的周用电模式簇;计算不同周用电模式簇间的相似度;根据同一用户所有周用电模式聚类结果,构建用户的全年用电数据向量。全年用电向量统计用户各周的用电习惯,在保留短期用电模式的基础上简化后续的聚类过程。根据不同周用电模式簇间的相似度和所有用户的全年用电数据向量,生成用户相似度矩阵;根据用户相似度矩阵,将所有用户的全年用电数据向量进行聚类,得到不同的用户年用电模式簇以及异常离群用户簇。通过上述方式,利用一次过程实现了从周和年的时间维度进行用户用电负荷分析,同时得到用户短期周用电模式和长期年用电行为,对用户进行类群划分之余筛选出异常离群用户,不需要由用户的全年所有数据构成向量进行聚类处理。

附图说明

图1为本申请中用电数据在多时间尺度上的分析方法的整体思路流程示意图;

图2为本申请中用电数据在多时间尺度上的分析方法的具体流程示意图。

具体实施方式

为了使本申请的目的、技术手段和优点更加清楚明白,以下结合附图对本申请做进一步详细说明。

为了对用户用电模式进行抽取和分析,对用户进行分类和筛选,本申请设计并实现了考虑不同时间尺度的用电负荷深度聚类方法,并且结合了rbm受限玻尔兹曼机特征学习算法。本申请整个思路流程如图1所示。

由图1可见,本申请中用电负荷数据分析方法可以实现多时间尺度用电负荷深度聚类,具体包括三个阶段,分别是短期用电模式聚类、用电尺度转换和长期用户聚类与异常用户分析。短期用电模式聚类从周期、振幅、峰谷差等角度对用户周用电模式进行提取和划分,实现了短时间尺度下对用电负荷的分析;用电尺度转换将短时间尺度与长时间尺度结合,把典型用电模式转换为用户年用电行为变化,为接下来长时间尺度下进行用户分析做准备;长期用户聚类与异常用户分析则实现了对用户的划分,获取典型用户用电特征并筛选出异常用电用户。整个过程仅需输入用户全年24点用电数据,通过从短期到长期层层递进的学习分析,输出短期用电模式、长期用电行为变化以及异常用电用户。

下面对本申请中的分析方法进行详细介绍。图2为本申请中分析方法的具体流程图。如图2所示,该方法包括:

步骤201,将用户的用电数据以周为单位构成向量,通过构建rbm受限玻尔兹曼机模型,进行隐层特征的深度学习,并输出隐层特征向量。

以周为单位输入用户的用电数据,也就是说,将用户的用电数据以周为单位构成向量。输入的数据总量包括n个用户的m周用电数据。如果最终需要进行用户全年数据分析,则需要输入用户全年各周的用电数据。可见,本申请中最终可以实现全年用电数据分析,但是原始输入不需要以全年用电数据为单位进行输入,而是以周为单位输入用电数据,从短期角度进行分析的同时降低处理的复杂度。

在得到数据后,通过数据预处理对脏数据进行清洗。具体预处理与现有方式相同,例如数据的补全等操作。

在数据预处理完成后即可开始构建rbm受限玻尔兹曼机模型,进行隐层特征的学习过程。rbm即受限玻尔兹曼机,是一种无监督神经网络模型,rbm受限玻尔兹曼机模型的构建是通过迭代方式进行深度学习的过程。具体地,rbm由可见层和隐藏层两层结构组成,分别对应原始输入数据和隐层特征。它通过在输出端尽可能重构输入数据对整个网络进行训练,当算法迭代收敛或达到预定迭代轮次后,算法停止,此时输出结果即学习到的隐层特征,是输入数据更加有力、有序的表达,可以视作对输入数据的高度提炼与分析,具有非常好的自主特征提取和数据降维功能。通过本步骤中对用户以周为单位的用电数据进行学习,以期得到人工很难发现的周期、波动特征,提升接下来分析的准确性。

步骤202,对隐层特征向量进行聚类,得到不同的周用电模式簇。

通过对隐层特征进行的聚类处理,得到不同的簇,对应典型7天用电模式,从而完成短时间尺度下的用电负荷分析。其中,聚类处理时通常采用基于距离的聚类方法,例如kmeans聚类方法。

在通过步骤201~202的处理后,提取出了7天的用户数据特性,并完成了分类处理,为后续长时间尺度的数据分析进行了数据上的准备。

步骤203,根据同一用户所有周用电模式聚类结果,构建用户的全年用电数据向量;计算不同周用电模式簇间的相似度。

本步骤中,根据步骤202中得到的7天聚类结果,对用户全年的用电数据进行标注,构建用户全年用电行为模型。具体地,将同一用户在全年各周用电模式聚类结果组合在一起,构成一个向量(以下称为用户的全年用电数据向量),代表用户全年用电行为模型,从而对应所有用户得到相应用户的全年用电行为模型。

这里需要注意一点,由于全年用电数据向量采用前述步骤202中的聚类结果作为输入数据,每个数据点代表当周的短期用电模式,也就是说,本步骤中的全年用电数据向量并不是原始的全年数据直接构成的向量,而是通过步骤201-203处理后的向量。同时,由上述全年用电数据向量的构成可见,基于此进行的全年用电数据分析,相比于直接利用用户的原始全年用电数据构成向量进行分析,在保留了短期用电模式信息的同时大大降低了处理的复杂度。

另外,为进行用户全年数据的相似度计算做准备,本步骤中,利用7天聚类结果,计算周用电模式簇间的相似度。具体相似度的计算方式采用现有方式,这里就不再赘述。

步骤204,根据不同周用电模式簇间的相似度和所有用户的全年用电数据向量,生成用户相似度矩阵。

根据不同周用电模式簇间的相似度和所有用户的全年用电数据向量,对所有用户的全年数据向量进行两两比较,得到用户相似度矩阵。其中,用户相似度矩阵中的每个点表示两两用户间全年用电数据向量的相似度。

具体地,生成用户相似度矩阵的具体方式可以为:对于任意两个用户a和b,根据不同周用电模式簇间的相似度,确定用户a和用户b在每周用电模式间的相似度,统计各周相似度之和作为用户a和用户b全年用电数据向量的相似度。

本步骤生成的用户相似度矩阵用于进行接下来的长时间尺度下的用户聚类和分析。

步骤205,根据用户相似度矩阵,将所有用户的全年用电数据向量进行初次聚类,得到不同的用户年用电模式簇。

在得到用户相似度矩阵后,依据该矩阵对用户行为数据进行聚类,得到用户划分结果。其中,聚类处理可以采用kmeans聚类方法。这样,就可以得到不同用户的年用电模式划分。

至此,本申请中最基本的数据分析方法流程结束。

进一步地,为实现异常离群用户的自动筛选,优选地,还可以进一步包括如下处理:

步骤206,在每个用户年用电模式簇内,进行二次聚类,确定异常离群的用户全年用电数据向量,并将其对应的用户作为异常离群用户;输出二次聚类得到的用户典型全年用电行为以及异常离群用户簇。

通过步骤205的处理实现了用户的基本分类。本步骤中,对每一个子用户簇进行改进的二次聚类,以确定异常离群用户。

具体地,二次聚类时,可以预先定义离群指标,通过网格搜索自动优化各子类聚类参数,使离群指标达到最优;最后对聚类结果进行分析,输出更为准确的典型用户用电模式和异常离群用户,从长时间尺度下对用户进行侧写。其中,离群指标可以根据实际需要进行选择,例如离群的全年用电数据向量与其他数据向量间的距离等。

具体地,常用的衡量聚类效果的指标如轮廓系数、兰德指数、互信息等,无法考虑异常离群点对聚类结果的影响,且当聚类结果只有一类时会出现失效情况。为解决此问题,可以定义离群指数discreteindex如下:

其中,cin表示所有点到本类中其它点距离的平均值,cout表示所有点到其它类中各点距离的平均值,ceer表示异常点到各类中所有点平均距离的最小值。离群指数越大则表明异常点距离聚类子簇越远,聚类子簇内聚更高簇间更远,具有更好的聚类效果。

上述即为本申请中用户用电数据的分析方法的具体实现。通过上述处理,能够从多时间尺度上进行用户用电数据的分析,降低了处理的复杂度,同时,还可以自动实现异常离群用户的筛选。

本申请的处理方法,与背景部分提到的申请相比,具有以下优点:

1、本申请从用户每天24点数据出发,对周用电模式与年用电行为变化进行分析,是一以贯之、层层递进的。同时采用深度聚类方式,将不同时间尺度结合起来,综合分析,形成统一的输出。除此之外,本申请还可以得到用户典型的周用电模式和年行为变化模型。上述处理效果均是公开号为cn107220906a的发明专利申请无法做到的;

2、本申请不需要额外领域知识,而是对用户24点用电量进行充分挖掘,通过深度聚类得到其短期和长期趋势及变化规律。公开号为cn106529707a的发明专利申请通过基于密度聚类和引力搜索算法进行分析,而本本申请借助rbm隐变量模型学习深层特征,通过时间尺度变化进行基于离群指标的深度聚类,不仅可以识别用电模式,更能对用户簇进行划分,筛选异常用户。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1