一种基于随机森林的电力用户特征识别分类方法与流程

文档序号:15447747发布日期:2018-09-14 23:34阅读:613来源:国知局

本发明属于电力用户特征识别技术,特别是涉及一种基于随机森林的电力用户特征识别分类方法。



背景技术:

当今世界发展越来越快,城市建设日新月异,能源的消耗速率也与日俱增,由于发展速度过快,全球已经陷入了深深的能源危机中,煤炭、石油等各种化石能源不断被消耗,日渐枯竭,而且,开采化石资源对环境造成严重危害,消耗化石资源也会产生大量有害气体。随着世界发展对能源的要求越来越高以及人们环境意识的加强,电动汽车、光伏以及储能等日渐普及,分布式设备得到前所未有的重视和发展,这也使得不同用户均具备了不同的调控潜力。同时由于经济地高速发展,地区电力的最大负荷持续增长,峰谷差渐渐增大,这对电网的安全运行造成巨大威胁,研究负荷特性,在此基础上有针对性地开展需求侧管理具有十分重要的意义。

但是,由其构成了众多的分布式能源,给传统电网的结构带来很大的冲击,为了应对这样一个局面,进行需求侧管理是一个有效解决该问题的措施,同时利用用户的调控潜力来调节电网,将在很大程度上改善电网的运行状况。

而在需求侧的众多类型用户中,不同类型用户都有不同的调控潜力。如果能够通过电力用户的特征识别,对用户进行分类,这对需求侧管理将起到很大的推动作用。通过对不同的用户采取不同的调控措施,尽可能的发挥不同电力用户的调控潜力,提高电网的运行状态,很有意义。因此,寻找一个有效的方法——对用户的特征进行识别、分类,是一个亟待解决的问题。



技术实现要素:

本发明要解决的技术问题是:提供一种基于随机森林的电力用户特征识别分类方法,利用现有数据,对随机森林模型进行训练,将训练得到的模型来对电网中的电网用户进行特征识别分类。

本发明的技术方案是:

一种基于随机森林的电力用户特征识别分类方法,它包括:

步骤s110、采集电力用户数据,根据电力用户的负荷曲线和电力用户数据,得到电力用户用电负荷数据;

步骤s120、对电力用户负荷数据进行归一化预处理,提取出电力用户负荷数据的影响因子,建立随机森林的训练集和测试集;

步骤s130、从训练集中随机抽取样本,抽取k个样本,利用决策树算法对k个样本进行训练,获得k个决策树分类模型;

步骤s140、将k个决策树分类模型组合起来,形成组合分类模型,即随机森林分类模型;

步骤s150、采集电力用户负荷特性数据,利用随机森林分类模型对这些数据进行分类,输出电力用户的分类结果。

步骤s140建立的随机森林分类模型,通过利用测试集对随机森林模型进行分类结果测试,将测试结果和测试集结果进行比较,以此来验证随机森林分类模型。

电力用户用电负荷数据包括:

①、峰值pmax,取电力用户日用电曲线中的最大值来作为该电力用户用电负荷曲线的峰值;

②、峰谷差δpm,取电力用户用电曲线中的最大值pmax和最小值pmin,两者的差值作为该电力用户用电曲线的峰谷值;

δpm=pmax-pmin

③、负荷率km,

④、最小负荷系数α,

⑤、耗电量wd,

本发明有益效果:

本发明基于随机森林的电力用户特征识别分类方法对电力用户特征识别并进行分类。首先通过收集大量的原始真实数据,将数据以一定比例划分为训练集和测试集,利用训练集训练多棵决策树,再将所有的决策树组合成随机森林,通过投票决定最终的分类结果,然后利用测试集对随机森林进行验证,最后利用随机森林对电力用户进行识别分类,输出分类结果;解决了现有技术不能对电网中的电网用户进行特征识别分类的问题。

附图说明

图1为本发明的流程示意图。

具体实施方式

本发明基于随机森林的电力用户特征识别分类方法包括以下步骤:

步骤s110,通过现有的电力系统智能采集装置对电力用户数据进行采集。上述的电力系统采集系统为智能用电的统一协调优化控制系统,通过该系统下的智能用电插座对用户数据进行采集,根据电力用户的负荷曲线和具体数据,分析不同电力用户用电数据特征,提炼出电力用户用电负荷主要特征;

①、峰值pmax。取电力用户日用电曲线中的最大值来作为该电力用户用电负荷曲线的峰值——日最大负荷pmax,一般工业用户用电峰值相对于家庭用户或者商业用户来说偏大;

②、峰谷差δpm。取电力用户用电曲线中的最大值pmax和最小值pmin,两者的差值作为该电力用户用电曲线的峰谷值

δpm=pmax-pmin

③、负荷率km。其中pav表示一天中的用户用电平均值。

④、最小负荷系数α。

⑤、耗电量wd。其中p表示电力用户日用电功率,一般工业负荷的耗电量比一般家庭大得多。

步骤s120,对电力用户负荷数据进行归一化预处理,消除量纲影响,提取出电力用户负荷数据的主要影响因子,建立随机森林的训练集和测试集,具体如下:

归一化处理:其中,a*表示归一化后的结果,a表示该特征数据,amax表示该类特征数据的最大值,amin表示该类特征数据的最小值;

随机森林的训练集和测试集容量之比为80%和20%。

步骤s130,有放回地从训练集中随机抽取样本,抽取k个样本,每个样本的样本容量和原始训练集一样;

步骤s130,利用决策树算法对k个样本进行训练,获得k个决策树分类模型。具体步骤如下:

设定树的数量为300;

1、构建第k棵决策树:

构建根决策点:

i、计算一元模型的熵。

ii、计算二元模型条件熵。计算用户类型和特征数据一起出现的联合概率,分别计算用户类型在不同特征数据下的条件概率,由联合概率和条件概率求出不同特征数据取值下的用户类型条件熵;

iii、计算互信息。再已知一元模型熵和不同特征数据下的二元模型熵后,计算互信息的值,度量哪种特征数据与用户类型的相关性最高,并以此作为决策树的根节点来构建决策树分类模型;

步骤s140,将k个决策树分类模型组成起来,形成组合分类模型,即随机森林分类模型,每个决策树通过投票表决最终分类,

利用测试集对随机森林模型进行分类结果测试,将测试结果和测试集结果进行比较,以此来验证随机森林分类模型;

收集电力用户负荷特性数据,利用该模型对这些数据进行分类;

输出电力用户的分类结果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1