一种基于电力大数据的自适应负荷预测选择方法

文档序号：9888796阅读：411来源：国知局

一种基于电力大数据的自适应负荷预测选择方法
【技术领域】
[0001] 本发明涉及一种负荷预测选择方法，具体涉及一种基于电力大数据的自适应负荷预测选择方法。
【背景技术】
[0002] 负荷预测是根据系统的运行特性、增容决策、自然条件与社会影响等诸多因数，在满足一定精度要求的条件下，确定未来某特定时刻的负荷数据，其中负荷是指电力需求量 (功率)或用电量;负荷预测是电力系统经济调度中的一项重要内容。
[0003] 自适应的负荷预测是根据客户类别和客户拥有的数据量和数据中负荷分布情况调用最适合的负荷分类方法，对重过载负荷进行预测。因为不同客户不同部门的电力数据采集、存储、运行和数据的特征都有很大的差异。所以，很难建立一个统一的电力负荷预测模型。故本发明综合分析客户信息和客户所有的电力数据信息，自适应选择合适的分类算法构造负荷预测模型，实现智能化管理。
[0004] 电力大数据负荷预测经典的建模方法。电力负荷预测的方法在近年来已取得长足的进步，传统的建模方法也有几十种，但随着智能电网、通信网络技术和传感器技术的发展，电力数据呈指数级增长、复杂程度增大，逐步构成电力大数据。传统的数据分析模式已无法满足需求。因此，本发明重点介绍三种适合用于电力大数据负荷预测且高效的分类算法，并分析其优缺点，为下文的自适应选择模型做准备。
[0005] AdaBoost 建模方法
[0006] 提升树是把"弱学习算法"提升(boost)为"强学习算法"的经典算法，即构建多个弱分类模型，最后用一种非随机的方式组合多个弱分类器进行决策。每轮的弱分类器构建根据上一轮样本的预测情况，赋予不同的权重，如果样本不能正确的分类，则它的权重增加。如果样本正确分类，则它的权重减少。元组的权重反映对它们分类的困难程度--权重越高，越可能错误的分类。使用这些权重，为下一轮的分类器产生训练样本。其基本思想是，希望算法更关注上一轮误分类的样本。所以，该方法可以明显提高分类的准确率。但是，由于AdaBoost关注错误分类的样本，所以存在结果负荷模型对数据过分拟合的危险。因此，对于数据正负样本分布不平衡的地区，该方法容易产生过拟合的现象，即使分类的总的正确率会很高，但是对于小类别样本预测效果较差。
[0007] 随机森林方法
[0008] 该方法的模型训练速度快、可扩展性强，对错误和离群点更鲁棒，可以防止过拟合的现象的发生。其基本思想：多个基分类模型构成的集合就是一个"森林"，单个的分类模型构建都是对原始数据的独立抽样，如此循环构建多个分类模型，分类时，每个分类模型都投票返回得票最多的类别。但是它的缺点就是，对多缺失值多类别的数据的分类效果较差。因此，采用随机森林算法建负荷预测模型时需判断输入数据集的质量是否适合用该方法实现。
[0009] SVM建模方法
[0010] 支持向量机适用于高维数据高精度的预测，它是一种线性和非线性数据的分类方法，它使用非线性映射将原始数据映射到高维空间，在该空间内搜索最佳分离超平面，从而对数据分类。用该方法实现对数据的分类工作，精度很高，但是由于分类过程中点积计算量极大，存在运行时间较长的问题。因此，采用SVM算法建分类模型时需判断输入数据的数据量和属性的类别是否满足需求。

【发明内容】

[0011] 为了克服上述现有技术的不足，本发明提供一种基于电力大数据的自适应负荷预测选择方法，本发明对新客户类别进行预测，自适应选择负荷预测算法，实现智能电网管理。
[0012]为了实现上述发明目的，本发明采取如下技术方案：
[0013] -种基于电力大数据的自适应负荷预测选择方法，所述方法包括如下步骤：
[0014] (1)客户类别判断；
[0015] (2)电力数据关联规则挖掘和数据化简；
[0016] (3)自适应负荷预测建模。
[0017]优选的，所述步骤(1)中，包括如下步骤：
[0018]步骤1-1、收集客户的特征数据；
[0019] 步骤1-2、调用已封装好的两步聚类方法构建客户聚类模型，建模时设置聚类数为 3；
[0020] 步骤1-3、用客户聚类模型进行预测时将预测结果为0的客户定义为小客户，输出客户类型为1，将预测结果非〇的客户定义为非小客户，客户类型为2。
[0021] 优选的，所述特征数据包括:客户所在地区信息、该地区经济水平、客户的员工信息和客户的用户量。
[0022] 优选的，所述步骤(2)中，包括如下步骤：
[0023]步骤2-1、所述关联规则挖掘用于从输入的负荷数据集D中挖掘出与负荷强关联的属性，即满足最小支持度与最小置信度的规则中包含的属性；
[0024]步骤2-2、提取强关联属性的数据，从而对负荷数据集D进行化简，化简后的负荷数据D'作为分类的输入数据。
[0025] 优选的，所述关联规则用于描述不同项集之间的相互依存性和关联性，其基本形式为，其中A与B是两个互斥的项集，所述关联规则的度量包括支持度、置信度和提升度;所述支持度是项集中包含A和B的项数与所有项数之比，公式为:support (Ai:B) = P (AUB) ,所述置信度是包含项集A的事物中也包含项集B所占的百分比，公式为:_Mence (A二B)=尸(半)，所述提升度是置信度与包含项集B的事物所占百分比的比值，公式为
[0026] 优选的，所述步骤2-2包括如步骤：
[0027] 步骤2-2-1、给定支持度的最小阈值，称为最小支持度，置信度的最小阈值，称为最小置信度；
[0028] 步骤2-2-2、根据重载和过载样本的实际比率设置不同的最小置信度和最小支持度分别提取影响重载的规则rulel和过载的规则rule2;
[0029] 步骤2-2-3、提取所述rule 1和所述rule2中包含的属性，作为与负荷强关联的属性，从负荷数据集D保留只包含此强关联属性和负荷属性的列数据，作为分类的输入数据 D，。
[0030] 优选的，所述步骤(7)包括如下步骤：
[0031]步骤3-1、判断客户类型，若是小客户，则执行步骤3-2,否则执行步骤3-4;
[0032]步骤3-2、判断数据量是否在SVM建模方法适应的范围内，若是则分别采用SVM建模方法和随机森林方法构建负荷预测模型，最终选择选择正确率和灵敏度较高的模型输出，方法结束;否则执行步骤3-3;
[0033]步骤3-3、分别采用随机森林方法和AdaBoost建模方法构建负荷预测模型，最终选择正确率和灵敏度较高的模型输出，方法结束；
[0034]步骤3-4、根据数据负荷类别分布情况选择分类方法，当负荷类别分布不平衡即负荷类别的比例小于阈值min_rate时，选择随机森林方法构建负荷预测模型输出，否则在随机森林方法和AdaBoost建模方法中选择模型正确率较高的模型输出。
[0035]优选的，所述步骤3-2中，所述正确率为该分类器正确分类的元组所占的百分比，表达式为：
[0036]
[0037]式中TP是真正例，指被分类器正确分类的正元组，TN是真负例，指被分类其正确分类的负元组，P是正元组数，N是负元组数，accuracy为正确率；
[0038]所述灵敏度为正确识别的正元组的百分比，表达式为：
[0039]
[0040] 式中，sensitivity 为灵敏度。
[0041] 与现有技术相比，本发明的有益效果在于：
[0042] 本发明构造客户聚类模型，对新客户类别进行预测，用客户的类别并结合电力数据的分布，系统可自适应选择负荷预测算法，实现智能电网管理。
[0043] 本发明在负荷数据进行关联性分析，分别提取影响重载和过载的特征，删除无影响的特征，一方面可以解决电力大数据候选属性过多，构造电力负荷模型效率低的问题，另一方面管理者可以根据提取到的特征分析该地区重过载的原因，对发电、输电、配电系统新增容量的大小做出正确的决策，是电力系统管理的现代化手段。
【附图说明】
[0044] 图1是本发明提供的一种基于电力大数据的自适应负荷预测选择方法流程图， [0045]图2是本发明提供的电力数据关联规则挖掘和数据化简的流程图，
[0046] 图3是本发明提供的自适应负荷预测建模流程图。
【具体实施方式】
[0047] 下面结合附图对本发明作进一步详细说明。
[0048] 如图1所示，为本发明提供的一种基于电力大数据的自适应负荷预测选择方法，所述方法包括如下步骤：
[0049] 步骤1、客户类别判断；
[0050] 在进行电力负荷预测的时候由于电力数据中涉及用电用户的地址、行业等敏感信息，客户不方便提供具体的负荷数据。电力负荷数据量大，根据数据去选择合适的负荷预测模型效率低。
[0051] 此时可以根据客户的类别去选择适合的负荷预测模型。因为客户的类别与客户电网数据之间往往存在着密切的关联，如小客户的电力数据量，电力数据的特征数小于大客户的电力数据量和数据特征数。由此可见，相同类别的客户需要的电力负荷预测模型也相似。因此，可以收集客户的特征数据:如客户所在地区信息、该

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：季知祥;李慧芳;朱朝阳;邓春宇;王晓蓉;李浥东;王海波;
技术所有人：中国电力科学研究院;国家电网公司;北京交通大学;国网山东省电力公司电力科学研究院;
我是此专利的发明人

上一篇：一种基于灰色理论的综合计划投入总盘预测方法
上一篇：一种计算机辅助智能调度系统的制作方法