一种基于大数据技术的电力系统短期负荷预测方法_2

文档序号:8905515阅读:来源:国知局
[0057] 其中,每一天为一个负荷序列,n代表该负荷序列为一个n维向量(通常为96维); dl2代表负荷序列1和负荷序列2的空间距离;该距离中的X化代表第一个负荷序列中的 第k维数据,X化代表第二个负荷序列中的第k维数据;xmax代表所有负荷序列第k维中的 最大值。
[0058] 将待预测日前一年的历史负荷数据作为历史数据集。采用上述应用标准化欧式距 离改进的层次聚类算法,W每天n点的负荷数据形成一个向量,通过计算各个向量之间的 标准化欧式距离,将其由零散分布的独立样本逐渐归为趋势相近的若干类。
[0059] S3同时利用输入历史负荷数据及天气信息及历史日日类型数据采用灰色关联分 析算法找出关键影响因素;
[0060] 本发明采用灰色关联分析算法计算每个因素(如日最高气温,日平均气温,平均 湿度,日类型(星期几)等)的灰色关联度。将预测日前一年的历史负荷数据、气象数据W 及日类型数据集作为分析样本,设定母序列为负荷值,天气因素、日类型为若干子序列。采 用灰色关联分析算法分析各个子序列与母序列的相关性,最后将一年每天的灰色关联度求 均值即可得到各个影响因素的灰色关联度。对灰色关联度进行排序,选定值较大的前4个 作为影响负荷的关键影响因素。
[0061] S4在S2和S3的基础上,利用CART算法生成决策树;
[0062] 在每个节点(除叶节点外)将选用Gini指数最小的关键影响因素,将当前节点的 历史负荷数据集分割为两个子集,直到最后的分类结果与S1中的聚类结果吻合。该过程完 成对历史负荷及关键影响因素数据与聚类结果间禪合关系的学习,能够清楚完善的表征分 类规则。
[0063] S5根据S2的聚类结果N,形成N个历史数据样本集;
[0064] S6保存S4生成决策树表征的分类规则;
[0065] S7根据N个历史数据样本集训练对应的N*96个支持向量机模型(96代表负荷数 据96个采样点,因此每个采样点对应一个支持向量机模型);
[0066] 针对步骤1的分类结果,将每类的负荷数据及相应的关键因素数据构建训练样 本,训练若干个支持向量机模型。在该个过程中,支持向量机的核函数选择RBF核函数,因 为此核函数下需要确定的支持向量机参数有核函数参数5 2,不敏感系数e和惩罚参数C。 参数的寻优方法选用网格寻优法,即穷举法。
[0067] S8根据待预测日的关键影响因素信息形成待预测日关键影响因素向量;
[0068] S9将S8中的向量输入S6中的分类规则中,得出该待预测日所属的类别;
[0069] S10根据S9中待预测日所属的类别,选择S7中对应的模型进行预测;
[0070] S11对目标电网中所有的用户执行上述操作;
[0071] S12对所有用户的预测结果进行求和;
[007引 S13输出求和的预测结果,即是系统负荷。
[0073] W浙江省某市的市级系统负荷预测为例,该市装配220kv级变电站13座,共有用 户120万户。同时该市配备了用电信息采集系统,能够获取每个用户96点/天的等间距负 荷采样点。
[0074] 实施步骤1(对应S1、S2):选定用户#1,用户待预测日前1年的负荷数据,格式如 下:
[00 巧]
[0076] 上述表格中的每一行数据为一个96维的数据样本,利用下式计算两两向量间的 标准化欧式距离:
[0077]
[0078] 根据计算结果合并距离最近的样本,如附图3中所示,该图的最底层为365个历史 负荷数据样本,自顶向上逐步合并,最终归为6类。六种颜色即代表6类,图4为六类负荷 的曲线图。
[0079] 实施步骤2(对应S3);根据历史负荷数据、历史天气因素数据W及日类型数据,采 用灰色关联分析算法找出影响负荷变化的关键影响因素。数据格式如下:
[0080]
[0081] m亥数据表格的前7列为子序列,第8列为母序列,采用w下灰色关联分析算法计 算:
[0082] 将灰色关联分析法应用到影响负荷变化的关键因素确定中去,步骤如下:
[0083] (a)确定规范化属性矩阵;
[0084] 历史负荷数据值为母序列Y= {y。72,…,yp}T,与之对应的关键影响因素为子序列 Xi= {Xii,X2i,…,Xpi}T,则可得到矩阵如下;
[0085]
[0086] 式中P代表有P个样本,q代表有q个待分析的影响因素,X代表因素序列,y代表 负荷序列。
[0087] 化)接下来对A矩阵按列用下式进行均值规范化处理,
[0090]式中,Xik代表第i个因素的第t时刻的值,di代表各个序列的均值化算子,是代 表每列元素的平均值。其中,母序列Y也按照同理规范化处理,记其均值化算子为D。
[0091] (C)A矩阵经过规范化后为:
[0092]
[0093] (d)计算关联系数
[0094] 因素Xi的第t个指标与负荷序列Y的第t个指标之间的关联系数Ci(t)的几何 意义是曲线Xi与曲线Y在t时刻的相对差值,其计算公式如下:
[0095]
[009引式中,Amax为|mk(t)-ei(t)I的最大值,Amin为|mk(t)-ei(t)I的最小值;I化(t)-ei(t)|为t时刻的值。P为分辨系数,其作用在于提高关联系数之间的差异性,一 般在0~1之间选取,通常取P= 0. 5。
[0097] (e)确定关键影响因素排序
[009引在上述关联系数的基础上,可W计算出因素X占负荷Y的关联度为:
[0099]
[0100] 一般情况下,灰色关联度值值在0到1之间。值越接近1,变量X、Y之间的线性 相关程度就越大,的绝对值越接近0,表示X、Y之间越没有线性相关关系;0<r<l,表示X、 Y有相关关系,但是非线性关系;IrI> 0. 6,视为局度关联;0. 2《IrI<0. 6,视为中等相关; IrI<0. 2,视为关联性极弱,可W忽略。
[0101] 通过上述计算,得到用户#1的6个影响因素的灰色关联度如下:
[0102]
[0103] 判定平均降水和平均风速为极弱相关性因素,剩下的最高气温、平均温度、平均湿 度及日类型为影响负荷走势的关键影响因素。
[0104] 实施步骤3 (对应S4、S6);根据用户#1的2012年负荷数据聚类结果及关键影响 因素,利用CART算法生成决策树。数据格式如下:
[0105]
阳1〇引数据格式说明:上表的前4列为实施步骤2中找出的影响用户#1负荷走势的4项 关键影响因素,聚类结果则代表历史负荷曲线在实施步骤1中被聚到了 6类中的哪一类。 [0107] 将该表格的最后一列作为决策树的最终叶节点类型,前面四项关键影响因素数据 作为决策树节点分裂的备选集,在每个节点分类时计算采用哪个属性的何值作为最佳分类 属性,算法如下:
[010引CART决策树是一种二分递归分割技术,其在每个节点(除叶节点外)将当前样本 集分割为两个子集。与采用基于信息论的信息增益法不同,CART算法所采用的属性选择度 量是基巧指数(Giniindex)。基巧指数用来度量训练样本集D的不纯度,假设数据集合D 包含m个类别,那么其基巧指数的计算公式为:
[0109]
[0110] 其中,Pj是j类元素出现的频率。基巧指数需要考虑每个属性的二元划分,假定 属性的二元划分将D划分成Di和D2,则此次在子节点W某属性A划分样本集D的基巧指数 为:
[0111]
[0112] 对于每个属性,考虑每种可能的二元划分,最终选择该属性产生的最小基巧指数 的子集作为其分裂子集。因此,由上式可知在属性A上的基巧指数Gini^D)越小,则表示在 属性A上的划分效果越好。在此规则下,由上至下不断分裂,直到整棵决策树生长完成。保 存该棵决策树,即为其分类规则。
[011引实施步骤4(对应S5、S7);
[0114]实施步骤4可与实施步骤2同
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1