一种基于大数据的短期负荷预测平台的制作方法_2

文档序号:9453525阅读:来源:国知局
j2,x.j3)处 进行负荷雨、》1 .
[0050]
[0051]
[0052]
[0053] 其中:ly为负荷预测值,Lj为负荷实际值。
[0054] 5K.令j=j+1,若j彡48,转步骤5B,否则转步骤6。
[0055] 步骤6、参数调节控制:
[0056] 6A?计算日负荷准确率:
[0057]
[0058] 6B?修改K值:令K=constant+AK,AK为自定义步长,若.反玄n为训练样本 个数,执行步骤5中的5B至5K;否则转步骤6C;
[0059] 6C.选择最高日负荷预测准确率A所对应的K值为最终局部加权线性回归算法的 KNN对应值,得到最终局部加权回归曲线方程,用以负荷预测。
[0060] (三)结果可视化模块
[0061] 预测平台预测结果的具体展现层,用于显示负荷预测结果。
[0062] (四)用户管理模块
[0063] 提供密码管理、用户组管理和用户管理功能。
[0064] 与现有技术相比,本发明的有益效果是:
[0065] ①传统负荷预测系统处理的数据规模较小,当数据量剧增时无法处理,本预测平 台能够处理海量用电数据;②传统负荷预测系统多数使用关系型数据库,只能存储结构化 数据,本预测平台能存储与处理影响负荷变化的多种结构类型数据,为负荷预测提供更全 面的数据分析基础;③传统负荷预测系统预测速度较低,本预测平台实现并行化负荷预测, 提高了预测速度,利于实现实时负荷预测;④本负荷预测平台具有可扩展性,以Hadoop集 群为架构,可方便增加节点,存储与计算能力增强。
【附图说明】
[0066] 图1是以Hadoop集群为架构的基于大数据的短期负荷预测平台图。
[0067] 图2是局部加权线性回归短期负荷预测流程图。
[0068] 图3是局部加权线性回归Mapreduce化的Map函数流程图。
[0069] 图4是局部加权线性回归Mapreduce化的Reduce函数流程图。
【具体实施方式】
[0070] 下面结合附图对本发明作进一步说明,但不应以此限制本发明的保护范围。
[0071] 图1为以Hadoop集群为架构的基于大数据的短期负荷预测平台图,它由数据整合 层、负荷预测层、结果可视化层以及用户管理构成,其中数据整合层包括数据加载、数据存 储、多级综合索引、数据处理模块。数据整合层实现从负荷相关的数据采集与加载、数据存 储到最后的数据处理的完全化数据处理流程,为之后的精细化负荷预测奠定准确、丰富的 数据基础;负荷预测层是平台的核心部分,通过将局部加权线性回归算法Mapreduce化实 现并行化负荷预测;结果可视化层是平台预测结果的具体展现层,将实时分析技术动态呈 现;用户管理层是平台的安全机制层,实现平台安全、可靠、高效地运行。
[0072] 图2为局部加权线性回归短期负荷预测流程图,是负荷预测层的具体实施步骤, 包括以下步骤1至步骤6 ;图3是局部加权线性回归Mapreduce化的Map函数流程图,包括 以下步骤步骤3与步骤4 ;图4是局部加权线性回归Mapreduce化的Reduce函数流程图, 包括步骤5与步骤6。
[0073] 步骤1、选取实验数据特征值:根据负荷周期性分析理论、相似性分析理论以及影 响负荷的因素相关性分析,选取历史负荷数据、历史气象数据、周属性信息、预测日数据作 为实验数据,影响负荷的特征值选取为每日时刻、日平均气温、星期属性。
[0074] 历史负荷数据可由EMS系统中采集;历史气象数据可由预测地区的气象局采集得 到。
[0075] 步骤2、构造实验样本训练集、测试集:应用多元局部加权线性回归模型进行负荷 预测,要得到负荷1与影响因素x之间的关系需要构造训练集和测试集,根据步骤1中选取 的影响负荷的特征值属性进行训练集、测试集的构造,构造形式:
[0076] 【时刻Xl,气温x2,星期属性xj
[0077] 时刻x1:每日每隔30分钟采样负荷数据,一天共48个时刻,表示如下:
[0078]
[0079] 气温x2:日平均气温
[0080] 星期属性x3:用数字1至7表示星期一至星期日。
[0081] 预测方式:日前负荷预测,训练样本为待预测日前两年每日每30分钟的负荷数 据,用以预测待预测日每30分钟的负荷,即测试样本为待预测日每30分钟的数据。
[0082]最终的训练集:(xu,xi2,xi3, 1;),i= 1,2, ???,n,对变量xu,xi2,xi3, 1;作n次观 察,得到n个训练样本。
[0083]最终的测试集:(x_n,x_j2,x_j3),j= 1,2,…,48,共48个待预测负荷点。
[0084] 步骤3、实验数据加载:实验训练集与测试集文件被Hadoop集群自主分成若干个 数据块,存放于分布式文件系统HDFS中。
[0085] 建立输入流对象,将HDFS中的训练集文本文件输入到Stream中以获得HDFS实 例,逐行读取训练集文本文件,进行类别转换并记为:traindata[i] = (xu,xi2,xi3),L[i] =込,i= 1,2,…,n,n为训练样本个数。测试集文本文件则在Map过程中输入。
[0086] 步骤4、实现Map过程:实现KNN算法中所有待预测点与所有样本点之间的距离计 算。输入为测试集文本文件,记为testdata[j] = ^4243),」=1,2,*",111。具体实现 步骤为:
[0087] 4A.定义Map函数输出值及其类型;
[0088] 4B?将测试集文本进行类型转换;
[0089] 4C.计算第j个测试样本与第i个训练样本之间的距离distance[j][i]::
[0090]
[0091]i= 1,2,…n为训练样本个数,j= 1,2,…48为测试样本个数
[0092]4D?定义Map函数输出键值对〈key,value〉:key=testdata[j],value= distance[j] [i]〇
[0093] 步骤5、实现Reduce过程:输入为Map函数输出的键值对〈key,value〉,输出为负 荷预测结果。具体实现步骤为:
[0094] 5A?定义K值:K=constant,令j= 1;
[0095] 5B.读取测试样本testdata[j] =x.j= (x.jpx.jrx.p),distance[j] [i],i= 1,2,... n;
[0096] 5C?对读取的testdata[j]与distance[j] [i]键值对进行类型转换;
[0097] 5D.将distance[j] [i]升序排歹(J,选择前K个最小距离并记为:d[j] [1]、d[j]
[2]、…、d[j] [K];
[0098] 5E?记前K个最小距离对应训练样本为traindata_k[s] = (xsl,xs2,xs3),L_k[s] =ls,s= 1, 2, ???,K;
[0099] 5F.计算ro中选出的K个点的权重:
[0100]
[0101] 5G.确定特征值矩阵X、因变量矩阵L、权矩阵W(Xj):
[0102]
[0103] ff(Xj) = diagtw^Xj), w2(Xj), ??? wK(Xj)]
[0104] 5H.采用加权最小二乘法求得在自变量Xl处得曲线参数估计值:
[0105]
[0106] 51.构造局部加权线性回归方程,在自变量testdata[j] =x_j=(x_n,x_j2,x_j3)处 进行负荷预测:
[0107]
[0108]
[0109]
[0110] 其中:!/为负荷预测值,L#负荷实际值。
[0111] 5K?令j=j+1,若j彡48,转步骤5B,否则转步骤6。
[0112] 步骤6、参数调节控制:
[0113] 6A?计算日负荷准确率:
[0114]
[0115] 6B?修改K值:令K=constant+AK,AK为自定义步长,若尺<n为训练样本 个数,执行步骤5中的5B至5K;否则转步骤6C;
[0116] 6C.选择最高日负荷预测准确率A所对应的K值为最终局部加权线性回归算法的 KNN对应值,得到最终局部加权回归曲线方程,用以负荷预测。
[0117] 通过以上模块与具体实施步骤,可得到以Hadoop集群为架构的基于大数据的短 期负荷预测平台,还可进一步改
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1