一种基于大数据的短期负荷预测平台的制作方法_2

文档序号：9453525阅读：来源：国知局

j2,x.j3)处进行负荷雨、》1 .
[0050]
[0051]
[0052]
[0053] 其中：ly为负荷预测值，Lj为负荷实际值。
[0054] 5K.令j=j+1，若j彡48,转步骤5B，否则转步骤6。
[0055] 步骤6、参数调节控制：
[0056] 6A?计算日负荷准确率：
[0057]
[0058] 6B?修改K值：令K=constant+AK,AK为自定义步长，若.反玄n为训练样本个数，执行步骤5中的5B至5K;否则转步骤6C;
[0059] 6C.选择最高日负荷预测准确率A所对应的K值为最终局部加权线性回归算法的 KNN对应值，得到最终局部加权回归曲线方程，用以负荷预测。
[0060] (三）结果可视化模块
[0061] 预测平台预测结果的具体展现层，用于显示负荷预测结果。
[0062] (四）用户管理模块
[0063] 提供密码管理、用户组管理和用户管理功能。
[0064] 与现有技术相比，本发明的有益效果是：
[0065] ①传统负荷预测系统处理的数据规模较小，当数据量剧增时无法处理，本预测平台能够处理海量用电数据；②传统负荷预测系统多数使用关系型数据库，只能存储结构化数据，本预测平台能存储与处理影响负荷变化的多种结构类型数据，为负荷预测提供更全面的数据分析基础；③传统负荷预测系统预测速度较低，本预测平台实现并行化负荷预测，提高了预测速度，利于实现实时负荷预测；④本负荷预测平台具有可扩展性，以Hadoop集群为架构，可方便增加节点，存储与计算能力增强。
【附图说明】
[0066] 图1是以Hadoop集群为架构的基于大数据的短期负荷预测平台图。
[0067] 图2是局部加权线性回归短期负荷预测流程图。
[0068] 图3是局部加权线性回归Mapreduce化的Map函数流程图。
[0069] 图4是局部加权线性回归Mapreduce化的Reduce函数流程图。
【具体实施方式】
[0070] 下面结合附图对本发明作进一步说明，但不应以此限制本发明的保护范围。
[0071] 图1为以Hadoop集群为架构的基于大数据的短期负荷预测平台图，它由数据整合层、负荷预测层、结果可视化层以及用户管理构成，其中数据整合层包括数据加载、数据存储、多级综合索引、数据处理模块。数据整合层实现从负荷相关的数据采集与加载、数据存储到最后的数据处理的完全化数据处理流程，为之后的精细化负荷预测奠定准确、丰富的数据基础；负荷预测层是平台的核心部分，通过将局部加权线性回归算法Mapreduce化实现并行化负荷预测；结果可视化层是平台预测结果的具体展现层，将实时分析技术动态呈现；用户管理层是平台的安全机制层，实现平台安全、可靠、高效地运行。
[0072] 图2为局部加权线性回归短期负荷预测流程图，是负荷预测层的具体实施步骤，包括以下步骤1至步骤6 ;图3是局部加权线性回归Mapreduce化的Map函数流程图，包括以下步骤步骤3与步骤4 ;图4是局部加权线性回归Mapreduce化的Reduce函数流程图，包括步骤5与步骤6。
[0073] 步骤1、选取实验数据特征值：根据负荷周期性分析理论、相似性分析理论以及影响负荷的因素相关性分析，选取历史负荷数据、历史气象数据、周属性信息、预测日数据作为实验数据，影响负荷的特征值选取为每日时刻、日平均气温、星期属性。
[0074] 历史负荷数据可由EMS系统中采集；历史气象数据可由预测地区的气象局采集得到。
[0075] 步骤2、构造实验样本训练集、测试集：应用多元局部加权线性回归模型进行负荷预测，要得到负荷1与影响因素x之间的关系需要构造训练集和测试集，根据步骤1中选取的影响负荷的特征值属性进行训练集、测试集的构造，构造形式：
[0076] 【时刻Xl，气温x2,星期属性xj
[0077] 时刻x1:每日每隔30分钟采样负荷数据，一天共48个时刻，表示如下：
[0078]
[0079] 气温x2:日平均气温
[0080] 星期属性x3:用数字1至7表示星期一至星期日。
[0081] 预测方式：日前负荷预测，训练样本为待预测日前两年每日每30分钟的负荷数据，用以预测待预测日每30分钟的负荷，即测试样本为待预测日每30分钟的数据。
[0082]最终的训练集：（xu，xi2,xi3, 1;)，i= 1，2, ???，n，对变量xu，xi2,xi3, 1;作n次观察，得到n个训练样本。
[0083]最终的测试集：（x_n，x_j2,x_j3)，j= 1，2,…，48,共48个待预测负荷点。
[0084] 步骤3、实验数据加载：实验训练集与测试集文件被Hadoop集群自主分成若干个数据块，存放于分布式文件系统HDFS中。
[0085] 建立输入流对象，将HDFS中的训练集文本文件输入到Stream中以获得HDFS实例，逐行读取训练集文本文件，进行类别转换并记为：traindata[i] = (xu，xi2,xi3),L[i] =込，i= 1，2,…，n，n为训练样本个数。测试集文本文件则在Map过程中输入。
[0086] 步骤4、实现Map过程：实现KNN算法中所有待预测点与所有样本点之间的距离计算。输入为测试集文本文件，记为testdata[j] = ^4243)，」=1，2，*"，111。具体实现步骤为：
[0087] 4A.定义Map函数输出值及其类型；
[0088] 4B?将测试集文本进行类型转换；
[0089] 4C.计算第j个测试样本与第i个训练样本之间的距离distance[j][i]::
[0090]
[0091]i= 1，2,…n为训练样本个数，j= 1，2,…48为测试样本个数
[0092]4D?定义Map函数输出键值对〈key,value〉：key=testdata[j]，value= distance[j] [i]〇
[0093] 步骤5、实现Reduce过程：输入为Map函数输出的键值对〈key,value〉，输出为负荷预测结果。具体实现步骤为：
[0094] 5A?定义K值：K=constant,令j= 1;
[0095] 5B.读取测试样本testdata[j] =x.j= (x.jpx.jrx.p)，distance[j] [i]，i= 1，2,... n；
[0096] 5C?对读取的testdata[j]与distance[j] [i]键值对进行类型转换；
[0097] 5D.将distance[j] [i]升序排歹(J，选择前K个最小距离并记为：d[j] [1]、d[j]
[2]、…、d[j] [K];
[0098] 5E?记前K个最小距离对应训练样本为traindata_k[s] = (xsl，xs2,xs3)，L_k[s] =ls,s= 1, 2, ???,K；
[0099] 5F.计算ro中选出的K个点的权重：
[0100]
[0101] 5G.确定特征值矩阵X、因变量矩阵L、权矩阵W(Xj):
[0102]
[0103] ff(Xj) = diagtw^Xj), w2(Xj), ??? wK(Xj)]
[0104] 5H.采用加权最小二乘法求得在自变量Xl处得曲线参数估计值：
[0105]
[0106] 51.构造局部加权线性回归方程，在自变量testdata[j] =x_j=(x_n，x_j2,x_j3)处进行负荷预测：
[0107]
[0108]
[0109]
[0110] 其中：!/为负荷预测值，L#负荷实际值。
[0111] 5K?令j=j+1，若j彡48,转步骤5B，否则转步骤6。
[0112] 步骤6、参数调节控制：
[0113] 6A?计算日负荷准确率：
[0114]
[0115] 6B?修改K值：令K=constant+AK,AK为自定义步长，若尺<n为训练样本个数，执行步骤5中的5B至5K;否则转步骤6C;
[0116] 6C.选择最高日负荷预测准确率A所对应的K值为最终局部加权线性回归算法的 KNN对应值，得到最终局部加权回归曲线方程，用以负荷预测。
[0117] 通过以上模块与具体实施步骤，可得到以Hadoop集群为架构的基于大数据的短期负荷预测平台，还可进一步改

完整全部详细技术资料下载

当前第2页1 2 3