一种基于岭回归的短期负荷预测方法及装置与流程

文档序号:16976273发布日期:2019-02-26 19:01阅读:328来源:国知局
一种基于岭回归的短期负荷预测方法及装置与流程

本发明涉及电力系统负荷预测技术领域,具体涉及一种基于岭回归的短期负荷预测方法及装置。



背景技术:

负荷预测根据历史负荷值确定某预测模型,在满足一定精度的情况下决定未来某特定时刻的负荷值。负荷预测是电力部门进行电力运行研究和配电网规划的重要组成部分,是确保电力系统安全有效和经济运行的根本,是电力规划建设的先决条件;电力网络布局、投资和运行的合理性主要受电力负荷预测的准确程度的影响,电力系统的经济、安全及可靠运行也离不开电力负荷准确预测,因此,提高负荷预测技术水平,有利于电力调度管理,有利于合理安排电网规划建设,有利于提高电力系统的经济效益和社会效益。

负荷预测已成为实现智能电力现代化管理的重要内容。目前电力负荷预测算法大多采用经验法,存在预测准确率不高的问题,此外,随着海量用电数据的大集中,传统的数据分析手段不足以应对海量数据挖掘的需求。因此亟需提供一种基于可靠算法的负荷预测方法以实现对电力系统负荷的高精度预测。



技术实现要素:

本发明提供一种基于岭回归的短期负荷预测方法及装置,其目的是根据的气象相似性指标筛选过的历史气象数据和相应的历史负荷数据确定没有干扰因素的训练样本;并根据筛选出的训练样本基于岭回归算法训练预测模型,从而实现对未来某时间段的电力系统负荷的高精度预测。

本发明的目的是采用下述技术方案实现的:

一种基于岭回归的短期负荷预测方法,所述方法包括:

获取历史日和预测日的气象数据以及历史日的气象数据对应的负荷数据;

根据历史日与预测日的气象数据的相似度指标值矩阵和历史日的气象数据对应的负荷数据确定训练样本;

将预测日的气象数据输入至预测模型,确定预测日的负荷数据,其中,所述预测模型为对训练样本进行岭回归训练获取的。

优选地,所述气象数据包括:温度、湿度、气压、风速数据。

优选地,所述根据历史日与预测日的气象数据的相似度指标值矩阵和历史日的气象数据对应的负荷数据确定训练样本,包括:

根据所述历史日与预测日的气象数据的相似度指标值矩阵确定历史日与预测日的相似系数;

选取所述相似系数中前n大的相似系数所对应的历史日的气象数据及该气象数据对应的负荷数据作为训练样本。

优选地,通过下式确定历史日i与预测日f的气象数据的相似度指标值矩阵rfi:

rfi=[ri1j,ri2j,ri3j,ri4j]t

其中,ri1j为历史日i对预测日f的第j个气象因素的欧氏距离,ri2j为历史日i对预测日第j个气象因素的相关系数,ri3j为对历史日i与预测日的第j个气象因素分别与各自前一日的气象因素值作一阶差分后再求得的欧式距离,ri4j为对历史日i与预测日的第j个气象因素,分别与各自前一日的气象因素值作一阶差分后求得的相关系数,i∈[1,n],j∈[1,m],n为历史日总天数,m为气象数据中气象因素总数;

所述ri1j、ri2j、ri3j和ri4j的公式分别是:

其中,wdi,j,k=wi,j,k-wi-1,j,k,wi,j,k为历史日i第k个时点的第j个气象因素的值,为历史日i的第j个气象因素的均值。

优选地,通过下式确定历史日i与预测日f的相似系数cfi:

cfi=ω1·rfi·ω2

其中,ω1为气象因素权重向量,ω2为气象因素距离指标权重向量。

优选地,对训练样本进行岭回归训练获取所述预测模型包括:

将训练样本中的气象数据作为自变量,所述训练样本中的气象数据对应的负荷数据作为因变量,利用岭回归算法获得预测模型。

进一步地,获得预测模型后利用样本数据评价所述预测模型:

将所述训练样本中各历史日的气象数据作为所述预测模型的输入,获取各历史日的负荷数据预测值;

根据所述各历史日的负荷数据预测值及样本数据中各历史日的气象数据对应的负荷数据,利用评价函数确定所述预测模型对应的均方误差;

若所述均方误差的值小于设定值则所述预测模型合格。

进一步地,通过下式确定所述预测模型对应的均方误差mse:

其中,observedi为样本数据中历史日i的天气数据对应的负荷数据,predictedi为历史日i的负荷数据预测值,n为历史日总天数。

一种基于岭回归的短期负荷预测装置,其特征在于,所述装置包括:

采集单元,用于获取历史日和预测日的气象数据以及历史日的气象数据对应的负荷数据;

确定单元,根据历史日与预测日的气象数据的相似度指标值矩阵和历史日的气象数据对应的负荷数据确定训练样本;

预测单元,用于将预测日的气象数据输入至预测模型,确定预测日的负荷数据,其中,所述预测模型为对训练样本进行岭回归训练获取的。

与现有技术相比,本发明具有如下有益效果:

本发明的方法及装置通过获取历史日和预测日的气象数据以及历史日的气象数据对应的负荷数据;根据历史日与预测日的气象数据的相似度指标值矩阵和历史日的气象数据对应的负荷数据确定训练样本;将预测日的气象数据输入至预测模型确定预测日的负荷数据的技术方案,能够提高短期负荷预测的精度和准确性。

本发明的方法及装置还基于无关样本干扰的训练最终得到更准确的预测模型;具体为:将训练样本中的气象数据作为自变量,所述训练样本中的气象数据对应的负荷数据作为因变量,利用岭回归算法获得预测模型;并根据历史日的负荷数据预测值和对应的负荷数据利用评价函数计算所述预测模型均方误差,确认模型准确度合格才进行负荷预测,保证了预测模型的高精度和负荷预测结果的准确性。

附图说明

图1是本发明一种基于岭回归的短期负荷预测方法的流程图;

图2是本发明实施例中获取训练样本的流程图;

图3是本发明一种基于岭回归的短期负荷预测装置的结构示意图。

具体实施方式

下面结合附图对本发明的具体实施方式作详细说明。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

本领域现有的负荷预测算法大多采用经验法,依据天气预报数据作为样本,存在预测准确率不高的问题,此外,不足以应对海量数据挖掘的需求。

本发明提供一种基于岭回归的短期负荷预测方法,该方法将气象相似系数筛选历史样本数据得到的样本作为训练预测模型的训练样本,利用样本数据评价训练获得的预测模型;基于利用没有无关样本干扰的样本训练获得的训练模型具有更高的精确性;预测模型经评价函数评价后再用于预测未来时间段内的台区负荷数据进一步保证了预测结果的准确度。

如图1所示,所述方法包括:

101.获取历史日和预测日的气象数据以及历史日的气象数据对应的负荷数据;

102.根据历史日与预测日的气象数据的相似度指标值矩阵和历史日的气象数据对应的负荷数据确定训练样本;

103.将预测日的气象数据输入至预测模型,确定预测日的负荷数据,其中,所述预测模型为对训练样本进行岭回归训练获取的。

其中,历史日的气象数据和对应的负荷数据为历史原始数据经过预处理的得到的数据;所述历史原始数据中包括负荷、气象信息、假期、日期等特征数据,通过假期和日期等特征数据能够准确判断历史日相对于预测日的天数;

预处理包括对历史原始数据进行对其和清洗操作;

步骤101中的气象数据包括:温度、湿度、气压、风速数据;

例如:训练样本特征数据如表1:

表1训练样本数据表

具体的,根据有相同天气类型与气象变化情况的日期,并且有相同天气类型与气象变化情况的日期所对的负荷与天气因素、前一天负荷变化情况的也存在相似性,通过寻找对预测日有较高气象相似度的历史日作为训练样本,基于上述训练样本训练预测模型,能够最大程度的排除无关样本对建立预测模型的干扰,从而提高最终预测模型的准确性与针对性。

在上述过程中,对于训练样本,一般是无差别的选择预测日之前的所有日期均选为训练样本,这样训练出的最终模型,缺乏对特定预测日期的针对性。考虑到对于每一个未知负荷具体值的预测日期,其天气情况一般可由气象部门发布的气象预测数据得到,因此针对具体的预测日,可以首先依据气象情况筛选预测所用的训练样本,依据预测日自适应的选择筛选后的训练样本,实现有针对的模型训练,最终得到一个没有无关样本干扰的较准确的预测模型。

具体包括:对于预处理原始数据得到的训练样本,通过天气相似性指标对样本进行筛选,该指标综合考虑了预测日与历史日的气象因素的欧式距离、较前一日的气象变化情况、相关系数等,并包含了温度、湿度、气压、风速等多种气象因素。

具体的,如图2所示,步骤102具体包括:

根据历史日与预测日的气象数据的相似度指标值矩阵确定历史日与预测日的相似系数;

选取所述相似系数中前n大的相似系数所对应的历史日的气象数据及该气象数据对应的负荷数据作为训练样本。

其中,通过下式确定历史日i与预测日f的气象数据的相似度指标值矩阵rfi:

rfi=[ri1j,ri2j,ri3j,ri4j]t

其中,ri1j为历史日i对预测日f的第j个气象因素的欧氏距离,ri2j为历史日i对预测日第j个气象因素的相关系数,ri3j为对历史日i与预测日的第j个气象因素分别与各自前一日的气象因素值作一阶差分后再求得的欧式距离,ri4j为对历史日i与预测日的第j个气象因素,分别与各自前一日的气象因素值作一阶差分后求得的相关系数,i∈[1,n],j∈[1,m],n为历史日总天数,m为气象数据中气象因素总数;

ri1j、ri2j、ri3j和ri4j的公式分别是:

其中,wdi,j,k=wi,j,k-wi-1,j,k,wi,j,k为历史日i第k个时点的第j个气象因素的值,为历史日i的第j个气象因素的均值。

通过下式确定历史日i与预测日f的相似系数cfi:

cfi=ω1·rfi·ω2

其中,ω1为气象因素权重向量,ω2为气象因素距离指标权重向量。

对训练样本进行岭回归训练获取所述预测模型包括:

将训练样本中的气象数据作为自变量,所述训练样本中的气象数据对应的负荷数据作为因变量,利用岭回归算法获得预测模型;

具体的,可以利用多组数据多次进行上述训练操作,对预测模型进行适应性调整和更新。

基于上述步骤,获得预测模型后利用样本数据评价所述预测模型:

将训练样本中各历史日的气象数据作为所述预测模型的输入,获取各历史日的负荷数据预测值;

根据各历史日的负荷数据预测值及样本数据中各历史日的气象数据对应的负荷数据,利用评价函数确定所述预测模型对应的均方误差;若均方误差的值小于设定值则所述预测模型合格;

具体的,通过下式确定预测模型对应的均方误差mse:

其中,observedi为样本数据中历史日i的天气数据对应的负荷数据,predictedi为历史日i的负荷数据预测值,n为历史日总天数。

均方误差是用作最小二乘回归的损失函数,表示所有样本预测值和实际值平方差的平均值。mse评价数据的变化程度,mse的值越小,说明预测模型描述实验数据具有更好的精确度;可多次设定评价函数mse的输入数据重复评价操作,确定最优的预测模型。

图3为本发明实施例的一种基于岭回归的短期负荷预测装置,包括:

采集单元,用于获取历史日和预测日的气象数据以及历史日的气象数据对应的负荷数据;

确定单元,根据历史日与预测日的气象数据的相似度指标值矩阵和历史日的气象数据对应的负荷数据确定训练样本;

预测单元,用于将预测日的气象数据输入至预测模型,确定预测日的负荷数据,其中,所述预测模型为对训练样本进行岭回归训练获取的。

确定单元包括:数据预处理模块、计算模块、数据筛选模块和评价模块;

数据预处理模块,用于预处理历史原始数据,包括:对齐历史原始数据和清洗历史原始数据;

计算模块:用于根据历史日与预测日的气象数据的相似度指标值矩阵确定历史日与预测日的相似系数;

数据筛选模块:用于根据历史日与预测日的相似性系数筛选训练样本;

评价模块:用于利用评价函数确定所述预测模型对应的均方误差,并确定所述预测模型是否合格。

最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1