一种住宅日用电负荷预测方法和设备与流程

文档序号:20837493发布日期:2020-05-22 17:03阅读:219来源:国知局
一种住宅日用电负荷预测方法和设备与流程

本发明涉及用电负荷技术领域,特别是指一种住宅日用电负荷预测方法和设备。



背景技术:

智能用电是构建坚强智能电网的重要支柱和主要环节之一,是实现坚强智能电网的基础。依托坚强电网和现代管理理念,利用高级量测、高效控制、高速通信、快速储能等技术,实现市场响应迅速、计量公正准确、数据采集实时、收费方式多样、服务高效便捷,构建电网与客户能量流、信息流、业务流实时互动的新型供用电关系。

目前对住宅用户用电负荷的预测多是采用传统的统计学的方法,例如,通过统计特定小区的某一时间段的用电负荷数据,绘制出此小区在这一时间段的用电负荷曲线,然后采用曲线拟合和误差分析相结合的方法,预测小区的住宅用户用电负荷。

本申请的发明人在研究住宅用户用电负荷时发现,住宅用户用电负荷变化不同于工厂、学校或一些聚合级别的负荷,存在巨大的不确定性,同时规律性也较低。采用传统统计的方法对住宅用户用电负荷进行预测,预测的精度较低。



技术实现要素:

有鉴于此,本发明的目的在于提出一种住宅日用电负荷预测方法和设备,以提高对住宅用户用电负荷预测的预测精度。

基于上述目的本发明提供的一种住宅日用电负荷预测方法,包括,

获取住宅用电负荷和自然环境数据;

将获取的用电负荷数据按时间段分割成多个数据集;

基于数据集构建卷积自编码器,并采用卷积自编码器对所述数据集进行编码处理,得到数据集的特征向量;

基于数据集的特征向量构建特征向量预测模型,并采用特征向量预测模型对数据集的特征向量进行预测处理,得到所述数据集的预测特征向量;

采用卷积自编码器对数据集的预测特征向量进行解码处理,得到预测数据集。

可选的,所述基于数据集构建卷积自编码器,并采用卷积自编码器对所述数据集进行编码处理,得到数据集的特征向量,包括:

将数据集进行随机组合,得到组合数据集,将所述组合数据集分割为编码器训练集和编码器验证集;

建立包括编码器和解码器的卷积自编码器模型;

将编码器训练集中的数据输入到卷积自编码器模型,对卷积自编码器模型进行迭代训练至收敛;得到训练的卷积自编码器模型;

采用编码器验证集中的数据对训练的卷积自编码器模型进行验证;

采用验证有效的卷积自编码器模型对所述数据集进行编码处理,得到数据集的特征向量。

可选的,所述建立包括编码器和解码器的卷积自编码器模型中,卷积自编码器模型的模型深度为编码器5层、解码器5层,卷积核为3,每一层的卷积核数量为16;每一层设置批标准化参数,激活函数采用非线性整流单元;编码器的第2层和第4层之后设置最大池化层,解码器的第2层和第4层之后设置上采样层,上采样采用等值复制方法;编码器的输出为特征向量,长度为24。

可选的,所述基于数据集的特征向量构建特征向量预测模型,并采用特征向量预测模型对数据集的特征向量进行预测处理,得到所述数据集的预测特征向量,包括:

将数据集的特征向量按不同住宅分开,得住宅特征向量;

将住宅特征向量转化为预测可用数据,并按时间先后顺序,将预测可用数据分为训练集、验证集和测试集;

构建特征向量预测模型;

分别采用训练集和验证集对特征向量预测模型进行训练和验证,至特征向量预测模型收敛,得到训练的特征向量预测模型;

将测试集数据输入到训练的特征向量预测模型中,得到所述数据集的预测特征向量。

可选的,所述将住宅特征向量转化为预测可用数据中,所述预测可用数据包括住宅的一个数据集的特征向量,此数据集之前的连续n个数据集的特征向量,这n+1个数据集的自然环境数据。

可选的,所述将预测可用数据分为训练集、验证集和测试集是按照08:0.1:0.1的比例将预测可用数据分为训练集、验证集和测试集。

可选的,所述采用卷积自编码器对数据集的预测特征向量进行解码处理,得到预测数据集后,还包括:采用平均反正切绝对值百分比误差对日用电负荷预测曲线和真实日用电负荷曲线进行误差分析,所述平均反正切绝对值百分比误差满足如下计算公式:

其中,maape是平均反正切绝对值百分比误差,n是测试集中特征向量的数量,t是智能电表一天采集的次数,a是一个时刻用电负荷的真实值,f是一个时刻负荷的预测值。

可选的,所述获取住宅用电负荷和自然环境数据,包括,

获取多个住宅多年的用电负荷数据和对应的当地每天的最高温度和最低温度数据;

对获取的用电负荷数据进行剔除异常、删除冗余和填充缺失的处理。

一种住宅日用电负荷预测的设备,包括,

获取模块:用于获取住宅用电负荷和自然环境数据;

处理模块,用于对获取的用电负荷数据进行处理,同时将处理后的用电负荷数据分割成多个数据集;

构建模块:用于基于数据集构建卷积自编码器和基于数据集特征向量构建特征向量预测模型;

编码模块:用于对数据集进行编码处理,得到数据集的特征向量;

预测模块:用于对数据集的特征向量进行预测处理,得到数据集预测的特征向量;

解码模块:用于对数据集的预测的特征向量进行解码处理,得到预测数据集;

分析模块:用于对预测数据集和真实数据之间进行误差分析。

从上面所述可以看出,本发明提供的一种住宅日用电负荷预测方法,首先采用卷积自编码器提取用户行为特征作为特征向量,再利用历史日特征向量预测用户当日的特征向量,最后用解码器重构预测得到的特征向量,最终得到预测的数据集,通过利用卷积自编码器提取住宅用电负荷数据集的特征,形成特征向量,捕获了用户的行为特征,并对特征向量的每日变化做出预测,而不是对每个时刻进行预测,更符合单个住宅的用电行为习惯的特性,有效提升了单个住宅每日负荷预测的精度。

同时通过平均反正切绝对值百分比误差分析,本发明预测误差相对于传统的预测误差下降了28.6%,本发明方法有效降低住宅每日负荷预测的误差,提高预测精度。

附图说明

图1为本发明实施例住宅日用电负荷预测方法流程图;

图2为本发明实施例住宅日用电负荷预测设备内部结构框图。

具体实施方式

为下面通过对实施例的描述,本发明的具体实施方式如所涉及的制造工艺及操作使用方法等,作进一步详细的说明,以帮助本领域技术人员对本发明的发明构思、技术方案有更完整、准确和深入的理解。

可知的是,现有技术中通过统计特定小区的某一时间段的用电负荷数据,绘制出此小区在这一时间段的用电负荷曲线,然后采用曲线拟合和误差分析相结合的方法,预测小区的住宅用户用电负荷。该预测方法由于忽略了住宅用户用电负荷变化的不确定性导致预测的精度较低。

为了解决预测精度低的问题,本申请的发明人研究发现,住宅用户的行为特征是提供小区的住宅用户用电负荷预测精度的关键因素,因此本申请提供了一种住宅日用电负荷预测方法,包括,

获取住宅用电负荷和自然环境数据;

将获取的用电负荷数据按时间段分割成多个数据集;

基于数据集构建卷积自编码器,并采用卷积自编码器对所述数据集进行编码处理,得到数据集的特征向量;

基于数据集的特征向量构建特征向量预测模型,并采用特征向量预测模型对数据集的特征向量进行预测处理,得到所述数据集的预测特征向量;

采用卷积自编码器对数据集的预测特征向量进行解码处理,得到预测数据集。

首先采用卷积自编码器提取用户行为特征作为特征向量,再利用历史日特征向量预测用户当日的特征向量,最后用解码器重构预测得到的特征向量,最终得到预测的数据集,通过利用卷积自编码器提取住宅用电负荷数据集的特征,形成特征向量,捕获了用户的行为特征,并对特征向量的每日变化做出预测,而不是对每个时刻进行预测,更符合单个住宅的用电行为习惯的特性,有效提升了单个住宅每日负荷预测的精度。

本申请实施例提供的一种住宅日用电负荷预测方法,流程如图1所示,包括如下步骤。

步骤101:获取住宅用电负荷和自然环境数据。

一种实施例中,步骤101可以包括获取多个住宅多年的用电负荷数据和对应的当地每天的最高温度和最低温度数据;对获取的用电负荷数据进行剔除异常、删除冗余和填充缺失的处理。

举例来说,

(1)针对某地区的住宅用户,获取了800个住宅5年的智能电表数据,数据为每15分钟获取一次,因此一个住宅一天会产生96个点的负荷数据,同时获取了这5年内当地每天的最高温度和最低温度数据;

(2)执行坏数据探测,首先计算一个用户的历史负荷的均值和标准差,将此用户负荷值大于均值加5倍标准差或小于0的数据定义为坏数据。探测结果发现,近50户数据存在异常,将异常数据剔除,因此可用数据剩余750户;

(3)执行冗余数据删除,将用户日数据点超出96个点的数据的超出部分进行删除处理;

(4)执行缺失数据填充,采用插值方式对用户日数据点少于96个点的数据进行填充。

通过预处理后,留存下来的数据即为后续预测所需的数据。

步骤102:将获取的用电负荷数据按时间段分割成多个数据集。

一种实施例中,步骤102可以包括将经过预处理后的每个住宅的历史用电负荷数据按日分割为包含日用电负荷点,由日用电负荷点构成日用电负荷曲线数据集,5年一共有1826日,日用电负荷曲线包含96个点,一共是750个住宅的日用电负荷曲线。

步骤103:基于数据集构建卷积自编码器,并采用卷积自编码器对所述数据集进行编码处理,得到数据集的特征向量。

一种实施例中,步骤103可以包括将数据集进行随机组合,得到组合数据集,将所述组合数据集分割为编码器训练集和编码器验证集;

建立包括编码器和解码器的卷积自编码器模型;

将编码器训练集中的数据输入到卷积自编码器模型,对卷积自编码器模型进行迭代训练至收敛;得到训练的卷积自编码器模型;

采用编码器验证集中的数据对训练的卷积自编码器模型进行验证;

采用验证有效的卷积自编码器模型对所述数据集进行编码处理,得到数据集的特征向量。

举例来说,

(1)将步骤102分割后的全部数据集中750个住宅的日用电负荷曲线随机组合,得到组合数据集,再按随机顺序将组合数据集分割为编码器训练集和编码器验证集,对应的比例为90%和10%;

(2)包括编码器和解码器的卷积自编码器模型,模型深度为编码器5层、解码器5层,为了防止梯度消失,每一层都设置了批标准化,激活函数采用非线性整流单元,卷积核为3;每一层的卷积核数量为16,编码器部分的第2层和第4层之后设置了最大池化层,对应的解码器部分的第2层和第4层之后设置了上采样层,上采样采用等值复制方法;编码器的输出为特征向量,长度为24;

(3)按每批次128个将编码器训练集中的日用电负荷曲线输入到卷积自编码器模型,采用提前停止策略训练卷积自编码器,若卷积自编码器的重构误差在100批之内不再缩小,则停止训练,并保存卷积自编码器的结构和参数;得到训练的卷积自编码器模型;

(4)将过拟合门槛定为验证误差是训练误差的2倍,将编码器验证集中的日用电负荷曲线输入到训练卷积自编器中进行验证,编码器验证集的验证结果显示验证误差是训练误差的1.5倍,在过拟合门槛设定的范围内,因此,训练的卷积自编码器模型有效;

(5)采用验证有效的卷积自编码器模型对步骤102分割后的全部数据集进行编码处理,卷积自编码器模型的编码器输出每个用户每天的特征向量,因此共生成750×1826=1369500个特征向量。

完成了对用户用电行为特征向量的提取。

步骤104:基于数据集的特征向量构建特征向量预测模型,并采用特征向量预测模型对数据集的特征向量进行预测处理,得到所述数据集的预测特征向量。

一种实施例中,步骤104可以包括:将数据集的特征向量按不同住宅分开,得住宅特征向量;

将住宅特征向量转化为预测可用数据,并按时间先后顺序,将预测可用数据分为训练集、验证集和测试集;将住宅特征向量转化为预测可用数据中,所述预测可用数据包括住宅的一个数据集的特征向量,此数据集之前的连续n个数据集的特征向量,这n+1个数据集的自然环境数据;将预测可用数据分为训练集、验证集和测试集是按照08:0.1:0.1的比例将预测可用数据分为训练集、验证集和测试集;

构建特征向量预测模型;

分别采用训练集和验证集对特征向量预测模型进行训练和验证,至特征向量预测模型收敛,得到训练的特征向量预测模型;

将测试集数据输入到训练的特征向量预测模型中,得到所述数据集的预测特征向量。

举例来说,

(1)将步骤103生成的全部特征向量按不同住宅分开,每个用户共有1826个日特征向量,即为住宅特征向量;

(2)将一个住宅的一天的特征向量当作被预测向量,住宅这一天之前的15个连续日的特征向量当作特征向量预测模型的输入数据,同时加入这16日的最高温度和最低温度,生成一条预测可用数据,采用此方法将一个用户所有天的特征向量都转化为预测可用数据,将预测可用数据按时间先后顺序,分为训练集、验证集和测试集,对应的比例为80%,10%和10%。

(3)采用长短期记忆网络(lstm)进行预测模型的建立,lstm在循环单元中引入了多种门结构,其计算如下:

it=σ(wi·[ht-1,xt]+bi)

ft=σ(wf·[ht-1,xt]+bf)

ot=σ(wo·[ht-1,xt]+bo)

ht=ot*tanh(ct)

这里it、ft和ot分别是输入门、遗忘门和输出门。ct是单元状态,代表候选的单元状态,it决定是否将其更新到单元状态ct中。单元状态帮助模型更好的传递梯度信息。w和b是单元中的参数和偏置。通过将输入序列{x1,x2,…,xn}输入到lstm中,得到一列对应的隐藏状态{h1,h2,…,hn}。这些隐藏状态作为序列的特征表示,用于生成输出,同时作为下一个循环的输入。

设置如下:单元深度为3,隐层神经元数量为64,遗忘门偏置初始化为1,其他参数采用服从(0,0.1)正态分布的随机初始化。每个时刻的输入是当日的特征向量,输出是当日的特征向量的预测值,输入的批次数为16。损失函数采用均方误差。

(4)将训练集中数据输入预测模型进行训练,并使用验证集进行验证,若模型收敛则停止训练。

采用adam优化算法结合学习率衰减加速收敛:adam算法自动调整学习率加速学习;若训练50批次没有出现新的验证集误差下降,则学习率衰减到当前值的0.1;若在100批次之内没有出现新的验证集误差下降,则判断为lstm模型收敛,停止训练。

(5)将测试集中数据输入训练的特征向量预测模型中,生成预测的每日特征向量,这里每个用户得到182天的预测的特征向量。

步骤105:采用卷积自编码器对数据集的预测特征向量进行解码处理,得到预测数据集,包括:将预测得到的日特征向量输入到训练的卷积自编码器的解码器中,通过解码得到预测数据集,即当日用电负荷预测曲线。

为了验证本发明实施例提供的住宅日用电负荷预测曲线和真实情况的当日负荷曲线之间的误差,采用平均反正切绝对值百分比误差(maape)进行误差分析,本实施例将maape的阀值定在0.5,平均反正切绝对值百分比误差满足如下计算公式:

其中,n是测试集中特征向量的数量,t是智能电表一天采集的次数,a是一个时刻用电负荷的真实值,f是一个时刻负荷的预测值。

采用本发明实施例提供的预测方法得到的多用户平均的maape为0.34,在阀值以内,因此本实施的步骤成功完成。对比传统的arima和svr算法的maape分别为0.51和0.46,本实施例得到的maape分别降低了32.7%和26.4%,由此可知,本发明实施例的方法有效降低了单个住宅每日负荷预测的误差,提升了预测精度。

基于上述的方法,本发明实施例提供的一种住宅日用电负荷预测的设备,内部结构框图如图2所示:包括获取模块201,处理模块202,构建模块203,编码模块204,预测模块205,解码模块206,分析模块207。

获取模块201用于获取住宅用电负荷和自然环境数据,具体的获取模块201获取800个住宅5年的智能电表数据,数据为每15分钟获取一次,同时获取了这5年内当地每天的最高温度和最低温度数据。

处理模块202,用于对获取的用电负荷数据进行处理,同时将处理后的用电负荷数据分割成多个数据集;具体的处理模块202将异常数据剔除,用户日数据点超出96个点的数据的超出部分进行删除处理;采用插值方式对用户日数据点少于96个点的数据进行填充。

构建模块203,用于基于数据集构建卷积自编码器和基于数据集特征向量构建特征向量预测模型,具体的构建模块203构建编码器和解码器的卷积自编码器模型,模型深度为编码器5层、解码器5层,为了防止梯度消失,每一层都设置了批标准化,激活函数采用非线性整流单元,卷积核为3;每一层的卷积核数量为16,编码器部分的第2层和第4层之后设置了最大池化层,对应的解码器部分的第2层和第4层之后设置了上采样层,上采样采用等值复制方法;编码器的输出为特征向量,长度为24。

编码模块204,用于对数据集进行编码处理,得到数据集的特征向量,具体的编码模块204采用验证有效的卷积自编码器模型对步骤102分割后的全部数据集进行编码处理,卷积自编码器模型的编码器输出每个用户每天的特征向量。

预测模块205,用于对数据集的特征向量进行预测处理,得到数据集预测的特征向量;具体的预测模块205,用于将数据集的特征向量按不同住宅分开,得住宅特征向量;

将住宅特征向量转化为预测可用数据,并按时间先后顺序,将预测可用数据分为训练集、验证集和测试集;将住宅特征向量转化为预测可用数据中,所述预测可用数据包括住宅的一个数据集的特征向量,此数据集之前的连续n个数据集的特征向量,这n+1个数据集的自然环境数据;将预测可用数据分为训练集、验证集和测试集是按照08:0.1:0.1的比例将预测可用数据分为训练集、验证集和测试集;

构建特征向量预测模型;

分别采用训练集和验证集对特征向量预测模型进行训练和验证,至特征向量预测模型收敛,得到训练的特征向量预测模型。

解码模块206,用于对数据集的预测的特征向量进行解码处理,得到预测数据集;具体的解码模块206用于采用卷积自编码器对数据集的预测特征向量进行解码处理,得到预测数据集。

分析模块207,用于对预测数据集和真实数据之间进行误差分析,具体的分析模块207用于采用平均反正切绝对值百分比误差对日用电负荷预测曲线和真实日用电负荷曲线进行误差分析。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。

本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1