基于深度LSTM神经网络的电网负荷预测方法与流程

文档序号:15217929发布日期:2018-08-21 17:04阅读:503来源:国知局

本发明涉及电网负荷预测技术领域,特别涉及一种基于深度lstm神经网络的电网负荷预测方法。



背景技术:

对于电网负荷的预测,是保证电网安全可靠运行、减少电网经济损失的关键所在,提高负荷预测的精度多年来一直是人们研究的重点。由于电网内部能源种类多样,能源利用方式也各有不同,因此导致电网负荷数据波动性、随机性较大,造成负荷预测精度较低,很难准确拟合负荷数据的分布。

针对负荷预测目前已有许多预测方法,然而随着电网智能化速度的不断加快,数据量的增大以及数据的波动性、随机性等使得传统的负荷预测方法越来越不能满足实际应用的需求。机器学习理论和应用的日渐成熟,不少学者将机器学习的算法应用于对负荷的预测之中,相比于传统的预测方法,机器学习方法能够更好的处理负荷数据的波动性、随机性等问题,在一定程度上提高了对电网负荷预测的精度,使得人们在电网的管理和调度上提供了一定的依据。

然而,目前的负荷预测应用,大多需要在构建模型之前,对预测样本进行筛选,利用相似性筛选出训练样本,必然导致未被选中样本所包含信息的丢失,另外由于预测结果的精度在很大程度上受所筛选样本的影响,这样当筛选样本不准确时,就会直接导致预测精度的下降。并且,目前的负荷预测方法对历史负荷数据依赖较强,即在预测时需输入历史负荷数据,适用于时间步长较短的负荷预测,如果想利用历史负荷值,去预测时间步长较远的负荷值,由于负荷数据分布变化较快,目前的负荷预测方法无法满足要求。



技术实现要素:

本发明旨在至少在一定程度上解决电网负荷预测精度不够高、时间步长较短等技术问题。为此,本发明的一个目的在于提出一种基于深度lstm(longshort-termmemory,长短期记忆)神经网络的电网负荷预测方法,能够提高电网负荷预测精度,并能够预测更大时间步长的负荷数据,以及能够提高预测的实时性。

为达到上述目的,本发明提出的基于深度lstm神经网络的电网负荷预测方法,包括以下步骤:根据输入特征数据和负荷数据生成训练样本,其中,所述输入特征数据包括实验时间的气象信息和是否为工作日的时间类型信息;对所述训练样本进行处理,并通过lstm神经网络对处理后的训练样本进行训练以得到lstm预测模型;通过将待预测时间的气象信息和是否为工作日的时间类型信息输入所述lstm预测模型,以对所述待预测时间内的电网负荷进行预测以得到电网负荷预测结果;对所述电网负荷预测结果进行分析,并判断所述电网负荷预测结果是否满足准确度要求;如果判断不满足所述准确度要求,则获取新的训练样本,并通过所述新的训练样本对所述lstm预测模型进行补充训练,以对所述lstm预测模型进行更新。

根据本发明实施例的基于深度lstm神经网络的电网负荷预测方法,根据包括实验时间的气象信息和是否为工作日的时间类型信息的输入特征数据生成训练样本,通过该训练样本训练得到lstm预测模型,并通过将待预测时间的气象信息和是否为工作日的时间类型信息输入该lstm预测模型得到电网负荷预测结果后,可对电网负荷预测结果进行分析,如果不满足准确度要求,则通过新的训练样本对lstm预测模型进行补充训练,以对lstm预测模型进行更新。由此,在训练预测模型时无需对数据进行筛选,既能够保证训练数据信息的完整性,又能够避免因数据筛选不准确而对负荷预测精度造成影响;由于输入特征数据包括实验时间的气象信息和时间类型信息,后续预测时以待预测时间的气象信息和时间类型信息作为输入,不依赖历史负荷数据,能够预测更大时间步长的负荷数据;通过对lstm预测模型不断进行补充训练,既能够提高预测精度,又能够避免因重新训练而加大计算量和预测耗时,大大提高了预测的实时性。

另外,根据本发明上述实施例提出的基于深度lstm神经网络的电网负荷预测方法还可以具有如下附加的技术特征:

根据本发明的一个实施例,所述气象信息包括最高温度、最低温度、最高相对湿度和平均相对湿度。

具体地,对所述训练样本进行处理包括:对所述训练样本进行批标准化处理,使输出信号的各个维度分布在均值为0,方差为1的分布中,其中,所述训练样本中的负荷数据作为所述输出信号;对进行批标准化处理后的训练样本进行维度的变换,并根据所述负荷数据的实际值和预测值计算损失函数flost;基于rmsprop优化方法对所述损失函数flost的值进行优化,使所述损失函数flost的值最小。

进一步地,通过以下公式计算所述损失函数flost:

其中,t为每个负荷数据的采样时间点,ytmn为所述负荷数据的实际值,ytmn为所述负荷数据的预测值,n为所述lstm神经网络的时间步长,m为所述输入特征数据的批次数。

进一步地,所述lstm预测模型包括lstm隐含层、输入全连接层和输出全连接层,lstm预测模型的网络连接权重与偏置主要由三部分组成,分别为输入全连接层与lstm隐含层之间的[uin,bin],lstm隐含层内的[wf,bf],[wi,bi],[wc,bc],[wo,bo],lstm隐含层与输出全连接层之间的[vout,bout],所述lstm预测模型中各模块的状态变化包括:

xt=uin·xt+bin

ct=σ(wf·[ht-1,xt]+bf)ect+σ(wi·[ht,xt]+bi)etanh(wc·[ht-1,xt]+bc)

ht=σ(wo·[ht-1,xt]+bo)etanh(ct)

yt=vout·ht+bout

其中,xt为某一天第t个时间点的输入特征数据,ct为所述lstm隐含层内部的网络状态,ht-1为第t-1个时间点的所述lstm隐含层的输出,ht为第t个时间点的所述lstm隐含层的输出,yt为所述输出全连接层的输出,tanh及σ分别为双曲正切激活函数和sigmnid激活函数。

具体地,对所述电网负荷预测结果进行分析,并判断所述电网负荷预测结果是否满足准确度要求,包括:获取一个预测周期内多个采样点的负荷数据的预测值与实际值的偏差平均值和偏差最大值;将所述偏差平均值与第一阈值进行比较,并将所述偏差最大值与第二阈值进行比较;如果所述偏差平均值大于等于所述第一阈值或所述偏差最大值大于等于所述第二阈值,则判断不满足所述准确度要求。

进一步地,所述偏差平均值为:

所述偏差最大值为:

其中,k为一个预测周期内采样点的个数,yt为所述负荷数据的实际值,yt为所述负荷数据的预测值。

根据本发明的一个实施例,如果判断满足所述准确度要求,则不对所述lstm预测模型进行更新。

附图说明

图1为根据本发明实施例的基于深度lstm神经网络的电网负荷预测方法的流程图;

图2为根据本发明一个实施例的lstm预测模型的结构示意图;

图3为根据本发明一个实施例的预测误差与学习率的关系曲线图;

图4为根据本发明一个实施例的预测误差与训练次数的关系曲线图;

图5为根据本发明一个实施例的电网负荷预测结果示意图;

图6为根据本发明一个实施例的电网负荷预测误差示意图;

图7为根据本发明另一个实施例的电网负荷预测误差示意图;

图8为根据本发明又一个实施例的电网负荷预测误差示意图;

图9为根据本发明实施例的基于深度lstm神经网络的电网负荷预测系统的方框示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

下面结合附图来描述本发明实施例的基于深度lstm神经网络的电网负荷预测方法。

图1为根据本发明实施例的基于深度lstm神经网络的电网负荷预测方法的流程图。

如图1所示,本发明实施例的基于深度lstm神经网络的电网负荷预测方法,包括以下步骤:

s1,根据输入特征数据和负荷数据生成训练样本,其中,输入特征数据包括实验时间的气象信息和是否为工作日的时间类型信息。

在本发明的一个实施例中,训练样本data={x,y}可包括输入特征数据x和负荷数据y。其中,气象信息可包括一段时间内如一天中的最高温度、最低温度、最高相对湿度和平均相对湿度,时间类型信息包括工作日或节假日类型,据此可将x表示为x=(x1,x2,x3,x4,x5)。负荷数据可通过每隔预设时间进行采样得到,例如,可每5分钟作为一个采样点,采样得到的负荷数据y可表示为y=(y1,y2,y3,...,y288)。

s2,对训练样本进行处理,并通过lstm神经网络对处理后的训练样本进行训练以得到lstm预测模型。

在本发明的一个实施例中,对训练样本进行处理,具体包括:对训练样本进行批标准化处理,使输出信号的各个维度分布在均值为0,方差为1的分布中,其中,训练样本中的负荷数据作为输出信号;对进行批标准化处理后的训练样本进行维度的变换,并根据负荷数据的实际值和预测值计算损失函数flost;基于rmsprop优化方法对损失函数flost的值进行优化,使损失函数flost的值最小。

具体地,批标准化处理后的训练样本为:

data′=(data-data_mean)/data_std,(1)

其中,data_mean为训练样本数据的平均值,data_std为训练样本数据的方差。

当lstm神经网络的时间步长为n,输入特征数据的批次数为m时,第p个批次的输入特征数据可表示为:

相应地,为后续便于计算负荷数据的实际值和预测值之间的偏差,可将负荷数据表示为:

然后,可利用负荷数据的实际值和预测值的差值的平方和计算损失函数,具体公式如下:

其中,t为每个负荷数据的采样时间点,ytmn为所述负荷数据的实际值,ytmn为所述负荷数据的预测值。

最后,基于rmsprop优化方法对上述flost的值进行优化,使其最小。rmsprop优化方法较批梯度下降(bgd)、随机梯度下降(sgd)等优化方法不同,通过从训练样本中获取部分小批量样本进行梯度计算,进而节省了大量的lstm模型训练时间,提高了预测模型在处理海量数据时的实时性。

s3,通过将待预测时间的气象信息和是否为工作日的时间类型信息输入lstm预测模型,以对待预测时间内的电网负荷进行预测以得到电网负荷预测结果。

在本发明的一个实施例中,待预测时间和实验时间可以天为单位,具体时间长短可根据实际需要进行设定。待预测时间若包括数天,则可将每天作为一个预测周期。

其中,待预测时间的气象信息可根据天气预报获取。

在本发明的一个实施例中,lstm预测模型的结构可如图2所示。其中,lstm预测模型包括lstm隐含层、输入全连接层和输出全连接层,lstm预测模型的网络连接权重与偏置主要由三部分组成,分别为输入全连接层与lstm隐含层之间的[uin,bin],lstm隐含层内的[wf,bf],[wi,bi],[wc,bc],[wo,bo],lstm隐含层与输出全连接层之间的[vout,bout],lstm预测模型中各模块的状态变化包括:

xt=uin·xt+bin,(5)

ct=σ(wf·[ht-1,xt]+bf)ect+σ(wi·[ht,xt]+bi)etanh(wc·[ht-1,xt]+bc),(6)

ht=σ(wo·[ht-1,xt]+bo)etanh(ct),(7)

yt=vout·ht+bout,(8)

其中,xt为某一天第t个时间点的输入特征数据,ct为lstm隐含层内部的网络状态,ht-1为第t-1个时间点的lstm隐含层的输出,ht为第t个时间点的lstm隐含层的输出,yt为输出全连接层的输出,tanh及σ分别为双曲正切激活函数和sigmnid激活函数。

通过上述lstm预测模型,可根据包括气象信息的输入特征数据,得到电网负荷预测结果。

s4,对电网负荷预测结果进行分析,并判断电网负荷预测结果是否满足准确度要求。

具体地,可获取一个预测周期内多个采样点的负荷数据的预测值与实际值的偏差平均值和偏差最大值,然后将偏差平均值与第一阈值进行比较,并将偏差最大值与第二阈值进行比较。如果偏差平均值大于等于第一阈值或偏差最大值大于等于第二阈值,则判断不满足准确度要求。

在本发明的一个实施例中,对于电网负荷预测结果的准确度评价,主要从两个方面考虑,以预测周期为一天为例,第一,预测当天288个采样点电网负荷的预测值与实际值偏差平均值应尽可能小;第二,预测当天内各个采样点的负荷数据的预测值与实际值的偏差应尽可能小。根据上述原则,可获取偏差平均值:

以及偏差最大值:

其中,k为一个预测周期内采样点的个数,yt为负荷数据的实际值,yt为负荷数据的预测值。

同时分别为负荷数据的预测值和实际值设定对应的阈值,即第一阈值emean、第二阈值emax。然后将负荷数据的预测值和实际值分别与对应的阈值进行比较。如果emax≥emax或者emean≥emean,则判断不满足准确度要求。

s5,如果判断不满足准确度要求,则获取新的训练样本,并通过新的训练样本对lstm预测模型进行补充训练,以对lstm预测模型进行更新。

即如果有emax≥emax或者emean≥emean,则直接基于新的训练样本对lstm预测模型进行补充训练,得到新的lstm预测模型,并替换原来的lstm预测模型。

在执行步骤s5后返回步骤s3,以基于新的lstm预测模型对待预测时间内的电网负荷进行预测。

而如果在步骤s4中判断满足准确度要求,则不对lstm预测模型进行更新,即不执行步骤s5。

根据本发明实施例的基于深度lstm神经网络的电网负荷预测方法,根据包括实验时间的气象信息和是否为工作日的时间类型信息的输入特征数据生成训练样本,通过该训练样本训练得到lstm预测模型,并通过将待预测时间的气象信息和是否为工作日的时间类型信息输入该lstm预测模型得到电网负荷预测结果后,可对电网负荷预测结果进行分析,如果不满足准确度要求,则通过新的训练样本对lstm预测模型进行补充训练,以对lstm预测模型进行更新。由此,在训练预测模型时无需对数据进行筛选,既能够保证训练数据信息的完整性,又能够避免因数据筛选不准确而对负荷预测精度造成影响;由于输入特征数据包括实验时间的气象信息和时间类型信息,后续预测时以待预测时间的气象信息和时间类型信息作为输入,不依赖历史负荷数据,能够预测更大时间步长的负荷数据;通过对lstm预测模型不断进行补充训练,既能够提高预测精度,又能够避免因重新训练而加大计算量和预测耗时,大大提高了预测的实时性。

下面通过具体实施例对上述实施例进行进一步补充说明和对上述实施例的优点进行验证。

在本发明的一个具体实施例中,可获取2014年1月1日到2016年6月30日的气象信息和负荷数据,剔除缺失数据后,剩余数据为900天的负荷数据,采样频率为5分钟一个采样点,即一天共288个负荷数据,选取前600组数据作为训练数据,后300组数据作为测试数据。

考虑到学习率对lstm预测模型性能的影响,过大的学习率容易使算法跳过最优点,影响训练精度,而过小的学习率又会陷入局部最优产生过拟合现象。对于学习率的确定,目前尚没有明确的理论支撑。同学习率类似,lstm神经网络的训练次数对模型性能的影响同样很大,训练次数的确定同样没有明确的理论支持。本发明实施例中通过固定训练次数观察学习率对预测结果的影响,以及固定学习率观察训练次数对预测性能的影响,得出如图3和图4所示的结果。由图3和图4可以看出,当学习率lr低于0.0001时,由于学习率过小,模型容易陷入局部最优;当lr大于0.01时,模型精度较低,无法较好的拟合负荷数据的变化。同样对于训练次数而言,当训练次数在800左右时,预测精度最高,且训练次数相对较少有利于加快模型的训练速度,满足实时性的要求。基于上述结论,可将学习率与训练次数分别定为0.001和800次。

将待预测时间的气象信息和时间类型信息输入上述lstm预测模型,得到的电网负荷预测结果如图5所示。继而可统计预测误差,计算得出每天平均误差的平均值为0.078,预测每天的最大误差的平均值为0.278,可以看出当模型对步长较远负荷进行预测时,同样有良好的预测效果。另外由于电网内部包含大量分布式能源,负荷突变现象较为严重,由上图可以看出负荷数据经常会在某个时间发生突变,基于这种特性,lstm能够准确追逐负荷突变数据,保证电网负荷预测的准确性。

随着时间的推进,当模型无法满足预测要求时,如图6所示,电网负荷的预测值的误差较大,当误差高于所设定的阈值时,可通过继续对模型添加数据进行补充训练,从而使模型重新拟合负荷分布,通过加入前一次训练数据往后的数据继续训练,得出新的预测模型。通过新的预测模型得到的电网负荷如图7所示。

由图7可以看出,对原先的模型进行补充训练后,同样可以较好地拟合负荷分布。另外,为节约时间,提高实用性,本发明实施例只在负荷误差不满足预测精度时,才对模型进行补充训练,这样避免了每次有新数据来都要调出原先模型进行补充训练,从而大大减少了计算负担。

最后本发明实施例通过与在负荷预测中应用较广泛的其他预测方法进行比对,并且通过对预测结果利用t检验的方法,证明本发明实施例的电网负荷预测方法与其他预测算法的显著差异性。常见的负荷预测的方法主要有支持向量机(svm)、线性外推法、灰色预测(gm)法等,分别通过比较精度以及计算时间,突出lstm算法在电网负荷预测方面的实用性。具体的精度评价指标分别为:均方根误差(rmse)、绝对值误差(mae)以及相对误差(mape),各个指标的计算公式如下:

利用上述采样频率为5分钟的数据,进行对比算法的验证,所得预测结果如图8和表1所示。

表1

由图8可以看出,当负荷数据在上升或者下降时由于数据比较平滑,一般的预测算法均能很好的拟合这种变化趋势,取得比较好的效果,但当负荷数据处于拐点处时,预测精度明显降低,尤其在处理这种负荷突变时,一般的预测算法很难跟踪这种变化,因此针对这种突变的情况,对负荷预测方法提出了更高的要求。lstm所得的预测精度,均高于其他三种预测方法,尤其在负荷数据发生突变时,本发明实施例所使用的预测算法同样能够较为准确的跟踪这种变化趋势,取得了良好的预测效果。另外由表1中可以看出,虽然跟其他三种算法相比起初训练lstm预测模型的时间会大于其他模型的训练时间,但当负荷数据发生变化已有的模型无法满足预测要求时,相比较其他预测方法进行模型的重新训练,本发明实施例所提出的在已有模型的基础上进行补充训练的预测方法,将大大提高模型在处理数据海量性、变化速度快的适用能力。

利用spss软件平台,基于t检验的统计方式,设定95%的置信区间,证明本发明实施例的预测方法与其他三种预测算法的差异性。所得的结果如表2所示。

表2

由表2可以看出,lstm(即本发明实施例的基于深度lstm神经网络的电网负荷预测方法)与gm所得的预测结果与真实值之间差值,第一个p(sig)值为0.002,小于0.05,说明假设方差相等不成立,第二个p(sig)值为0,同样小于0.05,说明lstm与gm所得的预测结果数据之间存在显著性的差异。同理,可以得出lstm与其他两种算法所得预测结果之间也存在显著性差异。

为实现上述实施例的基于深度lstm神经网络的电网负荷预测方法,本发明还提出一种基于深度lstm神经网络的电网负荷预测系统。

如图9所示,本发明实施例的基于深度lstm神经网络的电网负荷预测系统包括:样本生成模块10、模型构建模块20、预测模块30、结果分析模块40和补充训练模块50。

其中,样本生成模块10用于根据输入特征数据和负荷数据生成训练样本,其中,输入特征数据包括实验时间的气象信息和是否为工作日的时间类型信息;模型构建模块20用于对训练样本进行处理,并通过lstm神经网络对处理后的训练样本进行训练以得到lstm预测模型;预测模块30用于通过将待预测时间的气象信息和是否为工作日的时间类型信息输入lstm预测模型,以对待预测时间内的电网负荷进行预测以得到电网负荷预测结果;结果分析模块40用于对电网负荷预测结果进行分析,并判断电网负荷预测结果是否满足准确度要求;补充训练模块50用于在结果分析模块40判断不满足准确度要求,获取新的训练样本,并通过新的训练样本对lstm预测模型进行补充训练,以对lstm预测模型进行更新。

更具体的实施方式可参照上述实施例,为避免冗余,在此不再赘述。

根据本发明实施例的基于深度lstm神经网络的电网负荷预测系统,能够保证训练数据信息的完整性,提高预测精度,并能够预测更大时间步长的负荷数据,以及能够提高预测的实时性。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1