一种基于神经网络模型的电力负荷组合预测方法与流程

文档序号:16934455发布日期:2019-02-22 20:34阅读:207来源:国知局
一种基于神经网络模型的电力负荷组合预测方法与流程

本发明属于电力负荷预测领域,具体涉及一种基于神经网络模型的电力负荷组合预测方法。



背景技术:

随着电力系统的现代化发展,信息时代的电力系统的目标转向为每一个用户提供高质量、高可靠、高效率、低成本的电力服务。为了实现这一目标,智能的电力系统应该能够掌握和了解每个用户的用电行为习惯,提前掌握用户的用电需求,从而在不同的用电时段针对每个用户的需求进行科学高效地配供电。因此,用电负荷的准确预测就显得十分必要。实践中,用电负荷预测能够帮助我们了解到某一区域内潜在的用电规律,例如用电高峰期和用电低峰期。在用电高峰时间段到来之前,电力系统能够提前进行电力储备和调度来满足用电高峰期的用电需求,提高用电效率,削峰填谷,平滑电网负荷曲线,减轻电网负荷压力。事实上,这种负荷预测对于电力系统的现代化和智能化来说都很重要,其对于配用电的调度计划,成本收益分析,电价制定等都有指导性作用,能有效地提升用电效益,有助于经济发展。

近年来国内外学者在电力负荷预测方面展开了多种多样的研究工作,目前的用电负荷预测方式可以大致分为两大类:传统预测方法和神经网络预测方法。虽然从单数据集上的预测结果来看,传统预测方法和神经网络预测方法的预测效果都很好,但是在多数据集情况下,这两种预测方法的准确度较低。尤其是在多个电力负荷数据集的预测问题上,由于不同数据集的电力负荷变化规律存在差异,且每个数据集的电力负荷变化规律比较复杂,不同数据集的变化规律可能并不一致,从而导致常规的预测方法不太适用于电力负荷多数据集的预测。

此外,聚类算法和神经网络模型都是现有技术中进行电力负荷预测时常用的方法。目前常用的聚类算法有k-means算法等。不过由于k-means算法存在k值和k个中心点选择优化的问题,在面对多数据集预测的情况下,同样无法满足当前需求。在将聚类模型中提取出的数据集表征特征与数据集原有的特征数据一同输入到循环神经网络中进行训练的过程中,由于初始的组合预测模型预测结果受到多方面的影响,误差很大,最后获得的电力负荷预测与真实的电力负荷发展趋势相去甚远。



技术实现要素:

针对现有技术的以上缺陷或改进需求,本发明提供了一种基于神经网络模型的电力负荷组合预测方法,至少可以部分解决上述问题。本发明技术方案针对目前的电力负荷预测方法在面对多数据集电力负荷预测时准确率不高的情况,采用将聚类算法与循环神经网络模型相结合的组合预测方式,并对聚类算法和循环神经网络进行优化,提高了电力负荷预测的精度。

为实现上述目的,按照本发明的一个方面,提供了一种基于神经网络模型的电力负荷组合预测方法,其特征在于,包括

s1采集用每个用户的多个用电指标特征构成一个原始数据集;对原始数据集中的数据进行处理,生成特征属性和/或数据格式一致的初始数据集;

s2对初始数据集中的指标数据进行标准化处理,消除不同指标数据之间的量纲差别,获取标准数据集作为样本点;

s3优化聚类模型,将标准数据集输入聚类模型以确定近似最优的聚类个数并对初始中心点进行优化,提取多个标准数据集的表征特征;

s4将数据集的原始特征与表征特征输入神经网络,对应输出电力负荷值,训练获取初始神经网络预测模型;

s5对初始神经网络预测模型进行参数优化,获取最佳电力负荷组合预测神经网络,将该神经网络与聚类模型相结合,用于对电力负荷进行组合预测。

作为本发明技术方案的一个优选,步骤s1原始数据集的处理包括,

s11对原始数据集的特征属性进行扩展,将可能对电力负荷有影响的特征属性纳入到当前用户数据集中;

s12将数据集中的特征属性数据形态转换为统一格式;

s13对数据集的特征属性进行异常值检测,并对异常值进行修正。

作为本发明技术方案的一个优选,步骤s2中所述标准化处理包括,

s21采用z-score对数据集中的特征数据进行标准化处理,消除指标数据之间的量纲差别,获得神经网络的输入特征数据;

s22对电力负荷值取对数,获取经过标准化处理的目标值,作为神经网络的输出特征数据。

作为本发明技术方案的一个优选,步骤s3中包括,

s31绘制聚类模型的中心数目与成本函数曲线,根据曲线变化确定当前聚类模型的最佳聚类中心个数;

s32根据最佳聚类中心个数随机选择选择初始聚类中心点,计算每个聚类集合中的样本点被选为选为下一个聚类中心点的概率,更新该聚类集合的中心点,直至获得当前聚类模型的聚类中心点;

s33利用当前聚类模型的最佳聚类中心点,提取多个数据集的表征特征。

作为本发明技术方案的一个优选,步骤s4包括,

s41选择至少一种神经网络作为原始神经网络,将数据集的原始特征与表征特征输入原始神经网络,控制输出对应的电力负荷值;

s42对经过训练的神经网络进行比较,选择预测结果更最优的神经网络设为初始神经网络预测模型。

作为本发明技术方案的一个优选,步骤s5中所述参数优化包括,

s51根据用电负荷周期变化,对初始神经网络预测模型进步长优化,若用电负荷周期为规律变化周期,则时间步长设置为该周期,否则比较筛选最优时间步长;

s52确定初始神经网络预测模型的隐藏神经元数量取值范围,比较确认该范围内近似最优的神经元数量;

s53对不同激活函数下的初始神经网络预测模型进行比较,选取效果最好的激活函数作为初始神经网络预测模型的激活函数。

按照本发明的一个方面,提供了一种基于神经网络模型的电力负荷组合预测系统,其特征在于,包括

数据采集模块,用于采集用每个用户的多个用电指标特征构成一个原始数据集;对原始数据集中的数据进行处理,生成特征属性和/或数据格式一致的初始数据集;

标准化模块,用于对初始数据集中的指标数据进行标准化处理,消除不同指标数据之间的量纲差别,获取标准数据集作为样本点;

聚类模块,用于优化聚类模型,将标准数据集输入聚类模型以确定近似最优的聚类个数并对初始中心点进行优化,提取多个标准数据集的表征特征;

训练模块,用于将数据集的原始特征与表征特征输入神经网络,对应输出电力负荷值,训练获取初始神经网络预测模型;

优化模块,用于对初始神经网络预测模型进行参数优化,获取最佳电力负荷组合预测神经网络,将该神经网络与聚类模型相结合,实现对电力负荷进行组合预测。

按照本发明的一个方面,提供了一种存储设备,其中存储有多条指令,所述指令适用于由处理器加载并执行:

s1采集用每个用户的多个用电指标特征构成一个原始数据集;对原始数据集中的数据进行处理,生成特征属性和/或数据格式一致的初始数据集;

s2对初始数据集中的指标数据进行标准化处理,消除不同指标数据之间的量纲差别,获取标准数据集作为样本点;

s3优化聚类模型,将标准数据集输入聚类模型以确定近似最优的聚类个数并对初始中心点进行优化,提取多个标准数据集的表征特征;

s4将数据集的原始特征与表征特征输入神经网络,对应输出电力负荷值,训练获取初始神经网络预测模型;

s5对初始神经网络预测模型进行参数优化,获取最佳电力负荷组合预测神经网络,将该神经网络与聚类模型相结合,用于对电力负荷进行组合预测。

按照本发明的一个方面,提供了一种终端,包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适于由处理器加载并执行:

s1采集用每个用户的多个用电指标特征构成一个原始数据集;对原始数据集中的数据进行处理,生成特征属性和/或数据格式一致的初始数据集;

s2对初始数据集中的指标数据进行标准化处理,消除不同指标数据之间的量纲差别,获取标准数据集作为样本点;

s3优化聚类模型,将标准数据集输入聚类模型以确定近似最优的聚类个数并对初始中心点进行优化,提取多个标准数据集的表征特征;

s4将数据集的原始特征与表征特征输入神经网络,对应输出电力负荷值,训练获取初始神经网络预测模型;

s5对初始神经网络预测模型进行参数优化,获取最佳电力负荷组合预测神经网络,将该神经网络与聚类模型相结合,用于对电力负荷进行组合预测。

总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:

1)本发明技术方案,针对目前对于每个用户的用电需求都要分别单独设计一个预测算法进行预测的问题,采取了利用聚类算法对多个用户进行表征特征提取后再进行预测分析的方式,设计了一种可以适应多个预测对象的算法模型,来对一个及一个以上的用户进行用电负荷需求预测,大大简化了多个用户用电需求预测的工作量。

2)本发明技术方案,针对目前电力负荷预测算法模型误差较大的问题,在提取了多个用户电力数据的表征特征之后,利用电力数据和表征特征对神经网络进行训练,通过神经网络与聚类模型的有效结合,在实现高度兼容不同用户电力负荷数据的同时,还能够提高用户电力负荷预测的准确性。

3)本发明技术方案,针对传统聚类模型需要对聚类中心个数进行反复检测,从而导致针对多个用户的用电负荷预测工作量巨大的问题,利用k-score曲线的固有特点,通过对聚类算法进行优化,使得聚类算法在能够适应多种预测形式的情况下,不需要人工测试的参与,也能够自动选择出最佳的聚类个数。

附图说明

图1是本发明技术方案的实施例的电力负荷组合预测系统结构图;

图2是本发明技术方案的实施例的k-score曲线图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。下面结合具体实施方式对本发明进一步详细说明。

本实施例对本发明技术方案中的电力负荷组合预测方法进行了具体的说明。本发明技术方案的方法,主要针对的是多数据集的电力负荷预测。本实施例中的电力负荷预测是以用户为单位的,即一个用户的用电需求构成一个数据集。在用户数量庞大的情况下,由于不同用户的用电习惯有所差异,每个用户的用电需求数据集也不同,也就是说,每个数据集的用电负荷预测也有不同。在多用户的多数据集情况下,原先对于单数据集有较好预测作用的模型误差就会发生较大的偏差。针对这个问题,本实施例中采用了聚类模型与神经网络相结合的方式对电力负荷进行预测,同时为了进一步提高预测结果的准确性,还对聚类分析模型和神经网络模型进行了优化。

本实施例中,首先将多个用户产生的多个用电负荷数据集输入到聚类分析模型中,提取出多数据集的差异性特征。同时,结合这些数据集还具有其他特征,一起输入循环神经网络中进行训练,从而实现跨数据集的模型训练。本实施例中聚类模型优选使用经过改进的k-means聚类算法,神经网络模型优选经过优化的循环神经网络模型。

本实施例的电力负荷组合预测方法包括下列步骤:

第一步:对多个用户在历史用电过程中,电力负荷的原始数据集进行预处理。由于用户多种多样,且数据采集环境各有差别,原始数据集不可避免的会存在诸多问题,需要对其进行处理处理以符合聚类分析和神经网络训练的形式。本实施例中,原始数据集的预处理包括:数据集特征属性扩展,非数值数据的数值化,缺失值的填充,异常值的筛选和处理等。需要说明的是,本实施例中的数据集预处理,是以单个数据集为单位进行的,即针对每个数据集分别进行上述预处理过程。

具体来说,数据集特征属性扩展主要针对可能对电力负荷有影响的特征属性,将其纳入当前用户的数据集中。例如时间(数据采集的年、月、日、乃至当日时间),气温(最低气温,最高气温),天气,风力,节假日等。本实施例中,时间相关属性可以通过相关属性转换直接得到,气候相关属性可以通过查阅气候资料等获得。本实施例对这些特征属性的获取方式不作出具体的限定。将扩展属性与原始特征进行整合,即可获得当前用户的特征属性数据集。

由于数据集中包含的特征属性多种多样,每个特征属性的表达形式也有差异,因此数据集经过特征属性扩展后,还需要进行进一步的处理,具体来说就是将数据集内的特征属性转换为统一格式,例如数值化。本实施例中,优选将每种特征属性都以数字的形式进行表达。例如天气属性的取值可能为“晴”、“阴”、“雨”等,需要针对这些非数值数据进行数值化才能输入到模型中用于计算。本实施例中,针对天气属性优选采用整数编码来表示,用一个整数来表示一种天气,例如使用0表示晴天,1表示阴天,2表示雨天。

经过上述处理的数据集,还需要进一步对其中的缺失值和异常值进行检查筛选。即根据数据集的特征属性,找出当前数据集中缺少用户的哪些特征属性数据,然后根据该特征属性数据随时间的变化趋势对缺失值进行填充。本实施例中,优选采用缺失值对应的特征属性数据在一段时间内的均值(如缺失值前一周和后一周的均值)作为缺失值的填充值。如果将数据集中每个数据记录看做一个数据点,对其进行聚类分析后,孤立点就是异常数据。本实施例中,异常值等同于缺失值进行处理,即采用该异常值对应的特征属性数据在一段时间内的均值作为缺失值的填充值。

上述处理将原始数据集转化为初始数据集,每个初始数据集的特征属性和数据格式都是一致的。

第二步:对初始数据集中的数据进行标准化处理,将初始数据集转化为标准数据集,来消除指标之间的量纲影响,以解决不同数据指标之间不存在可比性的问题。数据的标准化包括输入特征数据的标准化以及目标值的标准化,本实施例中,对原始数据集进行标准化处理是为了有效地提升模型训练的效率以及模型精度。进一步地,输入特征数据的标准化包括对天气、历史用电负荷、风力、时间等特征数据进行标准化,本实施例中优选采用z-score标准化方式,其标准化公式如下:

其中,μ为所有样本数据的均值,σ为所有样本数据的标准差,x为样本值,n为样本个数。

本实施例的待预测目标值是电力负荷值,优选采用log函数标准化方式,其计算公式如下:

y*=log(y)(2)

其中,y为目标值,y*为标准化后的目标值。

第三步:对聚类模型进行优化改进。现有的k-means聚类模型主要存在两个方面的问题,一个是聚类算法k-means的k值选择问题,另一个是k-means聚类算法初始中心点选择问题。针对k值选择问题,本实施例中优选把不同k值以及聚类模型的成本函数score值共同组成的k-score曲线绘制出来。每个聚类模型的k-score曲线都不一样,但是大致的曲线都是一样的,手肘形状的曲线,有拐点。随着k值的增大,score会减小,每个类包含的样本数会减少,于是样本离其类的中心点(即重心)更近。随着k值继续增大,虽然score仍然会减少,但下降幅度明显变缓了,也就表明聚类模型的改善效果会不断减低。k值增大过程中,聚类模型的改善效果下降幅度最大的位置对应的值就是曲线中的转折点,本实施例中将这个k值作为近似最优的k值。进一步地,本实施例中的score计算公式优选如下:

其中,score为每个样本点到重心的误差平方和,fi表示为第i类的重心,yi为类fi里面的样本点。如图2所示是一个利用score曲线图像获得最佳k值的具体实施例,其中k=10时曲线发生突降,说明此时k达到真实的聚类数,再增加k所得到的聚类程度回报会迅速减小,所以score的下降幅度会骤减,然后随k值的增大而趋于平缓,因此对图2的曲线来说,该聚类算法的最佳k值为10。

对于k-means的初始中心点选择问题,本实施例中优选随机选择k个点作为第一个初始聚类中心点集合c1,然后重复计算每个样本点x与已有的聚类中心点之间的最短距离d(x),并计算每个样本点被选为下一个聚类中心点的概率p(x),根据概率选出下一个聚类中心点,更新c1,直到选出k个初始聚类中心点。也就是说,本实施例中首先确定最佳k值,然后选择任意k个点作为初始聚类中心点,进而以这个点为基础,利用概率对初始聚类中心点进行更新,直至筛选出全部的聚类中心点。作为本实施例的优选,在利用循环算法对聚类中心点进行更新的时候,还设置有循环停止条件,如循环迭代次数或者d(x)方差达到一定阈值等。

本实施例中概率p(x)计算公式优选如下:

其中,p(x)为数据点x被选为下一个聚类中心的概率,d(x)2为每个数据点x与当前已有的聚类中心之间的最短距离的平方。

本实施例中,通过对聚类模型进行k值和初始中心的优化,解决了目前k-means算法中存在的两个问题,一个是根据score值解决了k值选取的问题,另一个是根据概率p(x)解决了初始中心点选择的问题,从而使得聚类模型的选择更为准确。

实际上,利用经过优化的聚类模型提取多个标准数据集之间的表征特征,也就是提取不同数据集之间的差异性特征。表征特征的提取可以实现一个通用的模型来实现跨数据集的训练,否则每个对象都需要训练一个模型来进行预测。经过上述改进后的聚类模型能够自动选择一个近似最优的聚类个数以及优化的初始中心点选择方案,无须人工参与测试。

第四步:将通过聚类模型获得的表征特征与数据集的原有特征数据一起输入到循环神经网络中进行训练,获取初始神经网络预测模型。本实施例中,优选分别选择长短时记忆网络和门限递归网络这两类改进型循环神经网络进行训练并测试对比,根据测试结果选择最优循环神经网络类型,设为初始神经网络预测模型。

进一步地,对初始神经网络预测模型进行超参数优化,超参数是神经网络预测模型中必须手动设置的参数。本实施例中,优选进一步对循环神经网络的时间步长进行优化,确定隐藏神经元数量,并选择合适的激活函数。另外,模型训练过程中优选通过绘制训练误差函数和测试误差函数曲线来辅助判断过拟合出现点,并在过拟合刚出现时提前终止模型训练的方式来降低模型过拟合风险从而提升模型泛化能力。

其中,对于循环神经网络的时间步长的优化,由于时间步长与用电负荷规律周期有关,如果已知用电负荷规律变化周期,则时间步长设置为该周期时长;如果未知,则采用试凑法,通过对比不同的时间步长的训练效果来选出近似最优的时间步长,试凑过程中时间步长的取值优先选择2的指数倍数值。

在确定隐藏神经元数量时,优选根据经验公式(5)确定神经元数量的大致取值,然后在该取值上下一定范围内进行实验对比(如采用试凑法)得到近似最优的神经元数量。经验公式如下,其中,n表示神经元数量,x表示输入节点个数,y表示输出节点个数:

n=2(x+y)(5)

对于激活函数,本实施例中对sigmoid、tanh、relu三种激活函数的模型训练效果进行对比后,relu激活函数的效果最佳。本实施例中的relu激活函数的计算公式如下:

f(z)=max(0,z)(6)

第五步:将改进的聚类优化模型与循环神经网络模型相结合,获得本实施例中的组合预测模型,将多数据集的电力数据输入上述的组合预测模型后,得到电力负荷的最终预测值。

总而言之,本实施例中将多个用户产生的多个用电负荷数据集输入到聚类分析模块中,提取出多数据集的差异性特征后再同数据集的其他特征数据一起输入到循环神经网络中进行训练,从而实现跨数据集的模型训练。对于本实施例中所采用的聚类算法k-means,由于k-means算法存在k值选择和k个中心点选择的问题,无法满足当前需求,因此需要对k-means进行改进。然后再将聚类模型中提取出的数据集表征特征与数据集原有的特征数据一同输入到循环神经网络中进行训练。由于初始的组合预测模型预测结果很不理想,因此还需要在用电负荷这一特定应用场景下组合预测模型进行结构优化来提升模型的预测精度,并且针对不同的循环神经网络进行对比测试分析,来寻找出最适用于用电负荷预测的循环神经网络。最后将改进的聚类模型与调优后的循环神经网络模型进行组合得到组合预测模型实现多个电力负荷数据集的跨数据集预测。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1