本申请涉及电力及电网系统领域,特别涉及一种电力负荷特征的预测方法、一种电力负荷特征的预测系统,以及一种计算机可读存储介质和一种电力负荷特征预测终端。
背景技术
电力产业关乎国计民生,与人民的生产生活活动息息相关,电力系统的平稳运行是社会发展和经济发展的必要条件。维持电力系统的稳定,保持电力的供需平衡是基础,也就是系统的发电量与电力用户的电力负荷必须做到实时平衡,而负荷预测是维持供需平衡中非常重要的一环。若负荷的预测值低于实际值,会导致用户的用电需求无法得到满足,引起电量短缺的问题;若负荷的预测值高于实际值,因为电力具有不可大量存储的特点,故会导致电力资源的浪费。只有准确的电力的预测,才能有助于电力产业持续和健康地发展。
负荷预测就是通过历史的负荷数据,和系统的运行特征、社会条件、自然条件(温度、湿度等)、经济指标等,得到将来时刻的负荷估计值。如何有效利用上述的数据,采用合适的方法进行预测,保证预测的精确性,是负荷预测技术需要解决的主要问题。
随着各种随机终端电力用户如分布式新能源发电,光伏发电、电动汽车的并网,电力系统不确定因素和非稳定性因素逐步增多,给电力决策工作带来了更大程度的风险,也给电力负荷预测工作带来了新的挑战。随着大规模风电等可再生能源的并网,电力需求的不确定性需要在电力系统经济调度中准确的体现出来,然而确定性模型预测值单一,无法提供更加全面的负荷信息以供电力决策者参考。
可预见,考虑电力需求的不确定性需要的短期负荷预测方法将会是帮助电网保障稳定运行和合理规划的有效工具,可以为电力系统的运行调度提供必要信息。
申请内容
本申请的目的是提供一种电力负荷特征的预测方法、电力负荷特征的预测系统,以及一种计算机可读存储介质和一种电力负荷特征预测终端,解决现有的电力负荷特征预测精度低的问题。
为解决上述技术问题,本申请提供一种电力负荷特征的预测方法,具体技术方案如下:
利用k-means特征提取方法对历史负荷数据和新负荷数据进行特征选择并输出负荷最优特征集;
根据所述负荷最优特征集建立训练样本;其中,所述训练样本中样本为输入变量矩阵和对应目标值;
利用所述训练样本建立高斯过程回归模型;
根据所述高斯过程回归模型,构建特定置信水平下的负荷概率区间预测模型;
输入所述负荷最优特征集中的数据,利用所述负荷概率区间预测模型输出预测结果。
其中,利用k-means特征提取方法对历史负荷数据和新负荷数据进行特征选择并输出负荷最优特征集,包括:
利用k-means特征提取方法对历史负荷数据构造候选特征集;
对所述候选特征集进行特征聚类,形成第一候选特征集;
在所述第一候选特征集中加入新负荷数据,形成第二候选特征集;
对所述第二候选特征集进行在线特征分类和特征选择,输出负荷最优特征集。
其中,还包括:
每当在所述第一候选特征集中加入所述新负荷数据时,更新所述负荷最优特征集。
其中,根据所述负荷最优特征集建立训练样本之后,还包括:
利用滑动时间窗技术更新所述训练样本,并在更新时保证所述训练样本的样本数保持不变。
其中,根据所述高斯过程回归模型,构建特定置信水平下的负荷概率区间预测模型,包括:
根据所述高斯过程回归模型,建立输入矩阵和输出矩阵之间的关系表达式;
根据所述关系表达式建立符合联合高斯分布的有限集合;
确定所述有限集合中的核矩阵,确定所述目标值的分布函数;
确定所述分布函数的边缘分布,根据所述边缘分布确定超参数集,并得到所述高斯过程回归模型的对数似然函数;
计算输入样本和输入变量矩阵的联合分布;
根据所述联合分布建立所述输入样本的预测模型;
根据预设的置信水平和所述预测模型构建特定置信水平下的负荷概率区间预测模型。
其中,输入所述负荷最优特征集中的数据,利用所述负荷概率区间预测模型输出预测结果之后,还包括:
利用基于遗忘因子的递归最小二乘法更新所述负荷概率区间预测模型的模型参数。
其中,还包括:
从预测间隙覆盖率、预测区间规则化平均宽度、综合指标、平均绝对百分比误差中选取一种或任几种对所述负荷概率区间预测模型进行性能评估。
本申请还提供一种电力负荷特征的预测系统,该预测系统包括:
数据选择模块,用于利用k-means特征提取方法对历史负荷数据和新负荷数据进行特征选择并输出负荷最优特征集;
样本建立模块,用于根据所述负荷最优特征集建立训练样本;其中,所述训练样本中样本为输入变量矩阵和对应目标值;
高斯模型建立模块,用于利用所述训练样本建立高斯过程回归模型;
预测模型建立模块,用于根据所述高斯过程回归模型,构建特定置信水平下的负荷概率区间预测模型;
预测模块,用于输入所述负荷最优特征集中的数据,利用所述负荷概率区间预测模型输出预测结果。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的预测方法的步骤。
本申请还提供一种电力负荷特征预测终端,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现上述的预测方法的步骤。
本申请所提供的一种电力负荷特征的预测方法,包括:利用k-means特征提取方法对历史负荷数据和新负荷数据进行特征选择并输出负荷最优特征集;根据所述负荷最优特征集建立训练样本;利用所述训练样本建立高斯过程回归模型;其中,所述训练样本中样本为输入变量矩阵和对应目标值;根据所述高斯过程回归模型,构建特定置信水平下的负荷概率区间预测模型;输入所述负荷最优特征集中的数据,利用所述负荷概率区间预测模型输出预测结果。
本申请提出一种双策略在线高斯过程回归算法,结合基于k-means特征提取方法对模型输入变量进行选择。首先利用kfs方法从候选特征集筛选最优输入变量集,接着利用双策略在线高斯过程回归(doublestrategiesonlinegaussianprocessregression,dsogpr)构建特定置信水平下的负荷概率区间预测结果。随着各种随机终端电力用户如分布式新能源发电,光伏发电、电动汽车的并网,电力系统不确定因素和非稳定性因素逐步增多,给电力决策工作带来了更大程度的风险,也给电力负荷预测工作带来了新的挑战。本申请在避免不合理的电力决策带来的安全隐患和经济损失,具有重要的意义,其精确的负荷预测结果可以在电网的稳定运行和合理规划等方面发挥作用。本申请还提供一种电力负荷特征的预测系统,以及一种计算机可读存储介质和一种电力负荷特征预测终端,具有上述有益效果,此处不再赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种电力负荷特征的预测方法的流程图;
图2为本申请实施例所提供的一种利用k-means特征提取方法的流程图;
图3为本申请实施例所提供的一种电力负荷特征的预测系统的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使本申请的步骤描述的更清楚,以下说明中将采用各步骤相对应的数学表达式进行描述,但不应理解为该步骤对应的唯一表达式,仅作为本申请诸多实施方案中一种可行的实施方案。
请参考图1,图1为本申请实施例所提供的一种电力负荷特征的预测方法的流程图,该预测方法包括:
s101:利用k-means特征提取方法对历史负荷数据和新负荷数据进行特征选择并输出负荷最优特征集;
本步骤旨在利用历史负荷数据和新负荷数据进行处理和选择,使得后续的预测模型在两种数据的基础上更加精确。因为电力负荷预测过程是动态变化的,在这种动态特征空间下,考虑历史负荷数据和新的负荷数据流的全场景下的特征选择,更加有利于保证预测结果的精确度。针对此问题,本方法提出基于k-means(kmeansbasedfeatureselection,又称kfs)特征提取方法。同时,利用k-means特征提取方法可以对历史负荷数据和新负荷数据进行降维处理。负荷数据通常包括时间、运行特征、自然条件等多重因素,而经k-means特征提取后,可以消除电力负荷预测过程中无影响或影响较低的因素,得到对电力负荷预测结果影响最大的一种或几种因素,降低运算难度。
本申请在此不限定k-means特征提取方法的具体步骤,可以基于kfs方法,也可以在kfs方法的基础上有所改进等。本申请在此提出一种具体的特征提取过程,参见图2,图2为本申请实施例所提供的一种利用k-means特征提取方法的流程图,操作过程可以如下:
s1011:利用k-means特征提取方法对历史负荷数据构造候选特征集;
s1012:对候选特征集进行特征聚类,形成第一候选特征集;
s1013:在第一候选特征集中加入新负荷数据,形成第二候选特征集;
s1014:对第二候选特征集进行在线特征分类和特征选择,输出负荷最优特征集。
需要说明的是,特征聚类、在线特征分类和特征选择等过程均需要本领域技术人员根据电力负荷预测过程中的实际需求进行相应的设定,在此不作具体限定。
此外,每当在第一候选特征集中加入新负荷数据时,即可更新负荷最优特征集,可以保证预测结果的实时性和精确性。
当然还可以存在其他基于k-means特征提取方法的特征提取过程,在此不一一举例描述,均应在本申请的保护范围内。
s102:根据负荷最优特征集建立训练样本;
其中,训练样本中样本为输入变量矩阵和对应目标值;
训练样本中的样本是根据s101中得到的负荷最优特征集建立的。举例而言,对于给定的n个样本数据集
s103:利用训练样本建立高斯过程回归模型;
建立高斯过程回归模型为较成熟的现有技术,在此不作赘述。
s104:根据高斯过程回归模型,构建特定置信水平下的负荷概率区间预测模型;
本步骤旨在根据高斯过程回归模型建立最终的负荷概率区间预测模型。本申请在此提出一种具体的负荷概率区间预测模型建立过程,当然还可以有其他建立过程,在此不作限定。具体的建立过程可以如下:
s1041:根据所述高斯过程回归模型,建立输入矩阵和输出矩阵之间的关系表达式;
yn=f(xn)+εn(1)
其中f为在数据集d下定义的函数,εn为服从分布
s1042:根据所述关系表达式建立符合联合高斯分布的有限集合;
有限集合f={f(x1),f(x2),…,f(xn)}构成随机过程变量的一个集合,并且具有联合高斯分布,即:
p(f|x1,x2,…,xn)~(0,k)(2)
s1043:确定所述有限集合中的核矩阵,确定所述目标值的分布函数;
(2)式中k为核矩阵,其元素kij=k(xi,xj),k(·)为核函数。本实施例中选取平方指数协方差函数(squaredexponential,se)作为核函数,其定义为:
式中,
根据贝叶斯理论,gp(高斯回归方法,同后文的gpr)在给定数据d0集合内建立先验函数,在给定f的条件下,y服从的分布,也即目标值的分布函数为
s1044:确定所述分布函数的边缘分布,根据所述边缘分布确定超参数集,并得到所述高斯过程回归模型的对数似然函数;
由于分布(4)为各向同性高斯分布,因此可以通过式(5)计算y的边缘分布:
gp在训练过程中,通过寻找边缘分布(6)来确定超参数集
则先只需求解式(6)的最大值,对超参数初始化,在极大似然性的贝叶斯框架下确定最优超参数,可以通过上式对θ求偏导数获得:
式中tr()表示矩阵的迹。
s1045:计算输入样本和输入变量矩阵的联合分布;
至此,利用前面建立的gp模型来预测新的输入样本x*,计算联合分布p(x*|x,x*),即
其中y*=[y1,y2,…,yn,y*]t,k*为(n+1)×(n+1)的核矩阵。由于该联合分布也服从高斯分布,因此式(8)可以表示为
其中k*=[k(x1,x*),…,k(xn,x*)]t,k**=k(x*,x*)。
s1046:根据所述联合分布建立所述输入样本的预测模型;
利用高斯条件分布,可得新样本x*的预测分布,也即预测模型:
s1047:根据预设的置信水平和所述预测模型构建特定置信水平下的负荷概率区间预测模型。
根据式(10),可以获得给定置信水平α下的预测区间,即
规定公式(10)中,
需要说明的是,上述过程只是一种具体的负荷概率区间预测模型建立过程,本领域技术人员根据本申请所提供的内容还可以得到相类似或者在此基础上的其他预测模型建立过程,均应在本申请的保护范围内。
s105:输入所述负荷最优特征集中的数据,利用所述负荷概率区间预测模型输出预测结果。
在如s1046中得到负荷概率区间预测模型后,即可根据负荷概率区间预测模型进行电力负荷特征的预测。
预测过程中,使用的是s101中经过k-means特征提取降维后的数据,也即负荷最优特征集中的数据。而预测出的结果有效期较短,通常为一到两周。
本申请利用基于kmeans特征聚类的在线特征提取方法筛选最优输入变量集,将在线学习技术与高斯过程回归方法相结合,通过更新模型参数来应对隐藏在负荷数据内部的不确定性,使得新的算法能降低噪声带来的影响,有很好的跟踪能力和自适应性。
同时在电力数据逐渐完备和丰富的背景下,本申请充分利用电力用户的历史负荷数据,针对每一个具体的用户对其用电规律性和负荷形态进行分析,结合k-means特征提取算法,节约了计算时间和信息存储量,方便售电公司针对不同用电特性的用户提供差异化的增值服务。便于售电公司设计分时电价套餐,平滑地区负荷曲线,签订可中断负荷协议,降低偏差考核风险提供了坚实基础。
基于上述实施例,作为优选的实施例,s102之后,还可以包括:
利用滑动时间窗技术更新训练样本,并在更新时保证训练样本的样本数保持不变。
利用d0建立高斯过程回归模型(gaussianprocessregression,gpr)模型同时。利用滑动时间窗技术更新训练样本,每隔一段时间将m个旧的数据样本从d0中剔除,并加入m个新的样本,保证d0的样本数t0不变。
基于上述实施例,作为优选的实施例,s105之后,还可以包括:
利用基于遗忘因子的递归最小二乘法更新所述负荷概率区间预测模型的模型参数。
donline在线学习阶段,利用基于遗忘因子的递归最小二乘法(recursiveleastsquaredwithforgettingfactor,rls-ff)来更新an和cn,也即更新样本的均值函数和协方差函数。利用rls-ff更新an和cn的实现过程如下:
k*(n+1)=[k(x1,x*),…,k(xn,x*)]t(17)
其中,pn为转移矩阵,en+1为预测误差,ξn+1为辅助参数。矩阵pn的更新如下:
其中εn+1为辅助参数,λn为遗忘因子,其计算公式如下:
νn+1=λn(νn+1)(22)
本实施例致力于提高预测方法的预测精度,依据电力用户的历史负荷数据,将在线学习策略与高斯过程回归方法结合,实现了更好的预测区间质量、更窄的区间宽度、更高的预测精度。
基于上述任一实施例,作为优选的实施例,在预测后还可以包括:
从预测间隙覆盖率、预测区间规则化平均宽度、综合指标、平均绝对百分比误差中选取一种或任几种对所述负荷概率区间预测模型进行性能评估。
为了定性地评价预测模型的性能,需要考虑预测区间的可靠性和平均宽度,以及负荷平均值的精度,因此,选用以下四个指标作为模型的评价指标:
(1)预测间隙覆盖率(predictionintervalcoverageprobability,picp)
其中lt和ut代表预测区间的上限和下限,picp的值越大,说明落在预测区间的实际负荷值越多。
(2)预测区间规则化平均宽度(predictionintervalnormalizedaveragewidth,pinaw)
其中r代表预测区间的平均宽度。通常在保证picp尽可能大的前提下pinaw的值越小,说明预测精度越好。
(3)综合指标(coveragewidth-basedcriterion,cwc)
为满足上述两种指标的高覆盖率和窄区间要求,将上述两个指标转化为一个综合指标进行评估,其定义如下:
cwc=pinaw×(1+γ×e(-η×(picp-μ)))(25)
其中
(4)平均绝对百分比误差(meanabsolutepercentageerror,mape)
其中
进一步的,基于上述实施例,作为更完整的实施例,还可以同时进行利用基于遗忘因子的递归最小二乘法更新所述负荷概率区间预测模型的模型参数,和从预测间隙覆盖率、预测区间规则化平均宽度、综合指标、平均绝对百分比误差中选取一种或任几种对所述负荷概率区间预测模型进行性能评估,具体内容参考上文,在此不作赘述。
下面对本申请实施例提供的预测系统进行介绍,下文描述的预测系统与上文描述的预测方法可相互对应参照。
参见图3,图3为本申请实施例所提供的一种电力负荷特征的预测系统的结构示意图,该预测系统包括:
数据选择模块100,用于利用k-means特征提取方法对历史负荷数据和新负荷数据进行特征选择并输出负荷最优特征集;
样本建立模块200,用于根据所述负荷最优特征集建立训练样本;
高斯模型建立模块300,用于利用所述训练样本建立高斯过程回归模型;其中,所述训练样本中样本为输入变量矩阵和对应目标值;
预测模型建立模块400,用于根据所述高斯过程回归模型,构建特定置信水平下的负荷概率区间预测模型;
预测模块500,用于输入所述负荷最优特征集中的数据,利用所述负荷概率区间预测模型输出预测结果。
本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被处理器执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以12存储程序代码的介质。
本申请还提供了一种电力负荷特征预测终端,可以包括存储器和处理器,存储器中存有计算机程序,处理器调用存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然电力负荷特征预测终端还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的系统而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。