基于动态网络分位数模型的日前电价概率预测方法与流程

文档序号:20955751发布日期:2020-06-02 20:23阅读:337来源:国知局
基于动态网络分位数模型的日前电价概率预测方法与流程

本发明涉及智能电网与电力数据分析领域,是一种基于动态网络分位数模型的日前电价概率预测方法。



背景技术:

自竞争性电力市场问世以来,电价预测(epf)逐渐成为售电公司制定投资决策机制过程中必不可少的重要环节。其中,日前电价作为能源交易决策的参考价格,更是因其能直接影响售电公司的收益而备受关注。随着智能电网的迅速发展,大量分布式可再生能源接入电网,已经成为坚强智能电网重要的组成部分。然而,可再生能源的间歇性与不确定性对价格导向的电力市场带来重大影响,这将会极大地降低日前电价预测的精度。由此,寻求精准的日前电价预测方法是售电公司亟需攻克的难题。早期的调查指出,每提高1%的预测误差,就会增加10亿里拉的电力操作成本。因此,如何在开放的电力市场环境下进一步提升日前电价预测精度对售电公司具有十分重要的现实意义。

现有的日前电价预测方法主要是通过将使用历史日电价数据输入svm、bp神经网络等模型得到预测日电价的,(1)由于直接将历史日电价相关数据集输入不同的预测模型进行日前电价预测,忽视了电价的日周期性特征,如果向预测模型中输入与预测日电价特征不相符的数据,不仅增大计算量,还会导致日前电价预测精度下降;(2)由于日前电价预测的研究绝大多数不是概率预测,而是集中于点预测,存在着一定的局限性,概率预测可以细致反映电价变化的波动范围、为决策者提供更加丰富的信息更加受到学术界与运营商的高度重视;(3)现有的概率预测模型中,分位数回归神经网络概率预测模型(qfnn)因其不需要先验分布假设、能够提供稳定的预测信息而被广泛应用于负荷与风电功率概率预测中,但是,fnn需要预设网络节点数,而网络节点数设置的过多或过少都会降低模型的预测精度。迄今为止,尚未有基于动态网络分位数模型的日前电价概率预测方法的文献报道和实际应用。



技术实现要素:

本发明的目的是,克服现有技术的不足,提供一种科学合理,适用性强,预测精度高的基于动态网络分位数模型的日前电价概率预测方法。

本发明的目的是由以下技术方案来实现的:一种基于动态网络分位数模型的日前电价概率预测方法,其特征是,它包括以下步骤:

1)根据不同影响因素与电价序列间的关联关系设计综合影响因子进行电价相似日选取

①气象因素相似度计算

xi为日气象粒子特征向量,其中,i=1,2,...h,h表示预测日前h天的历史日,将第i个历史日的日实时小时温度、实时小时风速、实时降雨量、实时小时湿度表示为xi=(xi(1),...,xi(n)),n为因素数;而预测日特征向量x0=(x0(1),...,x0(n)),根据改进的灰色关联度计算序列x0与xi相似度γi为式(1),

其中,t=1,2,...,t为各个预测日与历史日气象影响因素指标序列的维数,表示预测日气象因素序列x0与历史日气象因素序列xi自比绝对差的最小值,表示预测日气象因素序列x0与历史日气象因素序列xi自比绝对差的最大值;ρ为分辨系数,ω(t)表示第t时间的影响因素指标与第i个气象影响因素的关联系数的权重,气象粒子相似度为γi,ω(t)的求取过程为:

首先定义t1与t2时刻的优先级联矩阵g=(gt1t2)t×t,其中表示t1时刻与t2时刻在某影响因素条件下的重要程度对比,根据时刻近大远小原则计算为式(2):

然后将g=(gt1t2)t×t转换为模糊一致矩阵其中bt1如式(3)所示,bt1t2如式(4)所示,

最后求出列项权值和,为式(5):

②负荷与可再生能源发电量相似度计算

将负荷曲线进行标准化处理,设qi,j为第i天的第j小时的负荷值,i=1,2,…,d,j=1,2,…,24,则标准化后的负荷值为:其中,代表第j小时的平均负荷值,为第j小时电价标准差,标准化的历史日负荷特征向量为yi=(yi(1),...,yi(n)),n为计算时刻数,预测日负荷特征向量为y0=(y0(1),...,y0(n)),采用dtw相似系数公式计算序列y0和yi的相似度,计算为式(6):

其中,γ(yi(n),y0(n))表示相似度,表示代价矩阵d中两序列对应元素的欧氏距离,距离越近,γ(yi(n),y0(n))越小;反之,相似度越大,将γ(yi(n),y0(n))记作qi,同理,令pi为可再生能源发电量相似度;

③日期类型相似度计算

电价波动规律与星期类型和间隔天数有着强关联关系,电价变化具有周期性,星期类型越相近,电价曲线波动越相似;预测日距历史日越近,电价相似度越大,星期相似度εi与相近日相似度ηi的计算为式(7)、式(8);

εi=1-|d(xi)-d(x0)|(7)

其中,d(x0)和d(xi)分别表示x0与xi映射后的值,λ为日无关系数,θ为周衰无关系数;d为预测日与第i个历史日相差天数;mod为取余函数;int为取整运算;w1、w2取值为7,z为相似度下限;

④综合影响因子计算

采用各因素相似度带权相加方法计算综合影响因子,计算为式(9):

ξi=f1ri+f2qi+f3pi+f4ηi+f5εi(9)

其中,f1,f2,f3,f4,f5分别为日特征气象因子、负荷、可再生能源发电量、星期类型、相近日的相似度权重系数,根据不同影响因素的作用程度对其进行赋值,令f2>f1>f4>f5>f3,f1+f2+f3+f4+f5=1,确定第i日与预测日之间的综合影响因子ξi,比较ξi的大小按从大到小排序,选择具有排名在前三分之一的综合影响因子的历史日作为相似日;

2)设计动态网络分位数电价预测(qgdfnn)模型

①qgdfnn模型输入层

qgdfnn模型共分为四层,分别为输入层、隶属径向基函数(rbf)层、规则层及输出层,在输入层中输入电价相关变量总数为n,记作xi,i=1,2,...,n;

②qgdfnn模型隶属rbf层

在隶属rbf层中,存在u个隶属rbf与每个xi相连,则共有u×n个节点,选用高斯函数作为隶属rbf,则隶属rbf计算为式(10):

其中,τ∈(0,1)能够生成不同的分位数g1(τ)为隶属rbf输出结果,cij(τ)表示输入变量xi的第j个隶属rbf分位数中心矩阵,i=1,2,...,n,j=1,2,...,μ,σij为隶属rbf宽度,令xi(t)表示新输入数据,t=1,2,...,m,m≤n,比较其与边界集φi之间的最小欧氏距离edi(jn),当edi(jn)≥kmf时,σij调整为式(11):

此时,为新生成的高斯函数中心,ci-1,j、ci+1,j是近邻的两高斯函数的中心,kmf取值范围为[0,0.5],是系统可定义常数;

③qgdfnn模型规则层

在规则层中,设新输入样本数据为(xi,pi),pi是第i个期望的输出,规则的增减需要遵循的原则:当(xi,pi)不满足模糊规则的ε-完备性时,需要增加新规则;当(xi,pi)的输出误差ei>ie时,需要考虑产生新规则;而当第j个模糊规则的重要性ψj<kerr时,第j个规则被删除,其中,ei=||pi-yi||,kerr为系统可容误差,yi为当前结构下qgdfnn的输出值,ie是根据期望精度预定义的阈值,它的变化过程为式(12):

定义偏差减小率矩阵e=(ρ1,ρ2,...,ρu),e的第j列ρj对应第j个规则的(n+1)个偏差减小率,用g2(τ)表示第j个模糊规则的输出,计算为式(13):

④qgdfnn模型输出层

在输出层中,对规则层输出结果进行加权求和得到输出结果为式(14):

其中,输出结果y(τ|x1,x2,...,xn)为因变量y在输入变量为(x1,x2,...,xn)条件下的对应分位数,wj(τ)为规则层到输出层之间的第j个模糊规则的分位数权重矩阵,j=1,2,...,u;

qgdfnn模型表达式整合为式(15)、式(16):

qy(τ|x)=f(xi,cij(τ),wj(τ))(15)

其中,qy(τ|x)表示因变量y在自变量为x时的τ条件分位数;

3)基于qgdfnn模型的核密度电价概率预测

①qgdfnn模型求解

对模型进行参数估计,将对模型中的cij(τ)、wj(τ)估计问题转为求解式(17)

其中,n为样本个数,ρτ(u)为损失函数,定义为式(18),通过式(17)得到cij(τ)和wj(τ)的最优估计值,带入式(15)中,得到相应变量的条件分位数,

②基于kde方法的日前电价概率生成

向模型输入相似日电价相关数据,具体定义为:令代表在t个实施例中第l个相似日的第d个影响因子,qgdfnn模型最终会输出预测日电价条件分位数,记作:zi=qyi(τ|xi),但是,要想获得预测日概率电价,还需要通过核密度估计(kde)方法将zi转换成预测日电价概率曲线,kde方法通过平滑尖峰函数拟合观测值模拟真实概率分布,最后,将zi作为核函数的输入值,通过选择合适的带宽进行概率密度预测,获得日前电价的概率密度函数;再通过对日前电价概率密度进行相应区间积分求解,得到日前电价概率预测曲线,假设z1,z2,...,zn是独立的同分布随机样本,某点的概率密度函数为式(19):

其中h是作为需要自动启动设置的平滑参数的带宽,n是样本大小,k(·)被视为非负核函数,选用epanechnikov核函数,计算为式(20):

其中,i(·)为示性函数,当括号里条件为真时,取值为1,否则为0;

③模型评估指标

为综合评价qgdfnn模型性能,评估指标为式(21)-式(25):

(a)平均绝对百分比误差(mape),用于误差分析预测结果,mape值越小越好,定义为式(21):

其中,n表示预测电价日的总天数,ah和fh分别代表第h小时的电价实际值和预测值;

(b)相对均方误差(rmse),用于反映预测值与实际值的偏差程度,rmse值越小越好,定义为式(22):

(c)标准差误差(sde),用来衡量与给定时间序列的价格波动相关的风险,sde定义为式(23):

eh=fh-ah,eh是第h小时的预测电价误差,是预测期的平均误差,sde值越小证明预测值误差受价格波动影响越小;

(d)最小信息准则(aic),权衡所估计模型的复杂度和此模型拟合数据的优良性,aic定义为式(24):

其中,k代表模型参数,k值越小,代表模型越简洁;l值越大,代表模型越精确,sse为平方和误差,用于测量时间序列内的变化,如果时间序列中的所有情况都相同,那么sse将等于0,sse定义为式(25):

本发明的基于动态网络分位数模型的日前电价概率预测方法,由于采用根据不同影响因素与电价序列间的关联关系设计综合影响因子进行电价相似日选取、设计动态网络分位数电价预测(qgdfnn)模型和基于qgdfnn模型的核密度电价概率进行预测,与现有技术相比的有益效果是:使用相似日数据进行基于qgdfnn模型的日前电价概率预测,其预测精度不仅得到显著提升,还大大缩短了运行时间;提出方法不仅对日前电价预测具有较高的精准度,而且对未来近一周的电价预测也能保持良好的精确度,证明其在大样本条件下具有稳定性;通过模型指标对比评价,qgdfnn模型的sde值远小于其他模型,说明该模型受价格波动相关风险影响小,对奇异值的耐受性强。其科学合理,适用性,效果佳。

附图说明

图1为本发明方法流程图;

图2对实施例1使用相似日数据与历史日数据预测结果对比图;

图3对实施例2使用相似日数据与历史日数据预测结果对比图;

图4对实施例3使用相似日数据与历史日数据预测结果对比图;

图5对实施例4使用相似日数据与历史日数据预测结果对比图;

图6各模型sde值对比图;

图7各模型aic值对比图;

图8对实施例1使用不同预测方法预测对比图;

图9对实施例2使用不同预测方法预测对比图;

图10对实施例3使用不同预测方法预测对比图;

图11对实施例4使用不同预测方法预测对比图。

具体实施方式

下面结合附图对本发明的一种基于动态网络分位数模型的日前电价概率预测方法作详细描述。

参照图1,本发明的一种基于动态网络分位数模型的日前电价概率预测方法,包括以下步骤:

1)根据不同影响因素与电价序列间的关联关系设计综合影响因子进行电价相似日选取

①气象因素相似度计算

xi为日气象粒子特征向量,其中,i=1,2,...h,h表示预测日前h天的历史日,将第i个历史日的日实时小时温度、实时小时风速、实时降雨量、实时小时湿度表示为xi=(xi(1),...,xi(n)),n为因素数;而预测日特征向量x0=(x0(1),...,x0(n)),根据改进的灰色关联度计算序列x0与xi相似度γi为式(1),

其中,t=1,2,...,t为各个预测日与历史日气象影响因素指标序列的维数,表示预测日气象因素序列x0与历史日气象因素序列xi自比绝对差的最小值,表示预测日气象因素序列x0与历史日气象因素序列xi自比绝对差的最大值;ρ为分辨系数通常取0.5,ω(t)表示第t时间的影响因素指标与第i个气象影响因素的关联系数的权重,气象粒子相似度为γi,ω(t)的求取过程为:

首先定义t1与t2时刻的优先级联矩阵g=(gt1t2)t×t,其中表示t1时刻与t2时刻在某影响因素条件下的重要程度对比,根据时刻近大远小原则计算为式(2):

然后将g=(gt1t2)t×t转换为模糊一致矩阵其中bt1如式(3)所示,bt1t2如式(4)所示,

最后求出列项权值和,为式(5):

②负荷与可再生能源发电量相似度计算

将负荷曲线进行标准化处理,设qi,j为第i天的第j小时的负荷值,i=1,2,…,d,j=1,2,…,24,则标准化后的负荷值为:其中,代表第j小时的平均负荷值,为第j小时电价标准差,标准化的历史日负荷特征向量为yi=(yi(1),...,yi(n)),这里n取144,预测日负荷特征向量为y0=(y0(1),...,y0(n)),采用dtw相似系数公式计算序列y0和yi的相似度,计算为式(6):

其中,γ(yi(n),y0(n))表示相似度,表示代价矩阵d中两序列对应元素的欧氏距离,距离越近,γ(yi(n),y0(n))越小;反之,相似度越大,将γ(yi(n),y0(n))记作qi,同理,令pi为可再生能源发电量相似度;

③日期类型相似度计算

电价波动规律与星期类型和间隔天数有着强关联关系,电价变化具有周期性,星期类型越相近,电价曲线波动越相似;预测日距历史日越近,电价相似度越大,星期相似度εi与相近日相似度ηi的计算为式(7)、式(8);

εi=1-|d(xi)-d(x0)|(7)

式(7)中,d(x0)和d(xi)分别表示x0与xi映射后的值,式(8)中,λ为日无关系数,θ为周衰无关系数,这里λ,θ∈[0.9,0.98],令λ=θ=0.93;d为预测日与第i个历史日相差天数;mod为取余函数;int为取整运算;w1、w2取值为7,z为相似度下限;

④综合影响因子计算

采用各因素相似度带权相加方法计算综合影响因子,计算为式(9):

ξi=f1ri+f2qi+f3pi+f4ηi+f5εi(9)

其中,f1,f2,f3,f4,f5分别为日特征气象因子、负荷、可再生能源发电量、星期类型、相近日的相似度权重系数,根据不同影响因素的作用程度对其进行赋值,令f2>f1>f4>f5>f3,f1+f2+f3+f4+f5=1,确定第i日与预测日之间的综合影响因子ξi,比较ξi的大小按从大到小排序,选择具有排名在前三分之一的综合影响因子的历史日作为相似日;

2)设计动态网络分位数电价预测(qgdfnn)模型

①qgdfnn模型输入层

qgdfnn模型共分为四层,分别为输入层、隶属径向基函数(rbf)层、规则层及输出层,在输入层中输入电价相关变量总数为n,记作xi,i=1,2,...,n;

②qgdfnn模型隶属rbf层

在隶属rbf层中,存在u个隶属rbf与每个xi相连,则共有u×n个节点,选用高斯函数作为隶属rbf,则隶属rbf计算为式(10):

其中,τ∈(0,1)能够生成不同的分位数g1(τ)为隶属rbf输出结果,cij(τ)表示输入变量xi的第j个隶属rbf分位数中心矩阵,i=1,2,...,n,j=1,2,...,μ,σij为隶属rbf宽度,令xi(t)表示新输入数据,t=1,2,...,m,m≤n,比较其与边界集φi之间的最小欧氏距离edi(jn),当edi(jn)≥kmf时,σij调整为式(11):

此时,为新生成的高斯函数中心,ci-1,j、ci+1,j是近邻的两高斯函数的中心,kmf取0.05;

③qgdfnn模型规则层

在规则层中,设新输入样本数据为(xi,pi)(pi是第i个期望的输出),规则的增减需要遵循的原则:当(xi,pi)不满足模糊规则的ε-完备性时,需要增加新规则;当(xi,pi)的输出误差ei>ie时,需要考虑产生新规则;而当第j个模糊规则的重要性ψj<kerr时,第j个规则被删除,其中,ei=||pi-yi||,kerr为系统可容误差,yi为当前结构下qgdfnn的输出值,ie是根据期望精度预定义的阈值,它的变化过程为式(12):

定义偏差减小率矩阵e=(ρ1,ρ2,...,ρu),e的第j列ρj对应第j个规则的(n+1)个偏差减小率,用g2(τ)表示第j个模糊规则的输出,计算为式(13):

④qgdfnn模型输出层

在输出层中,对规则层输出结果进行加权求和得到输出结果为式(14):

其中,输出结果y(τ|x1,x2,...,xn)为因变量y在输入变量为(x1,x2,...,xn)条件下的对应分位数,wj(τ)j=1,2,...,u为规则层到输出层之间的第j个模糊规则的分位数权重矩阵;

qgdfnn模型表达式整合为式(15)、式(16):

qy(τ|x)=f(xi,cij(τ),wj(τ))(15)

其中qy(τ|x)表示因变量y在自变量为x时的τ条件分位数;

3)基于qgdfnn模型的核密度电价概率进行预测

①qgdfnn模型求解

对模型进行参数估计,将对模型中的cij(τ)、wj(τ)估计问题转为求解式(17)

其中,n为样本个数,ρτ(u)为损失函数,定义为式(18),通过式(17)得到cij(τ)和wj(τ)的最优估计值,带入式(15)中,得到相应变量的条件分位数,

②基于kde方法的日前电价概率生成

向模型输入相似日电价相关数据,具体定义为:令代表第l个相似日的第d个影响因子,具体模型输入的自变量见表1所示,qgdfnn模型最终会输出预测日电价条件分位数,记作:zi=qyi(τ|xi),但是,要想获得预测日概率电价,还需要通过核密度估计(kde)方法将zi转换成预测日电价概率曲线,kde方法通过平滑尖峰函数拟合观测值模拟真实概率分布,最后,将zi作为核函数的输入值,通过选择合适的带宽进行概率密度预测,获得日前电价的概率密度函数;再通过对日前电价概率密度进行相应区间积分求解,得到日前电价概率预测曲线,假设z1,z2,...,zn是独立的同分布随机样本,某点的概率密度函数为式(19):

其中,h是作为需要自动启动设置的平滑参数的带宽,n是样本大小,k(·)被视为非负核函数,选用epanechnikov核函数,计算为式(20):

其中,i(·)为示性函数,当括号里条件为真时,取值为1,否则为0;

表1相似日实施例自变量描述

③模型评估指标

为综合评价qgdfnn模型性能,评估指标采用式(21)-式(25):

(a)平均绝对百分比误差(mape),用于误差分析预测结果,mape值越小越好,定义为式(21):

其中,n表示预测电价日的总天数,ah和fh分别代表第h小时的电价实际值和预测值;

(b)相对均方误差(rmse),用于反映预测值与实际值的偏差程度,rmse值越小越好,定义为式(22):

(c)标准差误差(sde),用来衡量与给定时间序列的价格波动相关的风险,sde定义为式(23):

eh是第h小时的预测电价误差,是预测期的平均误差,sde值越小证明预测值误差受价格波动影响越小;

(d)最小信息准则(aic),权衡所估计模型的复杂度和此模型拟合数据的优良性,aic定义为式(24):

其中,k代表模型参数,k值越小,代表模型越简洁;l值越大,代表模型越精确,sse为平方和误差,用于测量时间序列内的变化,如果时间序列中的所有情况都相同,那么sse将等于0,sse定义为式(25):

为验证采用本发明提供的基于动态网络分位数模型的日前电价概率预测方法能够有效提升日前电价预测精确度,发明人分别采用本发明提供的方法进行实验验证:1)使用相似日数据与历史日数据对相同日期进行预测对比分析;2)分别对svm、bp神经网络、elm模型与qgdfnn模型进行指标评价;3)使用不同3种预测方法与本发明方法预测结果对比分析。实验数据:美国加利福尼亚州自2018年1月1日至2019年3月1日的相关数据进行采集整理,构建了综合预测实验数据集(如表2所示)。其中,电价、负荷数据来自美国pjm网站(https://www.pjm.com/);温度、湿度、风速、日照强度数据来自美国气象中心网站(https://www.weather.gov/);煤炭发电量、水力发电量、核能发电量、风力发电量、光伏发电量以及运营商销售电量数据来自美国能源署网站(https://www.eia.gov/)。

表2综合预测实验数据集

在选定预测实施例的同时,还需对预测实施例进行相似日选取:

考虑季节性因素以及日期类型(节假日与工作日)对日前电价预测的影响选择预测日期,确定相似日搜索实施例(以及算例分析的预测实施例)按表3分类。

表3所有实施例的预测日期

由综合预测实验数据集与表3中的相似日搜索范围分别对不同实施例进行赋值计算,令f1=0.1,f2=0.4,f3=0.05,f4=0.3,f5=0.15。将计算出的ξi(i=1,...,l)进行从大到小排列,若最大综合相似因子(如ξi-1)与某日综合相似因子(如ξi+1)之差小于0.0005,则认为这两日全部为预测相似日。搜索到的相似日结果如表4所示。

表4相似日选取结果

分别将表3中实施例1~4选取出的相似日数据集进行归一处理。输入qgdfnn模型后获得对应预测日不同分位点上的电价预测值。本发明选择0.001到0.999的分位数范围,间隔为0.02。然后将预测的小时电价分位数作为epanechnikov核函数的输入变量,结合核密度估计方法,获得实施例1~4的小时电价预测概率密度。最后将实施例1~4的电价预测概率密度在相应区间积分,得到电价概率预测曲线。

发明人分别采用本发明提供的相似日选取方法下选中的相似日数据与历史日分别对相同日期进行电价概率预测结果,以及与不同模型的对比指标,以及不同日前电价预测方法的预测结果对比。图2为对实施例1使用相似日数据与历史日数据预测结果对比,图3为实施例2使用相似日数据与历史日数据预测结果对比,图4为对实施例3使用相似日数据与历史日数据预测结果对比,图5为对实施例4使用相似日数据与历史日数据预测结果对比,图6为各模型sde值对比,图7为各模型aic值对比(mape与rmse值对比如表5所示),图8为对实施例1使用不同预测方法预测对比,图9为对实施例2使用不同预测方法预测对比,图10对实施例3使用不同预测方法预测对比,图11为对实施例4使用不同预测方法预测对比。从图2~图5可以看出,使用本发明相似日选取方法选出的数据进行电价预测有效提升了电价预测精度。从图6、图7可以看出,使用本发明模型各方面性能都优于其他三种经典预测模型。从图8~图11可以看出,采用本发明预测方法相比其他方法的预测精度更高。

表5各模型mape与rmse对比结果

本发明的实施例并非穷举,本领域技术人员不经过创造性劳动的简单复制和改进,仍属于本发明权利保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1