本发明涉及智能电网,特别涉及一种高效的电网数据处理方法。
背景技术:
由分布式电源、储能装置、能量变换装置、负载和监控、保护装置汇集而成的分布式微网系统对主网而言,可作为在秒级时间尺度内动作以满足外部输配电网络需求的可控单元;对于电力用户,分布式微网是能满足用户特定需求的可定制电源。分布式微网负载预测是实现安全、节能、高效运行的重要前提,是实现分布式微网能量优化管理的条件和依据,其预测效果的好坏直接关系到分布式微网和主网系统发供电计划的编制、电能质量的高低和电力市场的交易等。现有关于分布式微网负载预测技术针对发电装置的发电预测,而对用户负载预测尚无成熟方法。随着用户负载的波动性和随机性越来越大、历史数据不全面,其负载预测难度更大。
技术实现要素:
为解决上述现有技术所存在的问题,本发明提出了一种高效的电网数据处理方法,包括:
将电网负载细化到负载值空间来预测,基于相似天选择准则来进行支持向量机训练样本的选择,然后选择混合型核函数,并针对各个负载值进行支持向量机参数优化选择。
优选的,所述选择混合型核函数,进一步包括:
采用将全局核函数kpoly与局部核函数krbf线性组合的混合型核函数kmix,即
kmix=ηkpoly+(1-η)krbfη∈[0,1]
其中η是多项式核函数kploy的预定义系数;
kpoly(xi,x)=[(xi,x)+1]2
其中x是预定义维度d的输入向量,xi是第i个核函数的中心,并且与x为相同维度的向量,||x-xi||2为(x-xi)的范数,σ为标准化核宽度;
所述针对各个负载值进行支持向量机参数优化选择,进一步包括:
需要优化的参数包括核宽度σ和系数η,设有d维空间由n个粒子组成的种群,第i个粒子的速度和位置分别为vi=(vi1,vi2,...,vid)和xi=(xi1,xi2,...,xid),第i个粒子的个体最大值和全局最大值分别为pi=(pi1,pi2,...,pid)和pg=(pg1,pg2,...,pgd),则粒子群中的粒子更新自身速度和位置:
v(k+1)i=w·v(k+1)i+c1r1(p(k)i-x(k)i)+c2r2(p(k)g-x(k)i)
x(k+1)i=x(k)i+a·v(k)i
k和k+1表示迭代次数;
c1=c2∈[0,4]为加速常数;r1,r2为分布在[0,1]之间的随机数;a为约束因数;w为惯性权值。
本发明相比现有技术,具有以下优点:
本发明提出的高效的电网数据处理方法,在用户负载的波动性和随机性较大和历史数据不全面的情况下实现了电网实时负载预测,为分布式微网能量管理的后续工作奠定基础。
附图说明
图1为本发明高效的电网数据处理方法的流程图。
具体实施方式
下文提供对本发明一个或者多个实施例的详细描述。结合这样的实施例描述本发明,但是本发明不限于任何实施例。本发明的范围仅由权利要求书限定,并且本发明涵盖诸多替代、修改和等同物。在下文描述中阐述诸多具体细节以便提供对本发明的透彻理解。出于示例的目的而提供这些细节,并且无这些具体细节中的一些或者所有细节也可以根据权利要求书实现本发明。
本发明在负载值空间上构建了一种支持向量机的分布式微网负载预测方法,为分布式微网能量管理的后续工作奠定基础。
本发明结合分布式微网负载的特点,构建支持向量机分布式微网的负载预测方法。将分布式微网负载细化到负载值空间来预测,基于相似天选择准则来实现训练样本的选择,然后选择混合型核函数,并将粒子群算法用于参数的优化选择。即训练样本和参数都是针对各个负载值分别选择的。具体步骤为:
(1)确定输入向量。对获取的原始负载数据进行预处理,构成输入向量的元素,对输入向量中的各影响因素和原始负载数据进行预处理。
(2)选择训练样本。基于双向加权的相似天选择准则对历史数据进行处理,形成最终训练样本。
(3)选择混合型核函数。采用一种同时保持模型的学习能力和泛化能力的混合型核函数。
(4)优化参数。用粒子群算法对预测方法的参数进行优化。
(5)求解模型并完成对当天特定时刻负载的预测。
其中在步骤3中,采用将全局核函数kpoly与局部核函数krbf线性组合的混合型核函数,即
kmix=ηkpoly+(1-η)krbfη∈[0,1]
其中η是多项式核函数kploy的预定义系数。
kpoly(xi,x)=[(xi,x)+1]2
其中x是预定义维度d的输入向量,xi是第i个核函数的中心,并且与x为相同维度的向量,||x-xi||2为(x-xi)的范数,σ为标准化核宽度。
在步骤4中,需要优化的参数有:核宽度σ和系数η,设有d维空间由n个粒子组成的种群,第i个粒子的速度和位置分别为vi=(vi1,vi2,...,vid)和xi=(xi1,xi2,...,xid),第i个粒子的个体最大值和全局最大值分别为pi=(pi1,pi2,...,pid)和pg=(pg1,pg2,...,pgd),则粒子群中的粒子更新自身速度和位置的公式为
v(k+1)i=w·v(k+1)i+c1r1(p(k)i-x(k)i)+c2r2(p(k)g-x(k)i)
x(k+1)i=x(k)i+a·v(k)i
k和k+1表示迭代次数;c1=c2∈[0,4]为加速常数;r1,r2为分布在[0,1]之间的随机数;a为约束因数;w为惯性权值。
以上粒子群对改进预测参数进行优化的具体步骤如下:
(1)设定粒子群参数,包括粒子数n、维度空间d、粒子分布范围和迭代最大次数tmax,适应度阈值ε;
(2)随机初始化粒子群;
(3)分别根据上述速度和位置更新公式更新粒子的速度和位置;
(4)计算适应度值f,并据此更新个体最大值pi和全局最大值pg,其中适应度函数用负载预测中负载值的相对误差来表示,即
f=|(p’t-pt)/pt|
p’t和pt分别表示t时刻点负载的预测值和实际值。
(5)如果适应度值满足|f(k+1)-f(k)|<ε或迭代次数满足k<tmax,则转到步骤(3);否则算法停止,输出pg即为待优化参数的最优解。
本发明在形成输入向量时,连续多天的天气因数量化值和每天负载均值;当天的天气因数量化值;引入每天类型量化值;引入在前多天同时刻的负载值。
当天的输入向量由以上相应的五类元素构成。本发明确定输入向量前对历史统计数据、影响因素及数据正则化这三方面进行处理。
对于历史统计数据,包括空缺数据的补足、数据垂直处理和水平处理三个方面。本发明引入采样点的每天负载变化率δx和负载变化率均值
当t=1时,
δx(i,t)=(x(i,t)-x(i-1,t))/x(i-1,t)
当t>1时,
δx(i,t)=(x(i,t)-x(i,t-1))/x(i,t-1)
其中x(i,t)为第i天t时刻的负载值,t为每天负载样本数,n为所选天数,δx(i,t)和
不同日期同一时刻负载具有一定的相似性,同时刻负载值应该维持在一定范围内。本发明对同时刻超出范围的原始负载序列异常数据进行了识别和校正,即所谓的垂直处理。
第一步,计算各负载值的均值和标准差。设负载序列为x(d,t),则各负载值均值e(t)及标准差σ(t)分别为
e(t)=∑x(d,t)/n
σ(t)=(∑(x(d,t)-e(t))/n)1/2
第二步,计算各负载值偏心系数和最大偏心系数。设第d天t时刻的偏心系数和t时刻最大偏心系数分别为ρ(d,t)和ρmax(t):
ρ(d,t)=|x(d,t)-e(t)|/σ(t)
ρmax(t)=max(ρ(d,t))
第三步,识别与校正异常值。首先判断是否有ρmax(t)大于预定义常数c,如果存在则认为该时间点t存在异常值,并进一步判断ρ(d,t)>c是否成立,若成立则将x(d,t)确定为异常值,用其前后一天同时刻的负载均值
x(d,t)=(x(d-1,t)+x(d+1,t))/2
迭代执行第二和第三步,直到识别出所有的异常值,最终使得ρmax(t)<c。这样负载序列中较明显的异常数据得到了垂直处理。
对已经垂直处理的负载序列做进一步的水平处理,先用中值法对原始负载序列产生一个平滑估计序列,再求出该平滑估计序列与实际负载序列的偏心系数,然后对各负载值负载进行水平处理。包括以下三步:
第一步,计算平滑估计序列x’(t)。设x(t)为垂直处理过的负载序列,取序列x(t)相邻三点负载中值生成一个新负载序列x(1)(t),再取x(1)(t)序列相邻三点负载的中值再生成一个新负载序列x(2)(t),即
x(1)(t)=(∑x(t-1)+x(t)+x(t+1))/3,t=1,...,t
x(2)(t)=(∑x(1)(t-1)+x(1)(t)+x(1)(t+1))/3,t=1,...,t
则负载平滑估计序列x’(t)为
x’(t)=0.1x(2)(t-1)+0.8x(2)(t)+0.1x(2)(t+1),t=1,...,t
第二步,计算实际负载序列x(t)与平滑估计序列x’(t)的偏心系数ρ(t),即
ρ(t)=|x(t)-x’(t)|/x’(t)
第三步,识别及校正异常值。预先给定偏心系数阈值μ,通过调节μ的大小确定对负载序列的校正程度。当ρ(t)>μ时,负载值为异常点,用该负载值对应的平滑序列估计值x’(t)来替换x(t);否则,保持原来的值。这样负载序列x(t)就得到了的水平处理。
经过垂直和水平处理的负荷数据通过正则化处理统一映射到[0.1,0.9]区间。即
x’=0.9-0.8×(xmax-x)/(xmax-xmin)
其中xmax和xmin分别是所有训练样本中特征值x的最大值和最小值。最后,形成该分布式微网负载预测方法中各负载值的输入向量。
在步骤2的选择训练样本前,首先收集与训练样本选择相关的历史统计数据。本发明考虑的因素包括天气因素、每天负载均值、每天类型。在形成训练样本选择准则时,对不同时刻的各个特征因素分别加以处理,以反映不同特征因素对同一时刻负载不同的影响程度。将前两个月的历史作为训练样本的待选范围,在负载值空间上,采用相似评估函数综合该负载值连续多天的负载序列局部形态相似度和水平加权特征相似度,并引入用于历史垂直加权的时间因数。
具体步骤为:
(1)计算历史与当天各负载值的局部形态相似度;
(2)计算历史与当天各负载值的水平加权特征相似度;
(3)综合这两个相似度并使用垂直加权的时间因数形成选择训练样本的相似评估函数;
(4)计算历史与当天的相似度并降序排列,依次选择相似度最高的多个天数作为预测方法的训练样本。
对于局部形态相似度,即从单个负载值分别定量分析历史前几天负载序列和当天前几天的局部形态相似度,具体实现步骤如下:
(1)将正则化的每天负载序列分别向前扩展k个时刻的负载形成新负载序列,设扩展后第p个历史天的新序列为fp,则
fp=[fp-1,t-(k-1),fp-1,t-(k-2),…,fp-1,t,fp,1,fp,2,…,fp,t]
fp,j表示第p天j时刻的负载值。
(2)计算p=0时,待预测当天各负载值的负载序列f0,j。
(3)计算局部形态相似度rf:
rfp,j=min{(max(fp,j/f0,j)-min(fp,j/f0,j)),(max(f0,j/fp,j)-min(f0,j/fp,j))
由于不同的特征因素对同一时刻负载值的影响程度不同,同一特征因素对不同时刻负载值的影响也不同。各个特征因素与该负载值的关联度,对连续多天的特征因素做水平加权计算。具体过程如下:
(1)确定当天的特征因素,包括当天气温范围、天气类型,当天负载均值;
(2)计算第i个特征因素与j时刻负载值的关联系数xsi,j:
①分别提取第i个特征因素值和j时刻负载值的负载值形成向量rti和fhj,即
rti=[rtl,i,rt2,i,…rtm,i]
fhj=[fhl,j,fh2,j,…fhm,j]
m为相似天选择范围的历史总天数;i为特征因素数;j为每日负载采样点数。
②分别将向量rti和fhj中的每个元素都除以各自向量中的第一个数据得到处理后向量为rti'和fhj',即
rti'(k)=rti(k)/rti(1)
fhj'(k)=fhj(k)/fhj(1)k=1,2,…,m
③计算向量rti'和fhj'中的第k个元素的关联系数xi,j(k)为:
④计算第i个特征因素与j时刻负载值的关联系数xsi,j:
(3)将关联系数xsi,j作为的水平加权值,量化特征因素对负载值的影响,水平加权后历史与当天的特征序列分别为rt'p和rt'0,即由rtp和rt0向量中的元素分别乘以对应的xsi,j值形成。设第p天与当天j时刻负载的特征相似度为rsp,j,则
在形成相似天综合评估函数时,使用时间因数α
αi=β1mod(ti/7)+1β2int(ti/7)+1
β1和β2分别表示历史与当天的距离每增加一天和一周的相似缩减比例;ti表示历史与当天的时间间隔,mod是取余函数,int是取整函数。
最终,相似评估函数s为
s=α·rf·rt
计算历史各天与当天的相似评估函数并由大到小排序,依次选择历史上最相似的多个天数作为最终的训练样本。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。