本发明涉及一种基于相似性聚合的分布式光伏发电功率状态估计方法,属于光伏发电系统技术。
背景技术:
目前,10kv及以上电压等级接入的光伏发电系统大多都接入了电网自动化系统,但是低压接入的分布式光伏发电系统则没有接入电网自动化系统,电网调度控制中心不能及时掌握低压光伏的发电运行情况。随着分布式光伏的快速发展,这给电网安全稳定运行带来了很大隐患。
低压接入的分布式光伏发电系统通常只通过用电信息采集系统采集了电量数据,其采集周期较长,一般为一天,电网调度控制中心不能实时掌握低压光伏实时运行情况。针对该问题,目前主要有两种方案:一是提高用电信息采集系统数据采集的时间分辨率,最小为15分钟,由此获得低压光伏的准实时数据;二是针对低压光伏独立加装自动化采集装置,以实现在秒级时间尺度内采集其实时数据。
针对以上第一种方案,有部分电网公司提高了电量数据采集的时间分辨率,最小为15分钟,可获得低压光伏的准实时数据,但是这种方式实时性仍不高,而且更大的技术障碍在于原用于采集电量数据的用电信息采集系统技术性能不能够满足数据庞大的低压分布式光伏实时数据采集的需要。
针对以上第二种方案,也有部分地区电网调度控制中心针对低压光伏独立加装了自动化采集装置,可以在秒级时间尺度内采集其实时数据,但是由于低压光伏点多面广,这种方式成本较高,实施不便,也将增加电网公司运维负担,不宜推广。
以上两种方案都是通过直接采集的方式获得低压光伏的实时运行数据,没有利用光伏发电的固有特性,即光伏发电主要受到地理位置和气象条件的影响,而同一地理区域内,气象条件基本一致,分布式光伏发电系统的有功出力亦具有一致性,即单位装机的有功出力基本相同。
技术实现要素:
本发明的技术解决问题:克服现有技术的不足,提供一种基于相似性聚合的分布式光伏发电功率状态估计方法,通过已实现自动化数据采集的光伏发电系统有功出力数据估计同一区域内其它未实现自动化采集的光伏发电系统有功出力数据,可提升分布式光伏的可观测性,有效解决低压光伏的实时数据采集问题,大大减轻安装采集设备带来的资金成本和运行维护成本。
本发明技术解决方案:一种基于相似性聚合的分布式光伏发电功率状态估计方法,包括以下步骤:
(1)基于分布式光伏出力时序曲线数据特征和l2范数距离,建立分布式光伏聚合模型,得到两个分布式光伏相似性的判据,两个分布式光伏之间的l2范数距离越小,相似性越大;
(2)以步骤(1)得到的两个分布式光伏相似性的为判断依据,基于k-means聚类的分布式光伏聚合求解方法,按照l2范数距离最小为原则,将分布式光伏加入距离最近的中心点(means)所在的聚类,得到聚合结果;
(3)利用聚合结果,基于电量数据计算分布式光伏发电功率状态估计参数;
(4)根据分布式光伏有功时序曲线数据特征随日期变化,根据累计估计误差判定是否重新进行聚合求解和状态估计参数计算,若累计估计误差大于一定阈值,则重新进行聚合求解和状态估计参数计算,得到新的聚类结果和状态估计参数。
所述步骤(1)中,建立分布式光伏聚合模型为:以分布式电源出力的时序曲线数据为特征向量,通过l2范数距离作为相似性依据,将l2范数距离小于一定阈值的两个分布式光伏纳入同一个聚合体,即完成分布式光伏聚合模型建立,具体包括以下步骤:
(11)确定第i个分布式光伏出力的时序曲线数据向量为:
si=[pi(t1),pi(t2),…,pi(tt)],i=1,2,…,n
其中,n为分布式光伏个数;pi(tj),j=1,2,…,t为分布式光伏在tj时段的有功出力,t为时序曲线数据向量的特征数,即时段数;
(12)确定第i个和第j个分布式光伏出力的时序曲线数据向量之间的l2范数距离为:
d(i,j)=||si-sj||2
d(i,j)为第i个和第j个分布式光伏出力时序曲线数据向量的l2范数距离;si为第i个分布式光伏出力的时序曲线数据向量,sj第j个分布式光伏出力的时序曲线数据向量。
所述步骤(2)中,基于k-means聚类的分布式光伏聚合求解方法,包括以下步骤:
(21)从所有的分布式光伏中随机抽取出k个分布式光伏,将k个分布式光伏出力的时序曲线数据向量分别作为k个聚类的中心点,然后遍历其余的分布式光伏,按照l2范数距离定义,对其余的每一个分布式光伏找到距离最近的中心点,并将这个分布式光伏加入距离最近的中心点所在的聚类,形成一个初始的聚类结果;
(22)每个聚类都至少有一个分布式光伏,计算每个聚类包含的分布式光伏出力的时序曲线数据向量的算术平均值,作为每个聚类新的中心点means,然后再遍历所有的分布式光伏,找到l2范数距离最近的中心点,并将这个分布式光伏加入距离最近的中心点所在的聚类,然后继续运行(22)执行迭代;
(23)如此往复步骤(22),直到前后两次迭代得到的所有聚类的中心点误差均小于设定阈值,最终得到分布式光伏聚类结果,即将所有分布式光伏分成了k个集合。
所述步骤(3)中,通过电量数据计算分布式光伏功率状态估计参数的方法包括以下步骤:
(31)确定分布式光伏的电量数据的集合,即e={ei|i=1,2,…,nj};
其中,nj为第j个聚合区内包含的分布式光伏的个数,ei为第i个分布式光伏的电量;
(32)确定自动化采集的分布式光伏的功率数据的集合,即p={pi|i=1,2,…,mj};
其中,mj为第j个聚合区内包含的实现自动化采集的功率数据的分布式光伏的个数,pi为采集的第i个分布式光伏的功率数据;
(33)确定待估计的分布式光伏的功率数据的集合,即
(34)待估计的功率数据
其中,inv是矩阵求逆运算符;tj是历史电量数据的个数,tj≥mj;
f(i),i=mj+1,…,nj,表示矩阵的第i行,即分布式光伏i的状态估计参数。
所述步骤(4)中,根据累计估计误差判定是否重新进行聚合求解和状态估计参数计算的方法包括以下步骤:
(41)确定累计估计误差ei,i=mj+1,…,nj,为通过功率估计结果计算得到的电量与实际电量的差值的均方根和,即
其中,δt为前后两个电量数据记录时刻之间的有功数据采集的个数;
(42)当ei<ε时,不需要重新进行聚合求解或所述状态估计参数计算,否则重新聚合并计算所述状态估计参数,其中,ε为误差允许阈值。
本发明与现有技术相比的优点在于:
(1)低压接入的分布式光伏发电系统通常只通过用电信息采集系统采集了电量数据,其采集周期较长,一般为一天,电网调度控制中心不能实时掌握低压光伏实时运行情况。针对该问题,电网公司一般通过提升电量数据采集的时间分辨率或单独加装实时数据采集装置的方式来获得低压光伏运行数据。第一种方案的时间分辨率最小为15分钟,可获得低压光伏的准实时数据,但是这种方式实时性仍不高,而且更大的技术障碍在于原用于采集电量数据的用电信息采集系统技术性能不能够满足数据庞大的低压分布式光伏实时数据采集的需要。第二种方案可以在秒级时间尺度内采集其实时数据,但是由于低压光伏点多面广,这种方式成本较高、实施不便、也将增加电网公司运维负担,不宜推广。而本发明考虑10kv接入的分布式光伏发电系统均已实现自动化数据采集,且同一地理区域内,气象条件基本一致,分布式光伏发电系统的有功出力亦具有一致性的情况,提出一种基于相似性聚合的分布式光伏发电功率状态估计方法,可以通过已实现自动化数据采集的光伏发电系统有功出力数据估计同一区域内其它未实现自动化采集的光伏发电系统有功出力数据,从而低压光伏实时运行数据的间接采集,提升分布式光伏的可观测性,有效解决低压光伏的实时数据采集问题,大大减轻安装采集设备带来的资金成本和运行维护成本。
(2)本发明实现了对分布式光伏的聚合和状态估计,有助于掌握区域分布式光伏的整体发电状态,实现低压分布式光伏发电功率的可观测性,有助于提升配电网安全运行水平,对服务分布式光伏有序发展具有重要的理论和现实意义。
附图说明
图1为本发明方法实现流程图。
具体实施方式
如图1所示,本发明的一种基于相似性聚合的分布式光伏发电功率状态估计方法,包括:基于分布式光伏有功时序曲线数据特征和l2范数距离,建立了分布式光伏聚合模型,提出了基于k-means聚类的分布式光伏聚合求解方法,并针对低压分布式光伏没有实现自动化数据采集的情况,基于聚合结果,提出基于电量数据计算低压分布式光伏发电功率状态估计参数的方法,最后考虑分布式光伏有功时序曲线数据特征随日期变化的特点,提出了根据累计估计误差判定是否重新进行聚合求解和状态估计参数计算的策略。本发明实现了对分布式光伏的聚合和状态估计,有助于掌握区域分布式光伏的整体发电状态,实现低压分布式光伏发电功率的可观测性,有助于提升配电网安全运行水平,对服务分布式光伏有序发展具有重要的理论和现实意义。
一方面,本发明的基于分布式光伏有功时序曲线数据特征和l2范数距离的分布式光伏聚合模型的原理是:以分布式电源出力的时序曲线数据为特征向量,通过l2范数距离作为相似性依据,将l2范数距离小于一定阈值的两个分布式电源纳入同一个聚合体。
具体包括以下步骤:
(1)记分布式电源出力的时序曲线数据(通常为一天)向量为:
si=[pi(t1),pi(t2),…,pi(tt)],i=1,2,…,n
其中,n为分布式电源个数;pi(tj),j=1,2,…,t为该分布式电源在tj时段的有功出力(此处有功数据均折算成单位装机容量的有功出力),t为时序曲线数据向量的特征数,即时段数。
(2)定义分布式电源出力时序曲线数据向量的l2范数距离为:
d(i,j)=||si-sj||2
d(i,j)为分布式电源i和j出力时序曲线数据向量的l2范数距离。
(3)当l2范数距离小于一定阈值时,两个分布式电源属于同一个虚拟电厂,即:
d(i,j)<δ,其中,δ为相似性判断阈值。
另一方面,本发明提出了基于k-means聚类的分布式光伏聚合求解方法,其包括以下步骤:
(1)所有的观测实例(一个分布式光伏为一个观测实例)中随机抽取出k个观测点,作为聚类中心点,然后遍历其余的观测点找到距离各自最近的聚类中心点,将其加入到该聚类中。由此形成一个初始的聚类结果。
(2)每个聚类中心都至少有一个观测实例,于是可以求出每个聚类的中心点(means),作为新的聚类中心,然后再遍历所有的观测点,找到距离其最近的中心点,加入到该聚类中。然后继续运行(2)执行迭代。
(3)如此往复(2),直到前后两次迭代得到的聚类中心点误差小于一定阈值。
再一方面,基于聚合结果,提出基于电量数据计算低压分布式光伏发电功率状态估计参数的方法,其技术原理在于:针对每一个聚合区,考虑到所有的分布式光伏电量数据均已实现自动采集,而分布式光伏电量数据之间的相关性和功率数据之间的相关性保持一致,因此,本发明提出通过电量数据计算分布式光伏功率状态估计参数的方法,其包括以下步骤:
(1)记分布式光伏的电量数据的集合,即s={si|i=1,2,…,n};
其中,n为一个聚合区内包含的分布式光伏的个数,si为其功率;
(2)记自动化采集的分布式光伏的功率数据的集合,即p={pi|i=1,2,…,m};
其中,m为一个聚合区内包含的实线自动化采集的功率数据的分布式光伏的个数,pi为采集的功率数据;
(3)记待估计的分布式光伏的功率数据的集合,即
其中,
(4)采用线性估计模型,即
其中,f(n-m,m)为待求解得状态估计参数,其下标表示矩阵的行列数,其求解公式如下:
其中,inv是矩阵求逆运算符;t(t≥m)历史电量数据的个数;
f(i),i=m+1,…,n,表示矩阵的第i行,即分布式光伏i的状态估计参数。
再一方面,考虑分布式光伏有功时序曲线数据特征随日期变化的特点,提出了根据累计估计误差判定是否重新进行聚合求解和状态估计参数计算的策略,包括以下步骤:
(1)定义累计估计误差ei,i=m+1,…,n,为通过功率估计结果计算得到的电量与实际电量的差值的均方根和,即
其中,δt为前后两个电量数据记录时刻之间的有功数据采集的个数。
(2)当ei<ε时,不需要重新进行聚合求解或状态估计参数计算,否则重新聚合并计算状态估计参数,其中ε为误差允许阈值。
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。