一种基于光伏发电出力聚类的气象监测点选择方法与流程

文档序号:18167778发布日期:2019-07-13 09:43阅读:408来源:国知局
一种基于光伏发电出力聚类的气象监测点选择方法与流程

本发明涉及电力领域,尤其涉及一种基于光伏发电出力聚类的气象监测点选择方法。



背景技术:

随着国家新能源政策发布,以及国家电网承担吸纳绿色能源措施的落实,分布式光伏总发电量快速增长,分布式光伏的总装机量达到一定规模。由于分布式光伏自发自用、余量上网的运行方式,其出力的随机性和波动性对配电网来说影响很大,因此分布式光伏的出力预测对电网来说具有重要意义。目前大部分功率预测方法都是针对光伏单站的光伏功率预测,而广域分布式光伏的功率预测研究很少,区域光伏电站群的功率预测实现有两种技术路线:一是对区域里所有光伏电站的功率预测结果进行简单的累加;二是基于代表光伏电站的功率预测结果,采用统计升尺度法实现区域性的光伏发电功率预测。对于包含很多个光伏电站的光伏群来说,由于单个电站的历史出力数据收集困难、局部气象因素无法获取等因素,简单累加法具有明显的局限性。

为了提高预测光伏出力的准确,需设置多个气象监测点,成本高,目前预测光伏出力不能兼顾成本及预测的准确性。



技术实现要素:

本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于光伏发电出力聚类的气象监测点选择方法,以达到合理选择气象监测点,以兼顾成本及预测的准确性的目的。为此,本发明采取以下技术方案。

一种基于光伏发电出力聚类的气象监测点选择方法,包括以下步骤:

1)以每一小时数据为一个样本,对数据进行标幺化处理后,截取5:00-20:00点15个小时的历史出力数据,按区间对光伏历史出力数据进行天气类型匹配识别,每个单个电站用15个时刻的天气类型指数来表示的出力历史数据,天气类型分为:晴天、晴间多云,多云、阴间多云,阴天,阵雨、雷阵雨、小雨,大雨、大到暴雨;

2)依次对每个整点的数据进行聚类分析,产生五种天气类型下的分布式光伏地理位置分布图,再次通过k-means聚类,对每一类天气类型下的光伏出力数据的地理位置分区;

3)每一种天气类型下,光伏出力的大小从属于一个区间,即光伏出力彼此具有相似性;按查表法定位每一个光伏电站的地理位置分块,若五种天气类型下光伏电站都从属于一个地理位置区块,只需从同一地理区块中中选择合适的电站作为初步参考电站,即无论什么天气类型下,光伏电站的出力都跟随参考电站,称为和谐电站;若不同的天气类型下,光伏电站从属于不同的地理区块,即从属于不同的参考电站,称为不和谐电站,则需另外选作参考电站;

4)在分类k值设定范围内计算不和谐电站与总电站数量的占比率,根据占比率,确定聚类分析的最优k值;

5)重新对全部分布式光伏地理位置按k值进行聚类分析,得出结果即为具有空间相关性的广域分布式光伏划群的区域化展示,获得光伏发电用户群划分结果;

6)统计区域内各个光伏电站与区域光伏出力的相关性系数,选择相关性大于设定值的电站作为该区域的代表电站;

7)对同一区域中的代表电站进行预测复核,衡量不同代表电站的优越性;

8)选择最为优越的代表电站所在地作为气象监测点。

本技术方案为气象站点最少部署或提出多光伏用户基于“空间-时间关联”的功率预测提供依据;首先将气象对光伏出力的影响分为大气候和小气候两类:大气候主要是日照或五类天气类型影响,通过光伏实际出力占额定出力的比例来划分,从而将历史数据时段划分为五类天气类型样本群;小气候认为是光伏安装高程、温度、湿度以及周围地理环境等广义小气候影响,对历史五类天气类型样本群,进行空间相关的聚类分析,得到用户光伏区域划分;综合分块中不合群的用户光伏点数量和子区域气象一致性来决定最优地域分块方案为用户光伏分群策略。本技术方案利用聚类分析方法对每类天气类型下的用户光伏按照地域进行分块,分析不同区域的出力一致性,优化用户光伏的分群位置,有利于选出最具有代表性的参考电站作为气象监测点的建设位置或购买气象数据的气象站参考位置,以利用最少的气象数据来预测群里每个用户光伏的功率,从而既优化了气象站位置选择以确保光伏预测精度,又减少了引入气象数据的成本,提高了经济性;另外,即便不采取增加气象站,将大规模分布式电站的气象一致性分群,可以通过气象一致性的分布式电站组建分群的时间空间光伏预测。

本技术方案综合考虑广域分布式光伏电站出力的空间相关性,在对其进行群化的基础上,利用相关系数检测与覆盖电站的出力相关性,综合考虑其地理位置、额定发电量、预测误差等因素,选择最具代表性的光伏电站作为气象监测点。

本技术方案适用于广域分布式光伏电站,考虑经济因素无法在每个电站建立气象监测点来获取气象数据,而精确的气象数据对光伏预测尤为重要,本技术方案选择合适的气象监测点对广域分布式光伏整体出力预测具有重要意义,兼顾了预测的准确性及经济性。

作为优选技术手段:在步骤1)中,天气类型的匹配时,根据实际日发电量与日额定发电量参考值的占比值k按区间对天气分类,分布区间和对应五类天气类型,当1≤k<0.8时,认为天气类型为晴天、晴间多云;当0.8≤k<0.6时,认为天气类型为多云、阴间多云;当0.6≤k<0.4时,认为天气类型为阴天;当0.4≤k<0.2时,认为天气类型为阵雨、雷阵雨、小雨;当0.2≤k<0时,认为天气类型为大雨、大到暴雨。

作为优选技术手段:在步骤1)中,天气类型识别包括步骤:

101)获取光伏历史数据;

102)获取单站最大功率;

103)日出力曲线标玄化;

104)日出力曲线四季化;

105)天气类型聚类识别;

106)按地域聚类分析,获得对应区间的天气状态。

本技术方案实现按季区分,能更准确的进行分区。

作为优选技术手段:离散采样时,日实际发电量是日间隔15分钟的采样值,则有:

其中i为光伏用户序号,j为光伏日采集点数,p(i,j)为第i个光伏用户j时刻的离散采样值,pmax为日额定发电量的参考值,此处由于缺少额定发电量数据,由日发电量离散采样值的历史最大值估算;当每间隔15分钟采集一次数据,一天有4×24=96点,即j=1,2,…,96。

作为优选技术手段:聚类分析结果依赖于初始聚类中心和聚类个数而波动,具有一定的不稳定性;选择合适的初始聚类中心位置对分析聚类结果至关重要;假设待聚类的数据集为x={xi|xi∈rp,i=1,2,…,n},k个初始位置中心为c1,c2,…,ck,用w1,w2,…,wk表示k个类所包含的样本集合,所有的样本集合为w;

定义1样本xi,xj之间的欧式距离:

定义2样本xi到所有样本距离的平均值:

定义3数据集样本的平均距离

定义4数据点xi的密度density(xi)

density(x)={p∈c|d(x,p)≤cmean*θ}

θ为密度半径系数;

首先根据定义3-4计算数据集中每一个样本数据的密度,寻找密度最大的样本作为第一个类的初始中心c1,删除处于密度半径中的样本,即

w=w-w1

重复上述原则,重新在w中寻找密度最大的样本将其作为第c个类别的初始中心,并令

以此类推直至找出k个初始聚类中心c1,c2,…,ck。

作为优选技术手段:使用向量间的欧式距离作为分类的依据,计算公式如下:

其中,dij为第i个标准向量和第j个标准向量间的欧式距离,n为每个标准向量的维度;

作为优选技术手段:获取的历史数据包括气象数据和历史出力数据,并将历史数据按季节划分,分为春季、夏季、秋季、冬季,每一季的数据在以天气聚类后,再以地区化聚类。

作为优选技术手段:在步骤7)中,通过计算平均绝对误差(mae)和均方根误差(rmse)指标来衡量不同代表电站的优越性;优化目标定义如下:

定义1:均方根误差和,计算如下:

定义2:平均绝对误差和,计算如下式:

其中c为区域类别,n为每个区域中的电站数量,m为功率的时间序列长度;

平均绝对误差和均方根误差越小则电站的优越性高。

作为优选技术手段:区域内各个光伏电站与区域光伏出力的相关性系数,计算公式如下:

式中:xi、yi分别代表不同的时间序列,为时间序列的均值,n为时间序列长度。

有益效果:

本技术方案综合考虑广域分布式光伏电站出力的空间相关性,在对其进行群化的基础上,利用相关系数检测与覆盖电站的出力相关性,综合考虑其地理位置、额定发电量、预测误差等因素,选择最具代表性的光伏电站作为气象监测点。

本技术方案适用于广域分布式光伏电站,考虑经济因素无法在每个电站建立气象监测点来获取气象数据,而精确的气象数据对光伏预测尤为重要,本技术方案选择合适的气象监测点对广域分布式光伏整体出力预测具有重要意义,兼顾了预测的准确性及经济性。

本技术方案利用聚类分析方法对每类天气类型下的用户光伏按照地域进行分块,分析不同区域的出力一致性,优化用户光伏的分群位置,有利于选出最具有代表性的参考电站作为气象监测点的建设位置或购买气象数据的气象站参考位置,以利用最少的气象数据来预测群里每个用户光伏的功率,从而既优化了气象站位置选择以确保光伏预测精度,又减少了引入气象数据的成本,提高了经济性;另外,即便不采取增加气象站,将大规模分布式电站的气象一致性分群,可以通过气象一致性的分布式电站组建分群的时间空间光伏预测。有效提高预测的准确。

附图说明

图1是本发明的流程图。

图2是本发明的子区域划分流程图。

图3是本发明的气象代表站选取流程图。

图4是本发明的光伏群化过程图。

具体实施方式

以下结合说明书附图对本发明的技术方案做进一步的详细说明。

如图1所示,一种基于光伏发电出力聚类的气象监测点选择方法,包括以下步骤:

1)以每一小时数据为一个样本,对数据进行标幺化处理后,截取5:00-20:00点15个小时的历史出力数据,按区间对光伏历史出力数据进行天气类型匹配识别,每个单个电站用15个时刻的天气类型指数来表示的出力历史数据,天气类型分为:晴天、晴间多云,多云、阴间多云,阴天,阵雨、雷阵雨、小雨,大雨、大到暴雨;

2)依次对每个整点的数据进行聚类分析,产生五种天气类型下的分布式光伏地理位置分布图,再次通过k-means聚类,对每一类天气类型下的光伏出力数据的地理位置分区;

3)每一种天气类型下,光伏出力的大小从属于一个区间,即光伏出力彼此具有相似性;按查表法定位每一个光伏电站的地理位置分块,若五种天气类型下光伏电站都从属于一个地理位置区块,只需从同一地理区块中中选择合适的电站作为初步参考电站,即无论什么天气类型下,光伏电站的出力都跟随参考电站,称为和谐电站;若不同的天气类型下,光伏电站从属于不同的地理区块,即从属于不同的参考电站,称为不和谐电站,则需另外选作参考电站;

4)在分类k值设定范围内计算不和谐电站与总电站数量的占比率,根据占比率,确定聚类分析的最优k值;

5)重新对全部分布式光伏地理位置按k值进行聚类分析,得出结果即为具有空间相关性的广域分布式光伏划群的区域化展示,获得光伏发电用户群划分结果;

6)统计区域内各个光伏电站与区域光伏出力的相关性系数,选择相关性大于设定值的电站作为该区域的代表电站;

7)对同一区域中的代表电站进行预测复核,衡量不同代表电站的优越性;

8)选择最为优越的代表电站所在地作为气象监测点。

本技术方案综合考虑广域分布式光伏电站出力的空间相关性,在对其进行群化的基础上,利用相关系数检测与覆盖电站的出力相关性,综合考虑其地理位置、额定发电量、预测误差等因素,选择最具代表性的光伏电站作为气象监测点。

本技术方案适用于广域分布式光伏电站,考虑经济因素无法在每个电站建立气象监测点来获取气象数据,而精确的气象数据对光伏预测尤为重要,本技术方案选择合适的气象监测点对广域分布式光伏整体出力预测具有重要意义,兼顾了预测的准确性及经济性。

本技术方案为气象站点最少部署或提出多光伏用户基于“空间-时间关联”的功率预测提供依据;首先将气象对光伏出力的影响分为大气候和小气候两类:大气候主要是日照或五类天气类型影响,通过光伏实际出力占额定出力的比例来划分,从而将历史数据时段划分为五类天气类型样本群;小气候认为是光伏安装高程、温度、湿度以及周围地理环境等广义小气候影响,对历史五类天气类型样本群,进行空间相关的聚类分析,得到用户光伏区域划分;综合分块中不合群的用户光伏点数量和子区域气象一致性来决定最优地域分块方案为用户光伏分群策略。本技术方案利用聚类分析方法对每类天气类型下的用户光伏按照地域进行分块,分析不同区域的出力一致性,优化用户光伏的分群位置,有利于选出最具有代表性的参考电站作为气象监测点的建设位置或购买气象数据的气象站参考位置,以利用最少的气象数据来预测群里每个用户光伏的功率,从而既优化了气象站位置选择以确保光伏预测精度,又减少了引入气象数据的成本,提高了经济性;另外,即便不采取增加气象站,将大规模分布式电站的气象一致性分群,可以通过气象一致性的分布式电站组建分群的时间空间光伏预测。

本方法主要包括k-means聚类方法,根据数据自身的距离或相似度将它们划分成若干组,划分的原则是组内样本最小化而组间距离最大化。该算法的具体步骤如下:

a)数据清理,对原始数据进行质量分析,包括数据缺失值分析、数据异常值处理等。

b)数据预处理,对数据进行归一化和标准化,用于消除量纲之间的差异。

c)聚类特征提取,从数据中提取最有效的聚类特征,转换为特征向量。

d)聚类,针对特征向量,选择最佳的聚类个数和距离函数,执行聚类或分组。

e)聚类评价,指对聚类的效果选择合适的评价函数进行评价。

如图2、3、4所示,本技术方案主要包括子区域划分和气象代表站选取两部分。

如图2所示,子区域划分流程包括步骤:

101)获取光伏历史数据;

102)求取单站最大功率;

103)日出力曲线标玄化,按每户的最大出力作1;

104)日出力曲线四季化;

105)日出力曲线形态化聚类(第一层聚类,拟天气聚类,一般为6类,对应大晴、晴、多云、阴、雨、大波动);

106)日出力曲线形态化聚类(第二层聚类,拟地区化聚类,一般为5-6类,对应该区的东、西、南、北、中等);

107)光伏站的天气聚类区域化结果分析;

108)光伏站的区域化结果输出。

如图3所示,气象代表站选取包括步骤:

201)获取光伏站的区域化结果;

202)光伏站的区域化地理区划分析;

203)单光伏站与气象代表站的关联表确定;

204)获取这些代表站的历史数据;

205)对代表站进行预测复核;

206)效果评估,选择最优的气象代表站。

以下就下列问题作进一步解释说明:

一、光伏出力过程与气象的关联原理:

1)大气候影响

由于光伏出力影响因素众多,其预测精度与天气状态密切相关。光伏发电量影响因子中太阳辐照度与光伏出力的相关性最大,甚至是线性相关的,为主要影响因素,称为大气候影响。

2)地理特性小气候的影响

大气候相同条件下,温度、湿度、光伏所在的地形等小气候因素对光伏出力也起不可忽略作用对于相同大气候下,属于某一地域的光伏的出力过程特性相近,由于地理特性小气候的影响,而不同地域的光伏过程特性出现偏差,成为小气候影响。

二、天气状态的确定:

由于光伏电站缺少历史气象数据,用光伏出力的历史数据提取天气类型的特征向量是聚类的关键。由于光照强度直接影响光伏出力,而晴天时由于云量较少,光照强度处于最大值,一定程度上可以反映光伏出力实际日发电量和日额定发电量参考值的占比值最大,随着光照强度的减弱,光伏出力实际日发电量与日额定发电量参考值的占比值逐步减少。因此提出日实际发电量与日额定发电量的比值为天气类型指数k,离散采样时,日实际发电量是日间隔15分钟的采样值,则有:

其中i为光伏用户序号,j为光伏日采集点数,p(i,j)为第i个光伏用户j时刻的离散采样值,pmax为日额定发电量的参考值,此处由于缺少额定发电量数据,由日发电量离散采样值的历史最大值估算。假设每间隔15分钟采集一次数据,一天有4×24=96点,即j=1,2,…,96。

根据实际日发电量与日额定发电量参考值的占比值按区间对天气分类,分布区间和对应五类天气类型如表1:

表1天气类型指数与天气类型对照

三、初始中心位置选择:

聚类分析结果依赖于初始聚类中心和聚类个数而波动,具有一定的不稳定性。选择合适的初始聚类中心位置对分析聚类结果至关重要。假设待聚类的数据集为x={xi|xi∈rp,i=1,2,…,n},k个初始位置中心为c1,c2,…,ck,用w1,w2,…,wk表示k个类所包含的样本集合,所有的样本集合为w。

定义1样本xi,xj之间的欧式距离:

定义2样本xi到所有样本距离的平均值:

定义3数据集样本的平均距离

定义4数据点xi的密度density(xi)

density(x)={p∈c|d(x,p)≤cmean*θ}θ为密度半径系数

首先根据定义3-4计算数据集中每一个样本数据的密度,寻找密度最大的样本作为第一个类的初始中心c1,删除处于密度半径中的样本,即

w=w-w1

重复上述原则,重新在w中寻找密度最大的样本将其作为第c个类别的初始中心,并令

以此类推直至找出k个初始聚类中心c1,c2,…,ck。

四、聚类依据

所谓聚类依据是指数据分类的条件。本文使用向量间的欧式距离作为分类的依据,计算公式如下:

其中,dij为第i个标准向量和第j个标准向量间的欧式距离,n为每个标准向量的维度。

五、区域划分过程

提某市分布式光伏用户的2017年6-8月92天的历史出力数据,截取早上9点至晚上5点间隔1小时的8个小时的历史数据作为数据源。子区域的划分过程如图4所示:基于聚类分析的子区域划分。

以早上11:00为例,首先对天气类型指数按区间对光伏历史出力数据进行天气类型匹配识别;然后通过k-means聚类,对每一类天气类型下的光伏出力数据的地理位置划分子区域;聚类类数范围设定为k=[3,10]。展示地理位置聚类分块数量为6块,每一种天气类型下聚类后光伏用户的地理位置分布;为方便区分对每一个子区域编号1-6。

每一种天气类型下,光伏出力的大小从属于一个地理区域,即该区域的光伏出力彼此具有相似性。分别定位每一个用户光伏的地理位置区域,若五种天气类型下用户光伏都从属于一个确定的地理位置区域,只需从同一地理区域中选择合适的电站作为初步参考电站,即无论什么天气类型下,该用户光伏的出力都跟随这相同的参考电站,我们称为和谐电站。若不同的天气类型下,用户光伏从属于不同的地理区域,即从属于不同的参考电站,我们称为不和谐电站;对于不和谐电站,则不同天气类型,难以跟随同一的参考电站。计算每一个区域覆盖的光伏从站并计算不和谐电站在全部电站中的数量占比,如表2。

表211:00时段的和谐电站与不和谐电站占比

随着地理位置分块类数增加,不和谐电站占比不一定随聚类类数变大而变大(或变小);根据本县域案例的分析,已表明了其波动性,如k=8的不和谐电站数量,就比k=7的要小。

随着地理位置分块类数增加,区域面积减小,天气类型指数的方差逐渐减小,区域内气象趋于统一,因此考虑微地形、微气象的影响,划分的子区域面积不宜过大。故综合考虑不和谐电站占比和气象一致性,该15分钟的数据样本中,聚类数为8的用户光伏分群为最优划分,其他时刻的数据样本选择代表站的方法与上述相同,可得出不同时刻的数据样本下,优化得到的最优划分类数有k=7、k=8、k=9。

用户光伏群的最优分类

基于用户光伏历史数据的不同分类数量k的计算结果见表3;可以看出,在最优分类k=7时,两种误差都是最小值,说明在这种区域分布优选出的代表电站历史出力数据与区域的波动情况最为接近。

表3两种误差比较结果

六、气象监测点优化选取

1、pearson相关系数

在最优分类个数基础上划分区域后,分别在区域中选择相关性较高的电站作为代表电站,通常为1个,而电站的装机容量、地理位置和预测精度都将影响区域预测的精度,本文首先考虑代表电站与区域电站的出力相关性因素,尽量选择与区域光伏电站出力波动性最接近的电站,因此结合光伏电站和区域电站的历史出力数据,统计区域内各个光伏电站与区域光伏出力的相关性系数,计算公式如下:

式中:xi、yi分别代表不同的时间序列,为时间序列的均值,n为时间序列长度。

2、气象监测点评价模型

光伏群的最终最优分类k值随着每一小时数据样本的分布不同而改变,即所选代表电站随不同时刻的数据样本改变而更新,但气象监测点应为固定的几个代表电站,因此需要对代表电站进一步的优化,此处引入平均绝对误差(mae)和均方根误差(rmse)指标来衡量不同代表电站的优越性。优化目标定义如下:

定义1:均方根误差和,计算如下:

定义2:平均绝对误差和,计算如下式:

其中c为区域类别,n为每个区域中的电站数量,m为功率的时间序列长度。

以上图1-4所示的一种基于光伏发电出力聚类的气象监测点选择方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行等同修改,均在本方案的保护范围之列。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1