一种结合类内相似度和类间差异度的聚类有效性指标建立方法与流程

文档序号:21102737发布日期:2020-06-16 20:58阅读:587来源:国知局
一种结合类内相似度和类间差异度的聚类有效性指标建立方法与流程

本发明属于电网规划领域,涉及一种聚类分析方法,特别涉及一种结合类内相似度和类间差异度的聚类有效性指标建立方法。



背景技术:

电力系统中长期规划和运行调度均涉及对大量的场景和方案进行分析评价。风力和光伏电站的输出功率随风能和太阳辐射变化,受天气、季节、区域等变量影响具有较强的随机性、波动性和间歇性的特征。风电/光伏的大规模并网影响电力实时平衡威胁电网安全,对电力系统规划和运行提出更高的要求,对提高电力系统风电/光伏发电并网接纳能力提出严峻挑战。场景缩减的目的是通过合并相似场景尽可能利用少量具有代表性的场景描述庞大的数据集合,从而降低问题的复杂程度。聚类算法是一种较为常见的典型场景提取方法,常见的聚类算法有k-means、模糊c均值算法、分层聚类算法、同步回代缩减算法(simultaneousbackwardreduction,sbr)。其中,但是,sbr法在应用时,其提取场景数的选择缺乏一定客观性。因此,k-means和模糊c均值算法易受初始聚类中心的影响、在迭代过程中易陷入局部最优解并且提取场景数难以确定,使得最终提取的结果缺乏足够代表性。分层聚类算法和同步回代算法在相似性度量往往采用欧氏距离、绝对距离等描述样本数量特征,无法准确反映时间序列形状特征,并且场景提取数往往由人为规定。由于医疗、海洋、电力等行业数据量大,往往需要通过对大量原始数据进行聚类分析从而提取典型场景,因此将一种结合类内相似度和类间差异度的聚类有效性指标引入sbr算法,对于完善和发展sbr法,具有比较重要的意义,并且可为电力部门各机组出力以及用户负荷过程典型场景提取提供技术支撑。



技术实现要素:

本发明的目的在于解决同步回代缩减法场景数选择依据的不足,提供一种结合类内相似度和类间差异度的聚类有效性指标,以确定最终提取的场景数目,并用于研究电力系统出力以及负荷特征。

为实现上述目的,采用的技术方案如下:

一种结合类内相似度和类间差异度的聚类有效性指标建立方法,其特征在于:包括如下步骤:

步骤1,计算初始场景集中每两个场景组合之间的相似性距离;

步骤2、采用改进同步回代缩减算法进行第k次场景缩减;k=1,2,3…n-m,其中n为初始场景集中场景总数,m为缩减后的场景数量;

步骤3、重复步骤2直至经过n-m次场景缩减后,最终得到m个场景及其对应的概率;

假定删除的场景数n-m,根据需要删除的场景数n-m按照改进sbr算法计算场景缩减后包含m类场景的典型场景集合x(m),及每一类场景对应的概率pm,同时记录第m类场景集合m=1,2,…,m,其中:

式中,表示典型场景集合中第m类中心场景,表示第m类中心场景第t个时间节点对应场景数值,表示所得的m类场景集合中第m类场景出现概率nm表示第m类场景中所包含的场景个数,包含第m类中心场景(n1+n2+...nm=n),表示第(nm-1)个被并入到场景的场景,表示场景在第t个时间节点对应场景数值;

步骤4、计算类内相似度s(m),实现如下:

式中,表示第m类场景集合中所有场景到第m类中心场景之间的相似性距离,由于第m类场景集合包含第m类中心场景,故除去类中心场景外剩余场景个数为nm-1。表示第m类场景集合中除中心场景外其余各场景到中心场景间的概率平均距离,s(m)表示m类场景的概率平均类内距离;

步骤5、计算m类场景之间的类间差异度d(m);

步骤6、计算ym有效性指标从而确定合适的场景数,实现如下,

ym场景缩减有效性指标由类内相似度和类间差异度组成,计算公式为:

完成聚类有效性指标建立。

进一步地,所述步骤1中具体计算方法如下:

记n天风电出力初始场景集为x=[x1,x2,...,xn]',其中第i个场景为xi=[xi1,xi2,...,xit],i=1,2,3…n,采样时间节点为t,t=1,2,3…t,xit表示第i个场景在第t个采样点对应场景数值,初始n个场景对应概率为p=[p1,p2,...,pn]',删除的场景集为y,删除场景数为n-m,最终得到的包含m个场景的场景集为x-y;

考虑风电出力过程线数量、形状以及峰谷差特性,提出如下任意两个场景xi和xj之间的相似性距离计算公式:

式中,max(xit)为场景xi中风电出力最大值,min(xit)为场景xi中风电出力最小值,max(xjt)为场景xj中风电出力最大值,min(xjt)为场景xj中风电出力最小值;θit表示风电出力第i个场景在t时刻的形维波动。

进一步地,所述形维波动采用风电出力过程线与水平线之间的夹角变化量表示,具体计算公式如下:

式中,ki,t为风电出力第i个场景的第t个折线段斜率,t表示时间节点,当t=1或t时,形维波动为首、尾风电出力折线段与水平线之间的夹角。

进一步地,所述步骤2中具体计算方法如下:

为了确定合适的场景集x-y使原始场景集x删除场景集y后缩减效果最佳,要求场景缩减前后场景集之间的概率距离dij最小,用公式表示如下:

式中,pi表示初始场景xi对应的概率;

为保证场景缩减前后,所有场景的概率之和仍为1,要求经场景缩减后得到的场景概率等于自身概率加上其他因距离接近而删除的场景对应概率之和,用公式表示如下:

式中,表示第k次场景缩减后场景xj更新后的概率,其中

第k(k=1,2,3…n-m)次缩减得到

将最小的对应的场景从场景集合x-yk-1中删除,并入已删除的场景yk-1中,得到将场景对应的概率加到场景集合x-yk-1中与场景xlk距离最近的场景对应概率上,再次计算更新后场景集x-yk中每两个场景组合之间的距离。

进一步地,所述步骤5中计算m类场景之间的类间差异度具体方法如下:

从场景集x(m)中任选两个场景xu(m)和xv(m),u,v=1,2,3,…,m;共有种组合方式,计算任意两个场景之间相似性距离计算公式如下:

计算m类场景间的类间差异度d(m)

本发明有益效果是:

本发明首次将基于类内相似度和类间差异度的ym指标应用到sbr场景数选择上,其意义在于:ym指标越小,说明经过场景缩减后得到的典型场景集合类内相似度越高,不同场景集合类间差异度越大,因而得到的结果更具有代表性。本方法将基于结合类内相似度和类间差异度的聚类有效性指标ym引入sbr算法,使得在实际场景缩减中场景缩减个数的确定更有依据,有助于sbr法的推广使用。

附图说明

图1是本发明实施例中以某电网的冬季三个月份共计90天风电出力数据经本发明提出的改进sbr法缩减后得到效果图。

图2是本发明实施例冬季风电出力提取场景数与ym指标之间的关系曲线。

图3是本发明实施例中风电出力过程线及形维波动示意图,其中横坐标为时间节点,纵坐标为风电相对出力。

具体实施方式

为了使本发明实施例的目的明确,技术方案及优点更加清晰,下面将结合本发明实施例来介绍本发明的技术方案。

本发明实施例一种结合类内相似度和类间差异度的聚类有效性指标建立方法,包括以下步骤:

步骤1,计算初始场景集中每两个场景组合之间的距离

本发明以某电网2017年冬季风电出力逐日96点资料为实例,事先对数据进行归一化处理,使得所有数据均在[0,1]区间内。记n天(n=90)风电出力初始场景集为x=[x1,x2,...,xn]',其中第i个场景为xi=[xi1,xi2,...,xit],i=1,2,3…n,采样时间节点为t,t=1,2,3…t,xit表示第i个场景在第t个采样点对应场景数值,初始n个场景对应概率为p=[p1,p2,...,pn]',删除的场景集为y,删除场景数为n-m,最终得到的包含m个场景的场景集为x-y;

考虑风电出力过程线数量、形状以及峰谷差特性,提出如下任意两个场景xi和xj之间的相似性指标(qc+指标):

式中,max(xit)为场景xi中风电出力最大值,min(xit)为场景xi中风电出力最小值,max(xjt)为场景xj中风电出力最大值,min(xjt)为场景xj中风电出力最小值;θit表示风电出力第i个场景在t时刻的形维波动。

所述形维波动风电出力过程线与水平线之间的夹角,具体计算公式如下:

式中,ki,t为风电出力第i个场景的第t个折线段斜率,形维波动及风电出力过程线如图3所示,其中t表示时间节点,i表示第i个风电出力场景。当t=1或t时,形维波动为首、尾风电出力折线段与水平线之间的夹角。

步骤2,采用改进同步回代缩减算法(isbr算法)进行第k(k=1,2,3…n-m)次场景缩减,实现如下,

为了确定合适的场景集x-y使场景集x删除场景集y后缩减效果最佳,要求场景缩减前后场景集之间的概率距离dij最小,用公式表示如下:

式中,pi表示初始场景xi对应的概率;

为保证场景缩减前后,所有场景的概率之和仍为1,要求经场景缩减后得到的场景概率等于自身概率加上其他因距离接近而删除的场景对应概率之和。用公式表示如下:

式中,表示第k次场景缩减后场景xj更新后的概率,其中

第k(k=1,2,3…n-m)次缩减得到

将最小的对应的场景从场景集合x-yk-1中删除,并入已删除的场景yk-1中,得到将场景对应的概率加到场景集合x-yk-1中与场景距离最近的场景对应概率上。再次计算更新后场景集x-yk中每两个场景组合之间的距离。

步骤3,重复步骤2直至经过n-m次场景缩减后,最终得到m个场景及其对应的概率,实现如下,

假定删除的场景数n-m,根据需要删除的场景数n-m按照改进sbr算法计算场景缩减后包含m类场景的典型场景集合x(m),及每一类场景对应的概率pm,同时记录第m(m=1,2,…,m)类场景集合其中:

式中,表示典型场景集合中第m类中心场景,表示第m类中心场景第t个时间节点对应场景数值,表示所得的m类场景集合中第m类场景出现概率nm表示第m类场景中所包含的场景个数,包含第m类中心场景(n1+n2+...nm=n),表示第(nm-1)个被并入到场景的场景,表示场景在第t个时间节点对应场景数值。

步骤4,计算类内相似度s(m),实现如下:

式中,表示第m类场景集合中所有场景到第m类中心场景之间的相似性距离,由于第m类场景集合包含第m类中心场景,故除去类中心场景外剩余场景个数为nm-1。表示第m类场景集合中除中心场景外其余各场景到中心场景间的概率平均距离,s(m)表示m类场景的概率平均类内距离,综合反映了m类场景集合类内相似性,s(m)越小表明m类场景类内相似度越高,场景缩减效果越理想。

步骤5,计算m类场景之间的类间差异度d(m),实现如下,

从场景集x(m)中任选两个场景xu(m)和xv(m)(u,v=1,2,3,…,m),共有种组合方式,计算任意两个场景之间相似性距离计算公式如下:

计算m类场景间的类间差异度d(m)

随着场景不断缩减,相似的场景不断被合并,剩下的场景之间的差异越来越大,故采用d(m)衡量剩余场景间的差异性,剩余场景之间的相似性距离越大表明缩减后得到的场景集合x(m)中各类场景间差异性越大。

步骤6,计算ym有效性指标从而确定合适的场景数,实现如下,

ym场景缩减有效性指标由类内相似度和类间差异度组成,计算公式为

显然,不同的场景数m对应不同的ym指标值,类内相似度s(m)越小,类间差异度d(m)越大,则ym指标值越小,表明得到的m个场景之间的差异度越大。但场景数越大,提取的各场景出现概率也会减小,因此场景数不宜取得过大,一般认为如果多个不同场景数对应ym指标都很小,且彼此相差较小时,优先选择较小的场景数为最终提取场景数。

采用上述方法提取冬季风电出力场景时,得到的提取过程如图1所示,根据步骤六得到冬季风电出力提取场景数与ym指标间的关系曲线,如图2所示,可以看出冬季风电出力场景数为2和4时对应ym指标值都比场景数为3时对应ym指标值大,虽然场景数为7时ym值最小,但是此时提取的场景中出现了极端场景(即出现概率小于5%的场景),故冬季风电出力场景数应选择3。基于图2,对冬季风电出力提取场景数为3比较合适,本实施例选择提取场景数为3,最终结果如图1所示。

本发明主要用于聚类分析领域,是对sbr方法的一种完善。本发明首次将基于类内相似度和类间差异度的ym指标应用到sbr场景数选择上,其意义在于:ym指标越小,说明经过场景缩减后得到的典型场景集合类内相似度越高,不同场景集合类间差异度越大,因而得到的结果更具有代表性。本方法将基于结合类内相似度和类间差异度的聚类有效性指标ym引入sbr算法,使得在实际场景缩减中场景缩减个数的确定更有依据,有助于sbr法的推广使用。

需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1