一种基于密度聚类算法实现光伏阵列工作状态分析与故障诊断的方法与流程

文档序号:12467250阅读:382来源:国知局
一种基于密度聚类算法实现光伏阵列工作状态分析与故障诊断的方法与流程

本发明涉及并网光伏发电系统工作状态分析及光伏阵列故障诊断技术领域,特别是一种基于密度聚类算法实现光伏阵列工作状态分析与故障诊断的方法。



背景技术:

光伏发电系统装机容量的日益增加对光伏系统的工作状态的分析和光伏阵列的故障诊断提出了需求。作为系统的核心部件,光伏阵列通常工作在复杂的户外环境中,易受到各种环境因素的影响,导致开路、短路、硬性阴影、热斑等各种故障。故障的产生会降低电站的发电效率,严重时甚至发生火灾。目前,常规的光伏阵列故障检测和保护方式是通过增加保护器件,例如过电流保护器和对地故障断路器进行故障的防护。然而,由于光伏阵列输出的非线性、高故障阻抗、低照度运行及逆变器中最大功率跟踪等功能影响,一些故障的发生并不能由保护器件进行消除。

目前,光伏阵列的故障检测方法主要有红外图像检测法、时域反射分析法和对地电容法。正常工作与非正常工作的太阳能电池板之间存在一定的温差,红外图像检测法利用被测物体的温度特性进行检测。时域反射分析法的原理为向光伏串联电路注入一个脉冲,分析和观察返回波形,就可判断得到组件的故障类型和位置。对地电容测量法通过分析测量得到的电容值来判断光伏串联电路中是否存在断路故障。但这些方案存在一些不足之处:红外图像检测法不能区分温度相差不明显的状态,故障检测的精度和效率取决于检测设备(红外热像仪)的等级,费用较大,实时性较差;基于时域反射分析法不能对运行中的光伏阵列进行在线操作,不具有实时性,并且对设备要求较高,诊断的精度有限;多传感器的故障检测方法存在所用传感器较多、检测结构在大规模光伏阵列应用中难以推广等缺点。

近些年来,人工智能被广泛应用到各种系统的故障诊断中。部分学者也将智能算法引入到光伏发电阵列的故障诊断中,例如神经网络算法、决策树算法、支持向量机等等。这些算法可以模拟任意的非线性关系而无需去建立精确模型,实现故障的判断和分类,但是这些方法同时具有需要大量人工标定样本、不同的季节下训练的诊断模型并不通用、不同光伏发电系统需要重新训练模型等不足。

目前,云平台广泛用于各种光伏发电系统的监控,不同光伏系统每日的运行数据都发送至云平台中进行存储,这使得通过日常的运行数据对光伏系统的工作状态和故障进行分析成为了可能。通过对光伏日常归一化数据的分析,发现数据的分布具明显的非球状聚类、聚类的中心具有最高的密度并与其他更高的密度点有相当的距离等特性,因此适合采用一种新型的基于密度峰值的聚类算法(CFSFDP)对数据进行分析,然后进一步实现工作状态的分析和故障诊断。目前,公开发表的文献及专利中尚未见有将基于密度聚类算法应用于光伏阵列工作状态分析与故障诊断中。



技术实现要素:

有鉴于此,本发明的目的是提出一种基于密度聚类算法实现光伏阵列工作状态分析与故障诊断的方法,采用基于密度的聚类算法,以此模型进行光伏发电阵列的故障诊断和分类,可精确的识别出光伏发电系统的运行状况。

本发明采用以下方案实现:一种基于密度聚类算法实现光伏阵列工作状态分析与故障诊断的方法,具体包括以下步骤:

步骤S1:采集日常工作中光伏发电阵列最大功率点的若干个电气参数,得到每一日的电气参数样本组合;

步骤S2:将每个电气参数样本进行归一化得到测试样本组合;

步骤S3:根据归一化后的测试样本组合进行计算得到距离矩阵;

步骤S4:采用基于密度的聚类算法对这些测试样本进行自动的聚类,获得若干个聚类;

步骤S5:基于预先通过仿真模型获得的参考数据,分别计算每组参考数据和每个聚类之间的最小距离,形成一个距离向量;

步骤S6:通过将距离向量中每个元素与聚类算法中的截断距离进行对比,识别每个聚类所属的工作类别。

进一步地,步骤S1中所述若干个电气参数包括阵列的最大功率点下的电压参数样本和电流参数样本;所述电气参数样本组合记为(Uj,Ij),其中,j为样本采集序号,j为1到N的整数,每个数字代表一种工作状态,Uj为第j个电气参数样本组合中的电压参数样本,Ij代表第j个电气参数样本组合中的电流参数样本。

进一步地,步骤S1中所述日常工作的工作状态包括正常工作、单支路开路、双支路开路、单支路上1个组件短路、单支路上2个组件短路。

进一步地,步骤S2中所述进行归一化具体为:将所述电气参数样本射到区间[0,1]内,具体映射公式为:

式中,m为光伏阵列中串联的太阳能板数目,n为光伏阵列中并联的太阳能板数目,UOC为参考太阳能板的开路电压,ISC为参考太阳能板的短路电流,为归一化后的电压参数样本,为归一化后的电流参数样本,得到归一化后的电气参数样本组合为:

进一步地,步骤S3中所述距离矩阵的得到采用欧氏距离的方法进行计算,具体采用下式计算:

dij=||xi-xj||2

式中,xi为第i个样本向量,xj为第j个样本向量,||·||代表2范式操作。

进一步地,所述步骤S4具体包括以下步骤:

步骤S41:根据步骤S3得到的距离矩阵,对其从小到大进行排序,选择2%处的距离值来设置样本截断距离dc

步骤S42:根据截断距离dc,计算出每个样本点的局部密度值ρi和其与密度高于它且离它最近的样本点的距离δi,具体的计算公式分别如下:

步骤S43:计算出每个样本点的归一化的γi,并对γi进行排序,其中γi的计算采用公式如下:

式中,ρmax表示最大ρi值,δmax表示最大δi值;

步骤S44:根据3-σ法则,选择超过γi平均值对应的前几个点作为聚类的中心点,并以这些中心点为参考,将剩余的所有样本点按到最近邻的更高密度对象的最小距离进行划分到各个簇,完成数据的聚类。

进一步地,步骤S5具体为:建立光伏模型,在低照度下,通过模拟各种工作状态及故障,仿真获得标定的参考数据集;计算各个聚类之间到各类数据集的最小距离,获得距离向量:

其中c代表每个聚类的标号,NC为聚类总的数量,因此c∈[1,NC];r代表参考数据集所包含的工作状态或故障的类别,NR为参考数据集总的数量,因此r∈[1,NR]。

进一步地,所述步骤S5具体为:将距离向量中的每个元素与截断距离dc进行对比来对每个聚类进行识别,如果dc,r小于dc,则该聚类判定为和参考数据r所对应的类别;如果所有的元素都大于dc,则将聚类判定为元素中最小值所对应的类别。

与现有技术相比,本发明有以下有益效果:本发明将光伏发电系统的日常运行状态和故障诊断转化为聚类问题,采用CFSFDP算法结合参考样本数据实现对光伏发电系统运行状态的判别和故障的诊断;本发明无需采集大量的样本数据对诊断模型进行训练,仅需对采集到的无标签的运行数据直接进行聚类操作,并通过仿真得到的少量带标签数据进行辅助实现聚类的识别,进而完成状态的识别和故障的诊断。通过对不同日常运行状态的模拟和实验测试,该方案均可精确的识别出光伏发电系统的运行状况。同时,该方案可直接移植到光伏监控系统中,例如云平台上,实现对不同光伏系统的监测。

附图说明

图1为本发明的方法流程示意图。

图2为本发明实施例中的光伏发电系统拓扑图。

图3为本发明实施例中的系统实验光伏平台图。

图4(a)为本发明实施例中正常工作状态时的原始数据分布图。

图4(b)为本发明实施例中正常工作状态时的γ以降序排列图。

图4(c)为本发明实施例中正常工作状态时的决策图。

图4(d)为本发明实施例中正常工作状态时的聚类及识别后的数据图。

图5(a)为本发明实施例中正常和短路1组合工作状态时的原始数据分布图。

图5(b)为本发明实施例中正常和短路1组合工作状态时的γ以降序排列图。

图5(c)为本发明实施例中正常和短路1组合工作状态时的决策图。

图5(d)为本发明实施例中正常和短路1组合工作状态时的聚类及识别后的数据图。

图6(a)为本发明实施例中正常和开路1组合工作状态时的原始数据分布图。

图6(b)为本发明实施例中正常和开路1组合工作状态时的γ以降序排列图。

图6(c)为本发明实施例中正常和开路1组合工作状态时的决策图。

图6(d)为本发明实施例中正常和开路1组合工作状态时的聚类及识别后的数据图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

如图1所示,本实施例提供了一种基于密度聚类算法实现光伏阵列工作状态分析与故障诊断的方法。图2为本实施例的光伏发电系统拓扑图,系统由m×n个光伏组件组成光伏阵列,通过并网逆变器与电网进行连接。在不同的大气温度和辐照度下,模拟三种光伏发电阵列日常运行中出现的不同工作状况,进行光伏发电系统的数据采集然后对数据进行聚类处理及识别,实施例的具体操作包括以下步骤:

步骤S1:采集日常工作中光伏发电阵列最大功率点的若干个电气参数,得到每一日的电气参数样本组合;

步骤S2:将每个电气参数样本进行归一化得到测试样本组合;

步骤S3:根据归一化后的测试样本组合进行计算得到距离矩阵;

步骤S4:采用一种新型的基于密度的聚类算法对这些测试样本进行自动的聚类,获得若干个聚类;

步骤S5:基于预先通过仿真模型获得的参考数据,分别计算每组参考数据和每个聚类之间的最小距离,形成一个距离向量;

步骤S6:通过判断距离向量中每个元素与聚类算法中的截断距离进行对比,识别每个聚类所属的工作类别。

较佳的,本实施例中采集数据所采用的光伏发电系统由20块太阳能面板组成,其中18块为工作面板,组成6串3并的方式,通过逆变器进行并网发电;另外2块为参考太阳能面板,1块获取开路电压UOC,另1块获取短路电流ISC,系统详细参数如表1所示。

表1

在本实施例中,所述步骤S1中所述若干个电气参数包括阵列的电压参数样本和电流参数样本,所述电气参数样本组合记为(Uk,Ik),其中,k为样本采集序号,其中k为1到N的整数,每个数字代表一种工作状态,Uk为第k个电气参数样本组合中的电压参数样本,Ik代表第k个电气参数样本组合中的电流参数样本。

在本实施例中,所述工作状态包括正常工作、单光伏组串上1个组件短路(短路1)和单光伏组串上1个组件开路(开路1)。特别地,本实施例在模拟光伏发电系统的3种日常工作状态进行采集数据:正常工作、正常工作与短路1组合状态和正常工作与开路1组合状态,在不同的照度和温度下进行数据采集,采集样本的同时采集参考太阳能板的开路电压UOC和短路电流ISC以实现对数据的归一化处理。所实施的大气温度和辐照度及采集的光伏数据量具体信息如表2所示。

表2

在本实施例中,所述步骤S2中对样本进行归一化的具体方法为:将电气参数样本映射到区间[0,1]内,具体映射公式为:

式中,m为光伏阵列中串联的太阳能板数目,n为光伏阵列中并联的太阳能板数目,UOC为参考太阳能板的开路电压,ISC为参考太阳能板的短路电流,为归一化后的电压参数样本,为归一化后的电流参数样本,得到归一化后的电气参数样本组合为:较佳的,实施例三种模拟运行状况归一化后的数据分布分别如图4(a)、图5(a)和图6(a)所示。

在本实施例中,所述步骤S3中得到距离矩阵的具体方法是采用欧氏距离的方法进行计算,公式为:dij=||xi-xj||2,xi为第i个样本向量,xj为第j个样本向量,||·||代表2范式操作。

在本实施例中,所述步骤S4采用一种新型的基于密度的聚类算法对这些测试样本进行自动的聚类,获得若干个聚类的具体方法为:

步骤S41:根据距离矩阵,对其从小到大进行排序,选择2%处的距离值来设置样本截断距离dc

步骤S42:根据截断距离dc,计算出每个样本点的局部密度值ρi和其与密度高于它且离它最近的样本点的距离δi,具体的计算公式分别如下:和

步骤S43:计算出每个样本点的归一化的γi,采用公式如下:并对γi进行排序;

步骤S44:根据3-σ法则,选择超过γi平均值对应的前几个点作为聚类的中心点,并以这些中心点为参考,将剩余的所有样本点按到最近邻的更高密度对象的最小距离进行划分到各个簇,完成数据的聚类;

在本实施例中,所述步骤S5通过建立光伏模型,在低照度下,通过模拟各种工作状态及故障,仿真获得标定的参考数据集。计算各个聚类之间到各类数据集的最小距离,获得距离向量其中c代表每个聚类的标号,NC为聚类总的数量,因此c∈[1,NC];r代表参考数据集所包含的工作状态或故障的类别,NR为参考数据集总的数量,因此r∈[1,NR];

在本实施例中,所述步骤S6中将距离向量中的每个元素与截断距离dc进行对比来对每个聚类进行识别,如果dc,r小于dc,则该聚类判定为和参考数据r所对应的类别;如果所有的元素都大于dc,则将聚类判定为元素中最小值所对应的类别。

较佳的,根据步骤S4,本实施例根据数据计算局部密度值ρi和其与密度高于它且离它最近的样本点的距离δi,得到γi的降序排列图如图4(b)、图5(b)和图6(b)所示,根据3-σ法则选出聚类中心点,如图中圆圈所包含的点。对应的决策图分别如图4(c)、图5(c)和图6(c)所示,图中右上角的点即为聚类中心点。根据步骤S5和S6,实施例中数据的聚类和识别后的数据图分别如图4(d)、图5(d)和图6(d)所示,图4(d)中的数据被判别为与正常工作状态的参考数据归为同一类别,图5(d)中的两簇数据分别被判别为与正常工作状态和短路1的参考数据归为相同类别,图6(d)中的两簇数据分别被判别为与正常工作状态和开路1的参考数据归为相同类别,因此可以得出实施例中的数据均被准确的聚类和识别。

以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1