一种风力发电机的异常识别方法与流程

文档序号:16391472发布日期:2018-12-25 19:20阅读:358来源:国知局
一种风力发电机的异常识别方法与流程

本发明属于故障诊断技术领域,具体涉及一种风力发电机的异常识别方法。

背景技术

随着全球风力发电能力持续增长和风电场的快速扩张、风机的不断应用,机组机舱体积随之增大,轮毂位置也更高,风机安全运行的挑战越来越大。风电机组长期暴露在大风、雷雨、冰雹等极端天气中,尤其海上风机还要受到长期的海水侵蚀,非常容易发生机械部件或电气系统等异常或故障。风机不同部位故障皆有可能引起风机停电,研究发现,在风机维护领域,即使一些微小的故障都会带来价格昂贵的维护成本,风机的维护面临着众多挑战。据研究分析表明,如果对风电机组采用预知维护,将大大降低风电机组的事后修复与计划维护成本,这对大规模发展风电产业的经济投入方面有着巨大的影响,因此对风电机组的异常状态进行分析,进行故障预警有着十分重要的意义。为了减少风机的故障以及由故障带来的经济损失,风力发电机的状况监测和异常识别在降低停机时间和维护成本方面日益重要。

目前风机功率曲线可提供输出功率与风速之间的关系,是风机异常识别与性能分析最常用的工具之一,研究人员在风电场scada数据的基础上,采用不同的方法估算和监测风机功率曲线。当风机处于正常工作(即有功无功控制)状态下,基于scada参数建模是风机异常识别的另一个有效方法。与功率曲线监测技术相比,它可以充分利用scada系统隐藏的运行信息识别风机组件的异常,通过使用scada参数挖掘方法,已经开发了多种条件参数预测模型以检测故障发生之前风机行为的显著变化。但前人研究时存在的问题主要如下:

(1)在建立风机异常识别模型时,通常会人为地选择几个关键属性作为模型的输入,这样容易选择错误的属性,导致建模失败,或者使得模型不通用。(2)训练模型时,只包含有功无功控制这一状态的样本,因自然因素导致的机组待风、机组待机等状态都纳入非正常工作状态,而上述仅是天气的干扰非风机的异常。(3)识别异常时,只能识别单类异常,不能同时识别多类异常。此外,残差法经常被用来确定风机的状态,但阈值的设置多数基于人为的经验,往往会干扰异常识别的准确性。



技术实现要素:

针对现有技术的不足,本发明实施提供一种风力发电机的异常识别方法。

本发明的一种风力发电机的异常识别方法,包括以下步骤:

步骤1:从风场scada系统采集多组包含多种风机属性的风机数据,构成初始风机数据集;

步骤2:删除初始风机数据集中的异常数据,以获得完整风机数据集,所述异常数据包括:某组大量缺失风机属性的风机数据;风机数据中某种每日、每月或每年都恒定不变的风机属性;处理后风机属性个数为n;

步骤3:采用小波阈值法对完整风机数据集进行降噪处理;

步骤4:采用k-means的聚类方法对降噪后的整个风机数据集中的风机属性分类,聚类后使得类内属性相似,类间属性相离;

步骤5:采用t-sne算法对聚类处理后的风机数据集进行降维处理;

步骤6:将降维后的数据进行皮尔森相关系数的计算分析,把数据按照相关系数的大小进行排列,风机数据集组织为具有相同尺寸的图像;

步骤7:将进行皮尔森相关系数分析后组成的图像送到卷积神经网络,并进行风机的异常识别;

步骤8:确定风机发生异常后,通过准则判定发生异常的风机属性所属的类别;

步骤9:通过对风机属性异常的识别,验证该风力发电机异常识别方法的有效性。

在本发明的风力发电机的异常识别方法中,步骤3中所述小波为db5,分解层数为5。

在本发明的风力发电机的异常识别方法中,所述步骤4具体包括:

步骤4-1:将风机数据集中的元素根据下式进行归一处理:

其中,vi表示任意元素,max(a)代表该风机属性的元素最大值,min(a)代表该风机属性的元素最小值,v是该风机属性的任意元素归一后的值;

步骤4-2:最大聚类数依据式确定,其中kmax为最大聚类数,n为风机属性的个数;

步骤4-3:经过步骤4-2计算,可将风机属性划分为2到类,通过下式确定聚类数目:

其中,sc表示轮廓系数,ai表示一个元素xi与同一分类中所有其他元素之间的平均距离,ai用于量化内部集中度;bi用于量化集群之间的分离度,在上述元素xi之外选择一个分类b,计算该元素xi和分类b中所有元素之间的平均距离bi,遍历所有其他分类,找到最近的平均距离bi,sc在-1到+1之间,值越大表示聚类效果越好,选取轮廓系数最大时对应的聚类数。

在本发明的风力发电机的异常识别方法中,所述步骤5具体包括:

步骤5-1:将聚类后的风机数据集按数据采集日分成为多个风机样本矩阵,对风机样本矩阵的数据进行归一化处理,变换为均值为0、方差为1的标准样本矩阵x={x1,x2,…xn};

步骤5-2:定义标准样本矩阵x={x1,x2,…xn}中两属性间的条件相似性表达式如下:

其中,σi为常数,代表了以xi为中心点的高斯分布的方差,因数据点不同而不同;xi,xj,xk表示标准样本矩阵中3个属性,根据下式计算两属性的相似度:

步骤5-3:根据经验设置困惑度perp、迭代次数t、学习速率η、动量α(t),随机设置降维后的风机数据集为y={y1,y2,…,yn},根据下式计算降维后的风机数据集中两属性间的相似度:

在给定perp的情况下使用二分搜索的方式并根据下式寻找合适的σ,梯度公式如下:

其中,c代表损失函数,不断调整perp、迭代次数t,直到找出上式最趋近于0时对应的perp和t的值;

根据上式计算得到降维后的风机数据集;

步骤5-4:k-means聚类后将风机属性划分为k类,t-sne算法降维后将每类降低成3维,降维后的风机数据集是y=k×3维,即可作为卷积神经网络的有效行输入。

在本发明的风力发电机的异常识别方法中,所述步骤6具体包括:

步骤6-1:对排序后的k组数据进行皮尔森相关系数计算;

其中cov(m,n)代表从风机数据集y中的k个类别中取出不同的类别m和类别n进行协方差系数计算,σm代表类别m的标准差,σn代表类别n的标准差。

步骤6-2:将计算完成的皮尔森相关系数按照大小进行两两比较排序,组合成具有连贯性的图像。

在本发明的风力发电机的异常识别方法中,所述步骤7具体包括:

步骤7-1:引入归一化层,将卷积神经网络的输入标准化为相同的尺寸;

步骤7-2:引入卷积层,通过卷积和非线性两个操作生成几个特征图来进行特征提取;

步骤7-3:引入池化层,通过池化操作减少特征图的大小;

步骤7-4:在获得较高级别的特征表征之后,将其转换为1-d矢量并馈送到分类层;

步骤7-5:分类层采用s型功能函数作为激活函数,对风机有无异常进行判断,其中输出0代表风机异常,1代表风机正常。

在本发明的风力发电机的异常识别方法中,所述步骤8具体包括:

步骤8-1:以天为单位计算降维后的健康状态的风机数据集中的3个属性的均值,分别记作a,b,c;

步骤8-2:改进经典公式推论:

进而推出:

步骤8-3:设m1=a+b+c;通过训练计算每天的的最值,找寻m1的最小值记作找寻m2的最大值记作进而得出风机正常状态下m的范围为若m超出此范围,则判定风机该类属性异常。

本发明的一种风力发电机的异常识别方法与现有技术相比,至少具有以下有益效果:

1、建立风机异常识别模型时,输入输出涉及所有属性,模型可以有效识别多类属性同时发生多种异常,建立的模型具有通用性,可适用于任何风场;

2、训练模型时,将天气因素导致的机组待风、机组待机等天气干扰而非风机异常等情况纳入正常状态,这些可以避免误判断;

3、先聚类后类内降维的数据预处理方法,用最简洁的特征表达了风机的状态,去除了不必要的干扰,有助于准确性的提高;

4、卷积神经网络模型的输入样本由完整的风机图像片段提供,其中包含全面的异常信息;同时特征对噪音敏感,特别是针对异常不明显的情况,卷积神经网络模型可以抑制噪声的不利干扰,准确发现风机属性图片微小的变化,其较强的区别特征的能力和鲁棒性使其具有更好的准确性。

附图说明

图1为本发明的一种风力发电机的异常识别方法的流程图;

图2a为本发明实施方式的采样点数据值大量缺失的异常数据示意图,

图2b为本发明实施方式的采集到的风机属性值恒定不变的示意图;

图3为本发明实施方式的卷积神经网络的结构图;

图4为本发明实施方式的卷积神经网络每层的输出特征图;

图5为本发明实施方式的第一类属性发生单项异常的五组输出图;

图6为本发明实施方式的第六类属性发生多项异常的准确率统计图;

图7为本发明实施方式的第六类属性发生多项异常的五组输出图;

图8为本发明实施方式的第六类属性发生多项异常的准确率统计图;

图9为本发明实施方式的多类属性发生多类异常的五组输出图;

图10为本发明实施方式的bpnn五组输出图。

具体实施方式

下面结合附图对本发明的一种实施方式做详细说明。

将采集到的风场scada数据中异常的属性剔出,保留的其他风机属性经k-means聚类,轮廓系数被用作评判聚类效果的标志,以确定聚类数目及各类属性;然后,将各类别的属性分别经t-sne降低成固定维数,新属性为各类别降维后属性的集合,为卷积神经网络模型提供异常识别的有效数据,使卷积神经网络发挥最大作用;最后,将降维后的有效数据划分为方阵转换为图片作为卷积神经网络的输入,通过对图片二分类实现风机的正异常判断,所提出方法的有效性将通过三个试验来证明。

如图1所示,一种风力发电机的异常识别方法,包括如下步骤:

步骤1:从风场scada系统采集多组包含多种风机属性的风机数据,构成初始风机数据集;具体实施时,每30秒采集一组风数据;

步骤2:删除初始风机数据集中的异常数据,以获得完整风机数据集,所述异常数据包括:某组大量缺失风机属性的风机数据;风机数据中某种每日、每月或每年都恒定不变的风机属性;处理后风机属性个数为n;

图2a为采样点数据值大量缺失的异常数据示意图,即某组大量缺失风机属性的风机数据,其中缺失点为第0-505个采样点;图2b为本发明实施方式的采集到的风机属性值恒定不变的示意图,即风机数据中某种每日、每月或每年都恒定不变的风机属性恒定不变的示意图。

步骤3:采用小波阈值法对完整风机数据集进行降噪处理,从而抑制信号中的无用部分,增强信号中有用的部分,所述小波为db5,分解层数为5;

步骤4:采用k-means的聚类方法将风机属性分为k类,聚类后使得类内属性相似,类间属性相离;具体实施时,本实施方式中将风机属性分为7类。所述步骤4具体包括:

步骤4-1:由于风机属性的量纲不同,不便于聚类,所以需要将风机数据集中的元素根据下式进行归一处理:

其中,vi表示任意元素,max(a)代表该风机属性的元素最大值,min(a)代表该风机属性的元素最小值,v是该风机属性的任意元素归一后的值;

步骤4-2:最大聚类数依据式确定,其中kmax为最大聚类数,n为风机属性的个数;

步骤4-3:经过步骤4-2计算,可将风机属性划分为2到类,通过下式确定聚类数目:

其中,sc表示轮廓系数,ai表示一个元素xi与同一分类中所有其他元素之间的平均距离,ai用于量化内部集中度;bi用于量化集群之间的分离度,在上述元素xi之外选择一个分类b,计算该元素xi和分类b中所有元素之间的平均距离bi,遍历所有其他分类,找到最近的平均距离bi,sc在-1到+1之间,值越大表示聚类效果越好,选取轮廓系数最大时对应的聚类数k。

步骤5:采用t-sne算法对聚类处理后的风机数据集进行降维处理,将每类属性分别降成3维,用固定的低维属性代替类内相似度较高的属性更具代表力和说服性。所述步骤5具体包括:

步骤5-1:将聚类后的风机数据集按数据采集日分成为多个风机样本矩阵,对风机样本矩阵的数据进行归一化处理,变换为均值为0、方差为1的标准样本矩阵x={x1,x2,…xn};

步骤5-2:定义标准样本矩阵x={x1,x2,…xn}中两属性间的条件相似性表达式如下:

其中,σi为常数,代表了以xi为中心点的高斯分布的方差,因数据点不同而不同;xi,xj,xk表示标准样本矩阵中3个属性,根据下式计算两属性的相似度:

步骤5-3:根据经验设置困惑度perp、迭代次数t、学习速率η、动量α(t),随机设置降维后的风机数据集为y={y1,y2,…,yn},根据下式计算降维后的风机数据集中两属性间的相似度:

在给定perp的情况下使用二分搜索的方式并根据下式寻找合适的σ,梯度公式如下:

其中,c代表损失函数,不断调整perp、迭代次数t,直到找出上式最趋近于0时对应的perp和t的值;

根据上式计算得到降维后的风机数据集;

步骤5-4:k-means聚类后将风机属性划分为7类,t-sne算法降维后将每类降低成3维,降维后的风机数据集是y=k×3维,即可作为卷积神经网络的有效行输入。

步骤6:对降维后的7类风机属性进行皮尔森相关系数分析,将这7类属性按照皮尔森相关系数大小进行排列,组成具有相关性的连贯的图像。所述步骤6具体包括:

步骤6-1:对排序后的k组数据进行皮尔森相关系数计算,皮尔森相关系数公式如下:

其中cov(m,n)代表从风机数据集y中的k个类别中取出不同的类别m和类别n进行协方差系数计算,σm代表类别m的标准差,σn代表类别n的标准差。

步骤6-2:将计算完成的皮尔森相关系数按照大小进行两两比较排序,组合成具有连贯性的图像。具体实施时,将风机数据集按照类别带入皮尔森相关系数公式中,得出7类数据间的相关系数表,根据关联系数的大小进行排序,把这7类数据进行排序,拼接成图像。

步骤7:将进行皮尔森相关系数分析后组成的图像送到卷积神经网络,并进行风机的异常识别,所述步骤7具体包括:

步骤7-1:引入归一化层,将卷积神经网络的输入标准化为相同的尺寸。

具体实施时,找到输入到归一化层的图像最大值和最小值及其对应位置;然后使用下采样方法将其归一化为所需大小;最后更换最大值和最小值;

步骤7-2:引入卷积层,通过卷积和非线性两个操作生成几个特征图来进行特征提取。

具体实施时,每个特征图是某些区域中输入风机属性图像的特定特征表示,卷积运算可以通过yj=∑ikij*xi表示。其中,*代表卷积操作;yj是输出的第j个特征图;kij是可训练的卷积核(也称过滤器);xi是第i个输入;

步骤7-3:引入池化层,通过池化操作减少特征图的大小。

具体实施时,首先将输入分成几个具有相同大小的非重叠矩形区域,最大池化操作得到矩形区域内的最大值;平均池化操作得到矩形区域内的平均值。

步骤7-4:在获得较高级别的特征表征之后,将其转换为1-d矢量并馈送到分类层。

步骤7-5:分类层采用s型功能函数作为激活函数,对风机有无异常进行判断,其中输出0代表风机异常,1代表风机正常。

步骤8:确定风机发生异常后,通过准则判定发生异常的风机属性所属的类别;所述步骤8具体包括:

步骤8-1:以天为单位计算降维后的健康状态的风机数据集中的3个属性的均值,分别记作a,b,c;

步骤8-2:改进经典公式推论:

进而推出:

步骤8-3:设m1=a+b+c;通过训练计算每天的的最值,找寻m1的最小值记作找寻m2的最大值记作进而得出风机正常状态下m的范围为若m超出此范围,则判定风机该类属性异常。

步骤9:通过对风机属性异常的识别,验证该风力发电机异常识别方法的有效性。

图3为本发明实施方式的卷积神经网络的结构图,包括卷积层、池化层、卷积层、池化层和完全连接的分类层;

依据的卷积神经网络模型结构设置原则,本实验中x=21,每个输入图片在标准化层归一化为21×21的尺寸,这样每个输入图片代表风机10min内的属性特征,其他设置如表1所示。通过反复实验得到相对最优的模型具体学习细节如表2所示。

表1提出的卷积神经网络的模型结构

表2学习细节

其中,第二层卷积内核的数量3是通过多次实验优化性能进行选择的。以图3为例,如图所示的测试样本最终被正确分类,归一化的风机图像显示在最左边,之后从左到右依次是c1、s1、c2、s2。图4为本发明实施方式的每层的输出特征图。

下面通过不同类别的风机属性的发生异常的识别,来验证本发明的风力发电机的异常识别方法的有效性。

(1)通过对第一类属性(k=1)发生单项异常的识别,验证该风力发电机的异常识别方法的有效性;

训练样本为2万个大小为21×21的风机属性图片,其中包含多种异常,测试样本为100个大小为21×21的风机属性图片,其中只包含齿轮箱后轴承温度过热这一种异常。

基于cnn模型判断风机状态,为避免巧合性,随机选取测试样本,选取的测试样本在两种状态下交叉。进行的五组测试,其中正常样本为48,异常样本52。

用灰色标记的实际值即我们给定的标签,五组彩色的预测值是模型每组预测的结果,若输出大于等于0.5默认为1,输出小于0.5默认为0,以此准则判断风机状态。判断风机状态识别的准确性,结果如表3和图5所示。

表3五组准确率的统计

表3记录了每一组测试的ta、fa、th、fh值,图6为每组测试的准确率q1、q2、q。五组测试对健康状态的风机正确识别率的平均值达到90.8%,并且每组都能达到85%及以上的准确率,对异常状态的风机识别准确率虽大部分略低于正常状态,并且每组都能达到83%及以上的准确率,综合准确率的平均值为90%。k=1时,δ1=-0.018;δ2=2.52×10-3,第一类属性的m值落在范围外,其余正常,风机第一类属性异常,经过多次试验得以验证。

(2)通过对第六类属性(k=6)发生多项异常的识别,验证该风力发电机的异常识别方法的有效性;

与第一类属性异常验证选取测试样本的原则相同,图7所示为进行的五组测试,并且正异常样本图片数量均为50。其中第一、二、四组异常程度较明显。表4为每一组测试ta、fa、th、fh的数目统计,图8是准确率q1、q2、q的统计对比图。

表4五组准确率统计

五组测试对健康状态的风机正确识别率的平均值达到95.2%,并且每组都能达到84%及以上的准确率,对异常状态的风机正确识别率的平均值依然高达95.2%,但仍达到平均值为87.3%,并且每组都能达到84%及以上的准确率,综合准确率的平均值为95.4%,高于步骤7的90%。相比于步骤7,步骤8表明异常程度明显的情况下,该模型异常识别的准确率将会提升。k=6时,δ1=-0.028;δ2=1.12×10-3,第六类属性的m值落在范围外,其余正常,风机第六类属性异常,经过多次试验得以验证。

(3)通过对多类属性发生多项异常的识别,验证该风力发电机异常识别方法的有效性。

为避免样本只有某一类属性异常的单一性不足以说明异常识别的准确性,步骤9验证识别同时发生多类异常。图9的五组测试,每组测试的异常类型都不相同,并且都同时包含多种类别的异常。表5统计各组和整体的风机状态识别的准确率。

表5组准确率统计

由表5可知,五组测试对健康状态的风机正确识别率的平均值达到95.6%,并且每组都能达到90%及以上的准确率,对异常状态的风机正确识别率的平均值高达96%,并且每组都能达到84%及以上的准确率,综合准确率的平均值为95.8%,结果表明,该方法对多类异常的识别仍持有较高的准确率,后三组测试因异常较明显,准确率极高。多类属性的m值异常。

表6为我们提出的方法与bpnn异常识别效果的比较,两个方法采用相同的数据进行测试,其中bpnn未经先聚类后类内降维的数据预处理过程,基于bpnn的异常识别结果如图10和表7所示。我们提出的方法与bpnn异常识别的效果比较如表7所示。

表6组准确率统计

表7各方法异常识别效果统计

结合三个案例,其一验证了我们提出的方法对风机异常识别的准确性;其二表明了异常程度越明显,异常识别准确率越高的特点。

以上所述仅为本发明的较佳实施例,并不用以限制本发明的思想,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1