基于数据驱动的风电机组多变量故障预测方法

文档序号:10725288阅读:351来源:国知局
基于数据驱动的风电机组多变量故障预测方法
【专利摘要】本发明涉及风电机组故障预测方法,具体是一种基于数据驱动的风电机组多变量故障预测方法。本发明解决了现有基于数据驱动的故障预测方法预测准确率低的问题。基于数据驱动的风电机组多变量故障预测方法,该方法是采用如下步骤实现的:步骤1:对被监测的风电机组部件进行状态数据采集;步骤2:采用五点滑动平均法对特征量进行降噪处理;步骤3:计算特征量与剩余寿命预测的相关度R;步骤4:建立多变量最小二乘支持向量机预测模型;步骤5:对多变量最小二乘支持向量机预测模型的正则化参数γ和核参数σ2进行优化;步骤6:验证多变量最小二乘支持向量机预测模型的有效性;步骤7:预测风电机组部件的剩余有效寿命。本发明适用于风电机组故障预测。
【专利说明】
基于数据驱动的风电机组多变量故障预测方法
技术领域
[0001] 本发明涉及风电机组故障预测方法,具体是一种基于数据驱动的风电机组多变量 故障预测方法。
【背景技术】
[0002] 故障预测是指根据历史数据和当前数据预测未来的故障趋势或剩余有效寿命。风 电机组故障预测是指在风电机组尚未出现故障的情况下,采用故障推理的方法对风电机组 未来将要发生的故障做出预测。相对于故障监测与诊断,故障预测最大的优势是:如果故障 预测的时间提前量足够长,并且故障原因与定位足够准确,现场运行人员就可以采取相应 措施防止故障的发生,提高了风电机组的稳定性。然而风电机组运行状态大多具有严重的 非线性、时变性、结构和参数的不确定性以及多输入多输出之间强耦合性等特点,整个系统 庞大而且复杂,环境恶劣、故障频发。这些都加大了风电机组故障预测的难度,所以故障预 测方法应具备:能够处理系统中的各种复杂特性(如非线性、非稳定性、不确定性等);预测 准确率高,误报率低;预测提前时间应足够工作人员处理故障;故障定位要精确,能够指导 工作人员排除故障。
[0003] 现有的风电机组故障预测方法包括如下两种:定性预测方法和定量预测方法。定 性预测方法,也即基于知识的方法,主要有粗糙集、数据挖掘(KDD)、支持向量机(SVM)、 Petri网以及专家系统等。定性预测方法的优势是可以充分利用专家的知识或经验,但此种 预测方法适用于定性推理而在定量计算方面具有很大的局限性。定量预测方法包括如下两 种:基于模型的预测方法和基于数据驱动的预测方法。其中,基于模型的预测方法是指利用 已经建立好的数学模型对设备未来状态进行预测,实现设备未来状态的故障预报。基于模 型的预测方法具有精确度高、误报率低、有利于故障定位等优点,但在风电机组故障预测中 受到很大的限制(由于风电机组自身严重的非线性以及各种扰动、噪声等因素的影响,很难 建立精确的风电机组数学模型)。而基于数据驱动的预测方法从风电场实际运行数据出发, 能够利用风电机组运行状态数据来挖掘设备的隐含特征。此种预测方法应用广泛、实用性 强、不需要建立数学模型,已成为故障预测的未来研究方向。
[0004] 目前,基于数据驱动的预测方法主要有经典时间序列法(AR,MA,ARMA等模型)、灰 色预测、回归分析、人工智能以及混沌理论预测等。这些方法均为单变量预测(即根据单个 变量的内在变化规律来获取未来值,由此进行风电机组故障预测),其预测准确率完全依赖 于单个变量。然而在实际应用中,单个变量往往受到多个变量的影响,因此上述方法普遍存 在预测准确率低的问题。为此有必要发明一种全新的风电机组故障预测方法,以解决现有 基于数据驱动的故障预测方法存在的上述问题。

【发明内容】

[0005] 本发明为了解决现有基于数据驱动的故障预测方法预测准确率低的问题,提供了 一种基于数据驱动的风电机组多变量故障预测方法。
[0006] 本发明是采用如下技术方案实现的:
[0007] 基于数据驱动的风电机组多变量故障预测方法,该方法是采用如下步骤实现的:
[0008] 步骤1:对被监测的风电机组部件进行状态数据采集,并从状态数据中提取如下特 征量:时域特征量、频域特征量、复杂度特征量;
[0009] 步骤2:采用五点滑动平均法对特征量进行降噪处理,由此消除特征量之间的随机 性影响;降噪处理公式表示如下:
[0011] 公式(1)中:x(k)表示降噪前的特征量数据序列;X'(k)表示降噪后的特征量数据 序列;k=l,2,…,η;
[0012] 在风电机组部件的稳定运行期,计算特征量中的均方根值对应的状态数据平均 值,并将状态数据平均值设为标准值,然后将均方根值除以标准值,由此得到相对均方根 值;
[0013] 以相对均方根值为标签指标,设定风电机组部件的退化起始阈值dmax和失效阈值 Ymax ;
[0014] 步骤3:计算特征量与剩余寿命预测的相关度R;计算公式表示如下:
[0016] 公式(2)中:y(k)表示与x(k)相对应的剩余寿命数据序列;^表示数据序列x(k)的 均值;^表示数据序列y (k)的均值;
[0017] 选择与剩余寿命预测的相关度R大于0.6的特征量作为多变量最小二乘支持向量 机预测模型的输入变量,同时去掉与剩余寿命预测不相关的特征量和噪声特征量;多变量 最小二乘支持向量机预测模型的输入变量包括如下六个特征量:均方根值、绝对平均值、峰 值、峭度指标、裕度指标、小波包-包络样本熵;
[0018] 步骤4:建立多变量最小二乘支持向量机预测模型;具体建立过程如下:
[0019] 假设单变量时间序列为乂=[以1),奴2),'",奴《],则根据了&1? 51^嵌入理论,单变 量时间序列的预测值与其前m个值相关,表示如下:
[0020] x(k+l)=f(x(k) ,x(k-l), ··· ,x(k-m+l)) (3);
[0021] 公式(3)中:m表示嵌入维数,一般取5~10;k=m,m+l,…,Ν;
[0022] 选取前η个为训练样本,后Ν-η个为预测样本,则训练样本的输入输出序列和预测 样本的输入输出序列分别表不如下:
[0023]
[0025] 公式(4)-(5)中:Xtrain、Yt rain表示训练样本的输入输出序列;Xtest、Ytest表示预测样 本的输入输出序列;
[0026] 定义变量L(k)受Μ维特征量xi(k),X2(k),. . .,XM(k)影响,贝lj变量L(k)表示如下:
[0027] L(k)=f(xi(k),X2(k), · · ·,XM(k)) (6);
[0028] 将公式(6)代入公式(4)-(5),则训练样本的输入输出序列和预测样本的输入输出 序列分别表示如下:
[0029]
[0031] 公式(7) - (8)中:X ' train、Y ' train表示多变量训练样本的输入输出序列;X ' test、Y ' test 表示多变量预测样本的输入输出序列;
[0032] 步骤5:采用启发式粒子群算法对多变量最小二乘支持向量机预测模型的正则化 参数γ和核参数σ2进行优化;具体优化过程如下:
[0033] 步骤5.1:对如下参数进行初始化:种群规模、学习因子、最大迭代次数、每个粒子 的初始位置和速度、个体最优值、全局最优值;
[0034] 步骤5.2:随机生成粒子位置,并将粒子位置坐标设为多变量最小二乘支持向量机 预测模型的正则化参数γ和核参数σ2,然后使用训练样本对多变量最小二乘支持向量机预 测模型进行训练预测;计算均方误差MSE,并将均方误差MSE作为每个粒子的适应度值;
[0035] 步骤5.3:将每个粒子的适应度值与个体最优值和全局最优值进行比较,由此确定 全局最优粒子;
[0036] 步骤5.4:判断全局最优粒子是否满足终止条件;若不满足终止条件,则根据公式 (9)-(10)更新粒子的速度和位置,并返回步骤5.2;若满足终止条件,则转到步骤5.5;
[0037] vid(t+l) = wvid(t)+ciri(pid(t)-Xid(t) )+C2r2(pgd(t)-Xid(t)) (9);
[0038] xid(t+l)=xid(t)+vid(t+l) (10);
[0039] 公式(9)-(10)中:w为惯性权重系数;C1、C2*两个学习因子,这里取(^ = 1.5,(32 = 1.7; η、Γ2为[0,1 ]之间的随机数;xid(t)、vid(t)分别表示每个粒子的位置与速度;pid(t)表 示每个粒子到目前为止所出现的最优位置;p gd(t)表示所有粒子到目前为止所出现的最优 位置;
[0040] 步骤5.5:找到满足终止条件的全局最优粒子位置,并将全局最优粒子位置坐标作 为多变量最小二乘支持向量机预测模型的最优正则化参数γ和最优核参数σ 2;
[0041] 步骤6:构造多变量非线性函数,由此验证多变量最小二乘支持向量机预测模型的 有效性;多变量非线性函数表示如下:
[0042]
[0043] 公式(11)中:χι、Χ2、Χ3表示多变量最小二乘支持向量机预测模型的输入,由均勾分 布函数与白噪声叠加;y表示多变量最小二乘支持向量机预测模型的输出;
[0044] 步骤7:根据多变量最小二乘支持向量机预测模型,预测风电机组部件的剩余有效 寿命;具体预测过程如下:
[0045] 根据风电机组部件的退化起始阈值dmax和失效阈值ymax,在相对均方根值未达到失 效阈值ym X之前,有:
[0046] | yk | | <ymax (12);
[0047] 则风电机组部件的剩余有效寿命表示如下:
[0048] RUUM) = min {i3 : +#||^^) (13);
[0049] 公式(12)-( 13)中:RUL表示风电机组部件的剩余有效寿命;p表示预测步长。
[0050] 与现有基于数据驱动的故障预测方法相比,本发明所述的基于数据驱动的风电机 组多变量故障预测方法通过建立多变量最小二乘支持向量机预测模型,并通过将多个特征 量作为预测模型的输入变量,实现了对风电机组部件的剩余有效寿命进行直接预测,因此 其预测准确率不再依赖于单个变量,而是由多个变量共同决定,从而显著提高了预测准确 率。
[0051] 本发明有效解决了现有基于数据驱动的故障预测方法预测准确率低的问题,适用 于风电机组故障预测。
【附图说明】
[0052]图1是本发明的流程不意图。
[0053]图2是本发明中步骤5的流程示意图。
[0054]图3是8个振动时域特征指标降噪前数据。
[0055]图4是8个振动时域特征指标降噪后数据。
[0056]图5是粒子群算法的适应度曲线。
[0057]图6是剩余有效寿命RUL的预测结果。
【具体实施方式】
[0058] 基于数据驱动的风电机组多变量故障预测方法,该方法是采用如下步骤实现的:
[0059] 步骤1:对被监测的风电机组部件进行状态数据采集,并从状态数据中提取如下特 征量:时域特征量、频域特征量、复杂度特征量;
[0060] 步骤2:采用五点滑动平均法对特征量进行降噪处理,由此消除特征量之间的随机 性影响;降噪处理公式表示如下:
[0061]
[0062]公式(1)中:x(k)表示降噪前的特征量数据序列;x'(k)表示降噪后的特征量数据 序列;k=l,2,…,η;
[0063] 在风电机组部件的稳定运行期,计算特征量中的均方根值对应的状态数据平均 值,并将状态数据平均值设为标准值,然后将均方根值除以标准值,由此得到相对均方根 值;
[0064] 以相对均方根值为标签指标,设定风电机组部件的退化起始阈值dmax和失效阈值 Ymax ;
[0065] 步骤3:计算特征量与剩余寿命预测的相关度R;计算公式表示如下:
[0066]
[0067] 公式(2)中:y(k)表示与x(k)相对应的剩余寿命数据序列;;;表示数据序列x(k)的 Λ^.· 均值;^表示数据序列y(k)的均值;
[0068] 选择与剩余寿命预测的相关度R大于0.6的特征量作为多变量最小二乘支持向量 机预测模型的输入变量,同时去掉与剩余寿命预测不相关的特征量和噪声特征量;多变量 最小二乘支持向量机预测模型的输入变量包括如下六个特征量:均方根值、绝对平均值、峰 值、峭度指标、裕度指标、小波包-包络样本熵;
[0069] 步骤4:建立多变量最小二乘支持向量机预测模型;具体建立过程如下:
[0070] 假设单变量时间序列为乂=4(1)4(2),'",奴《],则根据了&1? 51^嵌入理论,单变 量时间序列的预测值与其前m个值相关,表示如下:
[0071] x(k+l)=f(x(k) ,x(k-l), ··· ,x(k-m+l)) (3);
[0072] 公式(3)中:m表示嵌入维数,一般取5~10;k=m,m+l,…,Ν;
[0073] 选取前η个为训练样本,后Ν-η个为预测样本,则训练样本的输入输出序列和预测 样本的输入输出序列分别表不如下:
[0074]
[0076] 公式(4)-(5)中:Xtrain、Ytrain表示训练样本的输入输出序列;Xt est、Ytest表示预测样 本的输入输出序列;
[0077] 定义变量L(k)受Μ维特征量^a(k),X2(k),. . .,XM(k)影响,则变量L(k)表示如下:
[0078] L(k) = f (xi(k) ,X2(k), . . . ,XM(k)) (6);
[0079] 将公式(6)代入公式(4)-(5),则训练样本的输入输出序列和预测样本的输入输出 序列分别表示如下:
[0080]
[0082] 公式(7) - (8)中:X ' train、Y ' train表示多变量训练样本的输入输出序列;X ' test、Y ' test 表示多变量预测样本的输入输出序列;
[0083]步骤5:采用启发式粒子群算法对多变量最小二乘支持向量机预测模型的正则化 参数γ和核参数σ2进行优化;具体优化过程如下:
[0084] 步骤5.1:对如下参数进行初始化:种群规模、学习因子、最大迭代次数、每个粒子 的初始位置和速度、个体最优值、全局最优值;
[0085] 步骤5.2:随机生成粒子位置,并将粒子位置坐标设为多变量最小二乘支持向量机 预测模型的正则化参数γ和核参数σ2,然后使用训练样本对多变量最小二乘支持向量机预 测模型进行训练预测;计算均方误差MSE,并将均方误差MSE作为每个粒子的适应度值;
[0086] 步骤5.3:将每个粒子的适应度值与个体最优值和全局最优值进行比较,由此确定 全局最优粒子;
[0087] 步骤5.4:判断全局最优粒子是否满足终止条件;若不满足终止条件,则根据公式 (9)-(10)更新粒子的速度和位置,并返回步骤5.2;若满足终止条件,则转到步骤5.5;
[0088] Vid(t+l)=wvid(t)+ciri(pid(t)-Xid(t))+C2r2(pgd(t)-Xid(t)) (9);
[0089] Xid(t+l)=Xid(t)+Vid(t+l) (10);
[0090] 公式(9)-(10)中:w为惯性权重系数;C1、C2S两个学习因子,这里取(^ = 1.5,(32 = 1.7;ri、r2为[0,1]之间的随机数;xid(t)、vid(t)分别表不每个粒子的位置与速度;pid(t)表 示每个粒子到目前为止所出现的最优位置;p gd(t)表示所有粒子到目前为止所出现的最优 位置;
[0091] 步骤5.5:找到满足终止条件的全局最优粒子位置,并将全局最优粒子位置坐标作 为多变量最小二乘支持向量机预测模型的最优正则化参数γ和最优核参数σ 2;
[0092] 步骤6:构造多变量非线性函数,由此验证多变量最小二乘支持向量机预测模型的 有效性;多变量非线性函数表示如下:
[0093]
[0094] 公式(11)中:χι、Χ2、Χ3表示多变量最小二乘支持向量机预测模型的输入,由均勾分 布函数与白噪声叠加;y表示多变量最小二乘支持向量机预测模型的输出;
[0095] 步骤7:根据多变量最小二乘支持向量机预测模型,预测风电机组部件的剩余有效 寿命;具体预测过程如下:
[0096] 根据风电机组部件的退化起始阈值dmax和失效阈值ymax,在相对均方根值未达到失 效阈值ym X之前,有:
[0097] | yk | | <ymax (12);
[0098] 则风电机组部件的剩余有效寿命表示如下:
[0099] /?0秘)=min I 乂< + /; 1j ( 13);
[0100] 公式(12)-( 13)中:RUL表示风电机组部件的剩余有效寿命;p表示预测步长。
[0101]为了验证本发明中多变量最小二乘支持向量机预测模型(PS0-MLSSVM模型)的预 测效果,均匀生成220组序列,去掉前面50组平稳的序列,中间130组序列用于训练,最后40 组数据用于测试;
[0102] 分别采用PS0-MLSSVM和PS0-LSSVM模型进行预测,首先对PS0算法进行参数初始 化:最大迭代次数设为300,种群规模为30,正则化参数γ e [ 100,2000]和核参数σ2 e [ 1, 100];模型经过训练和测试,进行参数寻优,得到优化参数γ =929.8和σ2=14.7;
[0103] 为了具体评价两种模型的性能优劣,引入平均绝对误差(MAE)、平均相对误差 (MAPE)、均方根误差(RMSE)等评价指标,各指标的表达式如下:
[0104]
[0105]公式(14)中:yk表示实际值;y'k表示预测值;
[0106]得到两种预测模型评价指标对比表1,可以看到本发明提出的PS0-MLSSVM模型各 项指标均优于PS0-LSSVM,总体预测效果良好;而PS0-LSSVM模型由于受数据随机性和噪音 的影响,预测效果较差,验证了提出的多变量模型有效性。
[0107]表1:
[0109] 为进一步说明本发明中多变量最小二乘支持向量机预测模型的可行性,将多变量 最小二乘支持向量机预测模型应用于风电机组齿轮箱轴承的剩余寿命预测中:以山西省某 风电场的风电机组齿轮箱高速端轴承为研究对象,获取在线监测系统中2014年转速在 1740-1800RPM,功率在1500-1550KW范围内的时域、频域以及小波包-包络样本熵的振动数 据,共1190组。部分时域振动指标的退化数据如图3所示。通过图3可以看出:各特征量的随 机波动性较大,故障阈值难以准确设定,需要对特征进行降噪处理和相对标准化,根据本发 明提出的故障阈值设置方法,结合实际数据变化趋势设置相对均方根值的起始值为1.3(图 中第967个点)和失效值为3.0(图中第1036个点),如图4。截取第967-1036个点共70组的轴 承退化数据,用于轴承剩余有效寿命预测。因此,可以根据设置的阈值上下限计算出对应的 剩余寿命,然后利用多变量最小二乘支持向量机预测模型进行故障预测。将截取的退化数 据中前55组作为训练数据,后15组作为测试数据,模型经过粒子群算法优化后的参数为γ = 1822.2和σ2 = 20.6,图5为粒子群算法的适应度曲线。预测结果如图6,同时列出评价指标 表2,从表2中可以看出相对误差仅为7.93%,模型预测效果良好,验证了多变量预测模型的 有效性。
[0110] 表2:
【主权项】
1. 一种基于数据驱动的风电机组多变量故障预测方法,其特征在于:该方法是采用如 下步骤实现的: 步骤1:对被监测的风电机组部件进行状态数据采集,并从状态数据中提取如下特征 量:时域特征量、频域特征量、复杂度特征量; 步骤2:采用五点滑动平均法对特征量进行降噪处理,由此消除特征量之间的随机性影 响;降噪处理公式表示如下:…; 公式(1)中:χ化)表示降噪前的特征量数据序列;X'化)表示降噪后的特征量数据序列; k=l,2,...,n; 在风电机组部件的稳定运行期,计算特征量中的均方根值对应的状态数据平均值,并 将状态数据平均值设为标准值,然后将均方根值除W标准值,由此得到相对均方根值; W相对均方根值为标签指标,设定风电机组部件的退化起始阔值cUax和失效阔值ymax; 步骤3:计算特征量与剩余寿命预测的相关度R;计算公式表示如下:(2); 公式(2)中:y化)表示与X化)相对应的剩余寿命数据序列;表示数据序列X化)的均值; ^表示数据序列y化)的均值; 选择与剩余寿命预测的相关度R大于0.6的特征量作为多变量最小二乘支持向量机预 测模型的输入变量,同时去掉与剩余寿命预测不相关的特征量和噪声特征量;多变量最小 二乘支持向量机预测模型的输入变量包括如下六个特征量:均方根值、绝对平均值、峰值、 峭度指标、裕度指标、小波包-包络样本赌; 步骤4:建立多变量最小二乘支持向量机预测模型;具体建立过程如下: 假设单变量时间序列为X=[xα),x(2),…,x(N)],则根据Takens嵌入理论,单变量时 间序列的预测值与其前m个值相关,表示如下: x(k+l)=f (x(k) ,χ化-1) ,··· ,χ化-m+1)) (3); 公式(3)中:m表示嵌入维数,一般取5~10;k=m,m+l,…,Ν; 选取前η个为训练样本,后Ν-η个为预测样本,则训练样本的输入输出序列和预测样本 的输入输出序列分别表示如下:公式(4)-巧)中:Xtrain、Ytrain表示训练样本的输入输出序列;Xtest、Ytest表示预测样本的 输入输出序列; 定义变量Uk)受Μ维特征量XI化),X2化),...,XM化)影响,则变量Uk)表示如下: L(k)=f (XI化),X2化),...,抑1化))(6); 将公式(6)代入公式(4)-(5),则训练样本的输入输出序列和预测样本的输入输出序列 分别表示如下:公式(7)-(8)中:X'train、Y'train表示多变量训练样本的输入输出序列;X'test、Y'test表示 多变量预测样本的输入输出序列; 步骤5:采用启发式粒子群算法对多变量最小二乘支持向量机预测模型的正则化参数 丫和核参数进行优化;具体优化过程如下: 步骤5.1:对如下参数进行初始化:种群规模、学习因子、最大迭代次数、每个粒子的初 始位置和速度、个体最优值、全局最优值; 步骤5.2:随机生成粒子位置,并将粒子位置坐标设为多变量最小二乘支持向量机预测 模型的正则化参数丫和核参数σ2,然后使用训练样本对多变量最小二乘支持向量机预测模 型进行训练预测;计算均方误差MSE,并将均方误差MSE作为每个粒子的适应度值; 步骤5.3:将每个粒子的适应度值与个体最优值和全局最优值进行比较,由此确定全局 最优粒子; 步骤5.4:判断全局最优粒子是否满足终止条件;若不满足终止条件,则根据公式(9)- (10)更新粒子的速度和位置,并返回步骤5.2;若满足终止条件,则转到步骤5.5; vid(t+l)=wvid(t)+ciri(pid(t)-xid(t))+C2r2(pgd(t)-xid(t)) (9); xid(t+l) = xid(t)+vid(t+l) (10); 公式(9)-(10)中:w为惯性权重系数;ci、C2为两个学习因子,运里取ci = 1.5,C2 = 1.7; ri、n为[0,1]之间的随机数;xid(t)、vid(t)分别表示每个粒子的位置与速度;pid(t)表示每 个粒子到目前为止所出现的最优位置;Pgd(t)表示所有粒子到目前为止所出现的最优位置; 步骤5.5:找到满足终止条件的全局最优粒子位置,并将全局最优粒子位置坐标作为多 变量最小二乘支持向量机预测模型的最优正则化参数丫和最优核参数σ2; 步骤6:构造多变量非线性函数,由此验证多变量最小二乘支持向量机预测模型的有效 性;多变量非线性函数表示如下:(11); 公式(11)中:Χ1、Χ2、Χ3表示多变量最小二乘支持向量机预测模型的输入,由均匀分布函 数与白噪声叠加;y表示多变量最小二乘支持向量机预测模型的输出; 步骤7:根据多变量最小二乘支持向量机预测模型,预测风电机组部件的剩余有效寿 命;具体预测过程如下: 根据风电机组部件的退化起始阔值cUx和失效阔值ymax,在相对均方根值未达到失效阔 值ymax之自U ,有; yk I I <ymax (12); 则风电机组部件的剩余有效寿命表示如下:03):; 公式(12)-(13)中:RUL表示风电机组部件的剩余有效寿命;P表示预测步长。
【文档编号】G06Q50/06GK106096170SQ201610453241
【公开日】2016年11月9日
【申请日】2016年6月21日
【发明人】王灵梅, 李其龙, 孟恩隆, 孟秉贵, 申杰兵, 苏华
【申请人】山西大学, 大唐山西新能源有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1